Reinforcement Schedules
Operant Conditioning
Reinforcement
Primary and Secondary Reinforcers
Observational Learning
Decision Making: P-value Method
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
Updated: Dec 30, 2025

Studying Food Reward and Motivation in Humans
Published on: March 19, 2014
Will Dabney1, Zeb Kurth-Nelson2,3, Naoshige Uchida4
1DeepMind, London, UK. wdabney@google.com.
基于多巴胺的强化学习可以将奖励表现为概率分布,而不仅仅是单个值. 这项研究提供了支持大脑中这种分布式强化学习模型的神经证据.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: