Reinforcement
Reinforcement Schedules
Motivational Cycle
Observational Learning
Avoidance Learning and Learned Helplessness
Incentive Theory: Pull Theory of Motivation
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
Anqi Huang1, Yongli Wang1, Xiaoliang Zhou1
1School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing, 210094, China.
乐观的顺序软行为体批评与激励沟通 (OSSMC) 通过探索乐观的Q值和使用激励信息来增强多代理强化学习. 这种新的方法在合作任务中实现了更快的融合和更高的性能.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: