Observational Learning
Reinforcement Schedules
Self-Evaluation: Self-Enhancement and Self-Verification
Self-Presentation: Self-Monitoring and Self-Handicapping
Self-Schemas
Nonconscious Mimicry
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
Andrew Zhao1, Erle Zhu2, Rui Lu1
1Department of Automation, BNRist, Tsinghua University, China.
本研究介绍了自我参考 (SR),这是一个用于无监督强化学习的附加模块. 通过稳定奖励和保持探索性行为,SR提高了性能和样本效率.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: