Observational Learning
Associative Learning
Reinforcement
Avoidance Learning and Learned Helplessness
Reinforcement Schedules
Generalization, Discrimination, and Extinction
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
基于模型的离线强化学习 (RL) 使用对抗数据增强来改善政策优化. 通过动态选择模型,MORAL增强了培训数据,从而提高了各种任务的性能.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: