Reinforcement
Observational Learning
Reinforcement Schedules
Multi-input and Multi-variable systems
Associative Learning
Avoidance Learning and Learned Helplessness
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
本研究介绍了相互信息规范化作为强大的规范化 (MIR3) 强大的多代理强化学习 (MARL). 在复杂的系统中,MIR3增强了代理人的谨慎性,提高了强度和训练效率,以防复杂系统中的对抗行为.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: