Observational Learning
Reinforcement
Associative Learning
Collisions in Multiple Dimensions: Problem Solving
Reinforcement Schedules
Multi-input and Multi-variable systems
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
Tong Li1, Chenjia Bai2, Kang Xu3
1School of Cybersecurity, Northwestern Polytechnical University, Xi'an, 710072, Shaanxi, China.
本研究介绍了动态技能学习 (DSL),这是多代理强化学习 (MARL) 的新框架. 通过内部奖励,DSL使代理人能够发展各种技能,提高复杂合作任务的性能.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: