Reinforcement
Optimal Foraging
Observational Learning
Collisions in Multiple Dimensions: Problem Solving
Evolutionary Relationships through Genome Comparisons
Multi-input and Multi-variable systems
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
Kexing Peng1, Hanwen Qi1, Tinghuai Ma2
1School of Computer Science, Nanjing University of Information Science & Technology, Nanjing, 210044, China.
本研究介绍了GDE,这是一个新的多代理强化学习 (MARL) 框架,可以提高复杂任务的协调. GDE 结合了基于图的值分解与分阶段的进化策略优化,以提高代理性能.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: