Reinforcement
Observational Learning
Reinforcement Schedules
Collisions in Multiple Dimensions: Problem Solving
Associative Learning
Dynamic Equilibrium
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
Updated: Sep 12, 2025

The HoneyComb Paradigm for Research on Collective Human Behavior
Published on: January 19, 2019
本研究介绍了一种对模型动态游戏 (MDG) 的记忆效率高的反向增强学习 (RL) 算法,它消除了对持续激发和数据存储的需求. 新方法保证了温和初始条件的纳什平衡解决方案,改进了控制系统设计.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: