Observational Learning
Reinforcement
Avoidance Learning and Learned Helplessness
Associative Learning
Reinforcement Schedules
Multi-input and Multi-variable systems
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
本研究介绍了"何时探索" (WToE),这是一种在非静止环境中进行多代理探测的新方法. WToE有效地适应不断变化的动态,改进勘探策略并确保融合.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: