Reinforcement Schedules
Randomized Experiments
Associative Learning
Reinforcement
Generalization, Discrimination, and Extinction
Law of Effect
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
Yana Yang1, Meng Xi1, Huiao Dai1
1The School of Electrical and Information Engineering, Tianjin University, Tianjin 300072, China.
本研究介绍了Z-Score优先经验重复来增强深度强化学习. 该方法改善了经验利用,提高了算法性能和复杂决策问题的融合速度.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: