Survival Tree
Avoidance Learning and Learned Helplessness
Types of Errors: Detection and Minimization
Random and Systematic Errors
Randomized Experiments
Reinforcement
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
离线强化学习 (RL) 代理可以通过解决数据稀疏性来改进,这是估计错误的关键因素. 我们的IEEDS方法使用V-nets和状态意识的稀疏性马尔科夫决策流程 (MDP) 来减轻这些错误以获得更好的性能.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: