Observational Learning
Associative Learning
Multi-input and Multi-variable systems
Randomized Experiments
Sampling Continuous Time Signal
Introduction to Learning
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
持续值赋值 (CVA) 通过直接增强状态-动作值来增强深度强化学习,绕过复杂的过渡建模. 这提高了对控制任务的样本效率.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: