State Space Representation
Reinforcement Schedules
Transfer Function to State Space
Linear time-invariant Systems
Fixed Action Patterns
Instinctive Drift
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
Dayang Liang1, Qihang Chen1, Yunlong Liu1
1Department of Automation, Xiamen University, Xiamen 361005, China.
本研究介绍了顺序动作诱导的不变表示 (SAR),这是一种用于视觉强化学习的新方法. 通过利用动作序列,SAR有效地从有分心的观测中提取与任务相关的信息.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: