Reinforcement
Law of Effect
Observational Learning
Avoidance Learning and Learned Helplessness
Reinforcement Schedules
Hierarchy of Motor Control
您也可能阅读
通过共同作者、期刊和引用图与本文相关的文章。
Volodymyr Mnih1, Koray Kavukcuoglu1, David Silver1
1Google DeepMind, 5 New Street Square, London EC4A 3TW, UK.
这项研究介绍了深度Q网络,这是一种人工智能,可以通过端到端的强化学习从高维感官输入中学习. 该代理在Atari游戏中实现了人类水平的性能,从原始像素数据中展示了有效的概括.
科学领域:
背景情况:
研究的目的:
主要方法:
主要成果:
结论: