Reinforcement
Law of Effect
Observational Learning
Avoidance Learning and Learned Helplessness
Reinforcement Schedules
Hierarchy of Motor Control
こちらも読む
共著者、ジャーナル、引用グラフによってこの研究に関連する記事。
Volodymyr Mnih1, Koray Kavukcuoglu1, David Silver1
1Google DeepMind, 5 New Street Square, London EC4A 3TW, UK.
この研究は,エンドツーエンドの強化学習を使用して高次元の感覚入力から学習する人工的エージェントである深層のQネットワークを導入します. このエージェントは,Atariのゲームで人間レベルのパフォーマンスを達成し,未処理のピクセルデータから効果的な汎用化を実証しました.
科学分野:
背景:
研究 の 目的:
主な方法:
主要な成果:
結論: