深層補強学習による人間レベルのコントロール | JoVE Visualize

科学分野:

人工知能 (AI) とは,人工知能 (AI) のことです.
機械学習 (Machine Learning) とは,機械学習 (Machine Learning) について学ぶことです.
計算神経科学とは

背景:

強化学習 (RL) は,心理学的および神経科学的な原則に基づいたエージェント制御を最適化します.
現実世界のRLは,一般化のために高次元の感覚インプットから効率的な表現を導き出すためにエージェントを必要とします.
既存のRLエージェントは,手作りした特徴や低次元,完全に観察された状態に限定されています.

研究の目的:

高次元の感覚インプットからエンドツーエンドの強化学習を行うことができる新しい人工エージェントを開発する.
複雑な現実世界のシナリオで以前のRLエージェントの限界を克服するために.
原始的な感覚データと人工エージェントにおける効果的な意思決定の間のギャップを埋めるために.

主な方法:

ディープニューラルネットワークトレーニングの進歩を利用して,ディープQネットワークエージェントを作成しました.
エンドツーエンドの強化学習を採用し,インプットとして原始ピクセルとゲームスコアのみを処理します.
49のクラシックアタリ2600ゲームの多様なセットでエージェントをテストしました.

主要な成果:

ディープQネットワークエージェントは,アタリ2600ゲームにおけるこれまでのすべてのアルゴリズムを上回りました.
テストされたゲーム全体で,プロのヒューマンゲームテスターに匹敵するパフォーマンスを達成しました.
高次元のビジュアル入力から直接学習と一般化を成功させることが実証されています.

結論:

ディープQネットワークは,人工知能の重要な進歩であり,未処理の感覚データから学習することを可能にします.
このアプローチは,高次元の入力とアクションの間の溝を橋渡しし,汎用的なエージェントを作成します.
様々な挑戦的なタスクでエージェントの成功は,深層補強学習の潜在力を強調しています.