Control a nivel humano a través del aprendizaje de refuerzo profundo. | JoVE Visualize

Área de la Ciencia:

La inteligencia artificial es inteligencia artificial.
Aprendizaje automático Aprendizaje automático.
La neurociencia computacional es una neurociencia computacional.

Sus antecedentes:

El aprendizaje por refuerzo (RL) optimiza el control del agente basado en principios psicológicos y neurocientíficos.
La RL del mundo real requiere que los agentes deriven representaciones eficientes de entradas sensoriales de alta dimensión para la generalización.
Los agentes de RL existentes se limitan a características hechas a mano o estados de baja dimensión y completamente observados.

Objetivo del estudio:

Desarrollar un nuevo agente artificial capaz de aprender refuerzo de extremo a extremo a partir de entradas sensoriales de alta dimensión.
Para superar las limitaciones de los agentes RL anteriores en escenarios complejos y reales.
Para cerrar la brecha entre los datos sensoriales en bruto y la toma de decisiones efectiva en los agentes artificiales.

Principales métodos:

Utilizó los avances en el entrenamiento de redes neuronales profundas para crear un agente de red Q profunda.
Empleó aprendizaje de refuerzo de extremo a extremo, procesando solo píxeles sin procesar y puntuaciones de juegos como entradas.
Probó el agente en un conjunto diverso de 49 juegos clásicos de Atari 2600.

Principales resultados:

El agente de red Q profundo superó a todos los algoritmos anteriores en juegos de Atari 2600.
Logró un rendimiento comparable al de los probadores profesionales de juegos humanos en los juegos probados.
Aprendizaje y generalización exitosos demostrados directamente de la entrada visual de alta dimensión.

Conclusiones:

La red Q profunda representa un avance significativo en la inteligencia artificial, permitiendo el aprendizaje a partir de datos sensoriales en bruto.
Este enfoque cierra la brecha entre las entradas y acciones de alta dimensión, creando agentes versátiles.
El éxito del agente en una variedad de tareas desafiantes destaca el potencial del aprendizaje por refuerzo profundo.