Aprendizaje por Refuerzo Federado Offline | JoVE Visualize

Área de la Ciencia:

Inteligencia Artificial
Aprendizaje Automático
Informática Médica

Sus antecedentes:

La medicina personalizada requiere regímenes de tratamiento dinámico, que a menudo utilizan el aprendizaje por refuerzo offline (RL).
El intercambio de datos sanitarios sensibles entre instituciones está restringido debido a preocupaciones de privacidad y heterogeneidad de datos específica del sitio.
Los métodos existentes luchan por utilizar eficazmente los conjuntos de datos distribuidos para desarrollar estrategias de tratamiento sólidas.

Objetivo del estudio:

Desarrollar un novedoso marco de RL federado offline que aborde la privacidad y la heterogeneidad en los datos sanitarios multisitio.
Permitir el análisis de características a nivel de sitio dentro de un modelo unificado.
Diseñar un algoritmo eficiente en comunicación para optimizar regímenes de tratamiento dinámico.

Principales métodos:

Se propuso un modelo de proceso de decisión de Markov multisitio que acomoda efectos de sitio tanto homogéneos como heterogéneos.
Se desarrolló el primer algoritmo de optimización de políticas federadas para RL offline con complejidad de muestra garantizada.
El algoritmo requiere solo una ronda de comunicación a través del intercambio de estadísticas resumidas.

Principales resultados:

El algoritmo propuesto de RL federado offline demuestra garantías teóricas sobre la suboptimización de la política, comparable a los escenarios de datos centralizados.
Simulaciones extensas confirman la efectividad del algoritmo en el aprendizaje de políticas óptimas.
El método se aplicó con éxito a un conjunto de datos de sepsis multisitio.

Conclusiones:

El RL federado offline es un enfoque viable para la medicina personalizada con datos sanitarios privados y distribuidos.
El algoritmo propuesto ofrece una solución eficiente y efectiva para la optimización de regímenes de tratamiento multisitio.
Este trabajo facilita la aplicación clínica de técnicas avanzadas de RL en entornos sanitarios del mundo real.