Esta página ha sido traducida por una máquina. Otras páginas pueden seguir apareciendo en inglés. View in English

FADEL: Aprendizaje conjunto mejorado por el aumento de características y la discretización

  • 0Department of Computer Science and Engineering, National Sun Yat-sen University, Kaohsiung 804, Taiwan.

|

|

Resumen

Este resumen es generado por máquina.

FADEL, una nueva arquitectura de aprendizaje automático, mejora el reconocimiento de la clase minoritaria mediante la integración de la conciencia de tipo de característica y la discrecionalización supervisada. Este enfoque mejora el rendimiento del modelo sin aumento de datos, superando a los métodos tradicionales en conjuntos de datos desequilibrados.

Área De La Ciencia

  • Aprendizaje automático
  • Inteligencia artificial
  • Ciencia de los datos

Sus Antecedentes

  • Las técnicas de aumento de datos como SMOTE y CTGAN son frecuentes para la clasificación desequilibrada, pero pueden introducir sesgo, ruido y sobrecarga computacional.
  • Los métodos existentes pueden conducir a un exceso de ajuste, una reducción del rendimiento predictivo y un aumento de los riesgos de ciberseguridad.

Objetivo Del Estudio

  • Introducir FADEL, una nueva arquitectura diseñada para superar las limitaciones del aumento de datos en la clasificación desequilibrada.
  • Mejorar el reconocimiento de las clases minoritarias y la estabilidad del modelo sin depender del equilibrio o la ampliación a nivel de datos.

Principales Métodos

  • FADEL integra el conocimiento del tipo de característica con una estrategia de discretización supervisada.
  • Emplea un marco de conjunto de aumento de características único que procesa características continuas y discretizadas simultáneamente.
  • La arquitectura enruta dinámicamente los conjuntos de características a modelos básicos compatibles.

Principales Resultados

  • FADEL logró un 90,8% de recuerdo y un 94,5% de G-media en un conjunto de pruebas internas, sin aumento de datos.
  • En un conjunto de validación externa, FADEL mantuvo un recuerdo del 91,9% y una media de G del 86,7%.
  • Los resultados superaron a los métodos convencionales de ensamblaje entrenados en conjuntos de datos equilibrados por CTGAN.

Conclusiones

  • FADEL ofrece una solución robusta para el desequilibrio de clase extrema utilizando el aumento de características, superando los enfoques de aumento de datos.
  • La arquitectura demuestra una estabilidad superior, eficiencia computacional y generalizabilidad interinstitucional.
  • Proporciona una alternativa práctica al aumento de datos tradicional para problemas de clasificación desequilibrados.