Esta página ha sido traducida por una máquina. Otras páginas pueden seguir apareciendo en inglés. View in English

Mejorar el aprendizaje de los complejos datos desequilibrados y superpuestos de varias clases mediante el mapeo en una dimensión superior utilizando SVM+

  • 0Department of Computer Science, University of Gujrat, Gujrat, Pakistan.

|

|

Resumen

Este resumen es generado por máquina.

Este estudio presenta SVM ++, un nuevo enfoque de máquina vectorial de soporte (SVM) para mejorar el rendimiento de la clasificación de clases múltiples. SVM ++ aborda efectivamente los datos desequilibrados y las muestras superpuestas, mejorando la precisión del clasificador en conjuntos de datos complejos.

Área De La Ciencia

  • Aprendizaje automático
  • Ciencias de la computación
  • Ciencia de los datos

Sus Antecedentes

  • Los clasificadores tradicionales luchan con problemas de varias clases debido a muestras desequilibradas y superposición de datos.
  • Estos problemas degradan la eficiencia del clasificador, especialmente con el aumento del número de clases y los atributos superpuestos.
  • Los efectos combinados de los datos desequilibrados y las muestras superpuestas reciben poca atención en la investigación.

Objetivo Del Estudio

  • Introducir SVM++, un algoritmo modificado de Support Vector Machine (SVM), diseñado para mejorar la clasificación de varias clases.
  • Abordar los desafíos planteados por conjuntos de datos desequilibrados y atributos de muestra superpuestos en modelos de aprendizaje automático.
  • Mejorar el rendimiento del clasificador en escenarios con distribución desigual de muestras y estructuras de datos complejas.

Principales Métodos

  • El algoritmo SVM ++ propuesto implica un proceso de tres pasos: dividir los datos en conjuntos superpuestos y no superpuestos.
  • El algoritmo-2 clasifica aún más los datos superpuestos en regiones críticas-1 y críticas-2, identificando muestras problemáticas.
  • Se emplea una nueva función de mapeo del núcleo, que mejora el SVM tradicional al mapear muestras críticas-1 a una dimensión más alta basada en métricas de distancia.

Principales Resultados

  • SVM ++ demostró un rendimiento superior en comparación con los clasificadores de última generación en treinta conjuntos de datos del mundo real.
  • El algoritmo manejó efectivamente conjuntos de datos con diferentes grados de desequilibrio de la muestra y superposición de atributos.
  • El método propuesto mejoró significativamente la precisión de la clasificación en escenarios difíciles de varias clases.

Conclusiones

  • SVM ++ ofrece una solución robusta para los problemas de clasificación de varias clases plagados de datos desequilibrados y superposición de muestras.
  • El mapeo mejorado del núcleo y la estrategia de particionamiento de datos son clave para mejorar el rendimiento de SVM ++.
  • Esta investigación pone de relieve la importancia de abordar el desequilibrio y la superposición de datos combinados para el desarrollo efectivo de clasificadores.

Videos de Conceptos Relacionados

Classification of Systems-II 01:31

240

Continuous-time systems have continuous input and output signals, with time measured continuously. These systems are generally defined by differential or algebraic equations. For instance, in an RC circuit, the relationship between input and output voltage is expressed through a differential equation derived from Ohm's law and the capacitor relation,

Discrete-time systems have input and output signals at specific intervals, defined at distinct instants by difference equations. An example...

Classification of Systems-I 01:26

296

Linearity is a system property characterized by a direct input-output relationship, combining homogeneity and additivity.
Homogeneity dictates that if an input x(t) is multiplied by a constant c, the output y(t) is multiplied by the same constant. Mathematically, this is expressed as:

Additivity means that the response to the sum of multiple inputs is the sum of their individual responses. For inputs x1(t) and x2(t) producing outputs y1(t) and y2(t), respectively:

Combining homogeneity and...

Aggregates Classification 01:29

381

Aggregate classification is generally based on its size, petrographic characteristics, weight, and source. Size classification ranges from coarse to fine aggregates, defined by the size of the particles. Coarse aggregates are particles that do not pass through ASTM sieve No. 4, and aggregates that pass through the sieve are fine aggregates.
Petrographic classification groups aggregates based on common mineralogical characteristics. Some of the common mineral groups found in aggregates are...

Multi-input and Multi-variable systems 01:22

149

Cruise control systems in cars are designed as multi-input systems to maintain a driver's desired speed while compensating for external disturbances such as changes in terrain. The block diagram for a cruise control system typically includes two main inputs: the desired speed set by the driver and any external disturbances, such as the incline of the road. By adjusting the engine throttle, the system maintains the vehicle's speed as close to the desired value as possible.
In the absence...

Multiple Regression 01:25

3.2K

Multiple regression assesses a linear relationship between one response or dependent variable and two or more independent variables. It has many practical applications.
Farmers can use multiple regression to determine the crop yield based on more than one factor, such as water availability, fertilizer, soil properties, etc. Here, the crop yield is the response or dependent variable as it depends on the other independent variables. The analysis requires the construction of a scatter plot...

Associative Learning 01:27

572

Associative learning is a fundamental concept in behavioral psychology, wherein a connection is established between two stimuli or events, leading to a learned response. This process is critical in understanding how behaviors are acquired and modified. Conditioning, the mechanism through which associations are formed, can be divided into two main types: classical conditioning and operant conditioning, each elucidating different aspects of associative learning.
Classical conditioning, also known...