Esta página ha sido traducida por una máquina. Otras páginas pueden seguir apareciendo en inglés. View in English

Máquina vectorial de soporte doble de bolas granulares con datos de Universum

  • 0Department of Computer Science and Engineering, Indian Institute of Technology Ropar, Rupnagar, 140001, Punjab, India.

Resumen

Este resumen es generado por máquina.

La máquina vectorial de soporte doble de bola granular con datos de universo (GBU-TSVM) mejora la precisión y la robustez de la clasificación. Este nuevo enfoque modela los datos como hiperbolas, mejorando el rendimiento en conjuntos de datos ruidosos y superando a los métodos existentes.

Área De La Ciencia

  • Aprendizaje automático
  • Minería de datos
  • Reconocimiento de patrones

Sus Antecedentes

  • Las máquinas vectoriales de soporte (SVM) a menudo luchan con datos etiquetados limitados y son sensibles al ruido y los valores atípicos.
  • Las máquinas vectoriales de soporte doble convencionales (TSVM) representan los datos como puntos, lo que limita su robustez y eficiencia.
  • Los métodos existentes carecen de estrategias efectivas para manejar los datos ruidosos y aprovechar la información sin etiqueta o fuera de la clase.

Objetivo Del Estudio

  • Introducir la máquina vectorial de soporte gemelo de bola granular con datos de universo (GBU-TSVM) como un marco de clasificación sólido.
  • Mejorar el rendimiento de los TSVM mediante la integración de la computación de bolas granulares y los datos de Universum.
  • Mejorar la precisión de la clasificación y la eficiencia computacional, especialmente en presencia de ruido y datos etiquetados limitados.

Principales Métodos

  • Modelado de instancias de datos como hiperbolas en lugar de puntos dentro del marco TSVM.
  • Utilizando la computación de bolas granulares para un agrupamiento efectivo de datos y una complejidad de procesamiento reducida.
  • Incorporación de datos de Universum (muestras fuera de las clases objetivo) para refinar los límites de la decisión y mejorar la generalización.

Principales Resultados

  • GBU-TSVM logró una precisión del 92,38% en el conjunto de datos de Molec Biol Promoter en condiciones óptimas.
  • El modelo mantuvo una precisión del 89,17% incluso con una contaminación acústica del 20%, lo que demuestra una robustez significativa.
  • GBU-TSVM consistentemente superó a los modelos de referencia, incluidos GBSVM, TSVM, GBTSVM, Pin-GTSVM y UTSVM en los experimentos.

Conclusiones

  • GBU-TSVM ofrece un marco de clasificación superior y robusto para entornos de datos desafiantes.
  • La integración de la computación de bolas granulares y los datos de Universum mejora significativamente el rendimiento de SVM.
  • Este enfoque proporciona una dirección prometedora para el desarrollo de modelos de aprendizaje automático más resistentes y precisos.

Videos de Conceptos Relacionados

Classification of Systems-II 01:31

240

Continuous-time systems have continuous input and output signals, with time measured continuously. These systems are generally defined by differential or algebraic equations. For instance, in an RC circuit, the relationship between input and output voltage is expressed through a differential equation derived from Ohm's law and the capacitor relation,

Discrete-time systems have input and output signals at specific intervals, defined at distinct instants by difference equations. An example...

Aggregates Classification 01:29

380

Aggregate classification is generally based on its size, petrographic characteristics, weight, and source. Size classification ranges from coarse to fine aggregates, defined by the size of the particles. Coarse aggregates are particles that do not pass through ASTM sieve No. 4, and aggregates that pass through the sieve are fine aggregates.
Petrographic classification groups aggregates based on common mineralogical characteristics. Some of the common mineral groups found in aggregates are...

End Point Prediction: Gran Plot 01:07

580

A Gran plot is used to predict the equivalence volume or endpoint of a potentiometric or acid-base titration without reaching the endpoint. Typically, titration data is collected as a function of the titrant's volume up to a point less than the equivalence volume and then transformed into a linear format. The straight line is extended to the x-axis, indicating the necessary titrant volume to achieve the equivalence point.
For potentiometric titration, the Gran plot is created by plotting...

Sequence Networks of Rotating Machines 01:24

140

A Y-connected synchronous generator, grounded through a neutral impedance, is designed to produce balanced internal phase voltages with only positive-sequence components. The generator's sequence networks include a source voltage that is exclusively in the positive-sequence network. The sequence components of line-to-ground voltages at the generator terminals illustrate this configuration.
Zero-sequence current induces a voltage drop across the generator's neutral impedance and other...

Classification of Systems-I 01:26

294

Linearity is a system property characterized by a direct input-output relationship, combining homogeneity and additivity.
Homogeneity dictates that if an input x(t) is multiplied by a constant c, the output y(t) is multiplied by the same constant. Mathematically, this is expressed as:

Additivity means that the response to the sum of multiple inputs is the sum of their individual responses. For inputs x1(t) and x2(t) producing outputs y1(t) and y2(t), respectively:

Combining homogeneity and...

Quantifying and Rejecting Outliers: The Grubbs Test 01:02

2.0K

Sometimes, a data set can have a recorded numerical observation that greatly  deviates from the rest of the data. Assuming that the data is normally distributed, a statistical method called the Grubbs test can be used to determine whether the observation is truly an outlier.  To perform a two-tailed Grubbs test, first, calculate the absolute difference between the outlier and the mean. Then, calculate the ratio between this difference and the standard deviation of the sample. This...