¿Cómo tratan SVM y ANN los valores atípicos?

La variante de margen duro de SVM, que no trata con valores atípicos, es la siguiente:

[matemáticas] \ displaystyle \ min_w \ frac {1} {2} \ | w \ | ^ 2 [/ matemáticas]

S t

[matemáticas] y_i (w ^ Tx_i + b) \ geq 1 [/ matemáticas]

Es decir, desea encontrar el avión con el margen máximo de modo que cada punto de entrenamiento se clasifique correctamente con un margen de al menos 1. Esto claramente no maneja los valores atípicos, como se puede ver en el siguiente ejemplo:

Podemos obtener un hiperplano mucho mejor descuidando ese punto atípico rojo. Esto se maneja por extensión al margen suave:

[matemáticas] \ displaystyle \ min_w \ frac {1} {2} \ | w \ | ^ 2 + C \ sum_i \ xi_i [/ ​​math]

S t

[matemáticas] y_i (w ^ T x_i + b) \ geq 1 – \ xi_i [/ ​​matemáticas]

[matemáticas] \ xi_i \ geq 0 [/ matemáticas]

Es decir, se le permite tener algunos puntos clasificados incorrectamente o clasificados con un margen inferior a 1, pero por cada punto, paga un precio en la función objetivo, lo que le impide hacerlo con demasiada frecuencia. Controlar C equivale a controlar valores atípicos: una C baja implica que permitimos más valores atípicos, una C alta implica que permitimos menos valores atípicos.


En las ANN, generalmente no hay un manejo explícito de los valores atípicos. Esencialmente, no tiene restricciones que requieran que todas las etiquetas coincidan correctamente. Por lo general, minimiza alguna función de pérdida (como la pérdida euclidiana entre la etiqueta pronosticada y la etiqueta verdadera, o la pérdida de entropía cruzada) que es baja cuando los puntos se clasifican correctamente y alta cuando se clasifican incorrectamente. Por lo tanto, la red intenta automáticamente hacer coincidir tantas etiquetas como sea posible, y los valores atípicos tienen un efecto relativamente bajo en el entrenamiento. Esto es análogo al SVM de margen blando, donde cero [matemática] \ xi_i [/ ​​matemática] corresponde al punto correctamente clasificado y alta [matemática] \ xi_i [/ ​​matemática] corresponde a un punto clasificado incorrectamente.

El manejo de valores atípicos nuevamente se reduce a una regularización adecuada: si no permite modelos muy complejos, entonces la red solo puede adaptarse bien a la mayor parte de los datos y debe funcionar mal en los valores atípicos; Si permite modelos muy complejos, se ajustará tanto a la mayor parte de los datos como a los valores atípicos.


Fuente de la imagen: SVM: ¿márgenes duros o blandos?

More Interesting

¿Qué tipo de trabajo, como ingeniero de software, me apoyaría más para convertirme en Ingeniero / Investigador de Aprendizaje Automático más adelante en mi carrera?

¿Cómo se mejora y mejora la técnica de aprendizaje automático mientras nadie sabe exactamente cómo funciona?

¿El proceso gaussiano supone que sus covarianzas se mantienen constantes?

¿Cómo implementa una red neuronal de retroalimentación la propagación inversa?

Quiero aprender a extraer datos de un sitio web. ¿Donde debería empezar?

¿Qué se sabe sobre la detección de incertidumbre o vacilación en el texto en lenguaje natural (no en el habla)?

¿La programación de Python es suficiente para el aprendizaje automático o deberíamos aprender R también?

¿Cuáles son algunos ejemplos de traducción horrible, realizada por máquina / software?

¿Cómo es Octave el mejor lenguaje utilizado para el aprendizaje automático?

¿Las redes neuronales convolucionales funcionan de la misma manera que las redes en nuestro cerebro?

Cómo evaluar la reciente eliminación de recomendaciones para usar hilo dental

¿Cuál es el análisis de opinión en el caso de TripAdvisor? ¿Como funciona?

¿Por qué la minería de datos con aprendizaje automático no implica pruebas de hipótesis estadísticas?

¿Qué algoritmo sería bueno para asignar una probabilidad a la coincidencia de dos nombres (John Doe = Mr. Jonathan M Doe II)?

¿Cuáles son los 10 mejores algoritmos de minería de datos o aprendizaje automático? En 2006, la Conferencia IEEE sobre minería de datos identificó los 10 algoritmos principales. ¿Siguen siendo válidos?