¿Puede la regresión logística considerarse robusta para los valores atípicos?

Sí, en comparación con los modelos que son muy sensibles a los valores atípicos, por ejemplo, la regresión lineal (con un costo de mínimos cuadrados).

Veamos algunas fotos. Supongamos que desea clasificar el conjunto de datos 1-d de juguete a continuación. Con la regresión lineal, puede ajustar una línea a los datos, así

y luego asigne todos los valores por debajo de un umbral (digamos, 0.5) a la clase roja y todos los valores por encima de él a la clase azul.

Ahora, un valor atípico en el extremo derecho suprimiría la pendiente de la línea de mejor ajuste, empujando así el límite entre las dos clases considerablemente hacia la derecha.

La regresión logística, por otro lado, puede manejar este valor atípico sin problemas.

Ahora echemos un vistazo más de cerca a la función de pérdida de regresión logística.

[matemáticas] f \ left (\ mathbf {w} \ right) = \ underset {p} {\ sum} \ textrm {log} \ left (1 + e ^ {- y_ {p} \ mathbf {x} _ { p} ^ {T} \ mathbf {w}} \ right) [/ math]

Aquí, supongo que las etiquetas [math] y_ {p} [/ math] están en [math] \ left \ {-1, + 1 \ right \} [/ math]. Tenga en cuenta que esto es equivalente a la pérdida de entropía cruzada donde [math] y_ {p} \ in \ left \ {0,1 \ right \} [/ math].

También tenga en cuenta que tomar el registro de cada sumando en el costo anterior evita el efecto explosivo del exponencial cuando se evalúa en un valor atípico. Entonces, si nos deshacemos de la función de registro, aunque todavía tenemos una función de costo válida

[matemáticas] g \ left (\ mathbf {w} \ right) = \ underset {p} {\ sum} e ^ {- y_ {p} \ mathbf {x} _ {p} ^ {T} \ mathbf {w }}[/matemáticas]

Con una forma más simple de summand, ahora se ha vuelto altamente sensible a los valores atípicos. Es interesante saber que este último costo se usa en realidad en el aprendizaje automático en lo que se llama impulso. Lea más aquí si está interesado.

More Interesting

Nosotros, los humanos, estamos desarrollando IA. Que otros extraterrestres (ET) también desarrollen IA como nosotros. ¿Cómo se encontrarán los dos? Significa IA de humanos y IA de Alians.

¿Cuál es la idea de aprendizaje automático (IA) más elegida para un estudiante universitario?

¿Cuántas matemáticas usas en tu trabajo de aprendizaje automático?

Si utilizáramos el aprendizaje automático para operar los semáforos y el tráfico de los EE. UU. En las principales ciudades, ¿cuánto mejoraría eso la vida diaria?

¿Cómo la inteligencia artificial cambiará los mercados de valores en el futuro?

¿Cómo es posible que los robots humanoides tengan sentimientos y respondan preguntas inteligentes? ¿Por qué crees que Arabia Saudita le dio a Sophia la ciudadanía?

¿Es la "teoría unificada de AI" del MIT realmente un gran avance?

¿Qué tan rápido crearíamos inteligencia artificial inteligente si basamos a toda la sociedad en el diseño de tecnologías de inteligencia artificial?

¿Cuándo podrán las computadoras vencer a los mejores jugadores de póquer heads-up sin límite del mundo?

¿Cómo se puede desarrollar un algoritmo de aprendizaje automático?

¿Qué matemática se necesita para comprender la inteligencia general artificial?

¿Alguien ha planteado la idea de que no hay nada más pequeño que un sistema?

¿Cuál es el mayor error sobre la IA entre las masas en general?

Inteligencia artificial: ¿por qué el aprendizaje profundo solo despegó en la década de 2010 y no antes?

¿Cuáles son los famosos programas de IA sobre ajedrez?