El resultado de una regresión logística es más informativo que otros algoritmos de clasificación. Como cualquier enfoque de regresión, expresa la relación entre una variable de resultado (etiqueta) y cada uno de sus predictores (características).
Eche un vistazo a la salida a continuación de Dataiku DSS para la supervivencia en el problema del Titanic (una clasificación binomial en la que Survived = Yes).
La regresión logística no solo da una medida de cuán relevante es un predictor (tamaño del coeficiente) sino también su dirección de asociación (positiva o negativa).
- ¿Cuál es el orden para aprender a usar los campos aleatorios de Markov para el procesamiento de imágenes?
- ¿Cuál es el papel del análisis de datos exploratorios (EDA) en el aprendizaje automático?
- ¿El aprendizaje automático es un tema torpe?
- Cómo construir una aplicación de Android orientada al aprendizaje automático
- ¿Puedo terminar en trabajos de aprendizaje automático si tengo una maestría en neurociencia?
De manera diferente, un bosque aleatorio (y todas las demás variaciones del método del árbol de decisión) solo le indicarán qué predictores son más importantes para construir los árboles, sin ninguna información sobre la dirección de la asociación.
Una red neuronal artificial , debido a su proceso intrínsecamente multicapa, no proporciona una idea del tamaño ni la dirección de las relaciones entre las entradas y la salida. Es una caja negra.
Después de todo, su decisión sobre qué algoritmo implementar finalmente debe basarse en ROC AUC, precisión, precisión y recuperación. Sin embargo, el resultado de una regresión logística es un subproducto valioso.
En términos prácticos, le ayuda a descubrir relaciones ocultas en sus datos. Probablemente encontrará correlaciones interesantes que tal vez desee probar cuáles de ellas son causales mediante la aplicación de una estrategia de identificación adecuada.