¿Se puede dividir un modelo de regresión logística multinomial en modelos de regresión logística binarios separados?

Si los resultados son mutuamente independientes, entonces sí, el método es válido. Si los resultados son mutuamente excluyentes, entonces no, el método no es válido.

Es fácil ver por qué este es el caso. Si tiene tres modelos binarios, la suma de los resultados no necesariamente suma uno. Por lo tanto, los resultados de sus modelos binarios no modelan correctamente la variable dependiente. Puede obtener un resultado como:

  • A: 40%
  • B: 70%
  • C: 5%

Ahora si A, B y C son cosas como:

  • A: le gusta el helado
  • B: quiere un teléfono inteligente
  • C: le gusta ir al cine

Entonces estas probabilidades podrían ser correctas. Sin embargo, si los resultados son:

  • A: compra helado en 30 días
  • B: compra helado entre 30 y 60 días
  • C: compra helado después de 60 días o nada.

Entonces, la salida del modelo no tiene sentido, y es mejor que cree un modelo multinomial que asegure que las predicciones del modelo sumen hasta el 100%.

Analíticamente, sí: si su ejercicio de 3 niveles es válido, la división en 3 ejercicios de clasificación de 2 niveles debería seguir siendo válida. Los contrastes se han utilizado solo para eso.

Sin embargo, el conocimiento del dominio sería necesario para confirmar la validez de los resultados.

No hay ninguna razón estadística por la que no puedas hacerlo, pero no tiene mucho sentido hacerlo. Por ejemplo, tome un resultado típico de regresión mutlinomial como

¿Por quién votaste en 2016 para presidente?

y las opciones de respuesta serían Clinton, Trump, Stein, Johnson, Otros, Ninguno.

Ahora, primero, con 6 opciones, tiene 15 regresiones binomiales. En segundo lugar, puede obtener cualquier estimación del multinomio original.

More Interesting

¿Cómo podemos estimar múltiples parámetros de un clasificador?

¿Mejor ejecución de trabajos de Machine Learning directamente desde Pyspark o integración de scikit-learn en, a través del método de paralelización SparkContext?

¿Es la informática de alto rendimiento un conocimiento esencial para el aprendizaje profundo dado que se trata de una gran red neuronal?

¿Cómo se mejora y mejora la técnica de aprendizaje automático mientras nadie sabe exactamente cómo funciona?

¿Cuáles son los poderes de clasificación sobre la agrupación? ¿Por qué elegiría una clasificación?

Cómo verificar si el objeto de una imagen existe en otra imagen

¿Es una buena idea dejar el aprendizaje automático después de 2 años y estudiar desarrollo web, si me di cuenta de que no soy tan inteligente para todas esas matemáticas de ML?

¿Cuál es la diferencia entre el condicionamiento operante y el aprendizaje de refuerzo?

Aparte del aprendizaje automático, ¿cuáles son algunos campos de la informática que requieren conocimientos matemáticos?

¿Cómo se reduce el tamaño de una red neuronal profunda sin gastar grandes recursos para reentrenarla?

¿Cuáles son las tendencias e investigaciones actuales relacionadas con la red neuronal profunda en los sistemas inteligentes de transporte?

¿Cuál sería su guía para un hombre de 46 años que conoce la programación primaria y está interesado en obtener un conocimiento práctico del aprendizaje automático?

¿Cuál es la diferencia entre la red neuronal y la regresión logística?

¿Por qué se le da tanta atención a xgboost que al aprendizaje profundo a pesar de su ubicuidad en ganar soluciones de Kaggle?

Cómo elegir el parámetro C para SVM