¿Qué es mejor para la clasificación binaria, softmax bidireccional o regresión logística?

Teóricamente, son lo mismo. Una regresión logística multinomial es una generalización de la regresión logística a las clases C. Vea aquí la buena comparación hecha por John Mount: http://www.win-vector.com/dfiles… (en particular las ecuaciones (3) y (27)). Otra buena fuente de información es la conferencia de Andrew Ng sobre la regresión softmax (http://cs229.stanford.edu/notes/… – en particular p.27 segundo párrafo).

Empíricamente, si profundizamos en algunas implementaciones (OpenNLP, Tsuruoka’s one, Datumbox, etc.), podemos ver que para cada etiqueta tenemos un vector correspondiente de parámetros. Entonces, prácticamente aprendemos dos hipótesis (y no una). Dado que los parámetros de estas dos hipótesis se aprenden de forma interdependiente, creo que podemos esperar que una regresión logística multinomial logre, al menos , el mismo rendimiento que una binomial.

Aprendizaje automáticoRegresión logística

Related Content

¿Qué es un 'descriptor' en el contexto de una transformación de característica invariante de escala (SIFT)?

¿Cuáles son las funcionalidades clave que debe tener una biblioteca NLP mínima?

¿En qué se diferencia LSTM de RNN? En una explicación laica.

¿Cuál es el editor preferido para un tipo de aprendizaje automático que trabaja principalmente en Python?

¿Cuáles son los formatos estándar para compartir datos de aprendizaje automático?

¿Cuál es la diferencia entre la agrupación de texto y la clasificación de texto?

¿Qué recursos debo usar para comenzar a aprender Machine Learning durante el verano con mi educación actual?

More Interesting

¿Cómo funcionan las redes interbancarias?

¿Qué tan difícil es pasar de la optimización aplicada al aprendizaje automático / ciencia de datos?

¿Cómo se debe introducir el gobierno de máquinas?

¿Qué lenguaje de programación se usa para el aprendizaje automático?

Cómo preprocesar el conjunto de datos de correo electrónico de Enron

¿Podría la IA volverse autónoma y aprender y adaptarse de manera no supervisada a través del aprendizaje profundo?

¿Qué importancia tienen las estructuras de datos y los modelos gráficos para el aprendizaje automático?

¿Son los enfoques variacionales estocásticos la forma de hacer ML bayesiano a gran escala o ves alguna esperanza de ampliar los algoritmos basados en MCMC?

¿Cuáles son algunas de las ventajas de usar PyTorch sobre TensorFlow?

¿Cuáles son las tendencias recientes en ML e IA?

¿Cuáles serán las características de la próxima generación de servicios de monitoreo social?

¿Keras admitirá PyTorch como backend en el futuro?

¿Por qué parece que hay capas y capas de significado más profundo ocultas bajo la simple forma de escritura de Ernest Hemingway?

¿Qué significa 'modelado de conjunto'?

¿Cómo usa la NASA el aprendizaje automático?

Web Analytics