¿La pérdida de softmax es igual a la pérdida de entropía cruzada?

Técnicamente no porque “pérdida de softmax” no es realmente un término correcto, y “pérdida de entropía cruzada” sí lo es. Entonces, la pérdida de entropía cruzada es realmente el término correcto para describir la función: [matemáticas] – \ log \ left (\ frac {e ^ {f_ {y_i}}} {\ sum_j e ^ {f_ {j}}} \ right) [/ math]

El clasificador softmax es un clasificador lineal que utiliza la función de pérdida de entropía cruzada . En otras palabras, el gradiente de la función anterior le dice a un clasificador softmax cómo actualizar exactamente sus pesos usando algo como el descenso del gradiente.

En resumen, no son lo mismo. Sin embargo, las personas usan el término “pérdida de softmax” cuando se refieren a “pérdida de entropía cruzada” y, como saben lo que significan, no hay razón para corregirlas de manera molesta. Debido a que se usan indistintamente, los dos términos son efectivamente iguales.

Curso de redes neuronales convolucionales de Stanford sobre el clasificador Softmax

Related Content

Además de las universidades mejor clasificadas (# 1-20), ¿qué otra universidad ofrece un buen programa de maestría en informática con especialización en IA / ML en EE. UU.?

¿Por qué a veces vanilla SGD y Momentum superan a los optimizadores como AdaDelta en el aprendizaje profundo?

¿Cuál es el lugar de las redes neuronales en una arquitectura más amplia de cognición mecánica?

¿Por qué no reescalamos el vector de coeficiente de una regresión de lazo?

¿Por qué la regresión logística se considera robusta a los valores atípicos en comparación con un método de mínimos cuadrados?

¿Cuáles son los mejores software de aprendizaje automático de código abierto para reconocimiento facial?

¿Cuál es el mejor enrutador para el hogar?

No. Softmax es un tipo de capa de activación y está dada por

lo que nos permite interpretar las salidas como probabilidades, mientras que la pérdida de entropía cruzada es lo que usamos para medir el error en una capa softmax, y está dada por [1]

Notas al pie

[1] Clasificación de red neuronal, datos categóricos, activación de Softmax y error de entropía cruzada

Akaash Agarwal

More Interesting

¿Alguien puede resolver este ejemplo de algoritmo EM?

¿El aprendizaje automático no supervisado basado en la agrupación de datos también determina automáticamente la cantidad de agrupaciones?

¿En qué se diferencia un autoencoder (apilado) de un MLP, aparte de que los autoencoders aprenden funciones de identidad aproximadas?

¿Por qué debería obtener el doble de RAM que la memoria total de mi GPU para construir una plataforma de aprendizaje profundo?

¿Qué es la regularización neta elástica en el aprendizaje automático?

¿Cuáles son los documentos más importantes en el aprendizaje activo?

¿Qué debo hacer para que los cursos de aprendizaje automático sean más divertidos y pospongan las cosas?

¿Cómo debe prepararse para un programa de maestría / doctorado centrado en la inteligencia artificial?

¿Cómo se puede mejorar Google News?

¿La variable de tiempo muestra una conexión recurrente en RNN?

¿Cómo se implementa la funcionalidad de verificación de spam mediante el aprendizaje automático?

¿Qué tan útil es un trabajo cuantitativo en Goldman Sachs para un doctorado posterior en Machine Learning?

¿Funcionaría la búsqueda de 'colocaciones' de orden superior?

¿Qué debo elegir para mi tesis en Machine Learning?

¿Cómo están revolucionando las redes neuronales convolucionales la visión por computadora?

Web Analytics