¿Cómo funciona la propagación hacia atrás en la red neuronal convolucional?

Sugeriría comprender cómo funciona Backpropagation en una red neuronal simple (con capas completamente conectadas). Como se sugiere en la otra respuesta, el libro en línea de Michael Nielson y el curso de Andrew Ng sobre Coursera (Lección 5) son realmente buenos puntos de partida. Por supuesto, la conferencia de Andrej Karpathy sobre Backpropagation también es sorprendente.

Entonces, para explicarlo en términos simples: en Backpropagation, encontramos el gradiente de pérdida y lo propagamos hacia atrás a través de las capas, actualizando los pesos que lo usan. Y para esto, es mejor comprender cómo funciona la regla de cadena de diferenciación en Backpropagation.

Puede leer más sobre esto aquí en mi artículo: Convoluciones y propagaciones posteriores – Pavithra Solai – Medio

Para resumir el artículo:

Consideremos una capa convolucional simple con una matriz de entrada X y un filtro F con una salida O. Y si L es la pérdida, entonces el gradiente de pérdida de la siguiente capa será ∂L / ∂O . Ahora, necesitamos encontrar gradientes de la pérdida con respecto a F y X – ∂L / ∂F y ∂L / ∂X . ∂L / ∂F se usa para actualizar el filtro F. ∂L / ∂X se usa para propagar el gradiente de pérdida a la capa anterior.

Siga mi artículo anterior para ver cómo se calculan ∂L / ∂F y ∂L / ∂X .

Aprendizaje automáticoAprendizaje profundoInteligencia Artificialneuronales convolucionalesRedesRedes neuronales artificiales

Related Content

¿Qué pasos de procesamiento previo recomendaría para un aprendizaje automático exitoso en un conjunto de datos MNIST?

¿Puedo ser un ingeniero de aprendizaje automático con habilidades en desarrollo web y móvil?

¿Cuál es el propósito de visualizar las capas de activación en una arquitectura de red neuronal convolucional?

¿Cómo se diseñan las redes neuronales artificiales y qué teoremas académicos las respaldan?

¿Cómo se puede interpretar el teorema de Bayes en términos de inferir relaciones causales en los datos?

¿Quién inventó el nombre de Olivia?

¿Por qué mi computadora portátil se vuelve más lenta con el tiempo?

Hay dos recursos muy buenos sobre esto.

El libro en línea de Michael Nielsen en Redes neuronales y aprendizaje profundo. Explica desde lo básico como si estuviera enseñando propagación hacia atrás a un laico.

En segundo lugar, CS231n: Redes neuronales convolucionales para el reconocimiento visual. Las conferencias están disponibles en youtube. Además, lea las notas del curso escritas por el gran Andrej Karpathy.

Pavithra Solai Jawahar

More Interesting

Cómo integrar el marco Tensorflow con XGBoost

¿Cuál es su experiencia de aprendizaje automático en el mundo real en Haskell?

¿Qué programa de maestría de aprendizaje automático en UCL debería elegir?

¿Cuál es la diferencia entre ML y NLP?

¿Cómo funcionan AdaGrad / RMSProp / Adam cuando descartan la dirección del degradado?

Ahora mismo estoy aprendiendo desarrollo web, pero no creo que me sea muy útil. ¿Debo aprender el aprendizaje automático o el desarrollo de software?

¿Cómo se aplica la validación cruzada a la regresión logística? Quiero evaluar la precisión de un modelo de regresión logística en un conjunto de datos.

¿Cuál es el papel de la función de activación en una red neuronal? ¿Cómo funciona esto en un sistema de red neuronal humana?

Cómo usar el aprendizaje automático para identificar patrones en la trama de series de tiempo

¿Cómo califica Kaggle los envíos?

¿Cómo determinar el refuerzo lateral en la pila? ¿Cuáles son las especificaciones simplificadas?

¿En qué se diferencia el método de agrupamiento en el aprendizaje automático de disparar una consulta SQL 'select' para agrupar personas u objetos? ¿Cuáles son las diferencias y necesidades reales?

¿Dónde empiezo a aprender reconocimiento de imágenes con algoritmos de aprendizaje automático?

¿Qué es una explicación intuitiva para PCA?

Cómo implementar el reconocimiento de imágenes para crear una aplicación para organizar imágenes

Web Analytics