El camino más corto para comprender:
Paso 0: entiende que una función derivada es visualmente
Paso 1: comprenda qué es la regresión lineal y cómo la derivada de la función de costo con respecto a los pesos ayuda a encontrar los mejores pesos potenciales.
- ¿El aprendizaje de transferencia es adecuado para modelos que pueden tener características de entrada crecientes?
- ¿Existe una relación entre el aprendizaje automático y los procesos estocásticos?
- Cómo leer y comprender trabajos de investigación sobre aprendizaje automático
- ¿Cuál es el mejor algoritmo para implementar un reconocimiento de voz robusto en entornos ruidosos?
- ¿Cuáles son los beneficios y desafíos de hacer una investigación de aprendizaje profundo en la academia, en comparación con la industria?
Paso 2: profundiza un poco más en la regla de la cadena de derivación.
Paso 3: imagine la red neuronal como una regresión logística lineal de cadena múltiple e intente calcular la derivada de la función de costo de red con respecto a los pesos de cada capa.
Paso 4: después de completar los pasos anteriores, tenga en cuenta el hecho de que, al igual que con la regresión logística y cualquier optimización basada en gradientes, esas derivadas solo deben modificar parcialmente los pesos (en función de un llamado “parámetro de tamaño de paso” o mejor denominado universalmente ” tasa de aprendizaje”).
Esperamos darle ideas más intuitivas si lo desea.