Una función de costo no minimiza el error de los pesos. De hecho, no entiendo lo que quieres decir con “error de los pesos”. Una función de costo mide el error de toda su red neuronal . Cuanto más pequeño sea, mejor estará su red neuronal realizando su tarea dada. Por lo tanto, lo que debe intentar minimizar es la función de costo en sí .
Respondí a esta pregunta con una explicación de qué son y cómo funcionan, lo que puede ser útil para usted ya que menciona que tiene problemas para comprenderlos.
Sin embargo, realmente no entiendo lo que quieres decir con “dónde implementarlo”. Si quiere decir en qué parte del código real, necesitaría saber qué está usando (es decir, lenguaje de programación, cualquier biblioteca). En general, debe implementar su gradiente con respecto a la salida y usar el algoritmo de retropropagación con esto para calcular los gradientes del costo con respecto a cada uno de los pesos y sesgos, y luego actualizar cada uno de ellos con un pequeño múltiplo de sus gradiente (esto es descenso en gradiente). También implementaría y evaluaría la función de costo de vez en cuando para medir la precisión de su red neuronal.
- ¿Qué piensan los investigadores de IA del artículo 'Microsoft Research ve una reducción de la brecha de innovación en el aprendizaje profundo'?
- ¿Merecería la pena buscar un Sistema de Información de Gestión (MIS) y un doble de estadísticas?
- ¿Cómo Amazon echo y Alexa generan un potencial de $ 10 mil millones para 2020?
- ¿Cuáles son las nuevas áreas de investigación en aprendizaje automático especialmente relacionadas con la analítica y la minería de datos?
- ¿Cómo está transformando la inteligencia artificial la profesión jurídica?
No recomiendo probar todo esto hasta que comprenda la teoría. Hacerlo por primera vez es un desafío (lo fue para mí), incluso con una sólida comprensión teórica.