Al calcular los pesos en una red neuronal, ¿por qué multiplica la señal de error por la entrada?

Supongo que se refiere a la regla de actualización de peso que se aplica durante la propagación hacia atrás (la regla delta), que se define como:

[matemáticas] \ Delta w_ {ji} = \ alpha \ times (t_j – y_j) \ times g ‘(h_j) \ times x_ {j} [/ math]

El error proporciona una métrica que mide qué tan lejos está la red de su salida objetivo. A medida que la salida de la red se alinea con la salida objetivo, el error tenderá a cero, lo que significa que la actualización de peso también tenderá a cero. Esto tiene sentido, ya que no queremos cambiar nuestros pesos cuando se minimiza el error. La razón por la cual este valor se multiplica por la entrada (para que el peso se actualice) es porque la entrada representa la cantidad de influencia que este peso particular tiene en la salida de todo el sistema. Si la entrada es relativamente grande, la influencia de esta neurona particular es generalmente más fuerte; y entonces se debe calcular una mayor actualización de peso. Del mismo modo, si la entrada es cero, no hay influencia en la salida de la red y, por lo tanto, no se debe aplicar una actualización de peso.

More Interesting

Los robots persiguen nuestros trabajos. ¿Qué podemos hacer?

¿Por qué me siento como un robot a veces cuando mi cerebro decide cómo voy a hablar?

Cómo comenzar a usar GPU para el aprendizaje profundo

¿Qué lenguaje de programación debo usar para implementar algoritmos de Machine Learning?

¿Podrían usarse las redes neuronales para criar un perro al estilo de un campeón?

Si tuviera un sistema de IA de próxima generación hoy, ¿cómo lo usaría para ganar dinero?

¿Qué otras áreas de aprendizaje automático pueden reemplazar el aprendizaje profundo en el futuro?

¿Qué tan difícil sería crear una IA que escanee automáticamente todas las respuestas, comentarios y ediciones de Quora y las colapse automáticamente e informe al usuario si detecta que son anuncios de spam para piratas informáticos falsos, justo después de que se envían?

¿Qué campos del derecho no se pueden automatizar?

¿Es la inteligencia artificial para la batalla algo bueno o malo?

Cómo construir una red neuronal para el conjunto de datos de lente de película

Si fuera a construir un modelo de IBM Watson basado únicamente en los servicios en la nube existentes, ¿qué servicios usaría para los distintos componentes y cómo los integraría?

Acabo de ingresar a la escuela de posgrado y quiero trabajar en el campo de ML, AI y minería de datos. Tengo un verano antes de que empiecen las clases. ¿Dónde debería comenzar?

Cómo hacerme inteligente

¿Cómo sobreajustar el clasificador de aprendizaje automático? ¿Y cuál debo usar?