¿Cómo modifica una red neuronal su peso sin entrar en un efecto de ping-pong?

Estás absolutamente en lo correcto.

Nos ocupamos de esto reduciendo la cantidad de error que se propaga a través de la red. Es por eso que necesitamos muchas muestras para que la red converja a una solución decente y pueda generalizarse.

La forma en que hacemos esto es eligiendo una tasa de aprendizaje , que es un factor multiplicador constante que escala el error a una cantidad menor para evitar que la red oscile. En muchas muestras, la red converge a una solución estable (si los datos contienen una buena señal para la etiqueta, eso es).

Además, podríamos emplear parámetros de control de segundo orden como el impulso para asegurarnos de que el gradiente se mueva en la dirección correcta. Para entender esto, imagine conducir cuesta abajo a alta velocidad. Cuanto más pesado sea su automóvil, menos se descarrilará por pequeños baches en el camino, y posteriormente, los vehículos más livianos son más susceptibles a pequeños descarrilamientos en sus caminos debido a los cambios locales en la elevación. Consulte este enlace para comprender cómo funciona el impulso:

Por qué Momentum realmente funciona

Mire estos enlaces para comprender mejor el aprendizaje de redes neuronales:

Elegir una tasa de aprendizaje

https://openreview.net/pdf?id=Sy…

Puede echar un vistazo al concepto de impulso que minimiza los efectos drásticos de las ‘grandes modificaciones’ inusuales.

Ver CS231n Redes neuronales convolucionales para reconocimiento visual

More Interesting

¿Cuáles son los documentos de lectura obligatoria en AI / ML que trazan los principales desarrollos en el campo en los últimos 50 años?

¿Qué pasa si alguien crea IA sin un interruptor de matar?

¿Cuándo sería posible que los algoritmos de aprendizaje por refuerzo (RL) pudieran aprender ingeniería de software a través de MOOC (cursos en línea abiertos masivos)?

¿Cómo podría la inteligencia artificial mejorar la tecnología agrícola actual?

Si las células 'tontas' individuales independientes pueden agruparse para desarrollar la conciencia y la vida inteligente (es decir, nosotros), ¿por qué los grupos de hormigas ya inteligentes (que ya exhiben un comportamiento grupal inteligente) se convierten en un 'enjambre' inteligente con conciencia cuya inteligencia enana incluso el nuestro?

¿Qué hace que una neurona aprenda? Si no lo sabemos, ¿alguna vez será posible averiguarlo?

¿Qué tan bien maneja Parsey McParseface las oraciones del camino del jardín?

Cómo pasar de la neurociencia cognitiva a la inteligencia artificial / aprendizaje automático

¿Por qué solo se utilizan redes neuronales convolucionales para imágenes, en lugar de otras técnicas de aprendizaje profundo?

¿Por qué nadie ha escrito un traductor de idiomas perfecto?

Si estoy interesado en el aprendizaje automático y la inteligencia artificial, ¿es mejor postularse a puestos de ingeniero de software o de ciencia de datos?

¿Cuáles son algunos problemas abiertos en el aprendizaje automático para geodatos?

¿Cuál es una forma intuitiva de definir 'conocimiento previo' en el contexto del aprendizaje automático bayesiano?

Si se puede programar una IA totalmente autorreprogramada y totalmente sensible, ¿hay alguna forma de evitar que tenga alguna posibilidad de ser maliciosa?

¿Cuántas matemáticas uno debe aprender a tener opciones relativamente amplias en la investigación de ML e IA, como estudiante de doctorado principiante?