¿Cómo modifica una red neuronal su peso sin entrar en un efecto de ping-pong?

Estás absolutamente en lo correcto.

Nos ocupamos de esto reduciendo la cantidad de error que se propaga a través de la red. Es por eso que necesitamos muchas muestras para que la red converja a una solución decente y pueda generalizarse.

La forma en que hacemos esto es eligiendo una tasa de aprendizaje , que es un factor multiplicador constante que escala el error a una cantidad menor para evitar que la red oscile. En muchas muestras, la red converge a una solución estable (si los datos contienen una buena señal para la etiqueta, eso es).

Además, podríamos emplear parámetros de control de segundo orden como el impulso para asegurarnos de que el gradiente se mueva en la dirección correcta. Para entender esto, imagine conducir cuesta abajo a alta velocidad. Cuanto más pesado sea su automóvil, menos se descarrilará por pequeños baches en el camino, y posteriormente, los vehículos más livianos son más susceptibles a pequeños descarrilamientos en sus caminos debido a los cambios locales en la elevación. Consulte este enlace para comprender cómo funciona el impulso:

Por qué Momentum realmente funciona

Mire estos enlaces para comprender mejor el aprendizaje de redes neuronales:

Elegir una tasa de aprendizaje

https://openreview.net/pdf?id=Sy…

Aprendizaje automáticoAprendizaje profundoArtificialInteligencia ArtificialRedes neuronales artificialesVisión

Related Content

En el aprendizaje automático, ¿cómo podemos interpretar una situación en la que los errores de entrenamiento y prueba son altos? ¿Qué debemos informar a nuestros clientes?

¿Podrían las redes punto a punto seguir utilizándose para resolver problemas de IA?

¿Cómo se relacionan los actos de diálogo con el modelo de agente BDI (Belief Desire Intention)?

¿Cuándo crees que la mayoría de los trabajos manuales serán reemplazados por robots?

¿Cómo procesa el cerebro humano o cualquier cerebro animal la información en comparación con los procesadores informáticos actuales? ¿Cómo pueden los cerebros "codificarse" por sí mismos?

¿Dónde puedo aprender cómo administrar un departamento de electrónica de una gran tienda?

¿Debo eliminar las URL cuando hago el preprocesamiento para un análisis de sentimientos de Twitter?

Puede echar un vistazo al concepto de impulso que minimiza los efectos drásticos de las ‘grandes modificaciones’ inusuales.

Ver CS231n Redes neuronales convolucionales para reconocimiento visual

Cemal Aker

More Interesting

¿Cuáles son los documentos de lectura obligatoria en AI / ML que trazan los principales desarrollos en el campo en los últimos 50 años?

¿Qué pasa si alguien crea IA sin un interruptor de matar?

¿Cuándo sería posible que los algoritmos de aprendizaje por refuerzo (RL) pudieran aprender ingeniería de software a través de MOOC (cursos en línea abiertos masivos)?

¿Cómo podría la inteligencia artificial mejorar la tecnología agrícola actual?

Si las células 'tontas' individuales independientes pueden agruparse para desarrollar la conciencia y la vida inteligente (es decir, nosotros), ¿por qué los grupos de hormigas ya inteligentes (que ya exhiben un comportamiento grupal inteligente) se convierten en un 'enjambre' inteligente con conciencia cuya inteligencia enana incluso el nuestro?

¿Qué hace que una neurona aprenda? Si no lo sabemos, ¿alguna vez será posible averiguarlo?

¿Qué tan bien maneja Parsey McParseface las oraciones del camino del jardín?

Cómo pasar de la neurociencia cognitiva a la inteligencia artificial / aprendizaje automático

¿Por qué solo se utilizan redes neuronales convolucionales para imágenes, en lugar de otras técnicas de aprendizaje profundo?

¿Por qué nadie ha escrito un traductor de idiomas perfecto?

Si estoy interesado en el aprendizaje automático y la inteligencia artificial, ¿es mejor postularse a puestos de ingeniero de software o de ciencia de datos?

¿Cuáles son algunos problemas abiertos en el aprendizaje automático para geodatos?

¿Cuál es una forma intuitiva de definir 'conocimiento previo' en el contexto del aprendizaje automático bayesiano?

Si se puede programar una IA totalmente autorreprogramada y totalmente sensible, ¿hay alguna forma de evitar que tenga alguna posibilidad de ser maliciosa?

¿Cuántas matemáticas uno debe aprender a tener opciones relativamente amplias en la investigación de ML e IA, como estudiante de doctorado principiante?

Web Analytics