¿Qué significa un abandono en las redes neuronales?

La deserción es una forma de regularizar la red neuronal. Durante el entrenamiento, puede suceder que las neuronas de una capa particular siempre se vean influenciadas solo por la salida de una neurona particular en la capa anterior. En ese caso, la red neuronal se sobreajustaría.

La deserción previene el sobreajuste y se regulariza cortando aleatoriamente las conexiones (también conocidas como caída de la conexión) entre las neuronas en capas sucesivas durante el entrenamiento.

En la imagen de arriba, las conexiones marcadas como X tienen el peso establecido en cero mientras la información fluye entre las dos capas. Elegimos al azar cuál de las conexiones debe establecerse en cero y esto se hace durante cada paso de entrenamiento. Esto asegura que la red se generalice mejor para los datos de entrada.

Aprendizaje automáticoAprendizaje profundoInteligencia ArtificialRedes neuronales artificiales

Related Content

¿Cuál es el estado del arte en la "audición" de robots?

¿Qué deben saber todos sobre el aprendizaje automático?

¿Hay alguna investigación en ingeniería neuronal en relación con la inteligencia artificial?

¿Cuáles son los requisitos básicos que debo cumplir para ingresar a Stanford para MS en informática en especialización de inteligencia artificial?

¿Hay alguna superposición entre neurociencia / neurología e inteligencia artificial / aprendizaje automático?

¿Cómo contrata la NASA ingenieros informáticos? ¿La universidad a la que fuiste marcó la diferencia?

¿Podemos usar el algoritmo de aprendizaje de refuerzo Q-learning para hacer frente a los nuevos estados del entorno creados?

Abhishek tiene una excelente respuesta.
Me gustaría incluir los siguientes puntos.

La deserción es simplemente una forma de reducir las dependencias en la estructura de la red neuronal.

Alienta a cada neurona a formar su propia representación individual de los datos de entrada.

Este documento lo ayudará a comprender la deserción de una mejor manera.
http://www.cs.toronto.edu/~rsala …

Abhishek Shivkumar

More Interesting

¿Cómo se puede invertir para la próxima revolución de la IA?

Cómo evaluar los sistemas de recomendación de calificación unaria

¿Por qué la convolución de f (t) y DiracDelta (t-1) = f (t-1)?

Cómo fusionar el aprendizaje automático y la teoría de control

¿Cuál es la diferencia entre aprendizaje automático, autoaprendizaje, aprendizaje profundo y aprendizaje de refuerzo?

Cómo hacer la transición de la neurociencia computacional a la inteligencia artificial

¿Hay alguna evidencia de que un porcentaje de la población en la simulación de la Tierra no sea real y qué porcentaje podría reemplazarse mientras se mantiene la ilusión?

¿Cómo puede ser utilizada la inteligencia artificial por el gobierno de la India?

¿Cuál es la diferencia entre el valor umbral y el sesgo en la red neuronal artificial?

¿Por qué la comunidad de IA, incluso las principales empresas líderes, cree en la inteligencia artificial por el cerebro / neurociencia?

¿Los robots nunca serán considerados propiedad? ¿Habrá algún momento en el que los robots tengan derechos legales?

¿Cuándo se convertirán los videojuegos en un "arte"?

¿Es posible realizar una conmutación por error durante un solo ciclo de solicitud-respuesta HTTP sin volver a intentarlo? ¿Puede una máquina recibir una solicitud http y otra responder?

¿Cuál es la mejor manera de aprender robótica completa? ¿Cómo obtengo los conocimientos básicos de robótica para poder construir cualquier tipo de robot?

Si una IA se volviera consciente de sí misma, ¿tendría un ego?

Web Analytics