¿Cuál es la diferencia entre skip, mirilla y conexiones residuales en redes neuronales?

ResNet y sus bloques residuales constituyentes obtienen sus nombres del ‘residual’, la diferencia entre los valores predichos y los objetivos. Los autores de ResNet utilizaron el aprendizaje residual de la forma H (x) = F (x) + x. Simplemente, esto significa que incluso en el caso de no residual, F (x) = 0, aún conservaríamos un mapeo de identidad de la entrada, x. El residual aprendido resultante permite que nuestra red no haga peor teóricamente (que sin ella).

Las conexiones residuales y las conexiones de salto se usan indistintamente . Estos tipos de conexiones pueden omitir varias capas (consulte la página 4 del documento original de ResNet), no solo una. En resumen, las conexiones residuales se utilizan para hacer que las redes más profundas sean más fáciles de optimizar. [1]

Las conexiones de mirilla redirigen el estado de la celda como entrada a las puertas de entrada, salida y olvido de LSTM. Puede explorarlos en detalle leyendo los documentos originales del profesor Felix Gers [2] [3]. Estas conexiones se utilizan para aprender tiempos precisos.

Notas al pie

[1] https://arxiv.org/pdf/1512.03385…

[2] http://www.jmlr.org/papers/volum…

[3] http: // ftp: //ftp.idsia.ch/pub/ju…

Related Content

¿Tendremos inteligencia artificial de alto nivel para 2100?

¿Crees que se puede construir un lenguaje de programación muy alto que elija para los desarrolladores las estructuras de datos más apropiadas para el código que han escrito?

¿Una IA avanzada vería la religión como un virus?

¿Por qué el aprendizaje profundo funciona tan bien en el mundo real?

Inteligencia artificial en juegos: ¿cuán complejas son las IA más básicas en los juegos?

¿De qué maneras la IA puede reemplazar las actividades de gestión?

¿Cómo se puede evaluar la inteligencia?

Una conexión de omisión en una red neuronal es una conexión que omite una capa y se conecta a la siguiente capa disponible.

Una conexión residual es aquella que se conecta a la capa anterior.

Arjoonn Sharma

More Interesting

¿Cómo hacer un juego de Slenderman basado en texto? Más específicamente, ¿cómo puedo darle a Slenderman una IA?

¿Cuáles son algunos libros para convertirse en un profesional de aprendizaje automático?

¿Puede AI enojarse?

Inteligencia artificial: ¿Qué tan inteligentes son las mejores personas en inteligencia artificial, en comparación con las mejores personas en matemáticas y física?

¿Todos los robots tienen IA?

¿Cómo se podría cambiar el nombre de AI como 'inteligencia acelerada'?

¿Qué crm usa la inteligencia artificial?

¿Cómo usa Tesla las millas recorridas en cada automóvil para entrenar su piloto automático AI?

¿Cómo elegir la red neuronal para proyectos? ¿Qué red neuronal debo usar para detectar el equipaje abandonado usando el aprendizaje autodidacta?

¿Es apropiado utilizar el aprendizaje automático para encontrar la distribución de probabilidad aproximada de sus datos?

¿Cuáles son las bibliotecas de aprendizaje automático basadas en Python más populares?

¿Cuál es la diferencia entre la arquitectura de red neuronal y el algoritmo de red neuronal?

¿Cuáles son algunos hechos desconocidos sobre Cortana?

¿Qué es una lista de experimentos mentales con IA?

¿Hasta dónde cree que hemos llegado para lograr la inteligencia artificial?

Web Analytics