¿Existe alguna investigación sobre la mutación de una arquitectura de red neuronal durante el entrenamiento?

Además de lo que ya se ha publicado, las redes residuales y las redes de carreteras podrían verse como una forma de esto. La idea es que al incluir las conexiones de mapeo de identidad a cada capa, la red puede sustituir cualquier número de capas con un mapeo de identidad, de modo que durante el entrenamiento la red pueda encontrar su número óptimo de capas.

Para ampliar esto un poco, imagine que entrenamos una red de capa N con alguna forma de conexiones de mapeo de identidad, y que la configuración óptima verdadera es una red de capa X, donde X es menor que N. Luego, durante el entrenamiento, la red puede aprender usar el mapeo de identidad para las primeras capas NX, y luego la configuración óptima en las últimas capas X para producir la red óptima sin un número preseleccionado de capas elegidas por el operador (aparte del límite superior introducido por N).

Teóricamente, cualquier red con N capas debería poder hacer esto, pero las arquitecturas actuales tienden a experimentar grandes dificultades para obligar a esas primeras capas a formar un mapeo de identidad sin las conexiones que están diseñadas para omitir capas.

Sí hay !

Este equipo trabajó en una arquitectura en evolución para redes neuronales recurrentes y convolucionales , y logró resultados de vanguardia, lo cual es increíble. También descubrieron una arquitectura celular recurrente que describen como superior al clásico LSTM , que también sería impresionante si se reprodujera.

Creo que esto es prometedor y no puedo esperar para ver más trabajo sobre esto.

Tenga en cuenta que, sin embargo, tenían recursos masivos : ¡800 GPU! – así que eso no es algo que puedas ejecutar en tu computadora portátil.

El papel:

https://arxiv.org/pdf/1611.01578

Estoy bastante seguro de que estos trabajos se intentaron hace mucho tiempo (última era de las redes neuronales), pero no sé dónde están esos documentos.

Avísame si los encuentras.

Sí, se llama neuroevolución y NEAT / hyper NEAT. Mira el trabajo de Kenneth Stanley en este campo.

More Interesting

¿Cómo sabe el nuevo "cerebro" de Google X qué es un "rostro humano"?

Si estoy interesado en el aprendizaje automático y la inteligencia artificial, ¿es mejor postularse a puestos de ingeniero de software o de ciencia de datos?

¿Quora alguna vez se llenará de usuarios de IA?

Dado un problema de predicción, ¿cuáles son los principios que intervienen en el diseño de una red neuronal para ese problema?

Después de terminar el curso de aprendizaje automático en Coursera. ¿Qué tengo que hacer? ¿Curso de inteligencia artificial sobre edx o tutoriales de aprendizaje profundo?

¿Cuál podría ser la aplicación del aprendizaje automático en la industria de pagos?

¿Las iniciativas de investigación de IA de código abierto acelerarán la interrupción de los empleos y la economía a un ritmo inmanejable?

¿Cuál es el precio de mercado adecuado para un asistente virtual basado en inteligencia artificial?

¿Cuánto de la canción escrita de AI 'Daddy's Car' es realmente el producto de AI?

¿La IA resultará en que las mujeres dominen la programación de computadoras en el futuro lejano?

¿La IA es vulnerable a los hackers? En caso afirmativo, ¿será a prueba de piratas informáticos?

¿Cómo puedo hacer una extensión de Chrome que bloquee la pornografía, las imágenes sexys, violentas y desagradables?

¿Cómo se relacionan la inteligencia humana y el talento humano?

¿Cuál es la próxima gran novedad en la industria del software, aparte de la inteligencia artificial y la robótica?

¿Cómo es usar la nueva aplicación Quora 'escuchando' en los altavoces inteligentes Echo o Home?