¿Podría una red neuronal hacer su propia configuración?

Se ha investigado el uso de una red neuronal para configurar una arquitectura de red neuronal diferente . ¡Google Research tiene una publicación de blog concisa sobre esto! Su método basado en RL se llama “AutoML”, que describo brevemente a continuación:


En AutoML, se utiliza una red de controlador para generar la arquitectura de una red secundaria; la información de rendimiento resultante (de la red secundaria en alguna tarea) se puede usar para ajustar la salida de la red del controlador. Esto da como resultado el siguiente “ciclo de retroalimentación”:

Es bastante interesante comparar arquitecturas generadas por humanos (izquierda, abajo) y aquellas generadas por una red de controladores (derecha, abajo):

Para obtener más información, consulte estos documentos: “Evolución a gran escala de clasificadores de imágenes” (algoritmos evolutivos) [1] y “Búsqueda de arquitectura neuronal con aprendizaje de refuerzo” (RL) [2].

Notas al pie

[1] [1703.01041] Evolución a gran escala de clasificadores de imagen

[2] [1611.01578] Búsqueda de arquitectura neuronal con aprendizaje por refuerzo

Michael Taylor hace un buen trabajo al desglosar la red neuronal por piezas individuales y luego ensamblar cada pieza para usted a medida que comprende su lugar en la red. Existen algunas fórmulas matemáticas para completar la construcción de una red neuronal. Puede sonar demasiado, pero Michael hace un gran trabajo al desglosar la fórmula y explicar por qué se usa y qué función sirve. Cada parte de la construcción de una red de pensamiento libre se explica en pasos fáciles de seguir. Puede aprender a construir una red de IA que aprenda a tomar decisiones basadas en el aprendizaje de redes individuales en lugar de un grupo preestablecido de algoritmos. Si tiene algún interés en las redes neuronales y la inteligencia artificial, le recomendaría leer esta para ayudarlo a comprender mejor su conocimiento del proceso.

Échale un vistazo aquí: crea tu propia red neuronal en Kindle

Esta es una pregunta muy genérica, por lo tanto, será muy difícil de responder.

De todos modos, la intuición es correcta, este es el objetivo ideal al que aspiran todas las personas en el campo.

Nos gustaría que la parte de capacitación también elija la arquitectura de red adecuada y todas las demás configuraciones de acuerdo con nuestros requisitos de rendimiento y precisión.

Hay varias ideas nuevas, como AutoML que utiliza el aprendizaje automático para explorar la red neuronal y otras heurísticas por tareas específicas, pero todavía no estamos allí.

El problema es que la red explotaría rápidamente en complejidad y nunca terminaría. Hay demasiadas opciones.

De todos modos, hacer algo que haga sugerencias sobre qué red y parámetros usar en un caso de uso objetivo es fácil. O configure automáticamente el rango y el número de entradas y salidas, dado un archivo CSV.

La suposición iterativa en los parámetros de entrenamiento se puede automatizar mejor a través de un programa de búsqueda binaria, sin necesidad de una red neuronal.

More Interesting

Después del curso de ML de Andrew Ng, ¿debo hacer el curso de red neuronal de Geoffrey Hinton antes de hacer un aprendizaje profundo? ¿Cuánto conocimiento de redes neuronales es lo suficientemente bueno como para comenzar a hacer un aprendizaje profundo?

¿Cuándo combino algoritmos genéticos con redes neuronales?

¿La prueba de Turing está desactualizada? ¿Se necesita hacer una nueva prueba para validar la sensibilidad de una IA?

¿Cuál será el primer dispositivo en pasar la prueba de Turing?

¿Por qué Python se considera un buen lenguaje para IA y Machine Learning?

¿Crees que la IA puede resolver cualquiera de los problemas del milenio antes que los humanos?

¿Qué tan cerca estamos de tener un robot que limpiará mi habitación?

¿Cómo podría ser útil un robot capaz de verificar los signos vitales de salud?

¿Las preocupaciones relacionadas con la inteligencia sobrehumana que Nick Bostrom aborda en su libro 'Superinteligencia' son relevantes o descabelladas?

¿Cómo comenzar a aplicar el aprendizaje profundo para mis problemas? ¿Cuáles son las mejores / más fáciles herramientas / frameworks para arquitectura profunda?

¿Se automatizará el trabajo de ingeniero de software debido a las máquinas de tural neural y el aprendizaje profundo?

¿Cuál sería el papel del diseño en la era de la inteligencia artificial?

¿Se puede usar la red neuronal de convolución para clasificar las pinturas?

¿Cómo funciona la generación de historias artificiales (automáticas)?

Dadas las imágenes no epipolares en 2D de un objeto desde diferentes vistas (pero solo una parte), ¿cómo hacer que la IA prediga su reposo (modelo 3D completo) como un humano?