Las formas “clásicas” de aprendizaje profundo incluyen varias combinaciones de módulos de retroalimentación (a menudo redes convolucionales) y redes recurrentes (a veces con unidades de memoria, como LSTM o MemNN).
Estos modelos tienen una capacidad limitada para “razonar”, es decir, para llevar a cabo largas cadenas de inferencias o procedimientos de optimización para llegar a una respuesta. El número de pasos en un cálculo está limitado por el número de capas en las redes de retroalimentación, y por el tiempo que una red recurrente recordará cosas.
Para que los sistemas de aprendizaje profundo puedan razonar, necesitamos modificarlos para que no produzcan una sola salida (por ejemplo, la interpretación de una imagen, la traducción de una oración, etc.), pero pueden producir un conjunto completo de salidas alternativas ( por ejemplo, las diversas formas en que se puede traducir una oración). Para esto están diseñados los modelos basados en energía: darle un puntaje para cada posible configuración de las variables a inferir. Una instancia particular de los modelos basados en energía son los gráficos de factores (modelos gráficos no probabilísticos). La combinación de sistemas de aprendizaje con gráficos de factores se conoce como “predicción estructurada” en el aprendizaje automático. Ha habido muchas propuestas para combinar redes neuronales y predicción estructurada en el pasado, desde principios de la década de 1990. De hecho, el sistema de lectura de cheques que mi colega y yo construimos en los Laboratorios Bell a principios de la década de 1990 usó una forma de predicción estructurada sobre redes convolucionales que llamamos “Redes de Transformadores Gráficos”. Ha habido una serie de trabajos recientes sobre pegar modelos gráficos sobre ConvNets y entrenar todo de extremo a extremo (por ejemplo, para la estimación de la postura del cuerpo humano y demás).
Para una revisión / tutorial sobre modelos basados en energía y predicción estructurada sobre redes neuronales (u otros modelos), vea este documento: https://scholar.google.com/citat…
- ¿Por qué es tan difícil hacer una IA de bot altamente inteligente como GLaDOS, una que sea artificialmente 'consciente'?
- ¿Cómo debe un aspirante a programador de IA crear una cartera?
- ¿Cuáles son los peligros de la inteligencia artificial?
- Si en 2024 alguien pone a un bebé con un traje y una máscara de realidad virtual (Tierra), ¿son reales las personas y los animales con IA?
- ¿Por qué los marcos de aprendizaje automático convergen con diferentes resultados de precisión al comparar entre diferentes procesadores?
El aprendizaje profundo es ciertamente limitado en su forma actual, porque casi todas sus aplicaciones exitosas utilizan el aprendizaje supervisado con datos anotados por humanos. Necesitamos encontrar formas de entrenar redes neuronales grandes a partir de datos “sin anotar” en bruto para que capturen las regularidades del mundo real. Como dije en una respuesta anterior, mi dinero está en entrenamiento contradictorio.