¿Cuál es el lugar de las redes neuronales en una arquitectura más amplia de cognición mecánica?

La mayoría de las “arquitecturas cognitivas” están formadas por muchos módulos responsables de los diferentes aspectos del gobierno del agente. En la medida en que las redes neuronales sean buenas para manejar el subproblema de cualquiera de estos módulos, puede reemplazar ese módulo en la arquitectura con una red neuronal. Por ejemplo, el sistema de visión podría reemplazarse con un sistema de red neuronal.

Sin embargo, sospecho que muchos investigadores de aprendizaje profundo encontrarán ese enfoque para insertar módulos desagradable. Uno de los principales impulsos de la comunidad de aprendizaje profundo para construir sistemas de una manera “de extremo a extremo”. Eso significa que la función objetivo final que define el rendimiento de un sistema toca todos los componentes de procesamiento que lo conducen desde la entrada. Es un impulso en contra de tener módulos separados que son responsables de las cosas.

Dado eso, la comunidad de aprendizaje profundo probablemente preferiría idear una arquitectura cognitiva completamente nueva que sea una red neuronal gigante que esté entrenada de una manera totalmente completa. Y en lo que respecta a una función final “objetiva” que define el rendimiento, el modelo de aprendizaje de refuerzo (aprendizaje de refuerzo profundo) es probablemente el tipo de modelo preferido para manejar eso. Por ejemplo, DQN (el agente de juego Atari de DeepMind) no aprende por separado cómo procesar la visión. Más bien, aprende a procesar la visión al servicio de aprender a jugar bien; Cómo maximizar la recompensa.

Espere ver sistemas de aprendizaje de refuerzo profundo cada vez más complejos en el futuro que comiencen a manejar suficientes subproblemas para sentirse como una arquitectura cognitiva en el futuro cercano.