La mayoría de las “arquitecturas cognitivas” están formadas por muchos módulos responsables de los diferentes aspectos del gobierno del agente. En la medida en que las redes neuronales sean buenas para manejar el subproblema de cualquiera de estos módulos, puede reemplazar ese módulo en la arquitectura con una red neuronal. Por ejemplo, el sistema de visión podría reemplazarse con un sistema de red neuronal.
Sin embargo, sospecho que muchos investigadores de aprendizaje profundo encontrarán ese enfoque para insertar módulos desagradable. Uno de los principales impulsos de la comunidad de aprendizaje profundo para construir sistemas de una manera “de extremo a extremo”. Eso significa que la función objetivo final que define el rendimiento de un sistema toca todos los componentes de procesamiento que lo conducen desde la entrada. Es un impulso en contra de tener módulos separados que son responsables de las cosas.
Dado eso, la comunidad de aprendizaje profundo probablemente preferiría idear una arquitectura cognitiva completamente nueva que sea una red neuronal gigante que esté entrenada de una manera totalmente completa. Y en lo que respecta a una función final “objetiva” que define el rendimiento, el modelo de aprendizaje de refuerzo (aprendizaje de refuerzo profundo) es probablemente el tipo de modelo preferido para manejar eso. Por ejemplo, DQN (el agente de juego Atari de DeepMind) no aprende por separado cómo procesar la visión. Más bien, aprende a procesar la visión al servicio de aprender a jugar bien; Cómo maximizar la recompensa.
- ¿Cuál es el mejor algoritmo para descubrir características bien correlacionadas?
- ¿El aprendizaje automático o los algoritmos de aprendizaje se pueden aplicar a problemas de optimización?
- ¿Qué cobran por hora los contratistas en aprendizaje automático?
- ¿Cuáles son las relaciones entre el aprendizaje automático, el aprendizaje profundo, el aprendizaje supervisado y el aprendizaje no supervisado?
- ¿Cuáles son las diferentes áreas donde los bancos pueden usar NLP (procesamiento del lenguaje natural) para mejorar las operaciones comerciales?
Espere ver sistemas de aprendizaje de refuerzo profundo cada vez más complejos en el futuro que comiencen a manejar suficientes subproblemas para sentirse como una arquitectura cognitiva en el futuro cercano.