Yoshua Bengio: ¿Será el aprendizaje profundo un paso hacia la IA consciente?

Solo puedo ofrecer mi propia opinión. No pretendo hablar por la comunidad de IA / aprendizaje profundo.

Las redes de aprendizaje profundo son el estado actual de la técnica para descubrir las transformaciones (funciones) de alguna entrada a alguna salida para ciertas situaciones (reconocimiento de imágenes, etc.). En esencia, una función captura de manera compacta el rango de comportamiento posiblemente infinito de entrada-salida, simplemente porque estos comportamientos obedecen ciertas leyes matemáticas. En los términos más simples,

[matemáticas] f (X) = Y [/ matemáticas]

donde [math] X \ en R ^ n \; [/ math] y [math] Y \ en R ^ m \; [/ math] son ​​entradas y salidas. El trabajo de DL es descubrir cuál es el mejor modelo posible que capta esta situación o cuál es el mejor [matemática] \; f. [/ Matemática] En la mayoría de los casos, averiguar la [matemática] \; f \; [/ math] no es una posibilidad práctica, si es así, necesariamente llamaríamos a esta función un algoritmo determinista.

Estas son todas las matemáticas que usaré, lo prometo. Usando este modelo simple, el desafío es describir primero la autoconciencia. Si la autoconciencia tiene una descripción funcional, entonces DL puede encontrar un modelo lo suficientemente bueno para ello. Dicho de otra manera, la pregunta es, ¿puedo tener un modelo de cómputo que imite la autoconciencia? Matemáticamente hablando, pienso en la autoconciencia como una máquina de estados no determinista (porque permitiría que varios estados estuvieran activos simultáneamente), que es una abstracción más alta que las funciones. Cada uno de estos estados encapsula un modelo generado por una red DL, y hay salidas de estado activadas por las salidas del modelo. En última instancia, la máquina de estado se vería como una red neuronal mega-DL. Tendré que patentar cómo funcionan exactamente estas máquinas de estado y cómo puede imitar la autoconciencia (es broma … lo de código abierto cuando se valida).

Entonces, sí, DL es un paso hacia la autoconciencia, pero no es un medio en sí mismo. DL es seguramente el bloque de construcción para las matemáticas más elaboradas que eventualmente simularán la autoconciencia.

No existe una verdadera autoconciencia sin el entorno y la retroalimentación continua. Debe tener un modelo de usted mismo, un modelo del mundo y su lugar en él, hacer planes (usar los modelos para predecir el efecto), actuar y, si el efecto no es el que esperaba, debe ajustar los modelos (de usted o el mundo) y luego sus planes.

Solo agregar más capas a un NN no generará una verdadera autoconciencia, necesitamos un ciclo de retroalimentación. Me gusta: me duele un dedo del pie, ¿cómo es que? Bueno, un ladrillo cayó sobre él. ¿Cómo sucedió eso? Bueno, lo dejé caer … Sin ver las consecuencias de nuestras acciones, para que podamos actuar sobre eso (por ejemplo, aprender de él para que podamos hacerlo mejor la próxima vez),

No veo mucho valor en la “autoconciencia” si aún fuera posible tener algo. Tal vez a menos que todo tu cerebro ocupe todo nuestro universo, o al menos use toda la materia y energía en él. Asumiendo que no puedes echar un vistazo a partes de ti mismo desde el exterior, cualquier autoconciencia sería introspectivo y subjetivo. Podría ser estático o cambiante. Pero, ¿cuál sería el punto si no puede actuar en un entorno, aprender, etc.?

More Interesting

¿Tengo que escuchar el curso de aprendizaje automático Coursera de Andrew Ng?

¿Cómo puedo seleccionar todos los archivos que se modifican todos con un día de diferencia en un directorio UNIX?

¿Por qué debería obtener el doble de RAM que la memoria total de mi GPU para construir una plataforma de aprendizaje profundo?

¿Cuál es la diferencia entre clasificación y reconocimiento de patrones?

Cómo encontrar la correlación más fuerte entre los vectores de colores a continuación en MATLAB o Python

¿Qué sigue después del aprendizaje profundo?

¿Por qué es tan fácil el aprendizaje profundo?

¿Cuáles son algunas posibles aplicaciones interesantes del aprendizaje automático?

¿Qué algoritmos de optimización son buenos candidatos para la paralelización con MapReduce?

Construcción del modelo de correlación / regresión: ¿Cuándo debo usar variables dependientes / independientes reales, y cuándo debo usar sus tasas de crecimiento?

¿Qué tan buenas son mis posibilidades de conseguir un trabajo de científico de datos con un doctorado en el campo de la visión por computadora?

¿Es la reducción de dimensionalidad igual que la selección de características? ¿Cómo hacer la selección de características usando PCA en R?

¿Es posible o hay algún documento sobre el ajuste de hiperparámetros usando aprendizaje de refuerzo o regresión?

¿Cuántas muestras de entrenamiento se necesitan para obtener un modelo confiable en ML?

¿Cuáles son algunas razones por las que algunas personas prefieren R y Matlab a Python para el aprendizaje automático?