¿Son las redes de tipo neuronal el único juego real en la ciudad o podemos desarrollar máquinas sofisticadas de IA que no piensen como los humanos?

Mi cita favorita sobre el tema:

“La cuestión de si las máquinas pueden pensar es tan relevante como la cuestión de si los submarinos pueden nadar”. – Edsger W. Dijkstra

Las máquinas a menudo pueden lograr cosas de una manera que los humanos no pueden. La forma en que Watson responde preguntas no se parece en nada a la forma en que un humano responde preguntas; ni tampoco la forma en que DeepBlue juega al ajedrez como lo hace un humano, pero ambos tuvieron éxito. Tenga en cuenta que Watson utiliza un poco de aprendizaje automático, pero es una parte relativamente pequeña del sistema.

Dada la tecnología actual, no existe un enfoque de red neuronal que pueda superar a Watson.

El estado actual de las redes neuronales es que son muy buenas para clasificar cosas donde hay un millón de ejemplos. Pero los humanos pueden aprender de un solo ejemplo, llamado aprendizaje de una sola vez .

No está claro que sin un gran aumento simbólico u otro, las redes neuronales puedan ir al siguiente paso.

  1. Las redes neuronales no ‘piensan’ como lo hacen los humanos. El hecho es que no sabemos cómo funciona nuestro cerebro, mientras que sabemos cómo funcionan las redes neuronales. Michael I. Jordan llamó a las redes neuronales una “caricatura” del cerebro, e incluso eso podría ser un complemento para las redes neuronales.
  2. Las redes neuronales (aprendizaje profundo) son el juego principal en la ciudad y todos quieren hacerlo porque funciona muy bien. La IA que se ha vuelto tan poderosa en los últimos 5 años se debe en parte al aprendizaje profundo, en parte debido a la informática de la GPU y en parte al aumento de datos. Sin embargo, no creo que el aprendizaje profundo sea el único juego real en la ciudad y tampoco debería serlo. Hay muchos otros algoritmos potentes de aprendizaje automático (modelos gráficos probabilísticos, te estoy mirando) que funcionan muy bien.
  3. Toda la historia del aprendizaje automático ha sido sobre una clase de algoritmos que dominan y luego son reemplazados. Iniciado por sistemas de conocimiento – perceptrones – lógica difusa – redes neuronales – SVM – aprendizaje bayesiano – bosques aleatorios – aprendizaje profundo. No me sorprendería si el aprendizaje profundo deja de ser favorable para un algoritmo más sofisticado, aunque lo más probable es que creo que veremos cierta fusión entre redes neuronales y modelos gráficos probabilísticos / aprendizaje bayesiano y / u otros algoritmos.
  4. No tiene sentido limitar su estudio a una sola clase de algoritmo. Mejor, conviértase en un experto en aprendizaje profundo (o alguna otra clase de algoritmos), pero mantenga una mente abierta y aprenda al menos los conceptos básicos de otros buenos algoritmos.

El juego es real cuando hay muchos jugadores, ¿verdad?

Entonces, tienes razón si asumes que todos quieren usar redes neuronales, porque eso es lo que sucede ahora. Son convenientes, son relativamente fáciles de usar y hay muchos marcos que están listos para hacer todo el trabajo pesado por usted.

Hay un libro que a muchas personas les gusta, “AI: Un enfoque moderno”. No lo veo como un libro muy útil para un investigador porque lo que te dice es principalmente historia. Lo que ya deberías saber si estudias las cosas correctas. Entonces, a pesar de que realmente no puede esperar obtener ideas extraordinarias, aún puede leerlo y, entre algunas historias interesantes, encontrará que no solo no entendemos cómo construir una máquina inteligente, ni siquiera Entiendo cómo pensamos.

He leído muchos libros sobre psicología, filosofía, matemáticas e historia de la IA. El hecho de que podemos hacerlo se conoce al menos desde los años 50 o 60, aunque no se pueden sacar conclusiones confiables sobre si la mente humana se puede replicar en el silicio, se puede leer en la “Nueva Mente del Emperador” de Penrose sobre la capacidad de las computadoras comportarse de la misma manera. Que puede o no ser lo que quieres. Jugar al ajedrez no es inteligencia. Jugar a Go no es inteligencia.

Todo estuvo allí desde el principio. Minsky, von Neumann, McCarthy, Shannon: estas personas, que crearon informática, no sabían sobre el aprendizaje automático (no se inventó en ese momento). Se basaron en la teoría de la computabilidad y una pregunta general:

¿Puede una máquina dar la misma respuesta que un humano a la pregunta que se le hizo?

Puede ser un tema maravilloso para los debates, pero personalmente, no necesito un algoritmo para derramar lágrimas mientras veo a Hachiko para creer que es inteligente. Y aunque las redes profundas tienen sus limitaciones para el alcance de las tareas que pueden resolver, la teoría general de la computabilidad no las tiene.

Por lo tanto, no se trata de “profundidad”, sino de creatividad con las cosas más simples, esa debería ser la solución, y por lo tanto, si bien el aprendizaje profundo definitivamente lo está matando en algunas tareas, no es una solución definitiva para la IA general problema.

La cuestión de intentar copiar sistemas biológicos es que existe la posibilidad de pasar por alto o perderse algo. El atractivo de los modelos de redes neuronales significa que una gran cantidad de trabajo de investigación hoy en día está fuertemente enfocado en la dirección de la bioimimetría y en realidad es una dirección muy válida porque el cerebro humano o el cerebro de los mamíferos son extraordinariamente adaptativos y es importante mirarlos y ver qué tipo de cosas los hace funcionar. Podemos intentar descifrar teorías que luego podamos adaptar a nuestros algoritmos de aprendizaje automático.

Aunque esta imitación tiene un precio de simplificación excesiva, no es posible implementar cada una de las teorías de la neurociencia en un programa de computadora sin complicar demasiado las cosas. Así, en realidad, las redes neuronales artificiales son muy simples en comparación con sus contrapartes biológicas.

Pero no debemos ser felices y empujar demasiado en la dirección de la mímica porque podemos terminar haciendo simulaciones y las simulaciones son computacionalmente intensivas, esto es lo que veo con el aprendizaje profundo. Pero no es del todo malo hacer simulaciones porque a veces es una forma de crear sistemas altamente optimizados. La IA no debería ser solo una simulación porque hay mucho que sucede en los sistemas inteligentes, tanto que estos sistemas deberían ser eficientes, no solo confiar en cálculos paralelos de fuerza bruta, de nuevo veo esto en el aprendizaje profundo.

Por lo tanto, el cerebro biológico tiene más de lo que parece, intentar copiar el hardware biológico puede llevar a un callejón sin salida, pero tratar de copiar los algoritmos en sí mismos puede conducir a una verdadera IA. Por lo tanto, un sistema biológicamente motivado no necesita parecerse estructuralmente a un sistema biológico, sino que debe hacerlo algorítmicamente. Esto se puede explicar aún más al comparar los aviones con las aves, los aviones no aletean las alas, pero la física detrás de un avión y un pájaro son iguales o casi iguales, todo es aerodinámica en el trabajo. Lo mismo se aplica a la IA, de alguna manera hay muchas formas de lograr la IA, pero no todas necesitan “batir las alas”.

Es como diferentes sistemas de hardware que ejecutan el mismo algoritmo, el resultado es el mismo, pero algunos de esos sistemas de hardware son muy adecuados para implementar algoritmos particulares. Esto significa que la eficiencia puede estar en juego si nos equivocamos. La IA no se trata solo de resolver un problema, sino también de qué tan eficientemente se resuelve el problema. Personalmente, siento que el cerebro tiene muchas formas de asegurarse de que sus actividades neuronales sean lo más escasas posible. Por ejemplo, si se observa una cara solo ciertas regiones del cerebro se disparan mientras otras permanecen inactivas, ¿cómo sucede eso? el cerebro implementa de alguna manera algoritmos eficientes en lugar de algunos algoritmos de fuerza bruta.

El cerebro tiene alguna forma de canalizar la señal sensorial entrante a las regiones correctas para la conservación adecuada de la energía. La energía es un recurso escaso en el medio ambiente, por lo que es absolutamente importante que los algoritmos del cerebro sean eficientes por el uso adecuado de la energía.

Dicho esto, ahora está claro que siento firmemente que las redes neuronales no son el único juego real en la ciudad. Hay muchas formas en que un solo algoritmo puede implementarse estructuralmente, esto se debe a que la estructura puede no ser el factor limitante sino el algoritmo. Las neuronas biológicas pueden contar, las computadoras digitales también pueden contar, ese es el mismo algoritmo que se ejecuta en sistemas estructuralmente diferentes. Por lo tanto, la inteligencia es solo un algoritmo que puede ejecutarse en diferentes sistemas de hardware biológicos o no.

Los cerebros biológicos son inteligentes, por lo que las máquinas también pueden ser inteligentes, pero no necesitan ser estructuralmente similares.

Espero que esto ayude.

Solo como un punto de aclaración: las redes neuronales no ‘piensan’ como los humanos, de hecho, no hacen nada como pensar.

Algunas redes neuronales procesan la información de una manera análoga a cómo lo hacen los modelos simplificados de neuronas, pero esto es solo de una manera abstracta y muy general. Algunas redes neuronales procesan la información de maneras tan diferentes de cómo funcionan las neuronas biológicas que tiene mucho sentido (para mí) simplemente darles un nombre diferente y evitar toda la confusión.

Las NN son realmente buenas en algunas cosas (como reconocer dígitos escritos a mano), pero realmente malas en otras.

En términos de resultados, existen otros algoritmos (en particular modelos potenciados por gradientes) que son tan buenos, si no mejores, que las redes neuronales en algunas arenas.

Cada algoritmo tiene sus fortalezas y debilidades, las redes neuronales (de las cuales hay muchos tipos diferentes) no son diferentes.

Los ANN son una herramienta, un motor, pero no la solución completa. Creo que está claro que el futuro está en los sistemas híbridos que utilizan lo mejor de cada tecnología, simbólica y estadística. Simbólico golpeó una barrera en el pasado, pero no hay razón para que no pueda regresar reforzada por las habilidades de manejo de patrones de su tecnología complementaria. Lo he dicho una y otra vez, el problema es la falta de imaginación por parte de investigadores y tecnólogos. Necesitamos más ideas creativas en el campo, no dogmas molidos en las cabezas de los estudiantes por un sacerdocio.