¿Por qué todos están interesados ​​en las redes neuronales profundas ahora cuando otros sistemas de inteligencia artificial como las máquinas LISP fueron promocionados y no pudieron obtener una gran adopción en el pasado?

Yo diría que si bien el “aprendizaje automático” (ML) y las “redes neuronales” (NN) parecen estar en el campo de la “inteligencia artificial” (IA), en realidad no lo son.

ML y NN son metodologías estadísticas para crear un modelo que toma entradas y genera salidas. De alguna manera, ML y NN pueden considerarse un enfoque numérico de fuerza bruta , aunque se utilizan técnicas inteligentes para reducir el espacio de búsqueda.

La IA tiende a ser más una metodología que usa símbolos . Una de las grandes fortalezas de Lisp es poder manejar símbolos y listas . Entonces, problemas como la demostración de teoremas es un problema que involucra símbolos que ML no podría resolver.

Ahora, hay problemas que se consideraron AI pero que eran demasiado difíciles de resolver, pero ahora son accesibles usando ML. Algunos ejemplos:

  • Traducción de idiomas. El viejo concepto era que era posible crear algún tipo de representación simbólica intermedia en la que un lenguaje pudiera transformarse dentro y fuera. Ahora, se hace con el uso de fuerza bruta de muchos datos y trucos de alineación.
  • Visión por computador. El viejo enfoque era tratar de encontrar entidades (como segmentos de línea) en la imagen. El nuevo enfoque es lanzar muchas imágenes que consisten en datos de píxeles en NN.
  • Sistemas basados ​​en reglas. El viejo enfoque era crear de alguna manera reglas (a menudo de expertos en dominios) para predecir algo. El nuevo enfoque es dejar que ML encuentre las correlaciones estadísticas. A menudo, el resultado de ML no se puede interpretar fácilmente (como un conjunto de reglas).

La conclusión: ML ha demostrado ser una solución práctica para muchos problemas, mientras que la IA tuvo un éxito práctico limitado.

Creo que la razón es que las redes neuronales y los algoritmos genéticos están entrenados y producen resultados interesantes incluso si se aplican de manera teórica o práctica, mientras que otros enfoques requieren mucho esfuerzo por parte de un experto en el campo para producir resultados igualmente interesantes o útiles. Es notoriamente difícil traducir un campo de conocimiento a un lenguaje de inferencia de IA como LISP o lógicas difusas, pero para las redes neuronales puede ser suficiente tener un marco preestablecido para confrontar un conjunto de datos mínimamente adaptado para comenzar a obtener algunos resultados. Además, las redes neuronales prometen ser completas ya que pueden producir resultados a datos que no han visto antes y esos resultados pueden ser correctos, mientras que los sistemas basados ​​en lenguaje solo pueden producir respuestas estándar sin respuesta cuando se les presentan datos fuera de su alcance programado. Esto sucede con los Elizas: un LISP Eliza tiene una serie de respuestas preestablecidas para seguir avanzando en la conversación, incluso si una declaración no tiene ningún significado para Eliza, con la esperanza de que un humano caiga en ella y la reconozca como una respuesta significativa. Un generador de voz de red neuronal, en cambio, puede inventar respuestas nuevas y diferentes a material nunca antes visto fuera de su alcance del tren que incluso puede ser significativo para el ser humano interactivo y tener algún significado de asociación de tierra. Los sistemas basados ​​en el lenguaje solo pueden adaptarse y ** aprender ** con la ayuda de un mantenedor, en cuyo caso el nuevo contenido tendrá una garantía casi significativa, mientras que las redes neuronales y los algoritmos genéticos pueden adaptarse y ** aprender ** automáticamente sin intervención humana, concebible, y producir al menos nuevos resultados no muy malos para el menor esfuerzo. Entonces, la diferencia está en el esfuerzo necesario para producir resultados, un enfoque requiere esfuerzos directos mientras que el otro enfoque puede ser semi o totalmente automatizado.

Las otras respuestas tocan algunos puntos importantes, pero me gustaría agregar algunos de mis pensamientos aquí.

Tenga en cuenta que las redes neuronales profundas son realmente una exageración. El aprendizaje automático ha existido y ha sido exitoso durante bastante tiempo, pero en los últimos años ha habido mucha atención de los medios a las redes neuronales profundas. Esto hace que muchas personas se interesen, específicamente jóvenes estudiantes o personas nuevas en el campo. Dado que esto se publicita como la próxima gran cosa (y los medios solo informan historias de éxito, no los muchos experimentos fallidos), a muchas de estas personas les parece que los DNN son mágicos: puedes usarlos para resolver cualquier problema. Se convierte en su martillo: denles cualquier problema y tratarán de resolverlo utilizando DNN.

Simplemente mire en Quora para ver cuántas preguntas hay del tipo “¿Cómo empiezo con los DNN?”, “¿Cuál es el mejor lenguaje para los DNN?”, “¿Cómo usaría un DNN para resolver este problema?”.

Un problema clave con los DNN es que el análisis teórico aún es bastante limitado. Diseñar una buena arquitectura es más un arte que una ciencia, y regularmente se agregan nuevas técnicas a la caja de herramientas DNN.

Para tener una carrera exitosa en ML, creo que es importante estudiar una gran cantidad de técnicas esencialmente diferentes, y conocer al menos los conceptos básicos y algunas propiedades cruciales de cada uno. Sin embargo, muchos estudiantes ven esto sin importancia ya que se les ha dado la impresión de que los DNN son la única técnica que vale la pena estudiar.

Cuando se ven afectadas las limitaciones de los DNN (o cuando tienen que implementar un sistema en el que los expertos en la materia requieren un modelo interpretable por el ser humano), estarán perdidos y tendrán que aprender sobre otras técnicas.

Para mí, trataré los DNN como una herramienta útil en mi colección de herramientas de ML, bueno saber, útil para tareas particulares, menos útil para otros. Hice lo mismo para los sistemas basados ​​en LISP y la lógica difusa.

More Interesting

¿Qué tiene de especial Extreme Learning Machine (ELM) de manera que se celebre una conferencia exclusivamente para su estudio?

¿Puedes hacer un chatbot patentado usando API.AI?

Como principiante, ¿qué curso es mejor tomar edx sobre robótica, robots móviles autónomos o debajo de robots accionados?

Cómo crear e implementar un modelo de aprendizaje en un robot

¿Cómo afectará a la industria india de TI si abandonan su mentalidad basada en el servicio y comienzan a construir productos basados ​​en inteligencia artificial y aprendizaje automático?

¿Cuál crees que sería el futuro? cyborgs, inteligencia artificial u otra cosa?

¿Debo dominar las matemáticas / IA para comenzar a trabajar en un proyecto de reconocimiento facial?

¿Cuáles son los documentos de lectura obligatoria en AI / ML que trazan los principales desarrollos en el campo en los últimos 50 años?

En pocas palabras, ¿cómo se hace el aprendizaje automático con imágenes?

¿Crees que la IA reemplazará al médico y al dentista?

¿Cómo se relacionan la inteligencia humana y el talento humano?

Si alguna vez inventamos Robots inteligentes como humanos, ¿cuestionarán nuestra capacidad de crear algo inteligente mientras cuestionamos la existencia y el poder de Dios?

¿Cómo sabremos cuando hayamos creado la conciencia en una computadora?

¿Cuándo comenzaron las personas a referirse a los sistemas expertos como 'AI' y a llamar a lo real 'AGI'?

¿Existe un modelo de juguete para el aprendizaje automático?