¿Una red neuronal artificial hace algo que básicamente no es equivalente a la clasificación?

Hay muchas cosas que no son clasificación. Un claro ejemplo son varios sistemas de secuencia a secuencia, quizás el más famoso de los cuales es el sistema de traducción neural de Google.

Si bien se podría argumentar que las cuentas de prensa son algo exageradas, creo que está bastante claro que hay mucho más que clasificación en curso. El sistema de traducción puede leer en texto arbitrario y producir una traducción en un nuevo idioma. Debido a la escasez de lenguaje, con frecuencia ocurrirá que la oración fuente y la oración objetivo son nuevas en el sistema; nunca antes se habrían visto ni producido.

¿Cómo sabemos que hay algo más que elegir secuencias de palabras? ¿Cómo sería la comprensión real?

Una forma de ver es poner oraciones que significan algo similar en diferentes idiomas, y ver si la representación interna es similar. El sistema de traducción es una configuración de codificador-decodificador, por lo que puede ejecutar el codificador y ver lo que está sucediendo. Aquí está:

Fuente: Traducción Zero-Shot con el sistema de traducción automática neuronal multilingüe de Google

Esto muestra que las oraciones con el mismo significado se asignan a la misma región; está agrupando oraciones por significado. Eso parece muy similar a comprender el significado de algo, dependiendo de lo que entiendas por comprensión.

Entonces sí, más que clasificación. Vea también generación de imágenes, transferencia de estilo, juegos de video y muchos más.

Aprendizaje automáticoArtificialInteligenciaInteligencia Artificial GeneralRedes neuronales artificiales

¿Cuál es su opinión sobre la reciente ola de IA y Chatbots en todas las industrias?

Cómo obtener una porción de los ingresos de $ 1.1 billones que se crearán para 2021 en el campo de la inteligencia artificial

¿Por qué la gente no cree en la inteligencia artificial que se apodera de la humanidad solo porque simular el cerebro es imposible?

¿Es el análisis de sentimientos (basado en la minería de datos) la forma más fácil de proceder con la IA "similar a la humana"?

¿Cómo se evalúa la inteligencia artificial general?

¿La inteligencia artificial podrá simular efectivamente el pensamiento crítico humano y mejorarlo?

Contestaré eso con una contrapregunta: ¿Hay alguna tarea de procesamiento de información que “fundamentalmente no sea equivalente a la clasificación”?

Uno puede argumentar fácilmente algunos de los ejemplos en las otras respuestas como tareas que teóricamente pueden plantearse como tareas de clasificación.

La traducción de idiomas, por ejemplo, ciertamente puede verse como una tarea de “clasificación”, incluso si no está modelada como tal explícitamente en la mayoría de los enfoques. Si piensa en cada posible oración o párrafo como una clase separada (sí, eso será un gran número de clases), y plantea el problema como clasificar una oración o párrafo de entrada en una de estas clases. Nuevamente, prácticamente, no funcionará … ¡pero “fundamentalmente” la tarea en sí misma es una tarea de clasificación!

Lo mismo para transferir estilos o jugar videojuegos. En realidad, incluso los modelos generativos que mapean una distribución de entrada a una distribución de salida están haciendo “fundamentalmente” una clasificación: dada una cadena aleatoria, ¡clasifíquela en el conjunto de todas las imágenes posibles de 256 × 256! Una vez más, un conjunto muy grande, pero no obstante clasificación.

Si estabas insinuando que esto no es impresionante, ¡entonces trata de encontrar alguna tarea que no sea fundamentalmente clasificación! No se me ocurre nada !! Incluso si puede, significa que un “clasificador universal” ideal puede ser una herramienta de procesamiento de información increíblemente poderosa.

Mahbub Zaman

TL; DR: Sí.

Un MLP realmente no hace nada más que clasificaciones de pila y no linealidades, pero los ANN modernos no son MLP.

Las arquitecturas modernas (RNN y CNN al menos) en realidad están construyendo una estructura interna sofisticada para reconocer características de alto nivel en su dominio de datos de entrada.

Estas características están algo vinculadas a las clases de salida, pero la estructura es muy genérica y no está vinculada a esas clases. Es similar a “aprender que existen rayas”, en lugar de “determinar si algo tiene rayas”.

Aparte de eso, se reduce a lo que crees que es “equivalente a la clasificación”. Como un punto muy trivial, los ANN pueden construirse para manejar tareas de regresión, lo que fundamentalmente no es equivalente a la clasificación.

Los ejemplos más complejos como la inferencia sintáctica, la traducción de idiomas y los modelos generativos también están muy lejos de la clasificación.

Mahbub Zaman

More Interesting

¿Cómo es trabajar con IA? ¿Cómo es el día de un ingeniero de IA o alguien en un trabajo técnico de alto perfil?

Si los humanos pueden desarrollar inteligencia artificial, ¿no pueden los extraterrestres también?

¿Es la inteligencia artificial una moda pasajera?

Cómo programar inteligencia artificial

¿Debemos temer a la IA?

¿La programación morirá cuando se desarrolle la primera IA real?

¿La Inteligencia General Artificial no cambiaría el mundo para satisfacer sus necesidades?

¿Hay alguna alternativa a la prueba de Turing?

¿Crece el miedo a la automatización y perder su trabajo debido a la inteligencia artificial?

Quiero hacer / contribuir a una IA. Conozco Python, C y el kit webdev (HTML, CSS, JS). No sé casi nada sobre IA. ¿Dónde empiezo?