¿Una red neuronal artificial hace algo que básicamente no es equivalente a la clasificación?

Hay muchas cosas que no son clasificación. Un claro ejemplo son varios sistemas de secuencia a secuencia, quizás el más famoso de los cuales es el sistema de traducción neural de Google.

Si bien se podría argumentar que las cuentas de prensa son algo exageradas, creo que está bastante claro que hay mucho más que clasificación en curso. El sistema de traducción puede leer en texto arbitrario y producir una traducción en un nuevo idioma. Debido a la escasez de lenguaje, con frecuencia ocurrirá que la oración fuente y la oración objetivo son nuevas en el sistema; nunca antes se habrían visto ni producido.

¿Cómo sabemos que hay algo más que elegir secuencias de palabras? ¿Cómo sería la comprensión real?

Una forma de ver es poner oraciones que significan algo similar en diferentes idiomas, y ver si la representación interna es similar. El sistema de traducción es una configuración de codificador-decodificador, por lo que puede ejecutar el codificador y ver lo que está sucediendo. Aquí está:

Fuente: Traducción Zero-Shot con el sistema de traducción automática neuronal multilingüe de Google

Esto muestra que las oraciones con el mismo significado se asignan a la misma región; está agrupando oraciones por significado. Eso parece muy similar a comprender el significado de algo, dependiendo de lo que entiendas por comprensión.

Entonces sí, más que clasificación. Vea también generación de imágenes, transferencia de estilo, juegos de video y muchos más.

Contestaré eso con una contrapregunta: ¿Hay alguna tarea de procesamiento de información que “fundamentalmente no sea equivalente a la clasificación”?

Uno puede argumentar fácilmente algunos de los ejemplos en las otras respuestas como tareas que teóricamente pueden plantearse como tareas de clasificación.

La traducción de idiomas, por ejemplo, ciertamente puede verse como una tarea de “clasificación”, incluso si no está modelada como tal explícitamente en la mayoría de los enfoques. Si piensa en cada posible oración o párrafo como una clase separada (sí, eso será un gran número de clases), y plantea el problema como clasificar una oración o párrafo de entrada en una de estas clases. Nuevamente, prácticamente, no funcionará … ¡pero “fundamentalmente” la tarea en sí misma es una tarea de clasificación!

Lo mismo para transferir estilos o jugar videojuegos. En realidad, incluso los modelos generativos que mapean una distribución de entrada a una distribución de salida están haciendo “fundamentalmente” una clasificación: dada una cadena aleatoria, ¡clasifíquela en el conjunto de todas las imágenes posibles de 256 × 256! Una vez más, un conjunto muy grande, pero no obstante clasificación.

Si estabas insinuando que esto no es impresionante, ¡entonces trata de encontrar alguna tarea que no sea fundamentalmente clasificación! No se me ocurre nada !! Incluso si puede, significa que un “clasificador universal” ideal puede ser una herramienta de procesamiento de información increíblemente poderosa.

TL; DR: Sí.

Un MLP realmente no hace nada más que clasificaciones de pila y no linealidades, pero los ANN modernos no son MLP.

Las arquitecturas modernas (RNN y CNN al menos) en realidad están construyendo una estructura interna sofisticada para reconocer características de alto nivel en su dominio de datos de entrada.

Estas características están algo vinculadas a las clases de salida, pero la estructura es muy genérica y no está vinculada a esas clases. Es similar a “aprender que existen rayas”, en lugar de “determinar si algo tiene rayas”.

Aparte de eso, se reduce a lo que crees que es “equivalente a la clasificación”. Como un punto muy trivial, los ANN pueden construirse para manejar tareas de regresión, lo que fundamentalmente no es equivalente a la clasificación.

Los ejemplos más complejos como la inferencia sintáctica, la traducción de idiomas y los modelos generativos también están muy lejos de la clasificación.