La respuesta a esta pregunta depende mucho de cómo defina los problemas de aprendizaje automático “ordinarios”. Si por “ordinario”, se refiere al conjunto de problemas que pueden resolverse mediante el aprendizaje estándar supervisado y no supervisado, diría que la mayoría de los problemas de PNL encajan perfectamente en esa definición. Por ejemplo:
- La traducción automática es uno de los problemas difíciles de la PNL con los que hemos tenido un gran éxito recientemente. Todos los enfoques de vanguardia, como el sistema de traducción automática neuronal de Google [1] utilizan un enfoque de aprendizaje supervisado.
- Los problemas de clasificación de texto, por ejemplo, detección de spam, análisis de sentimientos, etc., que son probablemente los problemas de PNL más comunes que existen, se resuelven utilizando métodos de aprendizaje supervisados ”ordinarios”.
- Aprender incrustaciones de palabras, como word2vec o glove word word, es simplemente una forma no supervisada de convertir palabras a sus representaciones vectoriales (aunque algunos argumentan que es un aprendizaje débilmente supervisado [2])
La principal diferencia entre NLP y otros problemas de Machine Learning es el dominio con el que trabaja, es decir, el texto. Es difícil trabajar con texto o idioma, especialmente inglés, debido a su ambigüedad inherente, y eso hace que los problemas de PNL sean bastante difíciles de resolver. Pero incluso a ese respecto, no creo que los problemas de PNL sean fundamentalmente más o menos desafiantes que los problemas de aprendizaje automático en otros dominios “naturales” como las imágenes, el video o el habla.
Notas al pie
- ¿Por qué la radiología no puede hacerse completamente por IA?
- ¿Qué debería aprender a continuación si me gustan las estructuras de datos y los algoritmos?
- ¿Qué le preguntarías a un mentiroso que imita un comportamiento honesto para juzgar si es un mentiroso?
- ¿Cómo puede una computadora calificar ensayos?
- ¿Por qué API AI no es de código abierto?
[1] https://arxiv.org/pdf/1609.08144…
[2] He visto esto muchas veces que las personas afirman que word2vec no está supervisado. Pero …