A2A.
En 2012, el instituto de investigación Envisioning Technology de Michel Zappa realizó la enorme tarea de predecir qué tecnologías alcanzarán la madurez en el futuro cercano en Envisioning technology 2012 (enlace directo al PDF infográfico: http://static1.squarespace.com/s…). Si bien después de 4 años muchas predicciones son sorprendentemente correctas o incluso conservadoras, las predicciones del procesamiento del lenguaje natural parecen estar apagadas. Lo cual está bien, los esfuerzos por manejar el lenguaje natural se han subestimado desde los primeros intentos en la década de 1940.
Además de la falta de hardware, el problema general con el lenguaje natural ha sido históricamente una I + D costosa; hoy, el financiamiento de Silicon Valley es más generoso que nunca y creo que esto eventualmente nos llevará al punto de inflexión. Mi opinión sobre las predicciones en la infografía anterior:
- ¿Qué es una norma de lotes en el aprendizaje automático?
- ¿Cuáles son las tendencias en el desarrollo de la interfaz computadora humana?
- ¿Cuáles son las ventajas del desenfoque gaussiano, el desenfoque mediano y el filtro bilateral?
- ¿Cuál es la diferencia entre la teoría de simulación por computadora del Universo y el diseño inteligente?
- Estoy considerando cambiar el backend de una aplicación a formatos web semánticos. ¿Qué tipo de impacto en el rendimiento puedo esperar en comparación con el uso de un sistema RDB?
- Reconocimiento de voz : alta precisión del 90% o precisión humana para los principales idiomas. Ya está bastante cerca de la mayoría del hardware y, en mi opinión, solo tomará una toma de ingeniería más creativa (o la proliferación de hardware compatible con ASR) en lugar de una revisión general de la arquitectura. Creo que para ese momento, incluso los problemas más difíciles como el efecto Cóctel se resolverán.
- Interpretación del lenguaje natural (o comprensión del lenguaje natural): ya existen soluciones existentes, pero la comprensión genérica y humana tomará algunos años. 2025 podría ver eso resuelto.
- Traducción automática : ya está resuelto para contenido disponible públicamente en idiomas de nivel 1; Sin embargo, la traducción entre idiomas con estructura diferente, contenido que no está disponible públicamente e idiomas con poca cantidad de datos disponibles, será mucho más difícil de resolver. 2018 es demasiado optimista; No creo que se resuelva completamente en 2025.
- Análisis de sentimientos . Mientras que el análisis de sentimiento “binario” (positivo / negativo) generalmente está en un nivel “suficientemente bueno”, tomará otra década llevarlo a un nivel humano; en lo que respecta al Análisis de Sentimiento Basado en Aspectos, tomará más tiempo y no estará disponible “de barril” en 2025 para otros idiomas que no sean los principales.
El mayor problema con la PNL es más o menos como con la distribución de la riqueza: lleva un tiempo “llegar” a los idiomas menos comercialmente interesantes. La investigación cuesta dinero y hasta ahora los costos de I + D no son triviales. Es por eso que habrá más herramientas y software de PNL disponibles para los idiomas más comunes, y 2025 todavía tendrá grandes agujeros en la cobertura de los idiomas hablados por una población más pequeña.