No es el caso de que el inglés sea el único idioma bien investigado. Existe un gran interés en el reconocimiento del árabe y el mandarín del proyecto DARPA Gale, por lo que el árabe está muy bien investigado. El nuevo proyecto IARPA tiene como objetivo apoyar cualquier idioma en la Tierra y se espera que impulse la investigación en el dominio de otros idiomas.
http://www.iarpa.gov/solicitatio…
Los idiomas que ya tienen sistemas y bases de datos muy fuertes son el francés, el alemán y el japonés.
- ¿Alguna vez has construido un robot?
- Richard Muller: ¿Crees que el nacimiento de la verdadera IA es el principio del fin de la humanidad?
- ¿Cómo define "inteligencia" en el contexto de la inteligencia artificial?
- ¿Qué algoritmos crean otros algoritmos? ¿Cómo trabajan?
- Cómo diseñar un jugador de IA para juegos de estrategia en tiempo real como StarCraft usando informática
Del periódico
EL KIT DE HERRAMIENTAS DE RECONOCIMIENTO DEL DISCURSO IBM ATTILA
Hagen Soltau, George Saon y Brian Kingsbury
Las tarifas en 3 idiomas son:
Árabe 7.2% WER
Chino 9.1% CER
Inglés 12.3% WER
Pero es difícil marcar la diferencia únicamente en el lenguaje porque hay muchos otros factores, como la calidad del material de capacitación y evaluación, etc. Y hay problemas específicos del idioma, como los diacríticos en árabe. Algunos idiomas como el español son definitivamente mejores dado que todo lo demás es igual, pero es posible que no haya disponible un gran material de capacitación en español.
No es realmente un problema de investigación si algunos idiomas son mejores para el reconocimiento. Algunos definitivamente lo son, otros no. El enfoque utilizado para construir el sistema ASR utiliza principios fundamentales y funciona para la mayoría de los idiomas.