¿Las gramáticas de reconocimiento de voz se volverán obsoletas en los próximos 5 años?

“Gramáticas” generalmente implica el equivalente de una lista de todo lo que puede decir (escrito de manera más eficiente que una lista real). Tales gramáticas a veces se usan cuando el rango de cosas que puede decir está limitado por el contexto (por ejemplo, responder a un aviso en un sistema automatizado de servicio al cliente).

Hoy en día, los sistemas de vocabulario más grandes, como Siri, usan gramáticas estadísticas. Un ejemplo es la probabilidad de que una cadena dada de tres palabras ocurran juntas. Por ejemplo, “dos vinos tintos” es más probable que “lloros demasiado leídos” (como en este ejemplo, tales modelos incluso permiten que las palabras que suenan igual sean decodificadas con precisión).

Tales modelos estadísticos no tienden a quedar obsoletos, ya que la mayor parte de su contenido simplemente captura las características de un idioma. Pueden quedar obsoletos si se produce un nuevo uso en el idioma, por ejemplo, una nueva jerga, o si aparece un nuevo vocabulario, por ejemplo, una nueva marca o empresa. Incluso en este caso, un modelo estadístico puede actualizarse mediante un proceso de adaptación con nuevos ejemplos, en lugar de comenzar desde cero.

Pero, en la mayoría de las tecnologías actuales, los nombres de compañías se caracterizan en modelos estadísticos por una categoría, por ejemplo, NOMBRE-COMPAÑÍA o NOMBRE CORRECTO, ya que las palabras o frases en esas categorías se usan de la misma forma gramatical. Luego se puede actualizar el modelo estadístico cuando una nueva compañía o nombre propio entra en uso sin ejemplos. (Aunque los ejemplos pueden permitir ponderar los nombres por frecuencia de uso).

En resumen, los modelos de lenguaje estadístico son robustos incluso cuando no se actualizan, pero se pueden actualizar (y se actualizan) con un esfuerzo mínimo.