¿Cuáles son los grandes problemas de investigación en el reconocimiento de voz hoy?

Revisa este papel

Janet M. Baker, Li Deng,
James Glass, Sanjeev Khudanpur,
Chin-Hui Lee, Nelson Morgan y
Douglas O’Shaughnessy

Desarrollos de investigación y direcciones en reconocimiento y comprensión del habla, parte 1

http://dspace.mit.edu/handle/172…

Desarrollos de investigación y direcciones en reconocimiento y comprensión del habla, parte 2

http://dspace.mit.edu/handle/172…

Este artículo fue MINDS 2006–2007 Informe del Speech Understanding Working Group “, uno de los cinco informes que emanan de dos talleres titulados” Reunión de MINDS: Direcciones futuras para la tecnología del lenguaje humano “, patrocinado por la Oficina de Tecnología Disruptiva de los Estados Unidos (DTO).

En cuanto a los últimos años, las actas de la gran conferencia como ICASSP pueden darle la idea. La última se celebró en mayo y los temas más importantes fueron:

  • Problema de cóctel y separación de altavoces
  • Identificación del orador
  • Modelos matemáticos avanzados (campos aleatorios condicionales, etc.)
  • Soporte rápido para nuevos idiomas de manera semi-supervisada
  • Escasa representación de señal

Construyendo nuevos lenguajes en pequeñas cantidades de datos.

Eche un vistazo a Speechmatics: tecnología de reconocimiento automático de voz que está haciendo grandes cosas en este espacio.

More Interesting

¿De qué manera la empresa promedio utilizará tecnologías de visión por computadora dentro de 20 años?

¿Es cierto que incluso si podemos modelar a partir de la distribución del modelo [matemática] p (x) [/ matemática], el muestreo de importancia óptima no es [matemática] p (x) [/ matemática]?

¿Cuál es la diferencia entre el algoritmo LBG y K significa agrupación?

¿Cuáles son los pasos necesarios para el análisis de sentimientos de las redes sociales?

¿Son todos los problemas de programación cuadrática convexos?

Cómo detectar texto / imágenes en una imagen de documento

¿Cómo validaría un modelo que creó para generar un modelo predictivo de una variable de resultado cuantitativa mediante regresión múltiple?

¿Qué necesito, como principiante, para comprender y construir un modelo generativo como WaveNet?

¿Es justo evaluar una red neuronal profunda solo de acuerdo con su rendimiento en algunos conjuntos de datos específicos?

¿Cuáles son los beneficios de usar el Descenso de gradiente de mini lotes?

¿Cuál es la mejor manera de manejar múltiples brazos en algoritmos de bandidos?

¿Cuál es el mejor tutorial de Python para el aprendizaje automático?

¿Es Siraj Raval el Neil De Grasse Tyson del aprendizaje profundo?

¿Cuáles son los últimos algoritmos de aprendizaje de los vecinos más cercanos? Me refiero a todo lo que se basa en datos, como métodos basados ​​en instancias, kNN, algoritmos de aprendizaje vecinos y métricos, todo en un solo lugar.

¿El aprendizaje automático como campo todavía está en su infancia, o ya es sofisticado y está bien desarrollado?