¿Cuáles son los grandes problemas de investigación en el reconocimiento de voz hoy?

Revisa este papel

Janet M. Baker, Li Deng,
James Glass, Sanjeev Khudanpur,
Chin-Hui Lee, Nelson Morgan y
Douglas O’Shaughnessy

Desarrollos de investigación y direcciones en reconocimiento y comprensión del habla, parte 1

http://dspace.mit.edu/handle/172…

Desarrollos de investigación y direcciones en reconocimiento y comprensión del habla, parte 2

http://dspace.mit.edu/handle/172…

Este artículo fue MINDS 2006–2007 Informe del Speech Understanding Working Group “, uno de los cinco informes que emanan de dos talleres titulados” Reunión de MINDS: Direcciones futuras para la tecnología del lenguaje humano “, patrocinado por la Oficina de Tecnología Disruptiva de los Estados Unidos (DTO).

En cuanto a los últimos años, las actas de la gran conferencia como ICASSP pueden darle la idea. La última se celebró en mayo y los temas más importantes fueron:

Problema de cóctel y separación de altavoces
Identificación del orador
Modelos matemáticos avanzados (campos aleatorios condicionales, etc.)
Soporte rápido para nuevos idiomas de manera semi-supervisada
Escasa representación de señal

Related Content

¿Qué son las unidades recurrentes cerradas y cómo se pueden implementar con TensorFlow?

¿Cuál es el minimizador de [matemáticas] H [f] = \ sum ^ {N} _ {i = 1} \ | y ^ {(i)} - f (x_i) \ | ^ 2_ {2} + \ lambda \ | Pf \ | ^ 2 [/ math] cuando la salida es un vector?

¿Qué conocimiento debo tener antes de aprender el aprendizaje automático?

Cómo usar un árbol de decisión para construir datos sintéticamente

¿Qué es la estimación de máxima verosimilitud?

¿Cómo puedo encontrar si existe una coincidencia perfecta en un gráfico G?

¿Internet ha hecho que * algunas * personas sean más propensas a examinar críticamente los reclamos, mientras que * otras * personas * menos * sean más propensas a hacerlo?

Construyendo nuevos lenguajes en pequeñas cantidades de datos.

Eche un vistazo a Speechmatics: tecnología de reconocimiento automático de voz que está haciendo grandes cosas en este espacio.

Benedikt von Thüngen

More Interesting

¿De qué manera la empresa promedio utilizará tecnologías de visión por computadora dentro de 20 años?

¿Es cierto que incluso si podemos modelar a partir de la distribución del modelo [matemática] p (x) [/ matemática], el muestreo de importancia óptima no es [matemática] p (x) [/ matemática]?

¿Cuál es la diferencia entre el algoritmo LBG y K significa agrupación?

¿Cuáles son los pasos necesarios para el análisis de sentimientos de las redes sociales?

¿Son todos los problemas de programación cuadrática convexos?

Cómo detectar texto / imágenes en una imagen de documento

¿Cómo validaría un modelo que creó para generar un modelo predictivo de una variable de resultado cuantitativa mediante regresión múltiple?

¿Qué necesito, como principiante, para comprender y construir un modelo generativo como WaveNet?

¿Es justo evaluar una red neuronal profunda solo de acuerdo con su rendimiento en algunos conjuntos de datos específicos?

¿Cuáles son los beneficios de usar el Descenso de gradiente de mini lotes?

¿Cuál es la mejor manera de manejar múltiples brazos en algoritmos de bandidos?

¿Cuál es el mejor tutorial de Python para el aprendizaje automático?

¿Es Siraj Raval el Neil De Grasse Tyson del aprendizaje profundo?

¿Cuáles son los últimos algoritmos de aprendizaje de los vecinos más cercanos? Me refiero a todo lo que se basa en datos, como métodos basados en instancias, kNN, algoritmos de aprendizaje vecinos y métricos, todo en un solo lugar.

¿El aprendizaje automático como campo todavía está en su infancia, o ya es sofisticado y está bien desarrollado?

Web Analytics