Revisa este papel
Janet M. Baker, Li Deng,
James Glass, Sanjeev Khudanpur,
Chin-Hui Lee, Nelson Morgan y
Douglas O’Shaughnessy
Desarrollos de investigación y direcciones en reconocimiento y comprensión del habla, parte 1
- ¿Para qué se puede utilizar el análisis de la marcha?
- ¿Cómo funciona el algoritmo EM para un modelo mixto que factoriza según un modelo Naive-Bayes?
- Cómo medir el rendimiento de aprendizaje en Q-Learning
- ¿Qué es el filtrado colaborativo en términos simples?
- Cómo entrenar a una CNN con datos insuficientes y no tan buenos
http://dspace.mit.edu/handle/172…
Desarrollos de investigación y direcciones en reconocimiento y comprensión del habla, parte 2
http://dspace.mit.edu/handle/172…
Este artículo fue MINDS 2006–2007 Informe del Speech Understanding Working Group “, uno de los cinco informes que emanan de dos talleres titulados” Reunión de MINDS: Direcciones futuras para la tecnología del lenguaje humano “, patrocinado por la Oficina de Tecnología Disruptiva de los Estados Unidos (DTO).
En cuanto a los últimos años, las actas de la gran conferencia como ICASSP pueden darle la idea. La última se celebró en mayo y los temas más importantes fueron:
- Problema de cóctel y separación de altavoces
- Identificación del orador
- Modelos matemáticos avanzados (campos aleatorios condicionales, etc.)
- Soporte rápido para nuevos idiomas de manera semi-supervisada
- Escasa representación de señal