Si su calidad de audio es decente, resulta que puede hacerlo bastante bien con modelos simples y algo de procesamiento de señal. La gran cantidad de estructura en el lenguaje humano hace que bastantes tareas de PNL sean sorprendentemente fáciles.
Utilicé la clasificación de acento estadounidense vs británico como una tarea de referencia en mi tesis de pregrado. Estaba tratando de hacer un aprendizaje profundo y un descubrimiento de funciones sin supervisión, pero, si lo único que le importa es la clasificación de acento, puede hacerlo bastante bien sin hacer nada elegante. [1]
Para el enfoque de procesamiento de señales de la vieja escuela, consulte: http://www.isca-speech.org/archi… y http://linguistics.byu.edu/class…
- Es a tiempo parcial Ph.D. ¿En CSE es una opción práctica si no puede dejar su trabajo?
- ¿Cuáles son algunas buenas áreas de investigación en informática en IIT Kanpur?
- ¿Cuáles son los principales departamentos de investigación en informática en la India?
- Cómo comenzar el trabajo de investigación sobre aprendizaje automático y cómo puedo elegir un tema o problema en el aprendizaje automático
- A partir de mayo de 2014, ¿qué tan madura es la investigación en aprendizaje profundo?
Para un enfoque más moderno (y, en mi opinión, más fresco), consulte: http://www.mendeley.com/research…
[1] Puedes tocar la tesis si quieres, pero realmente no deberías: http://stanford.edu/~danjr89/the…