¿Cuánto trabajo se ha hecho para identificar acentos algorítmicamente?

Si su calidad de audio es decente, resulta que puede hacerlo bastante bien con modelos simples y algo de procesamiento de señal. La gran cantidad de estructura en el lenguaje humano hace que bastantes tareas de PNL sean sorprendentemente fáciles.

Utilicé la clasificación de acento estadounidense vs británico como una tarea de referencia en mi tesis de pregrado. Estaba tratando de hacer un aprendizaje profundo y un descubrimiento de funciones sin supervisión, pero, si lo único que le importa es la clasificación de acento, puede hacerlo bastante bien sin hacer nada elegante. [1]

Para el enfoque de procesamiento de señales de la vieja escuela, consulte: http://www.isca-speech.org/archi… y http://linguistics.byu.edu/class…

Para un enfoque más moderno (y, en mi opinión, más fresco), consulte: http://www.mendeley.com/research…

[1] Puedes tocar la tesis si quieres, pero realmente no deberías: http://stanford.edu/~danjr89/the…

Si te refieres a identificar el acento en los recursos de lenguaje hablado, se ha realizado mucho trabajo durante la campaña de evaluación de Reconocimiento de Idioma Hablado de NIST ( http://www.itl.nist.gov/iad/mig/ …). Principalmente, esta campaña no tenía la intención de estudiar el problema del acento, sino, además, la identificación del idioma y, a veces, la distinción entre varios hablantes de acuerdo con su localización geográfica (por ejemplo, inglés de las Indias o inglés de los EE. UU.). Pero la pregunta de acento es un tema de este trabajo de NIST y puede encontrar documentos interesantes y descripciones de prototipos relacionados con el problema de acento aquí.

El laboratorio del MIT Lincoln trabaja mucho en este tema (también en el aspecto dialectal). Puede encontrar una página especializada relacionada con publicaciones sobre este tema aquí http://www.ll.mit.edu/mission/co

También hay un trabajo intensivo realizado por la comunidad CS publicado durante talleres y conferencias especializadas como Interspeech. Vea, por ejemplo, la sesión Accent and Language Recognition of Interspeech 2009 especializada en algoritmos relacionados con la identificación de acento: http://www.interspeech2009.org/c

El Taller Odissey también es una buena referencia (este año será en Singapur en junio http://www.odyssey2012.org/ ). Habrá algunas sesiones relacionadas con el tema Dialecto del lenguaje y reconocimiento de acento. Allí encontrará las publicaciones más recientes y los estudios de algoritmos de vanguardia relacionados con la identificación de acento en idiomas.

More Interesting

¿Sigue siendo el libro de Nancy Lynch la mejor introducción a los algoritmos distribuidos?

¿Cuál es el mejor servicio de indexación en línea para la investigación en informática?

¿Qué lenguaje de programación es más útil cuando investigo en un sistema de reconocimiento de voz?

¿Qué experiencias de investigación de verano (REU) existen para la informática que se centran más en la teoría?

¿Por qué hay tantos problemas abiertos fundamentales en la complejidad computacional?

¿Cuáles son algunos de los resultados de investigación más inútiles en informática?

¿Por qué la gente dice que CS es más que programación o un lenguaje en particular?

¿Cuáles son los teoremas / deducciones más ingeniosos en la teoría de grafos?

¿Cuáles son los temas de investigación actuales sobre computación en la nube?

¿Cuáles son los mejores / más comunes algoritmos de clasificación de aprendizaje supervisado para datos de series temporales?

¿Cuáles son algunos de sus temas de investigación actuales en informática?

¿Podría el aprendizaje automático reemplazar a científicos e investigadores médicos?

¿Dónde podemos encontrar física teórica en informática?

¿Cuál es la diferencia entre informática y programación?

¿Qué hace a un gran investigador de aprendizaje automático? ¿Qué tipo de propiedades poseen esos individuos realmente excepcionales? ¿Es increíble la intuición, la ambición, una comprensión aguda de los dominios, o simplemente un celo religioso sobre el campo?