¿Cuánto trabajo se ha hecho para identificar acentos algorítmicamente?

Si su calidad de audio es decente, resulta que puede hacerlo bastante bien con modelos simples y algo de procesamiento de señal. La gran cantidad de estructura en el lenguaje humano hace que bastantes tareas de PNL sean sorprendentemente fáciles.

Utilicé la clasificación de acento estadounidense vs británico como una tarea de referencia en mi tesis de pregrado. Estaba tratando de hacer un aprendizaje profundo y un descubrimiento de funciones sin supervisión, pero, si lo único que le importa es la clasificación de acento, puede hacerlo bastante bien sin hacer nada elegante. [1]

Para el enfoque de procesamiento de señales de la vieja escuela, consulte: http://www.isca-speech.org/archi… y http://linguistics.byu.edu/class…

Para un enfoque más moderno (y, en mi opinión, más fresco), consulte: http://www.mendeley.com/research…

[1] Puedes tocar la tesis si quieres, pero realmente no deberías: http://stanford.edu/~danjr89/the…

¿Va en contra de las leyes de copyright si leo un trabajo de investigación y yo mismo codifico el algoritmo propuesto en el trabajo?

¿Cómo debe un junior de Ingeniería de Software llegar a un Científico de Investigación?

¿Cuáles son los campos de investigación en informática que no requieren habilidades en codificación / programación?

En la investigación cuantitativa, digamos informática, ¿cuál es la distinción entre un problema de investigación, una pregunta de investigación, objetivos de investigación y una hipótesis / ses de investigación? ¿Cuál es un ejemplo de cada uno?

Cómo mostrar que la distancia más corta entre 2 curvas que no se cruzan siempre se encuentra a lo largo de su normal común

¿Cuáles son los mejores / más comunes algoritmos de clasificación de aprendizaje supervisado para datos de series temporales?

Si te refieres a identificar el acento en los recursos de lenguaje hablado, se ha realizado mucho trabajo durante la campaña de evaluación de Reconocimiento de Idioma Hablado de NIST ( http://www.itl.nist.gov/iad/mig/ …). Principalmente, esta campaña no tenía la intención de estudiar el problema del acento, sino, además, la identificación del idioma y, a veces, la distinción entre varios hablantes de acuerdo con su localización geográfica (por ejemplo, inglés de las Indias o inglés de los EE. UU.). Pero la pregunta de acento es un tema de este trabajo de NIST y puede encontrar documentos interesantes y descripciones de prototipos relacionados con el problema de acento aquí.

El laboratorio del MIT Lincoln trabaja mucho en este tema (también en el aspecto dialectal). Puede encontrar una página especializada relacionada con publicaciones sobre este tema aquí http://www.ll.mit.edu/mission/co …

También hay un trabajo intensivo realizado por la comunidad CS publicado durante talleres y conferencias especializadas como Interspeech. Vea, por ejemplo, la sesión Accent and Language Recognition of Interspeech 2009 especializada en algoritmos relacionados con la identificación de acento: http://www.interspeech2009.org/c …

El Taller Odissey también es una buena referencia (este año será en Singapur en junio http://www.odyssey2012.org/ ). Habrá algunas sesiones relacionadas con el tema Dialecto del lenguaje y reconocimiento de acento. Allí encontrará las publicaciones más recientes y los estudios de algoritmos de vanguardia relacionados con la identificación de acento en idiomas.

Dan Robinson

More Interesting

¿Sigue siendo el libro de Nancy Lynch la mejor introducción a los algoritmos distribuidos?

¿Cuál es el mejor servicio de indexación en línea para la investigación en informática?

¿Qué lenguaje de programación es más útil cuando investigo en un sistema de reconocimiento de voz?

¿Qué experiencias de investigación de verano (REU) existen para la informática que se centran más en la teoría?

¿Por qué hay tantos problemas abiertos fundamentales en la complejidad computacional?

¿Cuáles son algunos de los resultados de investigación más inútiles en informática?

¿Por qué la gente dice que CS es más que programación o un lenguaje en particular?

¿Cuáles son los teoremas / deducciones más ingeniosos en la teoría de grafos?

¿Cuáles son los temas de investigación actuales sobre computación en la nube?

¿Cuáles son los mejores / más comunes algoritmos de clasificación de aprendizaje supervisado para datos de series temporales?