¿Cuáles son algunos de los temas candentes que se están investigando actualmente en la escucha de máquinas / procesamiento de audio?

Terminé mi trabajo en CMU LTI hace unos seis años, y ya no sigo mucho el audio computacional. Pero he enumerado algunos temas de investigación de música de computadora que recuerdo:

  • La transcripción automática de música y la categorización / clasificación automatizada siguen siendo un problema abierto. Esto incluye la segmentación multicanal (voz / instrumento) en diferentes entornos acústicos.
  • Emoción / expresión – Síntesis y transcripción en audio
  • Automatizado / acompañamiento de la máquina / corrección de errores en tiempo real (actuaciones en vivo)
  • La restauración de fidelidad / eliminación de ruido / compresión son otros proyectos en el área de procesamiento de señales estadísticas
  • Las personas mezclan y combinan modalidades adicionales (señales EEG o actuadores electromecánicos o luces …) con procesamiento de música para crear artefactos interesantes
  • Herramientas para el procesamiento de audio en tiempo real para ayudar en MOOC. Por ejemplo, generación automatizada de hipervínculos / disparadores de audio
  • Instrumento modelos acústicos / síntesis y optimización de diseño
  • También están los proyectos estándar sobre algos escalables de escucha / transcripción. Hacer que sea en tiempo real es otro desafío sobre el que todavía pienso que la gente sigue.
  • Hubo muchos proyectos de investigación basados ​​en hardware basados ​​en técnicas de formación en fase y síntesis de apertura / formación de haces para la clasificación / identificación / segmentación del habla también.

Aquí hay algunos enlaces.
https://www.lti.cs.cmu.edu/rsrch…
http://www.cs.cmu.edu/~rbd/

Gracias por la A2A

More Interesting

¿Cuál es su opinión sobre los rastros de elegibilidad para el aprendizaje de la diferencia temporal? ¿Es solo una asignación de crédito o un truco de aceleración?

El entrenamiento de redes neuronales profundas utilizando la propagación inversa tiene el problema de un gradiente de error que desaparece y que establece un límite sobre cuántas capas se pueden entrenar efectivamente, entonces, ¿por qué no usar un algoritmo genético para entrenar redes profundas, eliminando la propagación de errores?

¿Existe un método común para detectar la convergencia de la muestra de Gibbs y el algoritmo de maximización de expectativas?

¿Es posible generar programas informáticos solo a partir de especificaciones?

¿Cuál es la diferencia entre una curva ROC y una curva de recuperación de precisión? ¿Cuándo debo usar cada uno?

¿Cuáles son algunos buenos documentos con ejemplos del mundo real del aprendizaje de refuerzo inverso (IRL)?

Cómo saber si estoy hecho para el aprendizaje automático y las estadísticas

¿Cuál es mejor para la manipulación de datos en python: Pandas o SFrame?

¿Cuán relevantes son las redes neuronales atractoras en la investigación actual del aprendizaje automático?

Si se le da una opción entre el aprendizaje automático y el Internet de las cosas como una opción, ¿cuál es la mejor para elegir, teniendo en cuenta el alcance y el futuro?

¿Por qué se requieren conocimientos de aprendizaje automático para un periodista de datos? ¿Por qué la exploración y visualización de datos por sí sola no es suficiente para el periodismo de datos?

Como estudiante de pregrado de CS interesado en el aprendizaje automático, ¿cómo puedo saber si me gustaría la economía / computación financiera?

Data Science, Big Data, Machine Learning, ¿qué certificación debo hacer para cambiar la trayectoria profesional desde un entorno de control de calidad?

¿Cómo una red neuronal artificial calcula su salida?

¿Podemos regularizar la red neuronal profunda desconectando enlaces entre unidades, en lugar de abandonar unidades seleccionadas al azar?