¿Cuáles son algunas aplicaciones de Machine Learning en el procesamiento de señales para audio?

Habría muchas aplicaciones, incluso espacio para la innovación. Este es un tema candente para la investigación hoy en día. Fuera de mi cabeza, aquí hay algunas cosas que se están explorando actualmente junto con un enlace a un recurso, pero búscalas en Google y habrá muchos más recursos disponibles.

  • Análisis de los sentimientos
    Profundamente conmovedor: aprendizaje profundo para el análisis de sentimientos
  • Filtrado avanzado asistido por ruido o clasificación de voz
    http://research.ijcaonline.org/v…
  • SVM se utiliza para la identificación automática de altavoces (ASI) y el reconocimiento automático de altavoces (ASR)
    https://arxiv.org/pdf/1009.4972.pdf
  • GMM – UBM se utilizan para ASI y ASR
    http://cvrr.ucsd.edu/ece285/pape…
  • Las redes neuronales se utilizan para muchas cosas en el procesamiento de señales
    • ASI y ASR
      http://www.sersc.org/journals/IJ…
    • Lenguaje de modelado
      http://www.jmlr.org/papers/volum…
    • Sistema de voz a texto
      Las redes neuronales detrás de la transcripción de Google Voice
    • Sintetizadores de voz y generación.
      http: //static.googleusercontent….
  • Los HMM se usan para ASR
    http://mi.eng.cam.ac.uk/~mjfg/mj…
    • También obtienes métodos híbridos geniales, que esencialmente apilan, superponen o superponen múltiples métodos de ML:
      http://www.dtic.mil/dtic/tr/full…
      Y en el video a continuación.
  • K-means se utiliza para la agrupación en ASR y ASI
    http://www.ijcaonline.org/volume…
  • Como Vaibhav Arora mencionó en su asombrosa respuesta, detección de llamadas de animales
    • Murciélagos, pájaros, etc.
      http://www.antiquark.com/thesis/…
  • Interfaces neurológicas como el cordón neural de Elon Musk

Una presentación de video genial que encontré al responder su pregunta.
Aprendizaje automático en procesamiento de señal acústica

Un video divertido sobre cómo filtrar el ruido del audio y las señales neurológicas:

En Hunted Hive Digital Solutions, comúnmente utilizamos redes neuronales, varios clasificadores y regresores para automatizar algunas tareas de administración, como la transcripción de grabaciones de reuniones, el filtrado de grabaciones ruidosas y varias otras tareas no acústicas. Siempre estamos buscando nuevas formas de aplicar ML al procesamiento de señales comerciales.

Espero que esto ayude, cuídate.

El aprendizaje automático para audio es, en general, un término muy amplio, y en general tendemos a pensar en el audio como una señal de voz que está bien, pero el procesamiento de la señal de audio va más allá de las aplicaciones de procesamiento de voz.

Me gustaría agregar algunos: –

1) Procesamiento de señal de música

-> Clasificación de género

-> Generación de audio

-> Predicción de la región musical de origen

Una buena introducción sobre el procesamiento de señales musicales

https://www.coursera.org/course/

es posible que desee seguir ISMIR, también profesor George Tzanetakis

Curso UVIc MIR – Extracción de funciones de audio

2) sonidos naturales

-> Clasificación del sonido de las aves [1405.6524] La clasificación automática a gran escala de los sonidos de las aves se mejora notablemente mediante el aprendizaje de funciones sin supervisión

casi todas las clasificaciones de sonido de animales se pueden hacer usando Machine learning

Las características de MFCC que se usaban popularmente ahora se usan en combinación con características aprendidas no supervisadas.

3) Procesamiento del habla

-> Clasificación de idioma hablado (¡Recientemente escribí un artículo sobre esto!)

-> Traducción de idiomas

También hay muchos otros enlaces que pueden serle útiles.

Revisión de los sistemas automáticos de diagnóstico de fallas que utilizan señales de audio y vibración

https://www.ee.columbia.edu/~dpw

¡Creo firmemente que el aprendizaje profundo influirá en estos dominios ya que con el reconocimiento de voz esto se debe a que los métodos de extracción de funciones sin supervisión tienen una tendencia a hacer mejores extractores de funciones que las funciones artesanales tradicionales !!

Además, de interés es:

Reconocimiento de altavoces con características híbridas de una red de creencias profundas

ID del orador

ID de participantes

Categorización de materias y contexto

Significado e inferencia

Estado emocional

Verdad o falso

++++