Composición musical algorítmica: idea para una investigación

Ciertamente es una idea interesante. Voy a pasar por alto todos los detalles técnicos de cómo aislar, como usted lo llama, la variable “placer” en las exploraciones de FMRI, ya que no sé casi nada sobre tales cosas.

Sin embargo. Supongamos que tiene una pieza musical, y tiene un montón de marcas de tiempo y rangos de tiempo que su investigación muestra da placer a sus oyentes. El problema más interesante aquí es cómo usar estos datos.

Ahora sabe que ciertas partes de la música son agradables de escuchar, pero no sabe con certeza por qué o cómo. La causa podría ser una combinación de una gran cantidad de cosas. A la gente le gustan las gotas de bajo en dubstep. A la gente le gusta cuando el tema principal reaparece en la música clásica. A la gente le gustan los solos de guitarra en una canción de rock. Y así. El nivel de placer auditivo será muy alto en todos estos puntos, y será, en el mejor de los casos, un problema extraordinariamente difícil tratar de descubrir por qué son grandes momentos.

La anticipación y la resolución, por ejemplo, son responsables de crear muchos de estos momentos. Los contrastes dinámicos repentinos, las recapitulaciones triunfantes, las cadencias y todo tipo de otras herramientas disponibles para un compositor también pueden crear momentos brillantes. Pero tratar de determinar qué combinación de todos estos factores es responsable de una sección de música particularmente sorprendente (y cómo eso se traduce en que una pieza de música sea genial en su conjunto) con solo datos de “placer de escuchar” parece ser muy difícil y forma incorrecta de proceder con la composición algorítmica.

Como un ejemplo extremo, una acumulación muy tensa en el séptimo dominante que resuelve triunfante al tónico será, probablemente, uno de estos grandes momentos. Los datos mostrarán un aumento de placer con el tónico, pero si solo unes un montón de estos, no obtendrás esa respuesta porque no hay tensión. Incluso si reconoce que es la resolución la que está causando el pico (y esto se conocería a priori de todos modos) no obtendría la misma respuesta para unir un montón de progresiones VII – I juntas.

Lo que esperaría que ocurriera es esto: usted analiza todos estos datos y encuentra una gran cantidad de patrones que provocan el placer de los oyentes. Descubres que se correlacionan extremadamente bien con todas esas cosas que aprendes en teoría de la música y que han sido perfeccionados por generaciones de compositores.

En este punto, el problema más difícil es este: incluso si conoce todas estas reglas de la teoría de la música, tiene los datos para respaldarla, etc., ¿ puede hacer que una computadora genere música hermosa y emocional, sin haber tenido experiencias humanas, emociones, sentimientos, etc.

Esto está comenzando a aventurarse en territorio filosófico, así que me detendré ahora. Pero tal vez esto tenga un poco de sentido para ti. Y tal vez estoy completamente equivocado y este método desenterrará nuevas ideas sobre lo que hace una gran música. Esta es solo mi especulación de todos modos. ¿Por qué no darle una oportunidad?

Actualmente estoy trabajando en una investigación similar a su propuesta. Estamos trabajando en un sistema que predice qué tipo de música hará que el usuario se concentre mejor.

Dejamos que un sujeto de prueba realice una tarea que requiere concentración mientras se reproduce música al azar.
Utilizamos un dispositivo Emotiv Epoch EEG para leer señales electromagnéticas en tiempo real del cerebro. Estos se etiquetan por nivel de concentración, basado en observaciones. Estos luego son alimentados a un algoritmo de aprendizaje supervisado.

Ahora entrenamos un clasificador que es capaz de reconocer si un sujeto se está concentrando o no.
Los resultados con una clasificación SVM usando datos de un solo electrodo han sido bastante buenos, hasta un 76% correcto.

Estos resultados son del siguiente documento:
Página en mdpi.com

Un enfoque similar para el reconocimiento de emociones se realiza en el siguiente documento:
Página en lzu.edu.cn

Pero no solo queremos saber si el usuario está concentrado en este momento, queremos comenzar a predecir qué música hará que el sujeto de prueba se concentre mejor en x cantidad de segundos.

Para hacer esto, dividimos los datos en segmentos de 512 muestras. Solo conservamos rebanadas para las cuales el nivel medio de concentración en la siguiente x cantidad de segundos fue mayor que el nivel actual de concentración.

La red se entrena de la siguiente manera:

Entradas:
– Nivel actual de concentración (etiquetado a mano)
– Actividad cerebral actual (dividida en bandas, 512 muestras)
Salidas (datos etiquetados en la fase de entrenamiento)
– Metadatos de la música que se está reproduciendo actualmente (como bpm, estilo, modo, etc.)
– Nivel medio de concentración en los siguientes x cantidad de segundos

El sistema ahora puede sugerir metadatos para la música que harán que el usuario se concentre más y predecir qué tan concentrado estará el usuario en los siguientes x segundos si se reproduce música con estos metadatos.

Todavía estoy trabajando en un método para entrenar al clasificador no solo para aumentar el nivel de concentración, sino para aumentarlo tanto como sea posible.

Los metadatos obtenidos del clasificador se pueden usar a su vez para elegir una pieza musical apropiada para que el usuario la escuche para mejorar la concentración.

Se podría hacer un enfoque similar para la composición musical donde el nivel de concentración se reemplaza por “placer del oyente” y los metadatos musicales se reemplazan por notas midi.

Sí, se han realizado investigaciones en el área: La neurociencia de la música | Ciencia cableada

Sin embargo, tenga en cuenta que el placer obtenido de la música es relativo a la experiencia musical previa. Lo que le puede gustar a una persona, puede no ser del agrado de otra.

Creo que Darwin Tunes hace algo similar a esto, pero sin la FMRI. No es exactamente relevante para lo que estás buscando, pero puede ser una lectura interesante para ti. Aquí está la historia de NPR al respecto.
En Survival Of The Funkiest, Bad Music Dies First: NPR

More Interesting

¿Qué importancia tienen las estructuras de datos y los modelos gráficos para el aprendizaje automático?

¿Cuáles son actualmente los temas candentes en la investigación de aprendizaje automático y en aplicaciones reales?

En el aprendizaje profundo, ¿son el "aprendizaje incremental" y el "aprendizaje de transferencia" el mismo enfoque?

¿El modelado predictivo es una moda pasajera?

¿Es posible crear un 'ser' inteligente (AI) no una 'máquina'?

¿Cuáles son algunos buenos documentos sobre la extracción de sinónimos de los registros de consultas?

¿Cómo podemos implementar el aprendizaje profundo en Python? ¿Es el aprendizaje profundo un concepto importante en la ciencia de datos?

¿Cuáles son las principales áreas de la investigación bioinformática actual?

¿Cuáles son las principales razones contra el uso de apilamiento cuando tenemos redes neuronales?

¿Hay un equivalente a Rosalind en el aprendizaje automático?

Cómo entender el uso de un SVM con una red neuronal convolucional

He completado el curso para el aprendizaje automático. Quiero hacer un proyecto corto sobre aprendizaje automático. Actualmente estoy haciendo BE en CS. ¿Qué materia debo elegir?

¿Cuáles son las principales diferencias entre TensorFlow y SciKit Learn?

¿Cuál sería su guía para un hombre de 46 años que conoce la programación primaria y está interesado en obtener un conocimiento práctico del aprendizaje automático?

¿Cómo funciona el aprendizaje profundo en tiempo real?