Cómo proceder si no puedo desempeñarme mejor en un conjunto de datos en particular cuando intento ajustar un modelo de aprendizaje automático

No hay una respuesta definitiva a esta pregunta. También es posible que la precisión máxima alcanzable en el conjunto de datos sea de alrededor del 60%.

Sin embargo, puede verificar las siguientes cosas:

1) ¿Ha normalizado los datos (es decir, la media cero y la desviación estándar son una para cada característica)?

2) ¿Está introduciendo los datos correctamente? Por ejemplo, LibSVM espera que las clases sean +1 y -1; si alimenta las clases como 0 y 1 (que es el valor predeterminado en algunos conjuntos de datos), no obtendrá resultados significativos.

3) ¿Ajustó los parámetros correctamente? Para SVM, ¿qué núcleo usaste? ¿Probó un buen rango de valores del parámetro C?

Puede probar otros algoritmos, como el árbol de decisión, que son más interpretables y le permiten ajustar la complejidad del clasificador variando la profundidad del árbol.

Hemos descubierto que para los datos de audio, la etapa más importante suele ser el preprocesamiento. Primero realizamos un procesamiento de señal serio para extraer funciones útiles, y solo entonces el aprendizaje automático puede progresar. Le sugiero que investigue qué componentes del audio tienen mayor probabilidad de ser discriminatorios para el estado de ánimo y se asegure de extraer solo esas características del audio sin otras características menos útiles presentes. Luego aprende sobre esas características.