El teorema de No Free Lunch le impide afirmar inequívocamente que cualquier clasificador es mejor que todos los demás. Pero una cosa es preguntar qué clasificador supera al resto en todo el espacio del problema, y otra cosa es preguntar cuáles generalmente funcionan mejor en la práctica sin conocimiento previo del modelo generador de datos. En mi opinión, esta es una pregunta más útil porque probablemente no tendrá tiempo para probar todos los clasificadores y en su lugar le gustaría elegir decir ocho realmente buenos y centrarse en el ajuste de parámetros y el preprocesamiento.
En este caso, hay algunos estudios que han hecho comparaciones. Me gusta este aquí, pero no contiene tantos conjuntos de datos. Los autores también hicieron una conferencia sobre este tema:
¿Qué método de aprendizaje supervisado funciona mejor para qué? Una comparación empírica de métodos y métricas de aprendizaje
- ¿Cuáles son las aplicaciones industriales del algoritmo vecino K más cercano?
- Cómo dominar el aprendizaje automático en Python
- ¿Qué quieres decir con optimización?
- ¿Cuál es la diferencia entre TensorFlow y Grep? ¿Cuál es el más adecuado para el aprendizaje automático? ¿Por qué o por qué no?
- Cómo elegir un algoritmo de aprendizaje automático
Aquí hay otro, pero hay varios agujeros en su análisis a los que debe prestar atención.
Claramente hay confusión con estudios como estos. El aprendizaje profundo, por ejemplo, tiene varios matices que se están introduciendo rápidamente para especificar mejor las condiciones iniciales. Es complicado compararlos para decir un SVM.