Hola, hay una serie de factores que ayudan a decidir qué algoritmo elegir y por qué. Los factores principales incluyen:
- La cantidad de datos.
- El tipo de problema que está tratando de resolver (¿está buscando predicción basada en secuencias, etc.)
- La capacidad de explicación de un algoritmo puede ser un requisito especialmente en un escenario de la industria.
- el tipo de límite de decisión que requiere el conjunto de datos (esto es si puede visualizar el conjunto de datos) Los algoritmos dibujan diferentes líneas de decisión, algunos son lineales y otros no tanto …
Hay muchas familias de clasificadores por ahí y como estudio comparativo entre estos http://www.jmlr.org/papers/volum… es una buena lectura. pero en los que realmente necesita concentrarse son 4 básicamente SVM, bosques aleatorios, redes bayesianas y redes neuronales. (Los dos últimos son más como familias … pero estos cuatro deberían ser suficientes). También sugeriría leer documentos de investigación relevantes para el mismo, estos le darían consejos sobre qué enfoques es probable que tengan éxito.
He escrito sobre la elección de clasificadores, por lo que es posible que desee consultar mis respuestas a
- Estoy creando un plan de enrutamiento de vehículos con la ruta y el costo más bajos. ¿Sería más significativo el agrupamiento k-k o los vecinos k-más cercanos?
- ¿Debería haber una relación específica entre el número de características y el número de clases? Si tengo 15 funciones pero 50 clases con 1000 datos de entrenamiento, ¿tendré un problema de sobreajuste? ¿Y cuál es la mejor técnica de clasificación para esta relación?
- ¿Los bosques aleatorios son solo un tipo de Monte Carlo?
- ¿Los algoritmos subyacentes permiten a Shazam identificar una canción y Amazon Flow para identificar una imagen básicamente igual?
- ¿Qué herramientas están disponibles para extraer PCFG lexicalizados de un corpus analizado?
La respuesta de Vaibhav Arora al Aprendizaje automático: ¿Cuáles son las ventajas de SVM sobre las redes neuronales y k- los vecinos más cercanos?
La respuesta de Vaibhav Arora a ¿Cómo puedo saber si Deep Learning funcionará mejor para un problema específico, que SVM o bosque aleatorio?
ps: – las otras respuestas a estas preguntas también son una buena lectura 🙂