Tanto LR como SVM son algoritmos de clasificación supervisados. Podemos decidir con qué modelo ir de antemano, si tenemos una idea sobre el número total de características (n) y los puntos de datos de entrenamiento totales (m).
- Si n es relativamente mayor que m (como para la clasificación de texto), se pueden usar LR y SVM lineal (con núcleo lineal) y ambos tienen una complejidad similar.
- Si n es pequeño ym es intermedio (lo suficiente como para hacer el modelado), entonces SVM con kernel como el kernel gaussiano proporciona mejores resultados y será un poco más difícil de trabajar que LR.
- Si n es pequeño ym es muy grande, entonces esto tiende a no ajustarse a los datos de la prueba. Por lo tanto, reúna características adicionales o agregue características polinómicas para que se acerque a nuestro primer caso y use LR o SVM lineal
- Si n es muy grande ym es pequeño, entonces esto tiende a sobreajustar los datos. Por lo tanto, tratamos de eliminar las correlaciones entre características, eliminar características no significativas, reunir más conjuntos de datos para capacitación o usar la regularización. Finalmente, terminamos nuevamente con el primer caso y usamos LR o SVM lineal.
Muchos algoritmos, como Neutral Networks, proporcionan una mejor precisión y rendimiento en todos los casos anteriores, pero tienen un mayor tiempo de ejecución. Según la necesidad, tenemos que elegir nuestro algoritmo porque siempre hay una compensación entre precisión y tiempo de ejecución.
Entonces, para responder a su pregunta, comience trabajando con LR y SVM lineal. Luego vaya a SVM con kernels que proporciona un límite no lineal.
- ¿Cómo es ser un científico de datos en Instagram?
- ¿Cuáles son algunos buenos paquetes de R para el análisis de datos cualitativos?
- ¿En qué medida los roles de Data Science requieren familiaridad con Machine Learning?
- ¿Cuál es la diferencia entre los datos generados por la actividad y los generados por la máquina en la terminología de Big Data?
- ¿Cuáles son las opciones de salida de Mu Sigma?