¿Cómo debo elegir entre SVM y árbol de decisión para un problema de clasificación?

La mayor diferencia entre los dos algoritmos es que SVM usa el truco del kernel para convertir un problema linealmente no separable en uno linealmente separable (a menos, por supuesto, que usemos el kernel lineal), mientras que los árboles de decisión (y los bosques basados ​​en ellos, y los árboles potenciados, ambos en menor medida debido a la naturaleza de los algoritmos de conjunto) dividen el espacio de entrada en hiperrectángulos según el objetivo.

Por lo general, uno funcionará mejor que otro en una situación dada, pero es difícil saberlo en la mayoría de los casos en espacios de alta dimensión a menos que haya algo sobre los datos que sugiera uno sobre el otro. Este es el método preferido, pero difícilmente obvio en la mayoría de los casos.

La mayoría de las veces, las personas usan un conjunto de validación no solo para optimizar los hiperperametros sino también para elegir entre algoritmos. No es perfecto, pero a menudo funciona.

Ah, si tiene categorías en sus entradas, no puede usar SVM. Solo funcionan con datos numéricos.

More Interesting

Cómo distinguir el Aprendizaje profundo de los anteriores análogos en las composiciones de funciones, más específicamente el trabajo reciente sobre el "proceso gaussiano profundo"

¿Cuáles son los principales enfoques de la inteligencia artificial?

¿Cuántas de las noticias sobre IA y DL en este momento son sobre nuevas innovaciones y cuánto sobre aplicaciones? ¿Cuánto de eso es bombo? ¿Habrá una meseta pronto?

¿Qué idioma es el mejor para construir código de producción de aprendizaje automático?

¿Cuáles son las lecciones del desafío del Premio Netflix?

¿Se puede utilizar la investigación en aprendizaje automático para complementar la epistemología?

¿Por qué los entrenamientos CNN desequilibrados afectan tanto la clasificación?

¿Cuáles son los algoritmos / documentos de última generación sobre clasificación y recuperación de imágenes?

¿Las estadísticas necesitan un cambio de marca en respuesta a la ciencia de datos y el aprendizaje automático, que están superando las estadísticas en términos de relevancia? ¿Por qué o por qué no?

¿Qué es más poderoso, la red neuronal convolucional o la red artificial? ¿Cuál es más conveniente de usar?

¿Qué algoritmo funciona mejor para bandidos adversarios?

¿Qué es un buen algoritmo de recomendación de películas?

En Machine Learning: ¿por qué siempre entrenamos una muestra en lugar de todo el conjunto de datos / base de datos?

Máquina de Boltzmann restringida (RBM): ¿Cómo se podría reformular (y / o explicar) las dos tareas en la siguiente diapositiva de una charla de Geoffrey Hinton?

Cómo planear mover mi carrera hacia el aprendizaje automático en India