¿Cuándo podemos usar la máquina de vectores de soporte básica sobre otros algoritmos de clasificación?

Regresión logística (LR) vs SVM lineal
m: número de ejemplos de entrenamiento
n: número de características
caso 1: n: grande (relativo a m)
por ejemplo, n = 10000, m = 10-1000
usar LR o SVM

caso 2: n: pequeño, m: intermedio
por ejemplo, n = 1-1000, m = 10-10000
usar SVM con el núcleo gaussiano

caso 3: n: pequeño, m: grande
por ejemplo, n = 1-1000, m = 50000
cree o agregue más funciones, luego use LR o SVM sin kernel
Es probable que las NN funcionen bien para la mayoría de estos entornos, pero pueden ser más lentas para entrenar.

SVM y LR la función objetivo es convexa. para que no tenga que preocuparse por los optimismos locales. (en comparación con NNs) También es bueno mencionar que usa Multiplicadores de Lagrange en lugar de Descenso de degradado.

SVM puede usar las funciones del núcleo para transformar implícitamente las características de entrada en un conjunto de características mucho más grande. Esto se llama “truco del núcleo”.

Algunos de estos hechos se basan en el curso de ML de Andrew Ng en Coursera.

En términos generales, los SVM son muy buenos cuando tiene una gran cantidad de funciones. Por ejemplo, para la clasificación de texto en una bolsa de palabras modelo.

Los SVM con núcleos no lineales funcionan bastante bien en la mayoría de los casos y generalmente se enfrentan cara a cara con bosques aleatorios, a veces los RF funcionan un poco mejor y, a veces, los SVM ganan.

Los SVM también son particularmente útiles cuando se desea la clasificación ordinal (clasificación), se usan ampliamente en algoritmos de “aprendizaje para clasificar”.

Pero recuerde: no hay almuerzo gratis, cualquier algoritmo puede realizar cualquier otro para algunos datos dados.