¿Cuál es la diferencia entre los ingenuos Bayes y los algoritmos de máquina de vectores de soporte?

Considere un problema de clasificación, en el que se le dan datos de entrenamiento etiquetados: [matemáticas] \ {(x_1, y_1), \ ldots, (x_m, y_m) \} [/ matemáticas]. El objetivo es encontrar una función [matemática] f (x) [/ matemática], tal que [matemática] f (x_i) \ aprox y_ {i} [/ matemática], [matemática] \ forall i \ in \ {1 , \ ldots, m \} [/ math]. Idealmente, desea buscar [math] f (x) [/ math] en el espacio de todas las funciones posibles, pero eso es computacionalmente inviable y también propenso a sobreajustar. Entonces, usted define una clase de función [math] \ mathcal {F} [/ math], y busca la mejor [math] f [/ math] en [math] \ mathcal {F} [/ math].

Ahora, cómo define esta clase de función [math] \ mathcal {F} [/ math], y cómo mide la cercanía de [math] f (x_i) [/ math] y [math] y_i [/ math] da lugar a diferentes algoritmos:

Si su clase de función [math] \ mathcal {F} [/ math] es una combinación lineal de todos los puntos de datos, y la métrica para comparar [math] f (x_i) [/ math] y [math] y_i [/ math] es la pérdida de la bisagra, entonces obtienes un SVM.
Si su clase de función [math] \ mathcal {F} [/ math] es un modelo de probabilidad condicional con una estructura de independencia específica, y la métrica está maximizando la probabilidad de datos, entonces obtiene el clasificador Naive Bayes.

[Tenga en cuenta que las descripciones anteriores no son perfectas, porque no siempre es posible convertir ecuaciones matemáticas al inglés simple.]

Como puede ver, no hay mucha similitud entre los dos, excepto por el hecho de que ambos encajan en el marco de clasificación general. De hecho, como señaló Srinath Santosh en los comentarios, Naive Bayes es un modelo generativo, mientras que SVM entra en la categoría de modelo discriminatorio. [La respuesta de Prasoon Goyal a ¿Cuál es la diferencia entre modelo discriminativo y modelo generativo?]

AlgoritmosAprendizaje automáticoBayes ingenuos