Considere un problema de clasificación, en el que se le dan datos de entrenamiento etiquetados: [matemáticas] \ {(x_1, y_1), \ ldots, (x_m, y_m) \} [/ matemáticas]. El objetivo es encontrar una función [matemática] f (x) [/ matemática], tal que [matemática] f (x_i) \ aprox y_ {i} [/ matemática], [matemática] \ forall i \ in \ {1 , \ ldots, m \} [/ math]. Idealmente, desea buscar [math] f (x) [/ math] en el espacio de todas las funciones posibles, pero eso es computacionalmente inviable y también propenso a sobreajustar. Entonces, usted define una clase de función [math] \ mathcal {F} [/ math], y busca la mejor [math] f [/ math] en [math] \ mathcal {F} [/ math].
Ahora, cómo define esta clase de función [math] \ mathcal {F} [/ math], y cómo mide la cercanía de [math] f (x_i) [/ math] y [math] y_i [/ math] da lugar a diferentes algoritmos:
- Si su clase de función [math] \ mathcal {F} [/ math] es una combinación lineal de todos los puntos de datos, y la métrica para comparar [math] f (x_i) [/ math] y [math] y_i [/ math] es la pérdida de la bisagra, entonces obtienes un SVM.
- Si su clase de función [math] \ mathcal {F} [/ math] es un modelo de probabilidad condicional con una estructura de independencia específica, y la métrica está maximizando la probabilidad de datos, entonces obtiene el clasificador Naive Bayes.
[Tenga en cuenta que las descripciones anteriores no son perfectas, porque no siempre es posible convertir ecuaciones matemáticas al inglés simple.]
- ¿Qué harás cuando entrenes a tu modelo?
- ¿Keras admitirá PyTorch como backend en el futuro?
- ¿Cuáles son las diferencias entre la red neuronal artificial (informática) y la red neuronal biológica?
- ¿Puede la generación de características de fuerza bruta vencer a la ingeniería de características clásica?
- ¿Qué se debe considerar al decidir entre usar un algoritmo de filtrado colaborativo basado en el usuario y en el elemento?
Como puede ver, no hay mucha similitud entre los dos, excepto por el hecho de que ambos encajan en el marco de clasificación general. De hecho, como señaló Srinath Santosh en los comentarios, Naive Bayes es un modelo generativo, mientras que SVM entra en la categoría de modelo discriminatorio. [La respuesta de Prasoon Goyal a ¿Cuál es la diferencia entre modelo discriminativo y modelo generativo?]