¿Cuál es la diferencia entre los ingenuos Bayes y los algoritmos de máquina de vectores de soporte?

Considere un problema de clasificación, en el que se le dan datos de entrenamiento etiquetados: [matemáticas] \ {(x_1, y_1), \ ldots, (x_m, y_m) \} [/ matemáticas]. El objetivo es encontrar una función [matemática] f (x) [/ matemática], tal que [matemática] f (x_i) \ aprox y_ {i} [/ matemática], [matemática] \ forall i \ in \ {1 , \ ldots, m \} [/ math]. Idealmente, desea buscar [math] f (x) [/ math] en el espacio de todas las funciones posibles, pero eso es computacionalmente inviable y también propenso a sobreajustar. Entonces, usted define una clase de función [math] \ mathcal {F} [/ math], y busca la mejor [math] f [/ math] en [math] \ mathcal {F} [/ math].

Ahora, cómo define esta clase de función [math] \ mathcal {F} [/ math], y cómo mide la cercanía de [math] f (x_i) [/ math] y [math] y_i [/ ​​math] da lugar a diferentes algoritmos:

  • Si su clase de función [math] \ mathcal {F} [/ math] es una combinación lineal de todos los puntos de datos, y la métrica para comparar [math] f (x_i) [/ math] y [math] y_i [/ ​​math] es la pérdida de la bisagra, entonces obtienes un SVM.
  • Si su clase de función [math] \ mathcal {F} [/ math] es un modelo de probabilidad condicional con una estructura de independencia específica, y la métrica está maximizando la probabilidad de datos, entonces obtiene el clasificador Naive Bayes.

[Tenga en cuenta que las descripciones anteriores no son perfectas, porque no siempre es posible convertir ecuaciones matemáticas al inglés simple.]

Como puede ver, no hay mucha similitud entre los dos, excepto por el hecho de que ambos encajan en el marco de clasificación general. De hecho, como señaló Srinath Santosh en los comentarios, Naive Bayes es un modelo generativo, mientras que SVM entra en la categoría de modelo discriminatorio. [La respuesta de Prasoon Goyal a ¿Cuál es la diferencia entre modelo discriminativo y modelo generativo?]

More Interesting

En PCA, ¿cuáles son los roles y los significados físicos de las caras propias?

¿Puede Quora generar un patrón para el futuro de las personas con sus respuestas y preguntas?

Si quiero aprender mucho sobre IA, aprendizaje automático y ciencia de datos, y no tengo absolutamente ninguna experiencia sobre ellos, ¿por dónde empiezo?

¿Cuál es la mejor manera para que un estudiante de CS en una universidad india obtenga una pasantía / trabajo en una compañía en el sector de Big Data y / o Machine Learning en los Estados Unidos?

¿Qué son las redes neuronales progresivas?

¿Qué es un núcleo universal en el contexto del aprendizaje automático?

¿Cuál es el mejor software para Machine Learning y Deep Learning, de acuerdo con el tamaño del conjunto de datos y el sistema?

¿Cómo funciona el entrenamiento multi-gpu?

¿Cuáles son algunas aplicaciones del aprendizaje automático y la inteligencia artificial para los datos de detección remota basados ​​en el espacio y los SIG?

¿Qué puedo hacer con una base de datos de 800 GB de un sitio de reserva de boletos en línea? (Películas, obras de teatro, algunos eventos deportivos)?

¿Cuál es una buena manera de aprender aprendizaje profundo para que un estudiante graduado se una a un grupo de aprendizaje profundo de buena reputación?

¿Puedo crear un conjunto de datos y luego usarlo para evaluar un algoritmo de clasificación?

¿Qué conocimiento debo tener antes de aprender el aprendizaje automático?

Mientras aprende el aprendizaje profundo, ¿cuál es la mejor manera de pasar de una etapa de principiante a una etapa avanzada?

¿De dónde obtengo un sentimiento de Twitter durante todo el día del conjunto de datos?