¿Por qué el clasificador Bayes Network funciona tan bien como SVM con menos funciones que las que se usan con SVM?

Sin más detalles sobre los datos y el ajuste del modelo, hay dos explicaciones en las que puedo pensar.

Una explicación es que los parámetros del modelo SVM no están ajustados de manera óptima, mientras que el modelo de red Bayesian está bien diseñado y bien ajustado. Como resultado, está comparando un buen modelo de Bayes Net con un modelo SVM por debajo del par.

Una segunda explicación es simplemente la naturaleza de los datos en sí. Cada técnica de modelado tiene sus fortalezas y debilidades. Por lo tanto, es posible que este conjunto de datos simplemente juegue con las fortalezas de Bayes Net y / o las debilidades de SVM. Por supuesto, hay otros conjuntos de datos donde lo contrario sería cierto.

Independientemente de la verdadera explicación, no leería demasiado en este resultado. Después de haber trabajado con muchos conjuntos de datos y modelos a lo largo de los años, he visto resultados mucho más extraños que los que está preguntando.

Sin teorema del almuerzo gratis: “si un algoritmo funciona bien en una determinada clase de problemas, entonces necesariamente paga eso con un rendimiento degradado en el conjunto de todos los problemas restantes”. Si Bayes Nets funcionó tan bien como SVM con menos características o menor capacidad de modelo En todos los problemas, nunca nos importarían los SVM.

More Interesting

Dada una lista de codificadores y sus respectivos conjuntos de fragmentos de código, ¿es posible inferir a partir de un fragmento de código nuevo dado el codificador original?

Yoshua Bengio: ¿Será el aprendizaje profundo un paso hacia la IA consciente?

¿Qué áreas del aprendizaje automático son más importantes para los fondos de cobertura y los bancos de inversión (en equipos cuantitativos)?

En forma de estudios de caso, ¿cómo utilizan las empresas financieras el aprendizaje automático?

Cómo optimizar una red neuronal convolucional para hacer una clasificación de imágenes

Cómo calcular la ganancia de información para cada atributo si estoy diseñando un árbol clasificador de decisiones con nodos binarios en cada derrame

¿Cómo se compara la industria del aprendizaje automático con las opciones de carrera dentro del desarrollo web?

Word2vec: ¿Cómo puede el método de entrenamiento jerárquico soft-max de CBOW garantizar su autoconsistencia?

¿Qué es una red neuronal bayesiana?

Cómo crear una representación jerárquica de un conjunto de objetos usando una red neuronal

¿Cuáles son algunos casos de uso para el aprendizaje automático en realidad virtual?

Cómo lidiar con un conjunto de datos duro que no me da buenos resultados en la validación del modelo

¿Cómo se justifica el uso de la desigualdad de Hoeffding para demostrar que el aprendizaje es factible?

Cómo detectar y eliminar valores atípicos de ese conjunto de datos

¿Cuáles son algunos de los problemas abiertos más importantes en el aprendizaje automático en este momento?