Cómo combinar clasificador basado en reglas y SVM

Esta pregunta no está muy bien planteada. Sin embargo, supongo que la pregunta es cómo se pueden combinar varios modelos de ML para hacer una clasificación o predicción final.

Investigaciones empíricas / teóricas previas en el área del aprendizaje automático han demostrado que el conjunto de modelos ML donde uno combina múltiples clasificadores y luego combina sus resultados para la predicción final produce mejores resultados. Puede combinar los resultados de los clasificadores mediante un mecanismo de votación (por ejemplo, voto mayoritario). Esto funciona porque reduce en gran medida la varianza y solo aumenta ligeramente el sesgo.

Consulte la siguiente encuesta sobre métodos de conjunto:

Ensemble learning

Además, consulte la Sección 10 del siguiente documento sobre cómo aprender muchos modelos:

Algunas cosas útiles que debe saber sobre el aprendizaje automático

También existe una técnica de apilamiento en la que los resultados de los clasificadores individuales se convierten en las entradas de un alumno de “nivel superior” que descubre la mejor manera de combinarlos. Se puede utilizar un modelo de regresión logística de capa única como combinador. Vea abajo:

https://en.wikipedia.org/wiki/En…

Para responder a su pregunta si está tratando de construir un clasificador entrenando a dos alumnos (es decir, árboles de decisión y SVM), primero puede capacitar a cada alumno individual con sus datos de capacitación. A continuación, puede agregar / entrenar un algoritmo combinador de capa única (por ejemplo, regresión logística) para hacer una predicción final usando todas las predicciones de los otros algoritmos como entradas adicionales.

Hola y gracias por la pregunta.

La combinación de clasificadores basados ​​en reglas y SVM se realizó antes de dos maneras diferentes, si mi memoria me sirve bien. Pero para ser honesto, nunca me convenció por completo porque siempre he encontrado que es más un ejercicio de investigación en lugar de un método operativo y listo para funcionar. Aunque podría estar equivocado.

Dicho esto, el primer enfoque consiste en utilizar un Gráfico Acíclico Dirigido por Decisión (DDAG) (Li et al 2002). Aquí se construye un gráfico acíclico binario arraigado con cada nodo que tiene asignada una lista de clases y un clasificador correspondiente (por ejemplo, SVM). En cada nivel, el clasificador designado dicotomiza entre dos clases o conjuntos de clases dados, y se elimina la clase o conjunto de clases que no se predice.

El segundo enfoque es desarrollar un árbol oblicuo. Estoy luchando por encontrar la referencia al documento que leí hace unos años en mi base de datos. Los autores en ese artículo usan un árbol oblicuo y en cada nodo entrenan un SVM binario. La única referencia que tengo es Truong (2009) donde usa una regresión logística para definir la regla de división. Pero la idea es bastante similar.

Espero eso ayude

KL Li, HK Huang, SF Tian, ​​un novedoso clasificador svm multiclase basado en ddag, en: Actas de 2002 Conferencia Internacional sobre Aprendizaje Automático y Cibernética, vol. 3, 2002, págs. 1203-1207.

Truong A (2009) Árboles oblicuos de rápido crecimiento e interpretables a través de modelos probabilísticos. Tesis doctoral.

Un clasificador basado en reglas y un SVM son solo dos modelos no relacionados.

Como tal, puede usarlos en paralelo o en serie:

Paralela.

Clasifique usando ambos modelos de forma independiente, luego tome una decisión basada en ambos resultados.

Esta puede ser una regla simple, como elegir la respuesta de cualquier modelo que sea más seguro, o un nuevo modelo (por ejemplo: una regresión lineal) entrenado utilizando solo los resultados como datos.

Serie

Use uno de los modelos primero y use su salida como una característica para el siguiente modelo.

Puede probar estas dos técnicas y ver cuál funciona mejor en su problema particular.