Cómo combinar clasificador basado en reglas y SVM

Esta pregunta no está muy bien planteada. Sin embargo, supongo que la pregunta es cómo se pueden combinar varios modelos de ML para hacer una clasificación o predicción final.

Investigaciones empíricas / teóricas previas en el área del aprendizaje automático han demostrado que el conjunto de modelos ML donde uno combina múltiples clasificadores y luego combina sus resultados para la predicción final produce mejores resultados. Puede combinar los resultados de los clasificadores mediante un mecanismo de votación (por ejemplo, voto mayoritario). Esto funciona porque reduce en gran medida la varianza y solo aumenta ligeramente el sesgo.

Consulte la siguiente encuesta sobre métodos de conjunto:

Ensemble learning

Además, consulte la Sección 10 del siguiente documento sobre cómo aprender muchos modelos:

Algunas cosas útiles que debe saber sobre el aprendizaje automático

También existe una técnica de apilamiento en la que los resultados de los clasificadores individuales se convierten en las entradas de un alumno de “nivel superior” que descubre la mejor manera de combinarlos. Se puede utilizar un modelo de regresión logística de capa única como combinador. Vea abajo:

https://en.wikipedia.org/wiki/En…

Para responder a su pregunta si está tratando de construir un clasificador entrenando a dos alumnos (es decir, árboles de decisión y SVM), primero puede capacitar a cada alumno individual con sus datos de capacitación. A continuación, puede agregar / entrenar un algoritmo combinador de capa única (por ejemplo, regresión logística) para hacer una predicción final usando todas las predicciones de los otros algoritmos como entradas adicionales.

Related Content

¿Cuál es la diferencia entre validación y validación cruzada?

¿Cómo puede un joven de 16 años comenzar a aprender sobre el aprendizaje automático?

¿En qué medida se puede utilizar el aprendizaje automático y la IA en la detección y el tratamiento del cáncer?

¿Cuánto costaría desarrollar la capacidad de reconocimiento de escritura a mano?

¿Dónde puedo encontrar algunas empresas que trabajen con técnicas de aprendizaje automático y minería de datos, en el campo biomédico?

¿Cuáles son algunos gadgets geniales o juguetes simples que no cuestan mucho?

¿Cómo funciona el aprendizaje automático en el comercio algorítmico (finanzas)?

Hola y gracias por la pregunta.

La combinación de clasificadores basados en reglas y SVM se realizó antes de dos maneras diferentes, si mi memoria me sirve bien. Pero para ser honesto, nunca me convenció por completo porque siempre he encontrado que es más un ejercicio de investigación en lugar de un método operativo y listo para funcionar. Aunque podría estar equivocado.

Dicho esto, el primer enfoque consiste en utilizar un Gráfico Acíclico Dirigido por Decisión (DDAG) (Li et al 2002). Aquí se construye un gráfico acíclico binario arraigado con cada nodo que tiene asignada una lista de clases y un clasificador correspondiente (por ejemplo, SVM). En cada nivel, el clasificador designado dicotomiza entre dos clases o conjuntos de clases dados, y se elimina la clase o conjunto de clases que no se predice.

El segundo enfoque es desarrollar un árbol oblicuo. Estoy luchando por encontrar la referencia al documento que leí hace unos años en mi base de datos. Los autores en ese artículo usan un árbol oblicuo y en cada nodo entrenan un SVM binario. La única referencia que tengo es Truong (2009) donde usa una regresión logística para definir la regla de división. Pero la idea es bastante similar.

Espero eso ayude

KL Li, HK Huang, SF Tian, un novedoso clasificador svm multiclase basado en ddag, en: Actas de 2002 Conferencia Internacional sobre Aprendizaje Automático y Cibernética, vol. 3, 2002, págs. 1203-1207.

Truong A (2009) Árboles oblicuos de rápido crecimiento e interpretables a través de modelos probabilísticos. Tesis doctoral.

Joel Silva

Un clasificador basado en reglas y un SVM son solo dos modelos no relacionados.

Como tal, puede usarlos en paralelo o en serie:

Paralela.

Clasifique usando ambos modelos de forma independiente, luego tome una decisión basada en ambos resultados.

Esta puede ser una regla simple, como elegir la respuesta de cualquier modelo que sea más seguro, o un nuevo modelo (por ejemplo: una regresión lineal) entrenado utilizando solo los resultados como datos.

Serie

Use uno de los modelos primero y use su salida como una característica para el siguiente modelo.

Puede probar estas dos técnicas y ver cuál funciona mejor en su problema particular.

Ariel Pérez

More Interesting

¿Quién usa OpenNLP?

¿Qué piensa Andrew Ng sobre Deep Learning?

¿Cuán extendido es el aprendizaje profundo en finanzas?

¿Hay alguna universidad en la India que ofrezca cursos a corto plazo sobre aprendizaje automático / ciencia de datos?

¿Cuáles son los pasos básicos del procesamiento de texto en el procesamiento del lenguaje natural para la similitud de texto?

¿Puede LSTM u otro tipo de red neuronal recurrente aprender a extraer y representar un estado de Markov?

¿Qué tan útil es el aprendizaje automático?

Cómo corregir el sobreajuste

¿Por qué confiamos en la aleatoriedad de la búsqueda aleatoria en la optimización de hiperparámetros?

¿Cuál es la diferencia entre TensorFlow y Grep? ¿Cuál es el más adecuado para el aprendizaje automático? ¿Por qué o por qué no?

¿Cómo se usa el aprendizaje automático en FinTech (P2P, pagos), particularmente fuera de algo trading? ¿Alguien tiene ejemplos específicos en punto a punto, verificación de crédito, pagos, etc.?

¿Cuál es la relación entre los modelos gráficos probabilísticos y las redes neuronales (aprendizaje profundo)?

¿Qué tipo de trabajo, como ingeniero de software, me apoyaría más para convertirme en Ingeniero / Investigador de Aprendizaje Automático más adelante en mi carrera?

¿Qué preguntas se pueden hacer en una entrevista sobre el proyecto de Análisis de sentimientos de Twitter?

¿Cuál es la entrada para un clasificador Naive Bayes?

Web Analytics