¿Cuáles son las buenas formas de combinar dos salidas de un clasificador?

Puede intentar usar las salidas de probabilidad de los modelos individuales como entradas en otra regresión (apilamiento: aprendizaje en conjunto). Solo asegúrese de dividir sus conjuntos de entrenamiento / prueba para que la regresión del modelo apilado se entrene en datos invisibles.

Si desea ser realmente elegante, puede usar el apilamiento ponderado de funciones (página en arxiv.org) que le permite entrenar pesos de modelos basados ​​en metaparámetros. Este enfoque se utilizó con cierto éxito en el Premio Netflix.

Como ejemplo, RF podría funcionar mejor en películas que han sido calificadas por muchos usuarios, pero LR funciona mejor donde hay muy pocas clasificaciones. El modelo de conjunto pesaría los modelos individuales en consecuencia al aplicarlo contra una película en particular.

More Interesting

¿Existe un puntaje general de 'utilidad' para el rendimiento de recuperación de información?

¿Cómo se mejora y mejora la técnica de aprendizaje automático mientras nadie sabe exactamente cómo funciona?

¿Por qué la función sigmoidea rara vez se usa en capas ocultas recientemente?

¿Cuáles son algunas formas de evitar la maldición de la dimensionalidad?

¿Qué (empíricamente) necesita más datos de entrenamiento (etiquetados): modelos discriminativos o modelos generativos?

Cómo aprender machine learning para construir startups

Cómo llegar a un problema de aprendizaje automático para un proyecto personal

¿Por qué el preentrenamiento no supervisado actúa como un regularizador en arquitecturas profundas?

¿Podemos agregar la capa SVM como capa inferior en la arquitectura CNN para una mejor clasificación?

¿Qué tipo de empresas necesitan / necesitarán ingenieros de Machine Learning?

¿Qué es el aprendizaje automático en tiempo real?

Con suficiente capacitación, ¿puede el aprendizaje automático escribir una buena historia para un programa de televisión?

¿Cómo entrenamos un clasificador para el cual solo tenemos: 1) un conjunto de datos que son datos de entrenamiento explícitamente positivos y 2) un conjunto de datos que se desconoce (tiene el potencial de ser positivo o negativo)?

¿Se pueden utilizar algoritmos genéticos y optimización de enjambre de partículas para construir sistemas de reconocimiento de voz?

¿Qué métodos (sin supervisión) deberían usarse para la categorización jerárquica automática de documentos?