¿Qué significa ‘modelado de conjunto’?

El modelado de conjunto es el proceso de crear un sistema de clasificador múltiple (MCS) o conjunto de clasificadores (EoC). El modelado de conjunto también puede referirse al conjunto de regresores, pero en esta respuesta, nos referiremos únicamente al conjunto de clasificadores .

Por lo general, el modelado de conjunto incluye 3 fases principales:

  1. Generación : el proceso de generar el conjunto, puede ser a través de técnicas como Bagging, Boosting, Random Subspace o una generación manual , en la que los clasificadores básicos del conjunto se entrenan manualmente y se incluyen en el conjunto de clasificadores (generalmente, clasificadores heterogéneos) .
  2. Selección : reduzca el tamaño del conjunto manteniendo solo los “buenos clasificadores”. Si este proceso se realiza solo una vez, se llama poda; de lo contrario, tiene una selección de clasificador estático y dinámico (una selección diferente para cada muestra de prueba).
  3. Combinación : combina la salida de clasificadores en una sola predicción. Existen diferentes enfoques, como el voto mayoritario, el voto mayoritario ponderado y reglas como la media, el máximo, el mínimo, la mediana, el producto de las probabilidades a priori. También es posible combinar la salida de clasificadores usando otro clasificador.

La mayoría de estas reglas generales también se aplican para apilar y mezclar (que también son parte del modelado de conjunto) y, por lo general, son aún más complejas.

Enlaces útiles:

  • Guía de ensamblaje de Kaggle
  • 5 preguntas fáciles sobre modelado de conjunto que todos deberían saber
  • brew – brew 0.1.3 documentación

El modelado de conjunto es el proceso de ejecutar dos o más modelos analíticos relacionados pero diferentes y luego sintetizar los resultados en un solo puntaje o difusión para mejorar la precisión de las aplicaciones de análisis predictivo y minería de datos. En estadística y aprendizaje automático, los métodos de conjunto utilizan algoritmos de aprendizaje múltiple para obtener un mejor rendimiento predictivo que el que se podría obtener de cualquiera de los algoritmos de aprendizaje constituyentes. El aprendizaje conjunto ayuda a mejorar los resultados del aprendizaje automático al combinar varios modelos. Este enfoque permite la producción de un mejor rendimiento predictivo en comparación con un solo modelo.

En el modelado de conjuntos, se emplean múltiples modelos para responder una pregunta específica. En un escenario inmobiliario, la pregunta podría ser algo como, “¿cuál es el rendimiento esperado de este sitio?”. Cada modelo adopta un enfoque independiente para responder la pregunta y puede usar diferentes tipos de modelado (regresión lineal, árbol de decisión, etc.) , diferentes clasificaciones de modelos (desgloses), diferentes variables, etc. Los resultados se determinan en base a una sola mejor respuesta o una combinación de respuestas de los múltiples modelos.

para más referencias:

  • Ensemble learning – Wikipedia
  • Ensemble Learning para mejorar los resultados del aprendizaje automático
  • ¿Qué es el modelado de conjunto? – Definición de WhatIs.com
  • Lo que todo profesional inmobiliario necesita saber sobre el modelado de conjuntos

More Interesting

¿Hay alguna posibilidad de una B.Tech (CS) más fresca en trabajos de aprendizaje automático (ciencia de datos) en Bangalore?

¿Cómo afectarán herramientas como BigML y Google Prediction API al aprendizaje automático? ¿Reducirá la demanda de científicos de datos?

¿Cuáles son las ventajas de ReLU sobre softmax en la red neuronal profunda?

¿El análisis complejo es relevante para el aprendizaje automático?

Si enseñamos a un programa de aprendizaje automático cómo hacer operaciones aritméticas, ¿sería más rápido o más lento que los humanos?

¿Cuál es la diferencia entre el aprendizaje por refuerzo y la optimización de caja negra?

¿Cuáles son las principales similitudes y diferencias entre los alumnos basados ​​en instancias y las máquinas de vectores de soporte?

¿Cuáles son algunos de los problemas abiertos más importantes en el aprendizaje automático en este momento?

Como estudiante universitario de ciencias de la computación, cuál es la mejor opción entre cs o estadísticas Ph.D. para la carrera de ciencia de datos?

¿Cuáles son los consejos para aprender el aprendizaje automático?

¿Cómo es usar las API de servicios cognitivos de Microsoft?

Cómo comenzar a leer trabajos de investigación sobre Machine Learning

¿Es posible usar bibliotecas de aprendizaje automático OpenCV para aplicaciones que no son de visión por computadora?

¿Se están utilizando redes neuronales profundas para crear estrategias de fondos de cobertura / HFT?

¿Cuáles son algunos documentos académicos de aprendizaje automático notables / influyentes en los últimos 5 años?