¿Qué significa ‘modelado de conjunto’?

El modelado de conjunto es el proceso de crear un sistema de clasificador múltiple (MCS) o conjunto de clasificadores (EoC). El modelado de conjunto también puede referirse al conjunto de regresores, pero en esta respuesta, nos referiremos únicamente al conjunto de clasificadores .

Por lo general, el modelado de conjunto incluye 3 fases principales:

Generación : el proceso de generar el conjunto, puede ser a través de técnicas como Bagging, Boosting, Random Subspace o una generación manual , en la que los clasificadores básicos del conjunto se entrenan manualmente y se incluyen en el conjunto de clasificadores (generalmente, clasificadores heterogéneos) .
Selección : reduzca el tamaño del conjunto manteniendo solo los “buenos clasificadores”. Si este proceso se realiza solo una vez, se llama poda; de lo contrario, tiene una selección de clasificador estático y dinámico (una selección diferente para cada muestra de prueba).
Combinación : combina la salida de clasificadores en una sola predicción. Existen diferentes enfoques, como el voto mayoritario, el voto mayoritario ponderado y reglas como la media, el máximo, el mínimo, la mediana, el producto de las probabilidades a priori. También es posible combinar la salida de clasificadores usando otro clasificador.

La mayoría de estas reglas generales también se aplican para apilar y mezclar (que también son parte del modelado de conjunto) y, por lo general, son aún más complejas.

Enlaces útiles:

Guía de ensamblaje de Kaggle
5 preguntas fáciles sobre modelado de conjunto que todos deberían saber
brew – brew 0.1.3 documentación

¿Qué tan diferente es el aprendizaje automático de las estadísticas?

Tengo muchos datos de clientes. ¿Qué algoritmos de aprendizaje automático serían mejores para predecir qué productos desea comprar cada cliente?

¿Cuántas personas en el mundo son expertos en aprendizaje profundo para visión por computadora?

¿Cuál es la diferencia entre la estimación de máxima verosimilitud (ML) y máxima a Posteri (MAP)?

¿Cómo se puede aplicar el aprendizaje profundo a la clasificación de palabras?

¿Por qué las técnicas de optimización como el gradiente natural y los métodos de segundo orden (L-BFGS por ejemplo) no se usan mucho en el aprendizaje profundo?

El modelado de conjunto es el proceso de ejecutar dos o más modelos analíticos relacionados pero diferentes y luego sintetizar los resultados en un solo puntaje o difusión para mejorar la precisión de las aplicaciones de análisis predictivo y minería de datos. En estadística y aprendizaje automático, los métodos de conjunto utilizan algoritmos de aprendizaje múltiple para obtener un mejor rendimiento predictivo que el que se podría obtener de cualquiera de los algoritmos de aprendizaje constituyentes. El aprendizaje conjunto ayuda a mejorar los resultados del aprendizaje automático al combinar varios modelos. Este enfoque permite la producción de un mejor rendimiento predictivo en comparación con un solo modelo.

En el modelado de conjuntos, se emplean múltiples modelos para responder una pregunta específica. En un escenario inmobiliario, la pregunta podría ser algo como, “¿cuál es el rendimiento esperado de este sitio?”. Cada modelo adopta un enfoque independiente para responder la pregunta y puede usar diferentes tipos de modelado (regresión lineal, árbol de decisión, etc.) , diferentes clasificaciones de modelos (desgloses), diferentes variables, etc. Los resultados se determinan en base a una sola mejor respuesta o una combinación de respuestas de los múltiples modelos.

para más referencias:

Ensemble learning – Wikipedia
Ensemble Learning para mejorar los resultados del aprendizaje automático
¿Qué es el modelado de conjunto? – Definición de WhatIs.com
Lo que todo profesional inmobiliario necesita saber sobre el modelado de conjuntos

Fauzi Muhammad Alfath

More Interesting

¿Hay alguna posibilidad de una B.Tech (CS) más fresca en trabajos de aprendizaje automático (ciencia de datos) en Bangalore?

¿Cómo afectarán herramientas como BigML y Google Prediction API al aprendizaje automático? ¿Reducirá la demanda de científicos de datos?

¿Cuáles son las ventajas de ReLU sobre softmax en la red neuronal profunda?

¿El análisis complejo es relevante para el aprendizaje automático?

Si enseñamos a un programa de aprendizaje automático cómo hacer operaciones aritméticas, ¿sería más rápido o más lento que los humanos?

¿Cuál es la diferencia entre el aprendizaje por refuerzo y la optimización de caja negra?

¿Cuáles son las principales similitudes y diferencias entre los alumnos basados en instancias y las máquinas de vectores de soporte?

¿Cuáles son algunos de los problemas abiertos más importantes en el aprendizaje automático en este momento?

Como estudiante universitario de ciencias de la computación, cuál es la mejor opción entre cs o estadísticas Ph.D. para la carrera de ciencia de datos?

¿Cuáles son los consejos para aprender el aprendizaje automático?