¿Me puede recomendar algunos buenos libros, blogs, artículos y documentos dedicados a conjuntos de modelos y especialmente apilamiento de modelos, también conocidos como conjuntos de modelos híbridos?

Aquí hay un artículo que explica cómo el aprendizaje conjunto podría usarse para predecir las ventas de vino. Una metodología de predicción de conjunto utilizada en el proyecto basada en un conjunto ponderado de modelos de regresión lineal, GBM y XGBOOST : ML Model Ensembling with Fast Iterations

Todos los ajustes esenciales para la canalización de aprendizaje automático condicional para este proyecto se gestionan mediante un archivo de configuración. Para facilitar su uso a través de la solución, se incluyó en todas las capacitaciones y pronósticos de modelos. Por lo tanto, los parámetros respectivos serán recuperados por los scripts ejecutables, y la lógica condicional allí se activará respectivamente.

El proceso de construcción de una tubería de predicción de conjunto se realizó utilizando la herramienta DVC (Control de versión de datos). Las características clave esenciales son:

  • reproducibilidad : todos los miembros de un equipo pueden ejecutarlo en su premisa
  • separación de datos y código : esto garantiza que todos ejecuten siempre las últimas versiones de los trabajos de canalización con la ‘copia de oro’ más actualizada de los conjuntos de datos de capacitación y pruebas

El útil efecto secundario del uso de DVC fue que dejó de tener en cuenta lo que cambiaba en cada paso de la modificación de los scripts del proyecto o en la configuración de la tubería. Debido a que mantiene el gráfico de dependencias (DAG) automáticamente, desencadena automáticamente los únicos pasos que se vieron afectados por los cambios particulares: la capacidad de iterar rápidamente a través de toda la tubería de ML.

El artículo original fue publicado por David Wolpert en 1992 [1].

Estos son los mejores artículos que ayudan a comprender cómo funciona el apilamiento:

  • Kaggle Ensemble Guide por Triskelion
  • Una guía de Kaggler para el apilamiento de modelos en la práctica por Ben Gorman

Notas al pie

[1] CiteSeerX – Generalización apilada

http://stats.stackexchange.com/q
https://www.linkedin.com/pulse/b
http: //shodhganga.inflibnet.ac.i
http://docs.rapidminer.com/studi
Eso tomó alrededor de 5 minutos, para mí, todo en una búsqueda, usando Bing.com
En forma impresa … bueno, simplemente imprima lo que necesita y conserve un árbol.

No conozco ningún documento que lo mencione, de hecho, solo conozco un libro (minería de datos con weka).

Si buscas algunos conceptos básicos, verificaría Wikipedia.