¿Me puede recomendar algunos buenos libros, blogs, artículos y documentos dedicados a conjuntos de modelos y especialmente apilamiento de modelos, también conocidos como conjuntos de modelos híbridos?

Aquí hay un artículo que explica cómo el aprendizaje conjunto podría usarse para predecir las ventas de vino. Una metodología de predicción de conjunto utilizada en el proyecto basada en un conjunto ponderado de modelos de regresión lineal, GBM y XGBOOST : ML Model Ensembling with Fast Iterations

Todos los ajustes esenciales para la canalización de aprendizaje automático condicional para este proyecto se gestionan mediante un archivo de configuración. Para facilitar su uso a través de la solución, se incluyó en todas las capacitaciones y pronósticos de modelos. Por lo tanto, los parámetros respectivos serán recuperados por los scripts ejecutables, y la lógica condicional allí se activará respectivamente.

El proceso de construcción de una tubería de predicción de conjunto se realizó utilizando la herramienta DVC (Control de versión de datos). Las características clave esenciales son:

reproducibilidad : todos los miembros de un equipo pueden ejecutarlo en su premisa
separación de datos y código : esto garantiza que todos ejecuten siempre las últimas versiones de los trabajos de canalización con la ‘copia de oro’ más actualizada de los conjuntos de datos de capacitación y pruebas

El útil efecto secundario del uso de DVC fue que dejó de tener en cuenta lo que cambiaba en cada paso de la modificación de los scripts del proyecto o en la configuración de la tubería. Debido a que mantiene el gráfico de dependencias (DAG) automáticamente, desencadena automáticamente los únicos pasos que se vieron afectados por los cambios particulares: la capacidad de iterar rápidamente a través de toda la tubería de ML.

librosMachine LearningRecomendaciones de

Related Content

¿Cuáles son algunas preguntas abiertas relacionadas con bandidos multibrazos?

¿Se usa el álgebra abstracta en el aprendizaje automático?

¿Por qué el aprendizaje por refuerzo no era popular antes de que el aprendizaje profundo apareciera en escena?

Cómo guardar un modelo de red neuronal de convolución después del entrenamiento

¿Por qué es óptimo establecer el tamaño del paso para la regresión logística con el descenso del gradiente al recíproco de la consistencia de lipschitz?

Aparte del aprendizaje automático, ¿cuáles son algunos campos de la informática que requieren conocimientos matemáticos?

Cómo calcular la precisión y recordar para la clasificación, donde ambas clases son igualmente importantes

El artículo original fue publicado por David Wolpert en 1992 [1].

Estos son los mejores artículos que ayudan a comprender cómo funciona el apilamiento:

Kaggle Ensemble Guide por Triskelion
Una guía de Kaggler para el apilamiento de modelos en la práctica por Ben Gorman

Notas al pie

[1] CiteSeerX – Generalización apilada

Andrew Patterson

http://stats.stackexchange.com/q …
https://www.linkedin.com/pulse/b …
http: //shodhganga.inflibnet.ac.i …
http://docs.rapidminer.com/studi …
Eso tomó alrededor de 5 minutos, para mí, todo en una búsqueda, usando Bing.com
En forma impresa … bueno, simplemente imprima lo que necesita y conserve un árbol.

Maxim Liu

No conozco ningún documento que lo mencione, de hecho, solo conozco un libro (minería de datos con weka).

Si buscas algunos conceptos básicos, verificaría Wikipedia.

Maxim Liu

More Interesting

En PWR, ¿por qué las barras de control están dispuestas en grupos?

Como principiante, ¿cómo debo estudiar el aprendizaje profundo?

¿Cómo están revolucionando las redes neuronales convolucionales la visión por computadora?

¿Por qué los LSTM generalmente se entrenan con backprop y no con EKF?

¿Cuál es la mejor manera para que un principiante completo aprenda el aprendizaje automático?

Cómo construir una aplicación para educación

¿Cómo funciona el modelo de red neuronal profunda en la predicción de regresión en los datos del sensor?

¿Cuál es la forma mejor y más simple de agrupar productos por sus nombres?

¿Qué es Mach 23 en millas por hora?

¿Por qué tenemos que convertir el valor categórico en factor (en R) o variables ficticias antes de aplicar algoritmos de aprendizaje automático (especialmente regresión lineal)? ¿Afecta nuestros resultados?

¿Cuántas muestras de entrenamiento se necesitan para obtener un modelo confiable en ML?

¿Qué libros o recursos de probabilidad y estadística debo consultar antes de sumergirme en Machine Learning, PNL, minería de datos, etc.? Soy un completo principiante.

¿Cómo se puede hacer la experimentación de aprendizaje profundo en una PC en casa?

¿Cómo es usar las API de servicios cognitivos de Microsoft?

Quiero aprender el procesamiento del lenguaje natural en CMU. ¿Es mejor tomarlo como un estudiante de CS o tomarlo como un estudiante de lingüística (como una electiva)?

Web Analytics