¿Cómo puedo comenzar a usar métodos de “generalización apilada” en Python para las competencias de Kaggle?

Gracias por A2A.

Personalmente uso una tubería con archivos MAKE porque puede combinar salidas de modelos independientemente de sus idiomas. Si está interesado, consulte la introducción y el ejemplo en Kaggler.

En Python, la forma más fácil de configurar una tubería de apilamiento es usar la tubería de scikit-learn y FeatureUnion. Este tutorial lo guía a través de cómo combinar salidas de diferentes modelos para crear características en detalle.

heamy es otro paquete de Python que admite el apilamiento, escrito por Kaggle Master, Artem Golubin (también conocido como rushter). Vea el ejemplo, así como Kaggle Kernel.

En Java, Kaggle Grandmaster, Mario Michailidis (también conocido como kazAnova) escribió StackNet. Incluye muchas implementaciones de ML populares. Echa un vistazo a esta introducción en No Free Hunch

Sin embargo, mi recomendación para el apilamiento o cualquier tubería de Kaggle es construir su propia tubería. Puede aprender y mejorar mucho diseñando y construyendo una tubería robusta reutilizable.

¡Buena suerte! 🙂

Ciencia de datosMachine LearningPython (lenguaje de programación)

¿Cuál es la diferencia entre la clasificación de vectores de soporte y la regresión? ¿Un regresor de vectores de soporte se comporta como una red neuronal por casualidad?

¿En qué casos tengo que usar un entorno distribuido y en qué casos no?

¿Son buenos los cursos de Machine Learning AZ y Deep Learning AZ de Kirill Eremenko en Udemy?

Cómo entender el uso de un SVM con una red neuronal convolucional

¿Cómo incluyo AI en mi aplicación Chit Chat que estoy desarrollando?

¿Dónde puedo encontrar un código de Python para SVM que use datos de funciones múltiples?

Sebastian Raschka tiene una buena introducción al apilamiento [1] (para modelos de clasificación).

Puedes encontrar el cuaderno aquí .

[Editar]

Como mencionó Sebastian Raschka en la sección de comentarios, el cuaderno anterior no se trata de apilar sino de ensamblar , embolsar e impulsar la mayoría de votos (que son otros algoritmos de meta-aprendizaje).

Para implementaciones de apilamiento , verifique estos enlaces:

Clasificador de apilamiento – mlxtend
StackingCVClassifier – mlxtend

[/Editar]

Aparte de eso, puede consultar este núcleo de Kaggle [2] [3] y la publicación de blog [4].

Buena suerte.

Notas al pie

[1] Ensemble learning – Wikipedia

[2] Tu hogar para la ciencia de datos

[3] Introducción al ensamblaje / apilamiento en Python

[4] Una guía de Kaggler para apilar modelos en la práctica

Yassine Alouini

Si está buscando una biblioteca de aprendizaje de conjunto con una API de estilo Scikit-learn, es posible que desee echar un vistazo a ML-Ensemble. Es un paquete de terceros afiliados a Scikit-learn.

También hay algunas herramientas útiles para la selección de modelos que también pueden ayudarte a ajustar el conjunto.

¡Buena suerte!

Sebastian Flennerhag

More Interesting

OpenCV: ¿Cómo creo un conjunto de datos de descriptores de imagen con SIFT?

¿De qué sirve un alumno constante?

¿Qué tipo de antecedentes estadísticos debo tener para tomar el curso de Reconocimiento de patrones? Cual estadística Qué libro es útil para mi preparación?

¿Por qué se considera F # un buen lenguaje para el aprendizaje automático?

¿Cuáles son las ventajas y desventajas de las API de servicios cognitivos de Microsoft?

Cómo comenzar una investigación independiente en aprendizaje profundo

¿Implementó algoritmos de aprendizaje automático desde cero con el propósito de aprender?

¿Qué significa decir: "En la geometría de la información, el paso E y el paso M se interpretan como proyecciones bajo dos conexiones afines"?