¿Cómo puedo comenzar a usar métodos de “generalización apilada” en Python para las competencias de Kaggle?

Gracias por A2A.

Personalmente uso una tubería con archivos MAKE porque puede combinar salidas de modelos independientemente de sus idiomas. Si está interesado, consulte la introducción y el ejemplo en Kaggler.

En Python, la forma más fácil de configurar una tubería de apilamiento es usar la tubería de scikit-learn y FeatureUnion. Este tutorial lo guía a través de cómo combinar salidas de diferentes modelos para crear características en detalle.

heamy es otro paquete de Python que admite el apilamiento, escrito por Kaggle Master, Artem Golubin (también conocido como rushter). Vea el ejemplo, así como Kaggle Kernel.

En Java, Kaggle Grandmaster, Mario Michailidis (también conocido como kazAnova) escribió StackNet. Incluye muchas implementaciones de ML populares. Echa un vistazo a esta introducción en No Free Hunch

Sin embargo, mi recomendación para el apilamiento o cualquier tubería de Kaggle es construir su propia tubería. Puede aprender y mejorar mucho diseñando y construyendo una tubería robusta reutilizable.

¡Buena suerte! 🙂

Sebastian Raschka tiene una buena introducción al apilamiento [1] (para modelos de clasificación).

Puedes encontrar el cuaderno aquí .

[Editar]

Como mencionó Sebastian Raschka en la sección de comentarios, el cuaderno anterior no se trata de apilar sino de ensamblar , embolsar e impulsar la mayoría de votos (que son otros algoritmos de meta-aprendizaje).

Para implementaciones de apilamiento , verifique estos enlaces:

  • Clasificador de apilamiento – mlxtend
  • StackingCVClassifier – mlxtend

[/Editar]

Aparte de eso, puede consultar este núcleo de Kaggle [2] [3] y la publicación de blog [4].

Buena suerte.

Notas al pie

[1] Ensemble learning – Wikipedia

[2] Tu hogar para la ciencia de datos

[3] Introducción al ensamblaje / apilamiento en Python

[4] Una guía de Kaggler para apilar modelos en la práctica

Si está buscando una biblioteca de aprendizaje de conjunto con una API de estilo Scikit-learn, es posible que desee echar un vistazo a ML-Ensemble. Es un paquete de terceros afiliados a Scikit-learn.

También hay algunas herramientas útiles para la selección de modelos que también pueden ayudarte a ajustar el conjunto.

¡Buena suerte!

More Interesting

OpenCV: ¿Cómo creo un conjunto de datos de descriptores de imagen con SIFT?

¿De qué sirve un alumno constante?

¿Qué tipo de antecedentes estadísticos debo tener para tomar el curso de Reconocimiento de patrones? Cual estadística Qué libro es útil para mi preparación?

¿Por qué se considera F # un buen lenguaje para el aprendizaje automático?

¿Cuáles son las ventajas y desventajas de las API de servicios cognitivos de Microsoft?

Cómo comenzar una investigación independiente en aprendizaje profundo

¿Implementó algoritmos de aprendizaje automático desde cero con el propósito de aprender?

¿Qué significa decir: "En la geometría de la información, el paso E y el paso M se interpretan como proyecciones bajo dos conexiones afines"?

¿Cuáles son las diversas aplicaciones del aprendizaje automático en ciencias de la salud / ciencias de la vida?

¿Qué tema es adecuado para un taller de aprendizaje automático para estudiantes de secundaria típicos?

Cómo comenzar mi investigación sobre el aprendizaje por refuerzo si no soy bueno en Python

Cómo analizar un algoritmo de repetición selectiva

¿Son el aprendizaje automático / aprendizaje profundo / ciencia de datos, realmente ciencia espacial para que un tipo promedio entienda e implemente?

¿Cuál es la divergencia KL entre un Gaussiano y un Student-t?

¿Por qué la mayoría de las competencias recientes se centran en el aprendizaje profundo / redes neuronales? ¿No crea esto un desequilibrio en los tipos de problemas que se ofrecen?