¿Dónde puedo encontrar artículos sobre los métodos utilizados para ganar las competencias de Kaggle?

No estoy seguro acerca de los artículos, pero gané una competencia y puedo decirte lo que se necesita para ganar una competencia:

  1. Software : puede usar cualquier software que desee, pero Python y R son prácticamente el estándar hoy en día. Cuanto mejor sea la codificación, más rápido podrá moverse, más cosas puede probar.
  2. Algoritmos : debes conocer casi todos los algos en un paquete como sklearn porque es realmente difícil decir por adelantado qué funcionará mejor. Además, necesitará aprender algunas de las otras soluciones populares como XGBoost, Vowpal Wabbit y libFM.
  3. Trucos de Kaggle : es necesario aprender a explotar cada gota de información de los datos, algoritmos y tablas de clasificación. Eso significa, ajustar (pero no sobreajustar) el LB, aprendizaje semi-supervisado, mega conjuntos, …
  4. Ensamblaje : necesita saber cómo hacerlo bien. Olvídate de promediar modelos, estamos hablando de metamodelos y metamodelos.
  5. Formando equipo : formar equipo en el momento adecuado con el socio adecuado puede marcar una gran diferencia.
  6. Validación cruzada : tengo que saber cómo hacerlo bien.
  7. Suerte : juega un papel muy importante cuando los 100 mejores están separados por decimales.
  8. Ingeniería de características : muy importante para algunas competiciones, prácticamente inútil para conjuntos de datos no identificados.
  9. Perseverancia : cada Kaggler superior obtendrá cerca del 95% de su mejor puntaje final en un día más o menos. Así de buenos son. Pero solo la perseverancia te dará el último 5%.

Muchos competidores discuten sus soluciones y publican enlaces a sus publicaciones de blog en los foros después de que la competencia ha finalizado. Elegir un par de concursos terminados al azar y mirar los hilos del foro produjo algunos ejemplos:

  • Predecir preguntas cerradas sobre desbordamiento de pila
  • Detectando insultos en comentarios sociales

En la actualidad, muchos de ellos están agregados en la sección de entrevistas del blog de Kaggle: Tutoriales y entrevistas a los ganadores.

Hay una gran página para artículos dedicados a soluciones ganadoras. Documentos académicos – Kaggle

Aquí hay un tutorial bastante detallado de iPython Notebook para la competencia Titanic

More Interesting

¿Cuáles son algunos de los documentos fundamentales en el aprendizaje automático / algoritmos analíticos?

¿Es posible tener experiencia en desarrollo web, desarrollo de Android, resolución de problemas, IA y ML para tener un buen trabajo, o solo necesito concentrarme en un campo y no fusionar campos?

¿Cómo se eligieron las palabras sesgo y varianza (Machine Learning)?

¿Cuáles son algunas formas de preprocesar imágenes antes de aplicar redes neuronales convolucionales para la tarea de clasificación de imágenes?

¿Qué distingue una capa de una red neuronal de otras capas?

¿Qué es la divergencia contrastante?

¿Hay algún hallazgo reciente que indique que la ascendencia cerebral ocurre como un esquema de error de propagación inversa?

¿Cómo podemos usar la cadena de Monte Carlo Markov y bayesiano no paramétrico para la reducción de dimensionalidad?

Cómo usar el pronóstico de series de tiempo para predecir el tiempo que tomaría realizar alguna tarea

¿Qué tan difícil es para un estudiante de pregrado ser aceptado en un grupo de investigación en la universidad?

Cómo hacer que una red neuronal funcione como PCA

¿Cómo funcionan los vectores de párrafo frente a codificadores automáticos variacionales?

Además de las redes neuronales profundas, ¿existen antecedentes para cálculos largos con una inferencia máxima a posteriori eficiente?

¿Qué especificaciones de computadora se recomiendan para entrenar redes neuronales?

¿Cuál es el mejor clasificador que puedo usar en 'Reconocimiento facial en tiempo real' después de extraer funciones usando 'Alexnet'?