¿Qué diferencia a una solución típica de Kaggle en algún lugar en el medio del paquete frente a alguien en, digamos, el 5-10% superior?

Perseverancia.

Nada más que perseverancia. Cuando solía hacer Kaggle (gané un par de competencias, clasifiqué hasta 12 en el mundo, me convertí en uno de los 88 Grandes Maestros actuales), pude alcanzar el 90-95% de mi puntaje final con 4–8 horas de trabajo o Menos. Eso ya incluía soluciones de ensamblaje y metamodelos.

Continuar mejorando ese puntaje es a menudo más un desafío mental que un desafío de habilidades. Miras el problema, miras la tabla de clasificación, ves a las personas que te pasan en la tabla de clasificación por mejoras de 3 ° o 4 ° decimales sobre tu solución, ves al líder de la tabla de clasificación con una ventaja de 3 ° dígito sobre ti … en ese momento tu cerebro y soul se pregunta por qué en el mundo desearía pasar 2 meses más de trabajo para mejorar su solución por un margen que en la mayoría de los casos no hace absolutamente ninguna diferencia en un entorno empresarial. Ahí es donde debe profundizar y perseverar en contra de su mejor juicio y simplemente aceptar que “desperdiciará” algunas semanas de su vida hacia una meta que parece tener poco o ningún sentido.

Lo hice, tuve éxito un par de veces y recolecté un par de cheques agradables, fallé muchas otras veces y tuve que reflexionar sobre por qué había aprendido. No me arrepiento de la experiencia, pero en algún momento sentí que había dado suficiente y había obtenido suficiente de este tipo de experiencia y seguí adelante.

Ahora, no preguntaste al respecto, pero si te estás preguntando qué te hace hacer un top 10 en lugar de un top 10%, entonces esa es una historia diferente e involucra (principalmente) una tonelada de ensamblaje, la capacidad de fallar hacia adelante rápidamente y prueba tantas hipótesis como puedas en el marco de tiempo dado, y mucha, mucha suerte.

More Interesting

Cómo aprender y probar la tecnología de big data utilizando GitHub

Cómo cuidar sus datos de aprendizaje automático cuando hay demasiados experimentos

¿Las oportunidades de trabajo en big data / machine learning disminuyen después de dos años?

¿Cuándo debe un principiante en ciencia de datos comprender que ha elegido un campo equivocado?

Cómo seleccionar los atributos sensibles en un conjunto de datos

¿Cuáles son los mejores campos de arranque de ciencia de datos en términos de inserción laboral?

¿Cuáles son las habilidades más importantes para un ingeniero de datos?

¿Cuándo explotará la burbuja de ciencia de datos?

¿Cuáles son las rutas de aprendizaje típicas del análisis de datos?

Para algoritmos de bandidos con múltiples brazos, ¿tiene sentido dejar de muestrear un brazo si el límite de confianza superior p% es menor que el límite de confianza inferior p% de un brazo de diferencia?

¿Qué hizo que Palantir fuera tan exitoso?

¿Qué es una aplicación de aprendizaje automático y cómo se usa, que no es una de las siguientes: redes sociales, motores de búsqueda, bioinformática, neurociencia, investigación en el CERN, ciencia actuarial y sistemas de recomendación?

¿Vim es adecuado para la ciencia de datos?

Como analista de negocios de TI, ¿cómo pasar de un fondo de depósito de datos a análisis de datos y proyectos de inteligencia empresarial?

¿Cuáles son las diferentes herramientas utilizadas en la industria financiera para el análisis de datos?