¿Qué tan útil es una participación en competencias de Kaggle para la carrera de ciencia de datos?

No mucho directamente. Me clasifiqué en el puesto 12 en el ranking global de Kaggle y gané una competencia. Sin embargo, Kaggle sigue siendo un nicho y la mayoría de las personas en la industria de la ciencia de datos no tienen idea de lo que es (aparte de tal vez algún recuerdo del premio de Netflix). Para los extraños también es realmente difícil evaluar el valor de los resultados de Kaggle. Cuando dices “Soy x de un científico de datos de 400k en Kaggle”, la gente generalmente pide nombrar a algún científico de datos famoso en Kaggle y no podrás nombrar a ninguno. Lo mismo para las competiciones. Cuando dices que estaba x de 1000 en la competencia y, ¿contra quiénes competiste 1000? (Respuesta: una mezcla de científicos de datos (10%), estudiantes, profesionales de otros campos que desean aprender ML, …)

Dicho esto, el mayor valor que obtendrá de Kaggle es el conocimiento. Lo que aprenda en Kaggle será un gran activo en su carrera.

En cuanto a la clasificación, el número de competiciones en las que participó, no es tan útil. Las competiciones de Kaggle se pueden hacer de muchas maneras. Normalmente puedes participar solo y decir mucho. Puedes formar un equipo con alguien bueno y solo ver tu rango aumentar mientras ves películas. Puede enviar la presentación de otra persona (aquellos que tienen guiones de kaggle) y obtener el mismo rango (relativamente alto). Hay muchas formas de obtener rangos altos (aunque no rangos ganadores) que pueden impresionar a otros. Pero nunca saben si realmente hiciste esto. Solo tú lo sabías.

En términos de aprendizaje, creo que Kaggle es un gran lugar. Conocí personalmente a Kaggle hace ~ 6 meses y participé en ~ 6 competencias. Durante este tiempo, aprendí mucho, principalmente ” CÓMO MEJORAR TU MODELO “. Aprendí viendo los guiones de otros, aprendiendo nuevos algoritmos, ajustando parámetros para el mismo modelo. Aprendí a transformar mis datos para que me den más información. Aprendí a generar nuevas variables si las existentes no son suficientes. Aprendí …

Kaggle es un gran lugar para probar algo que aprendiste recientemente y será muy beneficioso para ti. El resultado no importa demasiado mientras consigas algo durante las competiciones.

Al participar en las competencias de Kaggle, te devuelve cualquiera de estas tres cosas: Conocimiento, un trabajo o Dinero. Data Scientist generalmente participa en concursos de Kaggle y muestra su cuenta de usuario de Kaggle en su currículum o en el perfil de LinkedIn. De esta forma, el reclutador puede verificar fácilmente su capacidad al ver su participación y desempeño. La mejor característica de Kaggle es su foro, no puedes encontrar un lugar mejor para hacer una pregunta de ML más que eso. La comunidad de Kaggle está ayudando mucho.

Hay muchos concursos de iniciación y conocimiento, y para ellos hay muchos tutoriales útiles disponibles. Sirve a grandes empresas como Facebook, Walmar Airbnb y les gusta organizar concursos y reclutas sobre la base del mejor rendimiento. Participar en competencias de Kaggle y alcanzar un rango es un logro de por vida. Esto impulsará su carrera y aumentará las oportunidades laborales.

Depende de lo que quieras evaluar.

No soy un gran fanático del aprendizaje automático competitivo, pero tiene sus méritos. Creo que trae tareas difíciles a la mesa que pueden mejorar la habilidad técnica en lo que respecta al aprendizaje automático.

Desde una perspectiva de CV, elegiré la tarea de prueba y el ajuste del equipo sobre los resultados de Kaggle todos los días. Se puede argumentar que alguien que compite en Kaggle debería, al menos en teoría, sobresalir en las tareas de prueba de aprendizaje automático, pero en una organización de equipo como la mía, tengo algunas dudas si eso se demostraría en la práctica.

Si ya está trabajando como científico de datos, no será de mucha ayuda. Si eres un estudiante universitario o estás interesado en el campo, te ayudará a aplicar todo ese conocimiento teórico a un problema real con un conjunto de datos interesante.