¿Que competencia de kaggle debería elegir?

Si su objetivo es mejorar usted mismo y obtener un mejor trabajo, definitivamente puede usar algunos de sus problemas sin fecha de finalización y posiblemente sin clasificación. Algunos de ellos tienen discusiones muy interesantes en el foro y pueden ser divertidos y una fuente de conocimiento comercializable.

Sin embargo, si desea algo en su CV, realmente necesita un alto rango (ni siquiera tiene que ganar un premio en efectivo) en una competencia real. Si alguien pone dinero en él, es una buena señal de que es un problema real y que la competencia fue feroz.

Para los puestos Junior, me gusta ver cualquier actividad de Kaggle, independientemente del rendimiento, porque me dice algo sobre el carácter del solicitante que elige pasar tiempo y participar. Para cualquier cosa que no sea bastante junior, esperaría un rendimiento razonable en la competencia de Kaggle.

Tengo un método para obtener una visión rápida del rendimiento de Kaggle en problemas que en realidad no he atacado. El punto de referencia simple, como arrojar el conjunto de datos en bruto / casi en bruto en RandomForest o similar es un 60, el mejor en la tabla de clasificación es 100 e interpolar linealmente cualquier otra cosa. Considero que este método es resistente a muchos problemas y métricas de evaluación, así como resistente a lo buenas que son las soluciones publicadas en el foro (a diferencia del rango de la tabla de clasificación, que puede ser engañoso)

Los mejores científicos de datos pueden anotar constantemente 90. Aunque contrataría también puntuaciones más bajas, si pueden explicar su trabajo, presentarlo bien y poseer otras habilidades importantes.

Si es nuevo en Kaggle, comience con los enumerados en 101.

Aquí hay algunos ejemplos que hice con MATLAB.

  • Comenzando con las competiciones de ciencia de datos de Kaggle
  • Redes neuronales artificiales para principiantes

¡Buena suerte!

More Interesting

El programa MSAN en USF se ve muy bien. Pero, ¿por qué el curso no se menciona en ninguno de los 10 mejores rankings de cursos de análisis empresarial?

¿Qué distribución de Linux es más adecuada para principiantes y entusiastas de la ciencia de datos / big data?

¿Qué credencial de ciencia de datos es más valiosa, un certificado en línea de la escuela de extensión de Harvard o un MSC en línea del Data Science Tech Institute (París)?

¿Cómo elegir un filamento ABS de alta calidad? ¿Cómo entiendo los datos técnicos relevantes?

¿Cuáles son algunos buenos libros / documentos sobre aprendizaje kernelized, en general y especialmente con SVM?

¿Qué herramientas y tecnologías de Bigdata, aprendizaje automático y PNL utiliza Quora?

¿Cuál es la diferencia entre análisis cuantitativo y ciencia de datos?

¿Cómo y de qué sitios web y libros puedo aprender en profundidad los conceptos de ciencia de datos para prepararme para el nivel de entrevista?

¿En qué se diferencian las matemáticas que usan los cuantos de las matemáticas que usan los científicos de datos?

Cómo interpretar la relación entre los conjuntos de datos.

¿Cuál es el futuro de Big Data en la gestión del talento?

¿Por qué Data Science es tan popular en los Estados Unidos pero casi inexistente en Suiza?

¿Los estadísticos están siendo reemplazados gradualmente y actualmente por científicos de datos?

Al entrenar un modelo de ML, ¿debo descartar los datos que tienen características faltantes o debo usar un valor medio para esos valores faltantes?

En la regresión logística, ¿cómo encuentra el mejor límite de decisión posible algorítmicamente?