Cómo comenzar a trabajar en conjuntos de datos de Kaggle

Kaggle Kernels

Recomendaría comenzar con el Titanic Dataset o el Iris Dataset.

Una vez que busque un conjunto de datos y vaya a esa página, haga clic en Kernels .

Los núcleos son básicamente códigos escritos por otros usuarios de Kaggle. Puede incluir valores de salida, gráficos, diagrama, tablas, etc.

  • Revise los núcleos, elija uno con un número decente de votos a favor y comience a analizar ese núcleo. Intente comprender el código escrito y ejecútelo en su propio entorno. Si no puede comprender una parte del código, busque en Google la sintaxis y qué hace exactamente ese fragmento de código. Así es como puedes aprender.
  • Una vez que hagas esto con un par de Kernels, comienza a escribir tu propio código. Tome un conjunto de datos e intente predecir algo que alguien ya tiene, pero utilizando un enfoque diferente.
  • Publique esto en su cuenta de Kaggle para que pueda ayudar a otra persona.

Espero que mi respuesta ayude. ¡Todo lo mejor! 🙂

Si eres principiante, lo que supongo que debes ser, entonces solo debes comenzar con los núcleos básicos de kaggle

1 conjunto de datos Titanic

2 actos aleatorios de pizza

3 demanda de bicicletas compartidas

Tómese el tiempo suficiente para comprender el conjunto de datos y luego intente comprender los núcleos en ese conjunto de datos e impleméntelos en su idioma conocido principalmente R o Python y seguramente aprenderá mucho y, finalmente, podrá participar en competiciones activas y aumentar su rango.

Otros sitios notables que puedes probar son:

1 Analytics Vidhya

2 crowdanalytix

Uno de los conjuntos de datos más fáciles de comenzar con Kaggle son los datos de Iris. No es un gran conjunto de datos y está bien explicado desde un punto de vista académico.

Si realmente eres un principiante, te sugiero que tomes un curso udemy donde demuestren el uso de datos de Kaggle y construyan modelos predictivos.