Cómo comenzar a trabajar en conjuntos de datos de Kaggle

Kaggle Kernels

Recomendaría comenzar con el Titanic Dataset o el Iris Dataset.

Una vez que busque un conjunto de datos y vaya a esa página, haga clic en Kernels .

¿Cuál ha sido la experiencia de la gente con RapidMiner?
¿La ingeniería de características es relevante para los bosques aleatorios? ¿Cómo son relevantes las transformaciones de centrado, escala y Box-Cox en este contexto?
¿Cuál es el significado de muchas sinapsis entre dos neuronas en la red neuronal?
Cómo comenzar la investigación en Machine Learning
¿Existe un programa de tipo PageRank para organizar mis canales RSS diarios?

Los núcleos son básicamente códigos escritos por otros usuarios de Kaggle. Puede incluir valores de salida, gráficos, diagrama, tablas, etc.

Revise los núcleos, elija uno con un número decente de votos a favor y comience a analizar ese núcleo. Intente comprender el código escrito y ejecútelo en su propio entorno. Si no puede comprender una parte del código, busque en Google la sintaxis y qué hace exactamente ese fragmento de código. Así es como puedes aprender.
Una vez que hagas esto con un par de Kernels, comienza a escribir tu propio código. Tome un conjunto de datos e intente predecir algo que alguien ya tiene, pero utilizando un enfoque diferente.
Publique esto en su cuenta de Kaggle para que pueda ayudar a otra persona.

Espero que mi respuesta ayude. ¡Todo lo mejor! 🙂

Análisis de datosAprendizaje automáticoBig DataCiencia dedatosKaggleMinería de

¿Por qué los lars y glmnet dan diferentes soluciones? ¿Cuál es mejor?

¿Puedo entrenar una red neuronal convolucional (CNN) con imágenes de fondo diferente en blanco y negro?

¿Cuál es el mejor algoritmo para descubrir características bien correlacionadas?

¿Dónde puedo encontrar a alguien que me enseñe 1 a 1 sobre el aprendizaje automático?

Cómo recopilar datos para problemas de la vida real mientras se entrena un modelo de aprendizaje automático

¿Cuál es la diferencia entre Python y el aprendizaje automático?

Si eres principiante, lo que supongo que debes ser, entonces solo debes comenzar con los núcleos básicos de kaggle

1 conjunto de datos Titanic

2 actos aleatorios de pizza

3 demanda de bicicletas compartidas

Tómese el tiempo suficiente para comprender el conjunto de datos y luego intente comprender los núcleos en ese conjunto de datos e impleméntelos en su idioma conocido principalmente R o Python y seguramente aprenderá mucho y, finalmente, podrá participar en competiciones activas y aumentar su rango.

Otros sitios notables que puedes probar son:

1 Analytics Vidhya

2 crowdanalytix

Bineesh Thomas

Uno de los conjuntos de datos más fáciles de comenzar con Kaggle son los datos de Iris. No es un gran conjunto de datos y está bien explicado desde un punto de vista académico.

Si realmente eres un principiante, te sugiero que tomes un curso udemy donde demuestren el uso de datos de Kaggle y construyan modelos predictivos.

Jatinpal Singh

More Interesting

¿Qué es un giroscopio? ¿Como funciona?

Cómo visualizar características de alto nivel en una red neuronal convolucional profunda

¿Cuáles son los beneficios y desafíos de hacer una investigación de aprendizaje profundo en la academia, en comparación con la industria?

¿Cuál es la mejor clase de Machine Learning en Penn?

¿Qué significa el término de procesamiento del lenguaje natural 'modelo de lenguaje' en términos simples?

¿Podemos agregar la capa SVM como capa inferior en la arquitectura CNN para una mejor clasificación?

¿Cómo funciona un mecanismo de atención en el aprendizaje profundo?

¿Cuál es el mejor método para la reducción de dimensionalidad y la selección / extracción de características en datos de espectrometría de masas?

¿Aprender implementando un buen enfoque, o leyendo y usando marcos como TensorFlow?