¿Alguien puede responder a estas preguntas relacionadas con la competencia de kaggle?

Fui yo quien hizo esta pregunta hace un par de meses cuando no tenía idea. Después de ganar algo de experiencia, creo que puedo responderla.

# 1: Encontrará un archivo de Excel de envío de muestra donde están disponibles los datos de entrenamiento y prueba. Puede ver cómo quieren ver su archivo de envío final.

# 2: Después de hacer el modelo, puede convertirlo en un marco de datos y luego en un csv para enviarlo.

# 3: nada! Pero el conocimiento de Python y bibliotecas como pandas, numpy y sklearn ayuda mucho. Si conoce las estadísticas, sabe más que suficiente para comenzar.

# 4: Conjunto de datos de entrenamiento, es el conjunto de datos que tenemos disponible para entrenar a nuestro modelo. Su modelo aprende de estos datos. Puede suponerlo como ilustración en el libro de texto cuyas respuestas también se dan y los datos de prueba, el conjunto puede ser comparado con el examen que das después de suficiente entrenamiento. Debe encontrar las respuestas a la pregunta formulada en el examen. Lea Wikipedia para obtener una definición adecuada, es solo para crear información.

Primero lea todo el contenido disponible en la página de la competencia que desea resolver. Todas sus preguntas serán respondidas.

1.Cada competencia tiene un archivo sample_submission.csv que es el formato que necesita para enviar los datos.

2.Utilice la biblioteca Pandas para crear un archivo csv que tenga el mismo formato que sample_submission.csv (vaya a algunos tutoriales en línea, tiene muchos)

3.Comience con un tutorial titánico en kaggle con python / R. es muy básico pero sería lo suficientemente bueno como para comenzar a caminar

4. El aprendizaje automático es casi un cerebro artificial, así que tomemos una analogía de que eres un niño y tu maestro te está enseñando multiplicaciones. El profesor le piensa algunos ejemplos y técnicas sobre cómo hacer la multiplicación y ahora, si le pregunto todos los ejemplos que aprendió, puede resolverlos, pero puede que haya memorizado los resultados, así que para evaluarlo, le doy una nueva tarea con un Un nuevo conjunto de multiplicaciones si lo resuelve, significa que aprendió la multiplicación.

De la misma manera que le está enseñando al cerebro artificial que si los datos son así, el resultado es así (los datos en los que el cerebro artificial aprende se llaman datos del tren). Después de entrenar su cerebro artificial, lo prueba con los nuevos datos y verifica qué tan bueno ha aprendido con los datos invisibles, estos son datos de prueba