Divulgación: trabajo para Dataquest. Enseñamos ciencia de datos en línea y creemos en el uso de proyectos para ayudar a solidificar su aprendizaje y demostrar sus habilidades a los empleadores, ¡así que tenemos mucho que decir sobre el tema de la construcción de proyectos!
Tenemos una serie de publicaciones en el blog en Dataquest sobre la realización de proyectos para crear una cartera de ciencia de datos, y pensé en compartir algunos de los mejores consejos de esa serie, ya que es muy relevante para su pregunta.
En primer lugar, estoy de acuerdo en parte con la sugerencia de Ty de que tratar de elegir su proyecto antes de comenzar su bootcamp puede ser prematuro. Sin embargo, lo que puede hacer es comenzar a practicar el tipo de técnicas que querrá mostrar en su proyecto.
- ¿Dónde puedo encontrar algunos buenos documentos sobre ciencia de datos / análisis y aprendizaje automático?
- ¿Qué es una fuente de datos?
- Soy ingeniero de procesos trabajando en una especialidad petrolera y considerando la transición a la ciencia de datos. ¿Estaría haciendo el movimiento correcto?
- ¿Cuáles son los mejores recursos para aprender la visualización de datos?
- ¿Hay empresas en la India que empleen estudiantes universitarios y los capaciten en Big Data Analytics / Data Science?
Estas son las principales cosas que quieres demostrar:
- Limpieza de datos sin procesar desordenados, incluida la combinación de conjuntos de datos de múltiples fuentes. [1]
- Extrayendo información de los datos y comunicándolos claramente usando números, tablas y visualizaciones. [2]
- Hacer predicciones a partir de los datos utilizando técnicas de aprendizaje automático. [3]
- Cómo construir un proyecto independiente para que sus predicciones / análisis puedan repetirse con el tiempo en nuevos datos. [4]
Sugeriría que, en lugar de tratar de abordarlos de inmediato, debería intentar construir un proyecto más pequeño que se centre en cada uno. Para saber cómo se vería cada uno de estos con más detalle, sugiero leer este blog: La clave para crear un portafolio de ciencia de datos que le permita obtener un trabajo.
Por último, la clave de cualquier proyecto es seleccionar el conjunto de datos correcto. Hemos compilado algunos recursos específicamente para encontrar conjuntos de datos para diferentes tipos de proyectos aquí: 17 lugares para encontrar conjuntos de datos para proyectos de ciencia de datos.
En esta etapa, trate de no sentirse abrumado por conseguir que todo sea perfecto. Simplemente comienza a construir algo que use las habilidades que has aprendido hasta ahora. Te encontrarás con obstáculos y tendrás que buscar en Google y leer la documentación para lograr lo que quieres hacer.
Eso es algo realmente bueno, ya que es donde ocurre la mayor parte del aprendizaje.
Buena suerte, y si tiene alguna otra pregunta, no dude en dejar un comentario a continuación o enviarme un mensaje.
Notas al pie
[1] Creación de una cartera de ciencia de datos: narración de historias con datos
[2] Creación de una cartera de ciencia de datos: narración de historias con datos
[3] Cómo llegar al top 15 de una competencia de Kaggle usando Python
[4] Creación de una cartera de ciencia de datos: proyecto de aprendizaje automático