Soy un mentor de ciencia de datos reflexivo para 4 estudiantes, y enfatizo que es importante poder abordar una pregunta científicamente. ¿Recuerdas esas tablas triples que tenías que hacer en las ferias de ciencias de primaria y secundaria? Bueno, saca ese método científico en todo tu pensamiento. ¿Qué intentas contestar? Asegúrese de llegar a una hipótesis antes de explorar sus datos. De lo contrario, veré sus resultados simplemente como un estudio de observación y no como un experimento completo.
También es importante ser creativo. La creatividad es importante porque todo lo que quieras medir no será sencillo. Debe saber cómo definir con precisión un problema y descubrir cómo usar los atributos numéricos que ya tiene o averiguar cómo mapear / normalizar sus datos no numéricos. Otra habilidad necesaria es la comunicación. Un científico de datos debe ser bueno para comunicar lo que cree que su jefe quiere que se responda, aclarar esas suposiciones y entregar resultados sin un montón de jerga estadística.
Con respecto al plan de estudios, recomendaría tener una comprensión sólida de la limpieza de datos (valores faltantes, duplicados, etc.), análisis exploratorio de datos (estadísticas resumidas, tramas esenciales, etc.), aprendizaje supervisado y no supervisado, sumergirse en PNL y tener un poco experiencia con redes neuronales.
- ¿Cuáles son los grandes proyectos de datos en torno a craigslist?
- Cómo convertir del modelo de datos conceptual (CDM) al modelo de datos lógico (LDM)
- ¿Qué idioma utilizas para la manipulación de datos?
- ¿Qué es la minería de datos? ¿Cuál es la necesidad de la minería de datos?
- ¿Cuál es la diferencia entre la ciencia neuronal, el aprendizaje automático y la minería de datos?
Echa un vistazo al Thinkful Bootcamp en https://thinkful.com/bootcamp/da….