Me temo que no puedo darle un conjunto perfecto de pasos que lo ayudarán a convertirse en un ingeniero de datos Y no en un científico de datos, pero puedo ayudarlo a obtener algo de claridad.
¿Por qué estoy calificado para responder esta pregunta? Por mi pasado. De hecho, me propuse convertirme en Data Scientist. Fui a la escuela de posgrado, me especialicé en Ciencias de la Computación y me aseguré de que mis cursos estuvieran llenos de cursos relacionados con la ciencia de datos. Estaba emocionado de poder usar la palabra de moda con autoridad.
Mi primera pasantía fue una pasantía de Data Science. Me dieron la tarea de investigar las enormes cantidades de datos que habían acumulado en su almacén de datos. Al mismo tiempo, también me preocupaba dónde y cómo entraban los datos.
- ¿Cuál es la diferencia entre Data science, Big Data y Hadoop?
- ¿Cuál es la mejor arquitectura de chispa (big data) crees que para este caso de uso?
- Cómo manejar datos incrementales en la tabla de la colmena
- ¿Esperamos que se creen más trabajos en las pruebas de Big Data dados los enormes requisitos para los roles de desarrollador de Big Data?
- Si hay Big Data, ¿hay también Small Data? ¿Por qué no nos enteramos de eso?
Luego, mi segunda pasantía fue nuevamente una pasantía de ‘Ciencia de datos‘. Sin embargo, esta vez mis tareas estaban al otro lado del velo. Estaba más involucrado en llevar los datos al almacén. Como resultado, comencé mis habilidades para estar más alineado con el de un ingeniero de datos.
Antes de que cualquier organización profundice en los ámbitos de la ciencia de datos, hay una fase de transformación involucrada. Durante esta fase, el objetivo es obtener todos los datos de forma interna, preferiblemente en un solo lugar. Solo después de esta fase, un científico de datos puede realmente trabajar para derivar cualquier valor de los datos.
Mi punto es: unirse a dicha organización y construir una plataforma de ingeniería de datos desde cero en presencia de un mentor le brindaría la mejor experiencia posible. En mi opinión, ese debería ser el comienzo perfecto para su carrera como ingeniero de datos.
Por supuesto, respondí cómo ser ingeniero de datos. Ahora, ¿cómo NO CONVERTIRSE en un científico de datos? La forma más obvia es no solicitar un puesto de Científico de Datos o un puesto en un equipo de Datos que requiera que esté más involucrado con la obtención de información de los datos. En su lugar, solicite puestos en los que sea responsable de configurar la plataforma. Pero no hay una forma segura de no convertirse en un Científico de Datos si con el tiempo su trabajo requiere que use varios sombreros.
Otro punto a tener en cuenta son las habilidades que se requieren para ser un ingeniero de datos:
- SQL, que es imprescindible
- Un lenguaje de secuencias de comandos, por ejemplo: Python
- Pasos de una tubería ETL y su importancia
- Buenas habilidades algorítmicas
- Varios (dependiendo de los requisitos del trabajo)