Hay dos roles amplios disponibles en el mundo de datos / Big-Data:
- Orientado a la ingeniería: ingenieros de fechas, especialistas en almacenamiento de datos, ingeniero de Big Data, ingeniero de Business Intelligence: todos estos roles se centran en construir esa tubería de datos utilizando código / herramientas para obtener los datos en una ubicación centralizada
- Orientado a los negocios: analista de datos, científico de datos: todos estos roles implican el uso de datos (de esas fuentes centralizadas) y ayudar a los líderes empresariales a tomar mejores decisiones. * *
* las empresas más pequeñas (o startups) tienden a tener roles donde los equipos pequeños (o solo una persona) lo hacen todo, por lo que la distinción no es tan evidente.
Ahora, dada su experiencia en python y programación, podría ser ideal para los roles de “ingeniero de datos” y recomendaría aprender sobre Apache spark (ya que puede usar el código de python) y comenzar a construir tuberías de datos. A medida que trabaje un poco más, puede aprender sobre cómo construir e implementar proyectos de aprendizaje automático de extremo a extremo con Python & Apache spark. Si adquieres estas habilidades y sigues aprendiendo, entonces estoy seguro de que terminarás con un buen proyecto.
- ¿Qué algoritmo está detrás de la convolución en MATLAB?
- ¿Cómo debo diseñar un buen algoritmo de disminución de tiempo?
- ¿No es posible en un árbol de búsqueda binario que el sucesor de un elemento tenga más de un hijo?
- Dados dos archivos de registro, cada uno con mil millones de nombres de usuario, ¿cómo podemos encontrar todos los nombres de usuario presentes en ambos archivos de registro de manera eficiente?
- ¿Debería un algoritmo de aprendizaje automático estar completo?
Espero que haya ayudado y buena suerte!