Si observa la mayoría de las descripciones de ciencia de datos hoy, una gran mayoría de ellas involucra Big Data y estadísticas. Realmente tiene que dividir los diversos tipos de puestos de ciencia de datos:
Analista de datos: normalmente se ocupa de evaluar e informar los resultados utilizando técnicas de visualización de datos como D3.js y Tableau.
Científico de datos: realiza análisis de datos exploratorios en conjuntos de datos para obtener una comprensión profunda de lo que implican los datos. Después de esto, se pueden implementar algunos algoritmos de Machine Learning para realizar algunos análisis predictivos / prescriptivos basados en los datos dados. Esto puede implicar trabajar con Big Data, por lo que los científicos de datos pueden requerir algún conocimiento sobre la informática en clúster (Hadoop, Spark, etc.)
- ¿Cómo puede un sitio web de video en línea beneficiarse de Big Data?
- ¿Cuál es la fuente de datos perfecta para el análisis de sentimientos a nivel de documento?
- Cómo comenzar una carrera con Big Data y cuál es la forma de conseguir un trabajo en Big Data como una forma más fresca
- ¿Cuáles son las mejores revistas de estudios de datos críticos?
- ¿Cuándo no debería usar un término constante en regresión lineal? ¿Alguien puede explicarlo con un ejemplo?
Ingeniero de datos: configura la arquitectura y el proceso para realizar análisis de Big Data. Estos ingenieros suelen tener un conocimiento más profundo sobre el marco informático de Cluster. Los científicos de datos utilizan la arquitectura Big Data creada por los ingenieros de datos para su trabajo.
Estas han sido mis observaciones desde que ingresé al Data Science Arena. Diría que el analista / científico de datos requiere más conocimiento en estadística que el ingeniero de datos, y el científico / ingeniero de datos requiere más conocimiento sobre Big Data que el analista de datos.