¿Hay puestos de ciencia de datos con un mayor énfasis en big data y estadísticas?

Si observa la mayoría de las descripciones de ciencia de datos hoy, una gran mayoría de ellas involucra Big Data y estadísticas. Realmente tiene que dividir los diversos tipos de puestos de ciencia de datos:

Analista de datos: normalmente se ocupa de evaluar e informar los resultados utilizando técnicas de visualización de datos como D3.js y Tableau.

Científico de datos: realiza análisis de datos exploratorios en conjuntos de datos para obtener una comprensión profunda de lo que implican los datos. Después de esto, se pueden implementar algunos algoritmos de Machine Learning para realizar algunos análisis predictivos / prescriptivos basados ​​en los datos dados. Esto puede implicar trabajar con Big Data, por lo que los científicos de datos pueden requerir algún conocimiento sobre la informática en clúster (Hadoop, Spark, etc.)

Ingeniero de datos: configura la arquitectura y el proceso para realizar análisis de Big Data. Estos ingenieros suelen tener un conocimiento más profundo sobre el marco informático de Cluster. Los científicos de datos utilizan la arquitectura Big Data creada por los ingenieros de datos para su trabajo.

Estas han sido mis observaciones desde que ingresé al Data Science Arena. Diría que el analista / científico de datos requiere más conocimiento en estadística que el ingeniero de datos, y el científico / ingeniero de datos requiere más conocimiento sobre Big Data que el analista de datos.

Las responsabilidades de los roles de la ciencia de datos varían mucho, ya que algunos tienen más que ver con el aprendizaje automático =, lo que requiere más conocimientos de grandes datos y estadísticas, mientras que algunos implican muchos análisis ad hoc; algunos implican principalmente informes, y algunos de investigación. Entonces, sí, no todos los roles de ciencia de datos se crean de la misma manera, y el conocimiento requerido depende en gran medida de las necesidades de la empresa / iniciativa.