¿Hay puestos de ciencia de datos con un mayor énfasis en big data y estadísticas?

Si observa la mayoría de las descripciones de ciencia de datos hoy, una gran mayoría de ellas involucra Big Data y estadísticas. Realmente tiene que dividir los diversos tipos de puestos de ciencia de datos:

Analista de datos: normalmente se ocupa de evaluar e informar los resultados utilizando técnicas de visualización de datos como D3.js y Tableau.

Científico de datos: realiza análisis de datos exploratorios en conjuntos de datos para obtener una comprensión profunda de lo que implican los datos. Después de esto, se pueden implementar algunos algoritmos de Machine Learning para realizar algunos análisis predictivos / prescriptivos basados en los datos dados. Esto puede implicar trabajar con Big Data, por lo que los científicos de datos pueden requerir algún conocimiento sobre la informática en clúster (Hadoop, Spark, etc.)

Ingeniero de datos: configura la arquitectura y el proceso para realizar análisis de Big Data. Estos ingenieros suelen tener un conocimiento más profundo sobre el marco informático de Cluster. Los científicos de datos utilizan la arquitectura Big Data creada por los ingenieros de datos para su trabajo.

Estas han sido mis observaciones desde que ingresé al Data Science Arena. Diría que el analista / científico de datos requiere más conocimiento en estadística que el ingeniero de datos, y el científico / ingeniero de datos requiere más conocimiento sobre Big Data que el analista de datos.

¿Cuál es la diferencia entre estadísticos y adivinos?

¿Por qué, en su opinión, tantas compañías de investigación clínica se niegan a usar Python en lugar de SAS o R?

¿Cómo comenzaría la optimización de negocios utilizando análisis de datos y aprendizaje automático?

¿Cuáles son algunas ideas de proyectos de graduación en el campo del análisis de datos, en relación con la ingeniería industrial u otras especialidades de ingeniería?

¿Qué significa dns_probe_finished_no_internet?

¿Cómo deberían funcionar mejor la ciencia y la ingeniería de datos?

Las responsabilidades de los roles de la ciencia de datos varían mucho, ya que algunos tienen más que ver con el aprendizaje automático =, lo que requiere más conocimientos de grandes datos y estadísticas, mientras que algunos implican muchos análisis ad hoc; algunos implican principalmente informes, y algunos de investigación. Entonces, sí, no todos los roles de ciencia de datos se crean de la misma manera, y el conocimiento requerido depende en gran medida de las necesidades de la empresa / iniciativa.

Ransford Hyman

More Interesting

¿Cuál es la diferencia entre data.frame y data.table en R (lenguaje de programación)?

Cómo cuidar sus datos de aprendizaje automático cuando hay demasiados experimentos

¿Cuáles son algunos buenos paquetes de R para el análisis de datos cualitativos?

¿Cómo alguien más nuevo pone el pie en la puerta de la ciencia de datos, tanto en términos de aprendizaje como de trabajo?

¿Cómo sabemos qué estructura de datos es mejor para el problema simplemente observando cuidadosamente el problema?

¿Cuáles son algunas iniciativas / compañías involucradas en el uso de la ciencia de datos para combatir el crimen, principalmente el tráfico de personas?

¿Hay puestos de ciencia de datos con un mayor énfasis en big data y estadísticas?

Para ser un buen analista de negocios, ¿qué tan bueno debería ser en R prog? ¿Están bien los conceptos básicos o debo tener un conocimiento profundo de ellos?

En ajedrez, ¿por qué es tan ventajoso jugar al blanco?

¿Todos los trabajos de analista de datos / ciencia de datos exigen altas horas de trabajo?