Aquí está la diferencia entre el científico de datos, el analista de datos y el ingeniero de datos (Business Intelligence):
Otros roles son híbridos de uno de estos tres roles. Por ejemplo, analista de BI.
Marco de referencia:
- ¿Dónde debo solicitar un trabajo de enseñanza de big data en Bangalore?
- ¿Cuáles son los procesos involucrados en el servicio de anexión de datos?
- ¿Cuál es la diferencia entre Data Science y Data Analytics?
- Cómo encontrar un candidato apasionado con experiencia de 0 a 1 año para reclutar y capacitarse en ciencia de datos
- ¿Cómo se puede utilizar la realidad virtual para enseñar ciencia de datos de manera más eficiente?
Debe averiguar qué preguntas hace la empresa. Se pueden clasificar en tres cubos:
- Qué
- Por qué
- Que sigue
Ahora, asignemos cada una de estas preguntas al rol.
Ingeniero de datos:
- Que :
¿Cuál es mi número de ventas para este trimestre?
¿Cuál es el beneficio para este año hasta la fecha?
¿Cuál es mi número de ventas en los últimos 6 meses?
¿Cómo fueron las ventas en el mismo trimestre del año pasado?
…
Todas estas preguntas se utilizan para informar sobre hechos; Muchas de estas preguntas pueden ser respondidas mediante extracciones manuales de datos por parte de un analista Jr., pero la mayoría de las organizaciones desean automatizar y establecer una plataforma de autoservicio. Los ingenieros de datos deben automatizar las canalizaciones de datos y construir una ubicación central para alojar todos los datos para ayudar a responder preguntas de “qué”. Además, la ubicación central se convierte en un lugar de referencia para analistas de datos y científicos de datos para consultar los datos que necesitan.
Herramientas utilizadas: ETL, Hadoop, Spark, Python, SQL
Analista de datos:
- Por qué :
¿Por qué mi número de ventas es mayor para este trimestre en comparación con el trimestre anterior?
¿Por qué estamos viendo un aumento en las ventas en los últimos 6 meses?
¿Por qué estamos viendo una disminución en las ganancias en los últimos 6 meses?
¿Por qué la ganancia de este trimestre es menor en comparación con el mismo trimestre del año pasado?
…
Todas estas preguntas intentan descubrir por qué sucedió algo. Un analista de datos generalmente toma una puñalada al respecto. Podría usar la plataforma existente construida por ingenieros de datos para extraer datos y / o también fusionar otros conjuntos de datos. Luego, él / ella aplica técnicas de análisis de datos en los datos para responder a la pregunta del “por qué” y ayudar a un usuario de negocios a obtener información útil.
Herramientas utilizadas: SQL, Excel, Tableau, R / Python (Básico)
Científico de datos:
- Que sigue:
¿Cuál será mi pronóstico de ventas para el próximo año?
¿Cuál será nuestro beneficio el próximo año para el escenario A, B y C?
¿Qué clientes cancelarán / abandonarán el próximo trimestre?
¿Qué nuevos clientes se convertirán en clientes de alto valor?
…
Todas estas preguntas intentan “predecir” lo que sucederá después (en base a datos / patrones históricos). A veces, en primer lugar, no conoce las preguntas, por lo que hay mucho pensamiento proactivo y, por lo general, un científico de datos lo está haciendo. A veces comienza con un problema comercial de alto nivel y crea una “hipótesis” para impulsar su análisis. Todo esto puede clasificarse en “ciencia de datos”.
Herramientas utilizadas: R / Python (avanzado) + Herramientas utilizadas por Data Analyst
Fuente: Blog de Paras Doshi (Insight Extractor)