Creo que se supone que hay diferencia entre los dos perfiles. Desafortunadamente, la mayoría de las líneas de tiempo se difuminan en la industria, lo que termina confundiendo a las personas.
Aquí están mis 2 centavos en esto:
La principal diferencia se debe al objetivo y al público final o consumidor del trabajo respectivo. Un científico de datos es una persona que tiene sentido con los datos , utilizando algo de ciencia . El sentido es la palabra clave de funcionamiento. Y eso es lo que subraya la diferencia de objetivos aquí.
- ¿Cuáles son las características de big data?
- Tengo 29 años, estoy desempleado y espero un hijo a fin de año. Estoy tomando un curso en ciencia de datos. ¿Qué más puedo hacer para estar a la vanguardia del juego cuando empiezo a buscar trabajo nuevamente en 2016?
- ¿Cuál es la mejor manera de evaluar los tiempos de respuesta de AB?
- ¿AI y Data Science cambiarán la cara de los negocios? Si es así, ¿cómo será su futuro?
- ¿Cómo se aplica la ciencia de datos a la robótica?
Para un científico de datos, se trata de sacar conclusiones, inferencias, interpretaciones de los datos. Eso se puede hacer usando modelos de aprendizaje automático o haciendo pruebas de hipótesis (A / B) o incluso creando una nueva métrica de producto y validando a través de procedimientos estadísticos. En todos los ejercicios, el objetivo final de un científico de datos es comprender los datos.
Para un ingeniero de aprendizaje automático, el objetivo final es hacer que una máquina aprenda de los datos. El objetivo no es explicar o interpretar los datos para una mejor inferencia, sino construir un sistema en forma de un producto que sea mejor para predecir el objetivo final. La atención se centra en la predicción más que en la inferencia, a diferencia de lo que los científicos de datos intentan lograr.
Ahora la pregunta obvia. ¿Por qué ambos tienen objetivos diferentes? ¿No están ambos trabajando en los mismos datos y usando ciencia?
Bueno, los objetivos son diferentes porque el consumidor final o la audiencia del trabajo es diferente. Para los científicos de datos, el público final o consumidor es normalmente el lado comercial de una organización. Gente o un gerente de producto que posee un producto que quiere entender cómo está funcionando su negocio o producto. Por lo general, dicha audiencia es de origen empresarial con poco conocimiento técnico . Y es por eso que un científico de datos tiene la responsabilidad adicional de poder comunicar sus resultados y hallazgos en una interpretación muy poco técnica.
Para un ingeniero de aprendizaje automático, el consumidor final o la audiencia del trabajo suele ser el lado tecnológico de una organización. Y la atención se centra más en construir un sistema utilizando tecnología en lugar de comprender el lado comercial de las cosas. En consecuencia, la conversación aquí trata con más conocimientos técnicos en lugar de tener que explicar cualquier hallazgo o sacar conclusiones de una manera no técnica al consumidor final del trabajo.
Y debido a la diferencia en la naturaleza del trabajo y los objetivos, hay una ligera diferencia en la expectativa del rol. Un científico de datos puede ser cualquier persona con buenas estadísticas, aprendizaje automático y algunos antecedentes en codificación. Para un ingeniero de aprendizaje automático, ya que su objetivo es construir un sistema que aprenda de los datos, la atención se centra más en habilidades de codificación / ingeniería de software bastante buenas con conocimiento de aprendizaje automático y algunas estadísticas.