¿Por qué las empresas solicitan habilidades de ingeniería de datos cuando reclutan científicos de datos, es decir, matemáticos?

Creo que hay un par de cosas a considerar aquí:

  1. La industria de la ciencia de datos ha creado numerosos roles y títulos a lo largo de los años para hacer frente a las necesidades cambiantes o para diferenciar un reclutador de otro. Existe una gran confusión para entender la diferencia entre los títulos creativos, como “data ninja” y “data wiz”, y los roles “científico de datos” versus “ingeniero de datos”, por ejemplo. Considere la industria de la ciencia de datos: quién hace qué (infografía) para obtener más información.
  2. Tengo la impresión de que solo recientemente, la atención para la gestión y el almacenamiento de datos ha aumentado considerablemente. Las empresas parecen ser cada vez más conscientes del hecho de que la ciencia de datos solo puede funcionar si se presta suficiente atención a la calidad e integridad de los datos, entre otros temas. Como resultado, muchas compañías están prestando más atención a sus canalizaciones de datos. Como ejemplo, verá que están buscando avanzar hacia soluciones de almacenamiento de datos más baratas, lo que también aumenta la necesidad de ingenieros de datos que puedan configurar lagos de datos, etc. De hecho, ¡la necesidad de ingenieros de datos está ahí!
  3. La distinción entre científicos de datos e ingenieros de datos a veces puede ser bastante oscura : la principal diferencia es, por supuesto, que los ingenieros de datos hacen el trabajo “pesado” en los datos en bruto que a menudo vienen sin formato, propensos a errores y con anotaciones específicas del sistema . Es el trabajo de los ingenieros de datos hacer algunas mejoras importantes en los datos antes de que los científicos de datos puedan “dar masajes” a los datos (es decir, hacer algunas mejoras menores a medianas para asegurarse de que los datos puedan usarse para construir modelos). En el aspecto técnico, creo que la mayoría de los entusiastas de la ciencia de datos pueden entender y ver muy claramente que estos esfuerzos son totalmente diferentes, mientras que el lado comercial a veces no comprende la diferencia entre estos dos. Es por eso que en algunos casos, verá que los dos equipos se fusionan … por lo tanto, verá que contratan científicos de datos para fines de ingeniería de datos .
  4. Por supuesto, hay algunas diferencias más entre los dos: considere la siguiente infografía o lea más aquí: Data Scientist vs Data Engineer.

Fuente: Infografía de Ingeniería de Datos vs. Ciencia de Datos

La mayoría de las empresas necesitan ingenieros de datos más de lo que necesitan científicos de datos. Sin embargo, la mayoría de la gente usa el término “Científico de datos” para varios tipos diferentes de trabajos, lo que crea mucha confusión. La mayoría de los solicitantes de empleo buscan el título de “Científico de datos”, lo que significa que se perderán muchos buenos candidatos si se anuncia para “Ingenieros de datos”.

Cada vez que busca un rol de ciencia de datos, debe dedicar mucho tiempo a descubrir exactamente lo que está buscando: ¿quieren que alguien ejecute estadísticas avanzadas y aprendizaje automático? ¿Construir tuberías de producción a gran escala? ¿Escribir informes y comunicarse con los interesados ​​no técnicos? No prestes demasiada atención al título del trabajo, actualmente está en un estado de cambio y relativamente sin sentido.

More Interesting

Las imágenes antiguas (p. Ej., Retratos HS de los años 70) tienen una estructura de cuadrícula. ¿Cómo se podría crear este tipo de visualización gráfica mediante programación?

¿Qué corporaciones / empresas multinacionales indias están contratando para trabajos de nivel de entrada en ciencia de datos o análisis de datos? ¿Cuáles son los requisitos para lo mismo?

Mientras se construye un modelo de datos predictivos, ¿el tratamiento para valores perdidos y valores atípicos debe realizarse tanto en los conjuntos de datos de entrenamiento como de prueba?

¿Te importa quién conoce tu historial de clics?

¿Puedo convertirme en un científico de datos sin aprender Python, pero solo con conocimientos de programación Java y aprendiendo el lenguaje R?

MATLAB: ¿Cómo utilizan realmente las compañías el código generado por Matlab / Statistica en la producción?

¿Cuál es el alcance futuro de la ciencia de datos con Python en India?

¿Cuál es el mejor instituto de ciencia de datos en Hyderabad?

¿Cómo pueden los científicos de datos y diseñadores de productos trabajar juntos de manera más efectiva? ¿Cómo deberían los desarrolladores ayudar a los diseñadores a comprender las posibilidades y limitaciones del análisis de datos y el aprendizaje automático?

Maestría en Investigación de Operaciones / Ciencia de Datos / Análisis de Negocios? ¿Cuál sería una mejor opción? (Curso y carrera sabia)

¿Cuáles son algunas necesidades de análisis de datos insatisfechos o de abastecimiento público relacionadas con el problema del cambio climático?

¿Cuáles son las mejores compañías de big data en INDIA para un desarrollador de software?

¿Cómo pueden los bancos (pequeños, medianos y grandes) usar big data para ser más eficientes?

¿Dónde debo solicitar un trabajo de enseñanza de big data en Bangalore?

¿Qué es el análisis de datos grandes y el alcance de Hadoop?