¿Qué campo tiene la mayor demanda y salario en los Estados Unidos: ingeniería de datos o ciencia de datos?

Científicos de datos.

En mi ciudad, Chicago, las ofertas de trabajo de científicos de datos superan en número a las ofertas de trabajo de ingeniero de datos en un factor de dos. Depende del area. En Los Ángeles, los ingenieros de datos tienen más ofertas de trabajo. Pero en su mayor parte, los científicos de datos tienen más demanda. Pero definitivamente, no diría de lejos …

Hay muchos ingenieros de software que están haciendo ingeniería de datos. Entrevisté para un par de esos puestos. Son exactamente la misma posición en la mayoría de los aspectos con un énfasis ligeramente mayor en los fundamentos de CS. Por lo tanto, podría ser un partido parejo. Aunque, muchas personas afirman que hacen trabajos de científicos de datos sin el título.

Pueden superponerse. Pero en su mayor parte no. La ingeniería de datos tiene más que ver con la creación de tuberías de datos y la creación de sistemas que hagan que los datos estén estructurados. La ciencia de datos se trata de usar su caja de herramientas para hacer predicciones o dar información sobre un conjunto de datos.

Si lo haces solo por el dinero, elegiste el campo correcto. jajaja Muchas personas se indignan por quienes persiguen la profesión que les apasiona solo por el dinero. Realmente no es un gran problema. Estarás bien si eres lo suficientemente inteligente como para cumplir con los requisitos del trabajo.

La ingeniería de datos y la ciencia de datos se superponen, de alguna manera … en cierto sentido, un científico de datos sin ninguna habilidad de ingeniería es un estadístico aplicado (y uno raro que no puede codificar), mientras que un ingeniero de datos sin ninguna idea de cómo resolver problemas o presentar científicos de datos con datos relevantes … bueno, no harían mucho de ingeniero. Por supuesto, un rol de ingeniería de datos requerirá mejores habilidades de ingeniería (canalizaciones de datos, etc.) mientras que un rol de científico de datos requerirá una capacidad analítica y de pensamiento más crítico.

Si está preguntando tratando de decidir qué debe ser, no lo haga por la demanda y el salario. Haz lo que eres bueno. Si está en la escuela, por ejemplo, en este momento, tome las clases que necesitaría para ambos y vea qué tiene sentido para usted. De hecho, tome otras clases también. Elegir lo que haces únicamente porque quieres tener demanda y ganar mucho dinero no es necesariamente una estrategia efectiva. Si no te gusta el trabajo y / o eres malo en eso … bueno, nunca innovarás. Nunca verás las posibilidades. Nunca podrá mirar un problema y comenzar a idear soluciones. Y esos atributos en un nicho o mercado laboral más pequeño probablemente generarán un salario mayor que ser mediocres en algo de alta demanda.

La locura por la contratación de la ciencia de datos ha hecho que mucha gente se suba al carro, pero el hecho es que si no comprende bien los problemas de datos, simplemente no será bueno. Oh, ciertamente, puedes obligarte a hacerlo, pero no puedes obligarte a que te guste. Y al gustarle, pensar en las muchas formas en que puede verlo, darse prisa pensando en la solución … eso, en cualquier campo, es lo que lo llevará a la excelencia.

Ciencia de datos, con diferencia. Según el último informe de tendencias de contratación de Hired, las solicitudes de entrevistas para científicos de datos en el tercer trimestre de 2016 aumentaron en un 33 por ciento con respecto al segundo trimestre, el mayor salto para cualquier función tecnológica. El aumento de la demanda también está afectando positivamente los salarios: los científicos de datos recibieron un promedio de $ 133K por ofertas salariales iniciales, que es un 5 por ciento más alto que el trimestre pasado. Cuadro comparativo de ofertas promedio a continuación:

¿La motivación detrás de esta pregunta es sobre la elección de la carrera profesional y el criterio principal que consideraría es el dinero? Si es así, quizás tampoco sea una buena opción.

Esto se debe a que el trabajo requiere un compromiso real para hacer lo correcto. En esta publicación de blog sobre la competencia de Kaggle, noté que ves muchas presentaciones con puntaje perfecto, y dije que plantea una pregunta seria.

Comenzando con las competiciones de ciencia de datos de Kaggle

Hay entradas con un puntaje de 1.00000 en la tabla de clasificación, pero o bien ajustan seriamente sus modelos a los datos de la prueba, o tal vez incluso los engañan, dado que el conjunto de datos completo está disponible en otras fuentes. Eso no solo no tiene sentido, sino que también plantea serias preguntas: ¿qué tipo de estándares de conducta deben cumplir los científicos de datos para producir resultados confiables?

La ciencia de datos o la ingeniería de datos es difícil en el sentido de que puede cometer errores fácilmente y es difícil detectarlos. Por lo tanto, tenemos que verificar nuestros resultados y nunca exagerar los resultados más allá de lo que podemos validar, y nunca es al 100%. Necesitamos personas honestas.

¿Ves cómo conseguir una puntuación perfecta en Kaggle te hace ver realmente mal? ¿Por qué la gente hace esto? Porque no entienden el requisito fundamental del trabajo: la honestidad. Si no eres honesto y meticuloso , ¡no puedo confiar en tu resultado!

Espero que no solo esté interesado en esta elección de carrera solo por dinero, sino que le animo a pensar primero en lo que se requiere en el trabajo y ver si es adecuado para usted primero.

Mira esta infografía reciente:

En este momento, podría decir lo siguiente:

  • Los científicos de datos tienen una demanda ligeramente mayor (85,000 versus 110,000 puestos de trabajo abiertos),
  • Los salarios promedio para los científicos de datos también son ligeramente más altos ($ 124,000 versus $ 135,000).
  • ¡La perspectiva laboral en los Estados Unidos para ambos es muy brillante!

Fuente: Data Engineering vs. Data Science Infographic. Lea más aquí: Data Scientist vs Data Engineer.

Mi respuesta a esta pregunta no se basa en absoluto en datos reales o evidencia empírica, sino solo en una hipótesis basada en la naturaleza de estos trabajos. Con esa advertencia gigante, aquí está mi opinión:

Mi impresión es que la ingeniería de datos es la más útil e importante cuando las empresas están a) creando datos a gran escala y / o b) desean crear productos que reporten o aprovechen esos datos en tiempo real. Como puede imaginar, muchas empresas, especialmente aquellas que recién comienzan, probablemente no cumplan ninguno de estos criterios.

Sin embargo, incluso una pequeña empresa que está produciendo una cantidad modesta de datos puede beneficiarse de un científico de datos. Un científico de datos puede ayudar a una empresa a desarrollar información a partir de los datos que está recopilando, puede conducir a una empresa hacia decisiones de producto más informadas mediante el despliegue y el análisis de experimentos controlados, etc.

Dados estos hechos, me imagino que, solo en términos de ofertas de trabajo en el mercado en un momento dado, la demanda de científicos de datos es mayor que la demanda de ingenieros de datos. Sin embargo, es muy posible que un ingeniero de datos de alta calidad sea más difícil de encontrar y / o pueda exigir más en el mercado laboral; no tengo ni idea.

Ni siquiera está cerca.

Muchos estudios internos en (uno en Google) muestran que el trabajo número uno en el mundo es el ingeniero de datos.

Una vez que saca las habilidades de las necesidades de trabajo, es fácil de ver.