¿Por qué hay tantos científicos de datos reales e ingenieros de aprendizaje automático?

No estoy de acuerdo con que hay “muchos” científicos de datos reales e ingenieros de ML en este momento. Si lo hubiera, entonces probablemente no nos pagarían tanto :). Pero para dar más detalles sobre la cuestión, Harvard Business Review acuñó la ciencia de datos como el trabajo “más sexy” en 2012. Machine Learning Engineer está a la altura de la ciencia de datos; pero la ciencia de datos es solo el término general como AI que abarca una amplia variedad de campos. En otras palabras, es un campo “candente” en este momento.

Pero para responder la pregunta:

  • Data Science es muy gratificante tanto desde el punto de vista financiero como laboral. Los científicos de datos como Google y FB (la mayoría de ellos) han citado un excelente equilibrio entre la vida laboral y salarios muy altos. No encontrará muchos trabajos que ofrezcan altos salarios y poco estrés.
  • Data Science puede ayudar a las empresas a resolver problemas reales de formas que antes no podían. Las empresas quieren parecer modernas; y el uso de datos (aunque no siempre es la medida IMO más prudente) para resolver sus problemas puede ser una excelente manera de ahorrar costos u optimizar los ingresos. Esto ofrece a muchos científicos de datos la capacidad de trabajar en problemas comerciales y codificar al mismo tiempo.
  • Los ingenieros de ML deben codificar soluciones avanzadas para problemas de ML que se ajusten a una arquitectura dada, deben ajustarse a las restricciones comerciales (eso significa que al ejecutivo de nivel XYZ C le debe gustar y comprender la solución) y deben resolver el problema comercial en mano. Eso sí, que esta descripción puede cambiar dependiendo de la organización en la que trabaje. La mayoría de las personas que son ingenieros de ML adoran ese desafío (y el dinero que viene con él).
  • Los ingenieros de ML en entornos de investigación también tienden a trabajar en problemas de vanguardia; y ver que su nuevo algoritmo hace lo que antes era una tarea “indescifrable” puede ser muy gratificante.
  • Como comentario adicional (y esto es puramente anecdótico), conozco a alguien que cambió su título de trabajo a ML Engineer en Tinder e instantáneamente comenzó a recibir aproximadamente el triple de la cantidad normal de “derechos de barrido”. Tomalo por lo que vale.

Pero puedo decirte que, aunque parezca una existencia gloriosa, debes saber MUCHO para convertirte en un científico de datos “real” o un verdadero ingeniero de ML. La gente pasó por Quora y respondió cuáles son las habilidades necesarias para ser un científico de datos (incluido yo mismo); y no es fácil obtenerlos todos. Pero si logras obtener las habilidades necesarias … Estaré encantado de darle la bienvenida al redil de científicos de datos “reales”. No hay muchos de nosotros por ahí; así que felicidades!

No hay Muy pocas personas con el título de “científico de datos” tienen el conocimiento profundo de las estadísticas, el diseño de algoritmos y los negocios necesarios para llegar a las conclusiones correctas y agregar un valor sustancial a una empresa. Me atrevería a decir que en los próximos 5 años, veremos una definición estandarizada de un científico de datos y un mejor proceso de investigación para encontrar a los competentes como la fruta de bajo perfil (donde alguien medio competente puede encontrar algo de conocimiento) del árbol.

No hay muchos científicos de datos o ingenieros de aprendizaje automático trabajando en el espacio aplicado. Aplicado significa: Usted limpia los datos, construye y califica los modelos y luego los pone en producción para ser consumidos.

Para ser sincero, no he encontrado demasiados que puedan ir de punta a punta. El ingeniero de extremo a extremo o DS implica bastantes habilidades que requieren mucho tiempo para dominar. Es por eso que el pago es tan alto para los pocos que son realmente hábiles.

El masaje de datos es la parte más difícil. Los datos están sucios y la limpieza es difícil. En el mundo real no obtienes archivos csv bien limpios.