¿Están sobrevaloradas las estimaciones de la escasez de científicos de datos? La inversión en herramientas y productos de big data está en aumento, al igual que los institutos que ofrecen títulos en Big Data / Data Science. ¿La inversión y el desarrollo de infraestructura significarán una disminución en el empleo?

Diría que definitivamente hay demasiada publicidad en torno a la llamada escasez. El problema tiene menos que ver con el escaso talento, y mucho más con los intereses de marketing que han interpretado mal el significado de la ciencia de datos , hasta el punto en que muchas empresas simplemente no entienden lo que significa el título, y muchos solicitantes descontentos se preguntaron qué Hicieron mal.

Esto ha llevado a la aparición de campamentos de arranque, convenciendo erróneamente a la gente de que unos pocos meses (y miles de dólares) los prepararán para el puesto. También lleva a los desarrolladores a aplicar con poca o ninguna capacitación estadística o científica. Algunas publicaciones incluso sugieren que un BA puede pasar a esta posición. Todavía tengo que conocer una empresa, una que tome en serio la ciencia de datos real , que contrate a los bootcamps, desarrolladores que tomaron un curso de Coursera o un BA con una inclinación por los números.

El párrafo anterior a menudo agrava a muchas personas, ya que sienten que sus antecedentes deben justificar la posición de Data Science. También habrá personas que digan “pero me han contratado con ese trasfondo … así que lo que dices es incorrecto”. Pero el hecho de que algunas compañías otorguen el título a personas sin capacitación en investigación científica solo habla de la falta de comprensión del mercado, no de la definición real de la ciencia de datos. No es correcto que a las masas de jóvenes profesionales ansiosos se les diga que se están preparando para este puesto cuando no lo están, y esto degrada el campo.

Si buscas en Google “científico de datos reales”, encontrarás artículos como Will the Real Data Scientists de Zachary Chase Lipton, Stand Up y Seth Dempsey en No confunda Business Intelligence con Real Data Science . Ambos hablan de la definición vaga y de cómo está causando problemas.

Tampoco puedo culpar a las personas por desilusionarse y enojarse ya que gran parte del mercado les dice que la ciencia de datos es algo que no es. Ni siquiera puedo culpar por completo al mercado, ya que muchos reclutadores y sus empresas no entienden lo que realmente implica el trabajo o las habilidades que se deben esperar para el puesto.

La verdad es que lo que llamamos ciencia de datos ha existido durante décadas, y la única diferencia reciente es la escala de datos. La ciencia de datos es la computación científica, lo que significa que los algoritmos, las matemáticas avanzadas, las estadísticas, la investigación científica y la computación distribuida / paralela se utilizan para construir modelos a partir de datos con el objetivo principal de explicar y predecir patrones.

El primer problema es que muchas personas piensan que el título de “científico” está etiquetado solo para resaltar el aspecto técnico de la posición. Por lo tanto, siempre que sea técnico y obtenga números, debería ser bueno. Esto es falso El término científico está ahí por una razón. Casi todos los científicos de datos reales con los que he trabajado son científicos con formación de doctorado que tienen experiencia en astrofísica, biofísica, biología / química computacional, bioestadística, bioinformática y física de la materia condensada. Fuera de las ciencias “duras” se encuentran personas con doctorados en inteligencia artificial / aprendizaje automático, estadísticas y matemáticas.

Por lo tanto, la mayoría de los puestos de ciencia de datos reales a menudo requieren un doctorado en un campo altamente cuantitativo. Los títulos de maestría también se consideran cuando hay suficiente experiencia para acompañar el título.

Ahora, aquí es donde mucha gente dice “pero un doctorado de ninguna manera garantiza que serás bueno para construir modelos avanzados en aplicaciones del mundo real”. Y tienen razón. Muchos doctorados no están preparados para la ciencia de datos, ya que el conocimiento profundo en un campo de la ciencia o la ingeniería no es garantía de una gran automatización que ofrezca un ROI del mundo real a una empresa. Pero ir a la escuela de medicina tampoco garantiza que alguien sea un gran médico … sin embargo, es un requisito previo. Existe la expectativa de que su médico estará, como mínimo, capacitado en medicina. En cuanto a la ciencia de datos, no existe una industria que no haya sido tocada por algoritmos avanzados de inteligencia artificial, y la descarga de la toma de decisiones a una máquina a menudo significa que se confía en millones de dólares a su capacidad para construir modelos que conviertan los datos en valor. Entonces, cuando una empresa quiere que se haga ciencia de calidad con sus datos muy valiosos, para construir máquinas que ejecuten la toma de decisiones para su empresa muy valiosa, quieren la “escuela de medicina” de la ciencia … y eso se llama un doctorado.

Usted mismo tiene un doctorado, pero aparentemente tiene problemas para encontrar una posición. Supongo que hay 2 razones para esto:

1) Su doctorado puede no ser tan cuantitativo;

2) No eres tú, son ellos.

Para el n. ° 1 , solo estoy adivinando, ya que no mencionaste nada “computacional” sobre tu título. Si hay algún nivel de computación científica, entonces debe enfatizar esto. Para el n. ° 2 , esto tiene que ver con las empresas que simplemente buscan lo incorrecto, como se discutió anteriormente.

Asegúrese de comprender qué es realmente Data Science. Buscar en Google la ciencia de datos le mostrará a las empresas y los bootcamps que han pagado por los resultados de búsqueda de Google … así que eso no lo ayudará mucho. Estoy en este campo y me apasiona especialmente educar a las empresas y estudiantes sobre lo que realmente implica este campo.

Consideraría entrevistar a compañías (no al revés) para ver primero si lo consiguen. Luego centre sus esfuerzos en esas empresas mientras hace hincapié en el aspecto de su título que lo hace ideal para ingresar al campo de la ciencia de datos .

Prueba de tornasol para determinar si una empresa hace ciencia de datos reales (buscando un )

– La compañía entiende que Business Intelligence y Data Science son fundamentalmente diferentes y tienen muy poco en común;

– Ofrecen a los posibles empleados un examen de código muy diferente de lo que les dan a los desarrolladores (preferiblemente un desafío de datos);

– Entienden que Data Science y Big Data no son sinónimos;

– Entienden cómo la automatización aportada por los científicos de datos es completamente diferente de lo que se vio durante la revolución industrial;

– Los científicos de datos que están en posiciones de liderazgo tienen doctorados o una gran experiencia en la industria.

Aquí hay algunos artículos que he escrito para ayudar a otros a comprender este campo.

Ciencia de datos y Big Data: dos bestias muy diferentes
https://www.linkedin.com/pulse/d…

Científico de datos: poseer hasta el título
https://www.linkedin.com/pulse/2…

Terminaré diciendo que esta respuesta no sugiere el requisito de un doctorado para hacer ciencia de datos. Simplemente estoy mostrando una evaluación realista de lo que buscan las empresas que hacen ciencia de datos reales. Los campos se benefician de una variedad de fondos diferentes. Al final del día, lo que importa es que puede resolver problemas reales en datos reales al construir modelos avanzados en aplicaciones adaptativas. Independientemente de sus antecedentes, debe ser el propietario y decirles a las empresas por qué es la persona adecuada para el trabajo. Dile a las empresas por qué eres el verdadero negocio.

En esa nota …

La única habilidad que debería preocuparte
https://www.linkedin.com/pulse/2…

Buena suerte,

La escasez de científicos de datos es muy publicitada. De todos modos, hay una escasez muy clara de científicos de datos, especialmente los calificados.

Entré en Glassdoor hace un momento y busqué “Data Scientist” en San Francisco. La búsqueda arrojó 2.369 resultados. Eso es muchos trabajos.

En Galvanize, ejecuto resultados educativos y estudio el mercado de trabajo de la ciencia de datos con un detalle insoportable.

Es difícil contratar a un científico de datos. De ahí viene el bombo publicitario.
He hablado con casi 200 gerentes de contratación de ciencia de datos en el último año y medio, y escucho una y otra vez que es difícil encontrar a las personas adecuadas para los roles de ciencia de datos.

Es difícil obtener un primer papel como científico de datos.
Hay muchas personas provenientes de la academia o la ingeniería que miran las descripciones de trabajo de ciencia de datos y dicen: “¡Oh, no puede ser tan difícil! Puedo hacer esas cosas”. Sin embargo, existe un gran abismo entre esos fondos adyacentes y el conocimiento real de la ciencia de datos. La brecha de conocimiento se centra en cómo abordar problemas comunes y cuáles son las herramientas adecuadas para qué tipo de trabajos.

Una vez que tiene un rol como Científico de Datos, es mucho más fácil obtener un segundo.
En nuestros programas de capacitación en ciencias de datos en Galvanize (Academia Zipfian y galvanizeU), trabajamos muy duro para preparar personas inteligentes y calificadas para obtener su primer trabajo de ciencia de datos de buena fe, incluidas las presentaciones personales a los gerentes de contratación. Lo que encontramos posteriormente es que las personas que tienen solo unos pocos meses, especialmente 1 año, de experiencia en ciencia de datos bajo sus cinturones son perseguidas todo el tiempo en Linkedin y tienen muchas opciones para ascender.

Sí, hay una escasez de científicos de datos y sí, se promociona. La mayor escasez es de científicos de datos con cualquier tipo de experiencia.

No creo que la escasez de científicos de datos esté exagerada. Veo muchas nuevas ofertas de trabajo todos los días. Además, recibo alrededor de 3 consultas por semana de reclutadores sobre diferentes oportunidades de empleo. La necesidad es real. El problema es definir exactamente qué es un científico de datos. La mayoría de los anuncios de empleo que veo muestran requisitos para un “equipo” completo de científicos de datos. Creo que es poco probable que una sola persona tenga toda la experiencia y los conocimientos deseados. Llamo a estos anuncios de trabajo “anuncios de unicornio” porque buscan una criatura mítica que no se encuentra en la naturaleza. Es casi como si la persona de recursos humanos que escribiera el anuncio simplemente buscara en Google “ciencia de datos” y copiara / pegara todas las palabras clave relevantes. Las expectativas de contratación deben ser más realistas.

Mirando más de cerca la parte del artículo en cuestión, no menciona a los científicos de datos:

6. Habrá una escasez de talento necesaria para que las organizaciones aprovechen los grandes datos. Para 2018, solo Estados Unidos podría enfrentar una escasez de 140,000 a 190,000 personas con profundas habilidades analíticas, así como 1.5 millones de gerentes y analistas con el conocimiento para usar el análisis de big data para tomar decisiones efectivas.

He escrito una respuesta que aborda mis pensamientos sobre el bombo de Big Data (¿Big Data está sobrevalorado y sobre pagado?). Para recuperar mis pensamientos sobre la exageración de Big Data, creo que el llamado a cientos de miles de científicos de datos es poco realista y exagerado. Cuando veo los desafíos de datos que enfrentan la mayoría de mis clientes hoy en día, generalmente enfrentan problemas relacionados con la calidad de los datos, el gobierno de los datos y la falta de comprensión sobre cómo interpolar y correlacionar los datos con las decisiones y procesos comerciales. Para resolver esos problemas, no necesita cientos de personas en su organización trabajando en ellos. Seguro que necesitará personas inteligentes y talentosas para conducir y proporcionar dirección. Y sin lugar a dudas, hay una escasez de esas personas. Pero una vez que tenga marcos, procesos y liderazgo establecidos, el desarrollo y la ejecución sucederán naturalmente.

Hasta cierto punto, pero la necesidad es muy real. Tenemos una gran escasez de personas con experiencia analítica, y hay muy pocos científicos de datos con conocimiento y calificaciones reales en el campo.

El diseño y el análisis experimental requieren habilidades de investigación típicamente perfeccionadas en un título de posgrado, y para comprender, aplicar e interpretar correctamente los algoritmos de aprendizaje automático se requiere un conocimiento de matemática a nivel de posgrado. Muy pocas personas tienen estas habilidades, y un científico de datos también debe tener experiencia en su industria (por ejemplo, biotecnología, software educativo …) y un don para explicar los resultados a los no expertos en la empresa.

Hay muy pocas personas con esta combinación de habilidades, y probablemente veremos la escasez de científicos de datos calificados para la próxima década, aunque muchos sin ningún conocimiento o experiencia real están siendo contratados para llenar los espacios vacantes, ya que alguien es mejor que nadie en esta carrera analítica Esto cambiará en los próximos años, a medida que las empresas se den cuenta de que necesitan personas calificadas para encontrar las pepitas de oro y evitar las pilas de estiércol.

Sean está muerto. Como alguien que ha estado jugando con datos para destilar inteligencia y resolver problemas (pronósticos, análisis predictivos, inteligencia de mercado, etc.) durante 2 décadas, estoy un poco desconcertado con el chorro en varias veces que se lanza el término “Ciencia de datos”. Los datos y la forja de datos han existido durante años. Ya sea que esté ayudando a los bancos a diseñar ubicaciones de sucursales, modelado logístico para predecir ventas cruzadas, pronosticar el uso de electricidad o predecir la penetración de los sistemas solares fotovoltaicos, todos estos esfuerzos NO SOLO requieren experiencia con Python o cualquiera que sea la herramienta del- mes Además de la capacidad de manipular multitudes de datos transaccionales o de otro tipo, se necesita una idea de los procesos comerciales, las relaciones económicas y psicosociales subyacentes, y una idea de cómo la información puede convertirse en conocimiento.

Como Sean mencionó, lo que ha cambiado es el gran volumen de datos: los clics han reemplazado las pisadas y las transacciones físicas. Todo esto me recuerda el frenesí anterior al Y2K en el que el almacenamiento cada vez más barato, la proliferación del uso comercial de bases de datos relacionales y el temor infundado de que las cosas se estrellaran el 1/1/2000 se combinaron para llevar a las grandes empresas a invertir mucho en Hardware, personal y software de TI. Se crearon millones de silos de datos sin pensar en qué hacer con los datos. Lo sé porque traté con los principales bancos comerciales que acababan de enterarse de la minería de datos y no se habían sumergido en el conjunto de ideas maravillosas que podían obtener sobre sus clientes, sus hábitos de compra, sus territorios de mercado y el potencial de ganancias sin explotar que podían. explotar con argumentos que podrían sintetizarse utilizando sus datos transaccionales con otros conjuntos de datos.

Estoy seguro de que hay una escasez de personas con experiencia en psicología, economía, finanzas, etc., capaces de pensar en preguntas para quienes les esperan respuestas. El problema con la última generación de aspirantes (no quiero ofender a nadie) que quieran aprovechar su experiencia para obtener trabajos como científicos de datos para que puedan extraer respuestas que carecen de preguntas.

Las respuestas de Katie y Raman resuenan con mi experiencia actual en la contratación de científicos de datos.

Para un proyecto que estoy liderando, estoy contratando ingenieros para tres tipos de puestos de desarrollo de Python: desarrollador de aplicaciones web full stack, servicios de datos backend y científico de datos. Más del 75% de los currículums que he recibido son para los puestos de científico de datos.

Un gran número de candidatos tiene un doctorado. en un campo que no sea CS, aunque también ha habido algunos de esos. Pero, muy pocos tienen más de un año de experiencia haciendo trabajos relevantes de ciencia de datos, y muchos tienen cero.

Mi desafío es que necesito ingenieros que puedan construir modelos predictivos que puedan ejecutarse en producción a escala con grandes cantidades de datos. Muchos de los candidatos con los que he hablado han trabajado principalmente de manera consultiva o ad hoc y tienen experiencia limitada o nula en escribir código que será parte de un producto. Todavía estoy evaluando para este tipo de roles si es más fácil para un desarrollador adquirir las habilidades de ciencia de datos necesarias, o viceversa, pero sospecho que el primero será el caso, en general.

Toda mi vida he escuchado: “hay una terrible escasez de ingenieros. Hay cada vez menos estudiantes en los campos científicos, y la escasez solo puede ser mayor en los próximos años”. Y entonces el país tiene que pedir una inmigración calificada. Si juzgo por la cantidad de veces que yo (y algunos otros amigos ingenieros) fui contactado por una compañía / reclutador, concluiría que la escasez no es tan terrible en absoluto. Y esto a pesar de graduarse de una escuela superior y tener excelentes trabajos.

Mi opinión es no apostar por la ciencia de datos porque los medios dicen que hay una escasez terrible y que los salarios son geniales. Es probable que los medios hayan encontrado una nueva palabra de moda sobre la que escribir, y no tengan idea de lo que están hablando. En su lugar, vaya a la ciencia de datos porque le gusta mucho.
Si realmente hay una escasez tan terrible como se describe en varios medios, creo que las compañías estarían dispuestas a gastar un par de dólares para capacitar al tipo en una tecnología específica que aún no domina, si tiene potencial.

No. La escasez de cualquier informático no está sobrevalorada. El mundo necesita tantos como sea posible. Vivimos en un mundo donde las tecnologías están creciendo exponencialmente, pero los informáticos solo están creciendo linealmente. Los dispositivos se hacen cada vez más pequeños y cada vez aparecen más plataformas de desarrollo y NECESITAMOS más informáticos AHORA.

Al llegar a los científicos de datos, ahora más que nunca, estamos recolectando enormes cantidades de datos y las personas que pueden tener sentido con esos datos son muy pocos. Entonces, ¿de qué sirven todos esos datos si no podemos procesarlos?

LittleGlobalVillage (@LilGloblVillage) | Gorjeo

Gracias por preguntarnos

Hay un gran margen para el análisis de datos. Puede leer el artículo de Forbes: el análisis de datos de cinco formas dará forma a los negocios, los deportes y la política en 2016

La profesión ha sido nombrada el trabajo más sexy del siglo y la India no se está quedando atrás. Desde la perspectiva del trabajo, siempre puedes hacer un curso certificado que te dará una ventaja sobre otros candidatos. Nosotros también en Imarticus Learning ofrecemos certificación en muchas herramientas analíticas. Visite nuestro sitio web para obtener más información: Cursos de banca de inversión y finanzas en India – Cursos de certificación en finanzas y análisis de negocios

Soy un ingeniero de software que tiene 4 años de experiencia principalmente en desarrollo. Tomé algunos MOOC y cursos en línea, probé suerte con los roles de Data Science en otras compañías. Principalmente, las llamadas que he estado recibiendo son para compañías basadas en productos que están desarrollando productos de datos de ‘nicho’ para varios dominios. Entonces, supongamos que existe una demanda para las personas que aprenden a máquina y que saben leer y escribir estadísticamente (especialmente en India, donde he trabajado). Hay trabajos que están puramente relacionados con la ‘Ciencia de datos’, pero las descripciones de los trabajos son de 4 a 5 años de experiencia en análisis.

En la India, el mercado laboral aún no ha madurado para darse cuenta de lo que es la “ciencia de datos”. Pero actualmente, como se describió anteriormente, los trabajos tienen ese tipo de expectativas.

En Datawerq, nuestra bolsa de trabajo de ciencia de datos, no vemos que esto se exagere en absoluto. El gran volumen de empresas que contratan para puestos de ciencia de datos hace que el espacio sea extremadamente competitivo, y si tiene las habilidades, es un mercado de vendedores.

Lo que lo hace desafiante para la contratación de gerentes es que ya no solo compiten con las empresas tecnológicas por el talento. Cada vez más vemos empresas más “tradicionales” (es decir, empresas que no consideramos tecnológicas) que comprenden el valor de esta disciplina y la contratan activamente.

Creo que las personas realmente necesitan comenzar a proyectar sus carreras en función del interés inherente y no de las tendencias. Además, las preguntas a lo largo de esta línea se han hecho innumerables veces dentro del tema BigData, hasta el punto de que es un poco molesto ver que contaminan mi feed. Si está realmente interesado en los datos, puede comenzar ahora descubriendo cómo encontrar información relevante aquí en Quora.