La primera respuesta de William Chen mencionó que 162K científicos de datos fueron devueltos por una búsqueda de palabras clave en LinkedIn, pero ese enfoque le da muchos falsos positivos. Según los datos de LinkedIn de hace unos meses, la cantidad de perfiles de científicos de datos que coincidían por título era mucho, mucho menor.
Utilizando la interfaz de búsqueda pública de LinkedIn, con el título del trabajo entre comillas, veo a 12.170 miembros con la frase “científico de datos” en cualquier parte de su perfil. Utilizando la faceta de búsqueda avanzada para mirar solo los perfiles con un título actual o pasado que contiene la frase “científico de datos”, veo 6.896 resultados. Hacer una búsqueda simple de palabras clave devolverá a muchos miembros que mencionan las palabras “datos” o “científico” en cualquier parte de su perfil, pero la mayoría de esas personas no tienen nada que ver con la ciencia de datos.
Como Gregory Piatetsky mencionó, hay muchos científicos de datos con el título de ingeniero de software, científico de investigación, etc., por lo que la cantidad de personas que coinciden en base a habilidades y educación, independientemente del título oficial del trabajo, probablemente esté en el rango de 150K-250K y la mayoría de ellos estarán en LinkedIn en este momento. Creo que una estimación de 1M es un poco alta. Hay muchos aspirantes a científicos de datos que se inscriben en Kaggle u otros grupos, pero probablemente tenga sentido limitar el recuento a las personas que realmente lo hacen como su trabajo diario.
- ¿Cuáles son algunas ideas de proyectos de graduación en el campo del análisis de datos, en relación con la ingeniería industrial u otras especialidades de ingeniería?
- ¿Cuáles son algunos buenos institutos de capacitación para aprender big data y análisis de datos en Bangalore?
- Quería ser un científico de datos, pero desde que me uní a la industria justo después de los estudiantes universitarios, no obtengo ese tipo de roles. Ir a un MS es muy difícil ahora que ya he pasado algunos años en la industria del software. ¿Qué tengo que hacer?
- ¿Qué tan necesario es una comprensión profunda de la computación paralela para un científico de datos?
- ¿Cuáles son las fortalezas / debilidades de los diferentes algoritmos de aprendizaje automático?