Sí, hay una escasez de científicos de datos, pero de alguna manera se debe al hecho de que el término ‘ciencia de datos’ y ‘big data’ están tan vagamente definidos que son casi inútiles. Desde mi experiencia, la definición de trabajo abarca desde alguien que conoce SQL hasta alguien que sabe todo sobre todos los temas de informática.
Si define específicamente a ‘científico de datos’ como parte ingeniero de datos (DBA, desarrollador, etc.), parte programador, parte estadístico y parte analista comercial, entonces sí, hay escasez de personas. Personas que pueden resolver un problema de datos desde el almacenamiento hasta la limpieza de datos, la estimación del modelo, la visualización y la venta de la respuesta a personas de negocios de una manera no técnica que entienden y tomarán decisiones.
En mi experiencia, la mayoría de las personas que hacen ciencia de datos son buenas en una o dos áreas y son aceptables en el resto. Para la mayoría de los casos, está bien, porque solo hay una gran cantidad de trabajo que puede hacer una sola persona.
- ¿Cuáles son los temas candentes en el aprendizaje automático y la lógica difusa juntos?
- ¿Cómo se calcula la pérdida WARP de la estadística de orden K para aprender a clasificar las recomendaciones?
- ¿Qué clases de modelos se pueden usar para predecir distribuciones de series de tiempo?
- ¿Qué es la regresión de Ridge en términos simples?
- ¿Por qué el preentrenamiento no supervisado actúa como un regularizador en arquitecturas profundas?
Un Máster en Visión por Computadora probablemente sea suficiente para ingresar a la ciencia de datos. La mayoría de las cosas que un científico de datos necesita hacer regularmente en el trabajo es a través de (programación de trabajo, mezcla de datos, resolución de problemas comerciales), no educación formal.