¿Qué odias de la ciencia de datos?

Mi mascota odia los cambios de vez en cuando. En este momento (noviembre de 2016) son:

  1. La cantidad de personas que se hacen llamar científicos de datos. Esta no es una caza de brujas de “científico de datos falsos”. ¡Odio eso! Esto es diferente. Abrí un puesto para científico de datos hace un par de meses. Algunas de las tareas de prueba y entrevistas realizadas por personas que tienen “Data Scientist” en su cargo actual fueron realmente malas. Estoy hablando de personas que no pueden explicar por qué no usaron la validación cruzada en una tarea de prueba.
  2. Que de repente todos son analistas de datos.
  3. Que los científicos de datos son trabajadores milagrosos para problemas que no están relacionados con los datos.
  4. Que los científicos de datos participen en discusiones sobre lo que es mejor simplemente porque eso es lo que usan. Los científicos de datos mejor que nadie deberían saber que: 1) no hay almuerzo gratis, 2) el sesgo es horrible

Estoy bastante seguro de que esto cambiará para los demás y luego volveré a estos, etc. Mis odios a las mascotas son muy dinámicos. 🙂

la percepción de que la barrera de entrada es baja …

no es un almuerzo gratis: estudia mucho en temas difíciles, domina la ingeniería de software, obtén títulos avanzados cuando tengas años para comprometerte a perseguir a un conejo en el fondo del agujero de los conejos.

Como cualquier rama de la ingeniería, no hay almuerzo gratis.

El bombo, sobre todo. La necesidad real de un científico de datos completo es extremadamente pequeña. Pocas organizaciones necesitan ese nivel de análisis, o pueden pagarlo. Las anécdotas de AT&T, Target, et al tienden a ocultar el hecho de que realmente no hay mucho llamado para el aprendizaje automático completo. Casi todo el análisis real se realiza en niveles inferiores por personas no formadas formalmente en ciencia de datos per se.