Estoy de acuerdo con varias de las otras respuestas en esta página en que es útil para los científicos de datos tener una sólida formación en estructuras de datos y algoritmos, al menos al nivel de uno de los cursos de pregrado con ese nombre. La competencia básica en este material es con frecuencia importante para los roles de ciencia de datos, y a veces es valioso poder encontrar soluciones algorítmicas más creativas cuando se procesan grandes volúmenes de datos.
Al mismo tiempo, me siento bastante cómodo admitiendo que la mayoría de los ingenieros de software con los que he trabajado son mucho mejores en estructuras de datos y algoritmos que yo. Si eligió uno de ellos al azar y nos pidió a cada uno de nosotros que implementemos un árbol rojo-negro, tal vez podría hacerlo, pero no creo que haya mucho misterio sobre quién lo hará más rápido y mejor. Creo que está bien: la ingeniería de software y la ciencia de datos son roles diferentes por una razón y corresponden a conjuntos de habilidades diferentes (pero superpuestos).
Lo que creo que está menos bien es si un científico de datos es informado por un ingeniero de software (o cualquier otra persona) de que hay una mejor manera de escribir un algoritmo o abstracción, y el científico de datos no tiene curiosidad por saber más. Deberíamos aspirar a ser mejores ingenieros de software con el tiempo, y a menudo podemos aprender mucho de nuestros colegas a este respecto.
- ¿Cuáles son las perspectivas de empleo si completo el Master de Ciencia de Datos de Código Abierto en http://datasciencemasters.org?
- ¿Por qué necesitamos científicos de datos si tenemos aprendizaje automático que puede analizar y procesar datos?
- Visualización de datos: ¿Existe una versión de "Cliffs Notes" de Grammar of Graphics?
- ¿Cómo ha creado Big Data una mayor demanda de personas con habilidades de investigación?
- ¿Puedes grabar ondas cerebrales en datos?
Por supuesto, lo mismo se aplica a la inversa para los ingenieros de software y las metodologías para una mejor toma de decisiones con datos.