Sé que a Silicon Valley le gusta retratar a los científicos de datos como desarrolladores virtuosos de software y maestros de todas las estadísticas, y eso es lo que pueden desear para sus startups de 10 personas (que valdrán miles de millones en 5 años, ¿verdad?).
Sin embargo, tendría cuidado con el plan de estudios del título de CS. Ya existe una distinción creciente entre Data Engineer y Data Scientist. Es mejor que los primeros tengan experiencia en CS, mientras que los segundos pueden ser más eclécticos, pero deben tener un fuerte enfoque en la implementación de análisis . Tenga en cuenta que dije desplegar capaz.
Necesitará apreciar las cargas que está imponiendo sobre el sistema de producción y las limitaciones dentro de las cuales debe trabajar. Por lo tanto, debe poder perfilar su código y tener una idea de las estructuras de datos apropiadas para usar (por ejemplo, es posible que desee reconsiderar el uso de una lista si necesita una adición / eliminación rápida y búsquedas … una tabla hash puede ser mejor). Sin embargo, apuesto a que la mayoría de los ingenieros de software le dirán que las estructuras de datos y los algoritmos son solo una pequeña fracción de sus preocupaciones diarias, a pesar de cómo están estructuradas las entrevistas modernas de software (¿nivel de entrada?).
- ¿Puedo aprender minería de datos sin aprendizaje automático?
- ¿Qué sería más fructífero aprender: R o SAS?
- ¿Qué significa el término 'tablero' aplicado a la ciencia de datos, particularmente a los datos del cliente?
- ¿Cuáles son los mejores programas de maestría en ciencias de datos en la India?
- ¿Hay algún curso de análisis (en el Reino Unido o en línea) que se especialice en interpretar análisis y datos para darme información comercial significativa?
Idealmente, desea poder escribir código limpio, bien documentado, eficiente (suficiente) que resuelva su problema de ciencia de datos. Además, sabrá cómo trabajar con bases de datos y estará familiarizado con los diferentes tipos (p. Ej., Relacional, gráfico, documento, valor-clave), así como también podrá realizar algunos modelos de datos básicos.
Sin embargo, un título de CS puede centrarse demasiado en el desarrollo de software y eso llevará tiempo desarrollando habilidades de modelado y análisis. Hay un puñado de temas de CS que son realmente cruciales para la ciencia de datos y muchos que no lo son.
¿Ha considerado reducirse en CS, con un enfoque en, tal vez, la computación distribuida y la computación científica? Luego podría tomar algunos cursos en bases de datos / modelos de datos / consultas avanzadas, raspado web y minería de texto, y algoritmos y estructuras de datos.