Al buscar un programa sólido de ciencia de datos, buscaría cuatro componentes esenciales:
- Profunda cobertura de los fundamentos teóricos del campo, incluidas las estadísticas, el aprendizaje automático, las bases de datos y la informática distribuida / de alto rendimiento;
- Cursos que incluyen la aplicación práctica de estas áreas, así como de discusión, manipulación y visualización de datos;
- Un componente de comunicación significativo, diseñado para ayudar a los estudiantes a desarrollar la capacidad de comunicarse de manera efectiva con personas de diferentes orígenes (no técnicos); y
- Un proyecto final, práctica o pasantía donde los estudiantes ejercen las habilidades que han aprendido sobre datos reales para resolver problemas reales para clientes reales (negocios, investigación, etc.).
Tenga cuidado con los programas que:
- Son solo títulos de informática con un curso adicional de estadística o dos;
- Son solo títulos de estadística con un curso de programación adicional o dos;
- Principalmente enseña una amplia gama de herramientas de ciencia de datos, pero no enseña muchas matemáticas, estadísticas o teoría de CS;
- No tenga la comunicación como área focal.
Esto no quiere decir que tales programas no puedan ser valiosos, pero es poco probable que ayuden a uno a convertirse en un científico de datos que pueda crecer y convertirse en un líder en la profesión.
- ¿Por qué elegiste trabajar en finanzas cuantitativas sobre ciencia de datos?
- ¿Me importa la multicolinealidad o la interacción cuando mi objetivo es la predicción?
- Quiero aprender R y python simultáneamente para minería y análisis de datos. ¿Hay algún sitio web que proporcione una estructura de curso similar para ambos?
- ¿Es bueno aprender a almacenar datos?
- Entre la codificación y la minería de datos, ¿qué es un buen trabajo?
(Entre paréntesis, por supuesto, recomendaré nuestro programa de Maestría en Ciencias de Datos en el Instituto de Tecnología de Illinois, diseñado teniendo en cuenta las preocupaciones anteriores).