Creo que en cualquier parte del mundo, la ciencia de datos requiere:
(1) Estadísticas introductorias (nivel universitario, incluye probabilidad, variables aleatorias, distribuciones de probabilidad, prueba de hipótesis, regresión lineal simple)
(2) Cálculo (nivel universitario, incluye cálculo diferencial e integral, y derivados parciales)
- ¿Cómo se transfiere una persona trabajadora a tiempo completo a la ciencia de datos?
- ¿Qué hace que un estadístico sea único?
- Cómo usar Kaggle, si soy un principiante en el campo de la ciencia de datos y el aprendizaje automático
- ¿En qué industrias se requiere Big Data?
- ¿Cómo es Data Mining and Predictive Analytics, de Chantal d larose?
(3) Teoría matricial o álgebra lineal (nivel universitario, incluye operaciones matriciales, vectores, espacios y subespacios vectoriales, ortogonalidad, determinantes, valores propios y vectores propios, y transformaciones lineales)
(4) Introducción a la econometría o modelos lineales (nivel universitario, incluye regresión lineal múltiple, problemas comunes en regresión lineal, regresión logística, modelos de ecuaciones simultáneas)
(5) SQL (incluye sentencias SELECT, selección de filas para la salida, ordenación de la salida, resumen de datos, combinaciones de SQL y subconsultas)
(6) Lenguaje de programación de código abierto (elija R, Python, Octave, SciLab, GRETL o Julia) (incluye programación de procedimientos, estructuras de control básicas, procesamiento de archivos, matrices y objetos definitorios)
Los seis anteriores no lo califican para ser un científico de datos. Le permiten estudiar más la ciencia de datos.