La ciencia de datos requiere un delicado equilibrio de programación y matemáticas / estadísticas
En términos generales, los temas que necesitará para familiarizarse con Data Science son los siguientes:
- ¿Cuál es la diferencia entre ETL y R Programming?
- Dada la opción entre probar el Residency Match o hacer un curso de 2 años en ciencia de datos, ¿cuál preferirías?
- ¿Hay algún software de Big Data de código abierto disponible en este momento?
- Quiero aprender análisis avanzados en 1-2 meses. ¿A qué curso debo unirme para convertirme en un experto en análisis de datos?
- ¿Cuál es la diferencia entre los datos espacio-temporales con otro tipo de datos?
- Álgebra lineal
- Regresión lineal
- Regresión logística
- Probabilidad básica y avanzada
- Estadísticas Bayesianas
- Estadística inferencial
- Estimacion
- Prueba de hipótesis
- Prueba T
- prueba de chi-cuadrado
- Anova
- Correlación
- Estadísticas descriptivas
- Diferentes tipos de distribución (Normal, Bernoulli, Binomial, Poisson, etc.)
- Matrices (Multiplicación, Operaciones inversas en matrices)
La mejor parte del mundo de hoy es que ya no necesitas ir a prestigiosos colegios / universidades para obtener lo mejor de la educación. Hay muchos MOOC que ofrecen conferencias de clase mundial sobre estadísticas requeridas para la ciencia de datos. Aquí hay algunos que podría usar para comenzar:
- Coursera – Habilidades matemáticas de ciencia de datos
- Udacity – Introducción a las estadísticas descriptivas
- Udacity – Introducción a las estadísticas inferenciales
- Khan Academy – Estadísticas y probabilidad | academia Khan
Lo único que aprendí en mi viaje es que no es necesario ser un experto en Estadística para comenzar con Data Science. Incluso si se siente cómodo con los conceptos básicos de estos conceptos, puede comenzar y luego adquirir las habilidades necesarias cuando sea necesario.