Cada kit de herramientas tiene su propósito:
- Numpy Agrega compatibilidad con Python para matrices y matrices multidimensionales grandes, junto con una gran biblioteca de funciones matemáticas de alto nivel para operar en estas matrices.
- SciPy es una colección de algoritmos matemáticos y funciones de conveniencia basadas en la extensión Numpy de Python. Agrega un poder significativo a la sesión interactiva de Python al proporcionar al usuario comandos y clases de alto nivel para manipular y visualizar datos.
- Pandas Biblioteca de software escrita para manipulación y análisis de datos en Python. Ofrece estructuras de datos y operaciones para manipular tablas numéricas y series de tiempo.
- Scikit-learn es un módulo de Python para aprendizaje automático creado sobre SciPy y distribuido bajo la licencia BSD de 3 cláusulas.
Si desea estudiar el aprendizaje automático, debe conocerlos todos.
Esta imagen también será útil.
- Para cursos en línea de ciencia de datos / análisis; ¿Qué sería mejor: Edureka (Cubriendo R y Machine Learning) o AnalytixLabs (Cubriendo R, SAS y Excel)?
- Cuando trabajamos en aprendizaje automático en big data, ¿podemos usar la biblioteca scikit-learn con MLlib?
- ¿Cómo se obtiene el conocimiento de dominio requerido al obtener un título en matemática aplicada o ciencia de datos?
- ¿Cuáles son los mejores programas de grado / diploma de Ciencias de datos en India y para qué exámenes tiene que presentarse para ser elegible para estos programas?
- ¿Cuántos científicos de datos empleados pueden resolver problemas de competencias en línea como la de Kaggle?
Muestra dependencias entre estos kits de herramientas.
Referencias
Cuadernos Python de ciencia de datos donnemartin / data-science-ipython-notebook
Análisis continuo Anaconda http://quasiben.github.io/PyData…