¡Trabajaría para mejorar tus habilidades de programación y ciencia de datos! Esto es lo que sugeriría:
Aprenda Python: es dinámico, un lenguaje de ciencia de datos muy común, fácil (ier) de entender, ¡y hay toneladas de recursos en línea! Si está buscando un libro específico para comenzar, le recomiendo Think Python.
Aquí está el programa de estudios que uso en Byte Academy:
- ¿Dónde aprendo análisis de datos para un mejor trabajo?
- Estoy planeando obtener la admisión para MS Data Science. ¿Alguien puede sugerirme las mejores universidades en las que pueda ingresar y tener buenos aspectos futuros?
- Soy un graduado de economía que planea realizar análisis de datos. ¿Cuál debería ser mi primer paso?
- ¿Existe alguna buena información para el aprendizaje automático de pronóstico de demanda de capacitación? Estoy buscando datos de ventas de series temporales con muchos atributos.
- ¿Cuál es la diferencia entre la informática social y la ciencia social computacional?
Introducción a la ciencia de datos
- Fundamentos de la ciencia de datos
- ¿Qué es la ciencia de datos? ¿Cuáles son sus casos de uso?
- Introducción a la probabilidad y estadísticas
- Flujo de trabajo de ciencia de datos
- Pila de ciencia de datos de Python
- Herramientas: IPython Notebook, Anaconda
- Módulos: Panda, numpy, scikit-learn, scipy, nltk, etc.
- Colaboración: Git y GitHub
- Adquisición de datos, exploración y disputas
- Raspado web, expresiones regulares, remodelación
- BeautifulSoup, re, pandas
- Análisis exploratorio de datos
- Visualización de datos
- Seaborn, matplotlib, ggplot, bokeh
- Análisis de datos geoespaciales
- Tipos de datos
- Point, Polygon, MultiPolygon, etc.
- Análisis y trazado
- Módulos: Geojsonio, bien proporcionado, geopandas
- Pequeño proyecto con análisis de datos
- Almacenamiento y gestión de datos
- Introducción a bases de datos y SQL
- Diseño / modelado de bases de datos relacionales
- Detalles de SQL
- SELECCIONAR, ACTUALIZAR, INSERTAR, ELIMINAR, DONDE, AGRUPAR POR, UNIRSE, etc.
- Claves extranjeras, índices,
- NoSQL
- Documentos, tiendas de valores clave, auto-sharding, etc.
- MongoDB
- Proyecto pequeño de base de datos
- Tecnologías de Big Data
- Conceptos fundamentales
- Map-Reduce, Data Lakes
- Cluster y Cloud Computing
- Amazon AWS, Google
- Hadoop
- Apache Spark
- Pequeño proyecto con Map-Reduce y Spark en AWS.
- Predicción y aprendizaje automático
- Modelado estadístico e inferencia
- Distribuciones de probabilidad
- Estadística clásica / frecuente
- Regresión y sesgo
- Scipy.stats y paquetes de statsmodel
- Aprendizaje automático
- Algoritmos de aprendizaje automático estándar
- Modelos de regresión, clasificación, SVM, árboles de decisión, bosques aleatorios
- Scikit-learn
- Introducción al aprendizaje profundo
- RNN y CNN
- Introducción a TensorFlow
- Otras herramientas: Theano, lasaña
- PNL y minería de texto
- Nltk Corpora & Brown
- Para las palabras
- Paquete Nltk
- Análisis léxico
- Modelos de N-gram
- Etiquetador de partes del discurso
¡Recomiendo elegir las porciones más interesantes de esto y aprenderlo! Si estás interesado en cursos, echa un vistazo a Byte.