Soy muy bueno en probabilidad, estadística y matemática aplicada, ¿cómo obtengo un trabajo de ciencia de datos de nivel de entrada? La tecnología cambia la vida futura

¡Trabajaría para mejorar tus habilidades de programación y ciencia de datos! Esto es lo que sugeriría:

Aprenda Python: es dinámico, un lenguaje de ciencia de datos muy común, fácil (ier) de entender, ¡y hay toneladas de recursos en línea! Si está buscando un libro específico para comenzar, le recomiendo Think Python.

Aquí está el programa de estudios que uso en Byte Academy:

¿Dónde aprendo análisis de datos para un mejor trabajo?
Estoy planeando obtener la admisión para MS Data Science. ¿Alguien puede sugerirme las mejores universidades en las que pueda ingresar y tener buenos aspectos futuros?
Soy un graduado de economía que planea realizar análisis de datos. ¿Cuál debería ser mi primer paso?
¿Existe alguna buena información para el aprendizaje automático de pronóstico de demanda de capacitación? Estoy buscando datos de ventas de series temporales con muchos atributos.
¿Cuál es la diferencia entre la informática social y la ciencia social computacional?

Introducción a la ciencia de datos

Fundamentos de la ciencia de datos

¿Qué es la ciencia de datos? ¿Cuáles son sus casos de uso?
Introducción a la probabilidad y estadísticas

Flujo de trabajo de ciencia de datos

Pila de ciencia de datos de Python
Herramientas: IPython Notebook, Anaconda
Módulos: Panda, numpy, scikit-learn, scipy, nltk, etc.
Colaboración: Git y GitHub

Adquisición de datos, exploración y disputas

Raspado web, expresiones regulares, remodelación

BeautifulSoup, re, pandas

Análisis exploratorio de datos
Visualización de datos

Seaborn, matplotlib, ggplot, bokeh

Análisis de datos geoespaciales

Tipos de datos
Point, Polygon, MultiPolygon, etc.
Análisis y trazado
Módulos: Geojsonio, bien proporcionado, geopandas

Pequeño proyecto con análisis de datos

Almacenamiento y gestión de datos

Introducción a bases de datos y SQL

Diseño / modelado de bases de datos relacionales
Detalles de SQL
SELECCIONAR, ACTUALIZAR, INSERTAR, ELIMINAR, DONDE, AGRUPAR POR, UNIRSE, etc.
Claves extranjeras, índices,

NoSQL

Documentos, tiendas de valores clave, auto-sharding, etc.
MongoDB

Proyecto pequeño de base de datos

Tecnologías de Big Data

Conceptos fundamentales

Map-Reduce, Data Lakes

Cluster y Cloud Computing

Amazon AWS, Google

Hadoop
Apache Spark
Pequeño proyecto con Map-Reduce y Spark en AWS.

Predicción y aprendizaje automático

Modelado estadístico e inferencia

Distribuciones de probabilidad
Estadística clásica / frecuente
Regresión y sesgo
Scipy.stats y paquetes de statsmodel

Aprendizaje automático

Algoritmos de aprendizaje automático estándar
Modelos de regresión, clasificación, SVM, árboles de decisión, bosques aleatorios
Scikit-learn
Introducción al aprendizaje profundo
RNN y CNN
Introducción a TensorFlow
Otras herramientas: Theano, lasaña
PNL y minería de texto
Nltk Corpora & Brown
Para las palabras
Paquete Nltk
Análisis léxico
Modelos de N-gram
Etiquetador de partes del discurso

¡Recomiendo elegir las porciones más interesantes de esto y aprenderlo! Si estás interesado en cursos, echa un vistazo a Byte.