Soy muy bueno en probabilidad, estadística y matemática aplicada, ¿cómo obtengo un trabajo de ciencia de datos de nivel de entrada?

¡Trabajaría para mejorar tus habilidades de programación y ciencia de datos! Esto es lo que sugeriría:

Aprenda Python: es dinámico, un lenguaje de ciencia de datos muy común, fácil (ier) de entender, ¡y hay toneladas de recursos en línea! Si está buscando un libro específico para comenzar, le recomiendo Think Python.

Aquí está el programa de estudios que uso en Byte Academy:

Introducción a la ciencia de datos

    1. Fundamentos de la ciencia de datos
      1. ¿Qué es la ciencia de datos? ¿Cuáles son sus casos de uso?
      2. Introducción a la probabilidad y estadísticas
    2. Flujo de trabajo de ciencia de datos
      1. Pila de ciencia de datos de Python
      2. Herramientas: IPython Notebook, Anaconda
      3. Módulos: Panda, numpy, scikit-learn, scipy, nltk, etc.
      4. Colaboración: Git y GitHub
  1. Adquisición de datos, exploración y disputas
    1. Raspado web, expresiones regulares, remodelación
      1. BeautifulSoup, re, pandas
    2. Análisis exploratorio de datos
    3. Visualización de datos
      1. Seaborn, matplotlib, ggplot, bokeh
    4. Análisis de datos geoespaciales
      1. Tipos de datos
      2. Point, Polygon, MultiPolygon, etc.
      3. Análisis y trazado
      4. Módulos: Geojsonio, bien proporcionado, geopandas
    5. Pequeño proyecto con análisis de datos
  2. Almacenamiento y gestión de datos
    1. Introducción a bases de datos y SQL
      1. Diseño / modelado de bases de datos relacionales
      2. Detalles de SQL
      3. SELECCIONAR, ACTUALIZAR, INSERTAR, ELIMINAR, DONDE, AGRUPAR POR, UNIRSE, etc.
      4. Claves extranjeras, índices,
    2. NoSQL
      1. Documentos, tiendas de valores clave, auto-sharding, etc.
      2. MongoDB
    3. Proyecto pequeño de base de datos
  3. Tecnologías de Big Data
    1. Conceptos fundamentales
      1. Map-Reduce, Data Lakes
    2. Cluster y Cloud Computing
      1. Amazon AWS, Google
    3. Hadoop
    4. Apache Spark
    5. Pequeño proyecto con Map-Reduce y Spark en AWS.
  4. Predicción y aprendizaje automático
    1. Modelado estadístico e inferencia
      1. Distribuciones de probabilidad
      2. Estadística clásica / frecuente
      3. Regresión y sesgo
      4. Scipy.stats y paquetes de statsmodel
    2. Aprendizaje automático
      1. Algoritmos de aprendizaje automático estándar
      2. Modelos de regresión, clasificación, SVM, árboles de decisión, bosques aleatorios
      3. Scikit-learn
      4. Introducción al aprendizaje profundo
      5. RNN y CNN
      6. Introducción a TensorFlow
      7. Otras herramientas: Theano, lasaña
      8. PNL y minería de texto
      9. Nltk Corpora & Brown
      10. Para las palabras
      11. Paquete Nltk
      12. Análisis léxico
      13. Modelos de N-gram
      14. Etiquetador de partes del discurso

¡Recomiendo elegir las porciones más interesantes de esto y aprenderlo! Si estás interesado en cursos, echa un vistazo a Byte.

Para obtener un nivel de entrada en una buena empresa, necesita un curso de certificación

Puedes probar Simplilearn

Por qué sugiero la certificación es que comprenderá si sus habilidades son suficientes para trabajos de ciencia de datos o no, y eso también lo ayudará a ingresar a algunas buenas empresas donde puede aprender mucho.