Cómo aprender ciencia de datos con un conocimiento intermedio de Python

Existen numerosos recursos para aprender Data Science. Estoy enumerando algunos de los recursos gratuitos:

  • Tutoriales | Kaggle: Muy buen sitio web con numerosos recursos y muchos problemas de práctica y ejercicios.
  • Tutoriales de ciencia de datos para principiantes y programadores | Codementor
  • Aprenda R, Python y Data Science en línea | DataCamp: una plataforma popular para aprender ciencia de datos con Python y R.
  • Tutoriales de Data Science: otro sitio web con muchos problemas basados ​​en Data Science (Tutorial and Practice).

Algunos cursos en línea:

  • Cursos de ciencia de datos | Coursera
  • Capacitación, cursos y certificación de ciencia de datos en línea | Academia de rompecabezas (de pago)
  • Introducción al curso en línea de ciencia de datos | Udacity

Algunos libros:

  • http://www.amazon.in/Hands-Progr…
  • Compre Doing Data Science Book en línea a precios bajos en India
  • Ciencia de datos desde cero

Te sugiero que asistas a un curso de Matemáticas para mejorar tus habilidades de Probabilidad y Estadística.

Espero que esto ayude 🙂

Buena suerte

Data Science se trata de explorar datos, pensar en ellos y obtener resultados de ellos.

Para hacer eso, solo un conocimiento intermedio de Python no es suficiente. Debes estar bien versado en Estadística, Probabilidad y Álgebra Lineal. Durante el primer mes, solo debes aprender sobre todo esto. Hay muchos recursos en Internet.

Para estadísticas:

  1. Introducción a la estadística descriptiva | Udacity: Para construir la base básica en Estadística.
  2. Estadística inferencial: aprenda análisis estadístico | Udacity: Después de la descripción, siga este curso, le ayudará a comprender las pruebas de hipótesis, etc.

O

Simplemente revisa este increíble libro http://greenteapress.com/thinkst

Tiene todo lo que necesitarás.

Para probabilidad:

Le sugiero que revise el MIT 6.041SC Probabilistic Systems Analysis and Applied Probability, otoño de 2013 – YouTube. Este es un curso abierto en línea ofrecido por MIT on Probability.

Para álgebra lineal:

Ir a través del curso de Khan Academy sobre álgebra lineal. Álgebra lineal | Academia Khan. Es un curso excelente que lo equipará con el conocimiento requerido de Álgebra Lineal.

Ahora que tiene el conocimiento requerido de todo lo que necesita, es el momento de comenzar. Debe aprender las tres bibliotecas más importantes de Python llamadas Numpy, Pandas y Matplotlib.

Repase las primeras cuatro conferencias de jrjohansson / scientific-python-lectures. Después de eso, aprende pandas por introducción a las estructuras de datos de pandas. Este es un blog increíble para que comiences con Pandas.

Después de eso, solo necesita aprender Algoritmos de aprendizaje automático. Hay muchos cursos en Internet para eso, pero para restringir, sugeriría esto:

  1. Aprendizaje automático | Coursera Este curso de Andrew Ng es increíble, tiene una explicación sorprendente para cada tema, es solo que no está en Python.
  2. CS109 Data Science Este es el curso más efectivo en Internet. Después de completar esto, puede resolver cualquier problema en Machine Learning.

Después de aprender esto, ahora eres un maestro, solo necesitas practicar ahora. Hay muchos sitios que albergan competiciones. Su hogar para la comunidad de ciencia de datos y análisis | Discusiones analíticas | La discusión de Big Data es la principal.

Ahora te has convertido en Kaggler de un Python Noob.

Feliz aprendizaje

También hay un gran sitio que tiene tutoriales amazong para cada tema hackr. io, hojearlo un poco.