Buen esfuerzo para cubrir y repasar los fundamentos de Python. Supongo que ahora puedes codificar libremente en Python.
El siguiente paso posible para usted es comenzar con la limpieza de datos primero antes de saltar el arma y preocuparse por el análisis avanzado / aprendizaje automático, etc. Aquí hay un plan que debería ser bueno para usted durante los próximos tres meses.
- Continúe ganando experiencia en Python, ya sea profesionalmente o mediante un proyecto paralelo.
- Comience a explorar marcos de análisis de datos de Python como NumPy, SciPy y Pandas. (Google busca sobre ellos). Puede descargar datos disponibles públicamente, como el censo, el clima, etc. Algunos conjuntos de datos interesantes están disponibles aquí: Depósito de aprendizaje automático de UCI: conjuntos de datos. Para empezar, simplemente intente cargar el conjunto de datos en la memoria usando python y realice el corte y corte en cuadritos y resuma los datos.
- Puede explorar análisis de datos, cursos de limpieza en Coursera u otras ofertas similares y apuntar a terminar uno o dos populares. El curso lo equipará con las habilidades básicas de análisis de datos, al menos al nivel en el que puede extraer, limpiar y preparar conjuntos de datos para un análisis de nivel superior.
Haga esto durante los próximos tres meses y habría adquirido una experiencia considerable.
- ¿Cuáles son las perspectivas de empleo si completo el Master de Ciencia de Datos de Código Abierto en http://datasciencemasters.org?
- ¿Cuál es la mejor opción para las ciencias de datos: IPython o R?
- ¿De qué manera el big data y el aprendizaje automático cambiarán el mundo de los restaurantes?
- ¿Cuáles son los buenos MOOC disponibles para aprender Data Science en YouTube?
- Cómo comenzar con un proyecto relacionado con big data
Los pasos 4 y posteriores serían comenzar a aprender el aprendizaje automático y / o el análisis estadístico.
Consejo: – Descargue la plataforma de ciencia de datos de Anaconda desde aquí – ¡Descargue Anaconda ahora! que viene preempaquetado con marcos de análisis de datos.
HTH