Como Roman ya dijo, dominar Python para la ciencia de datos no difiere mucho de dominar Python en general, pero tiene algunos énfasis diferentes, ya que usa Python como una herramienta para su flujo de trabajo de ciencia de datos (que va desde la importación hasta la exploración, munging, modelado, validación e informes (y de vuelta a la importación, comenzando todo el proceso nuevamente).
Esto significa que algunos aspectos de Python serán más importantes para usted que otros:
- Importar sus datos es algo que debe dominar. Muchas de las bibliotecas a continuación ofrecen funciones para esto.
- Las listas y los diccionarios son bastante importantes para almacenar sus datos. Operaciones como seleccionar, agregar, eliminar, … elementos de estas estructuras no deberían ser nada extraordinario.
- Las bibliotecas NumPy, Scikit-learn, Pandas, Matplotlib serán muy importantes para trabajar. Además, es posible que desee buscar en otras bibliotecas que sean buenas para el raspado web / minería de texto: puede encontrar algunas sugerencias aquí: Minería de texto en R y Python: 8 consejos para comenzar
- Dado que la presentación de informes es importante en la ciencia de los datos (pero no necesariamente en la codificación), es posible que también desee consultar cuadernos como Jupyter.
Puede ser que todavía me olvide un par de cosas en esta lista, pero es solo una referencia.
- ¿Cuál es la mejor recuperación de fotos para recuperar datos de Android?
- ¿Cuál es el lenguaje del big data?
- R requiere que los datos se carguen en la RAM, ¿eso no dificulta el trabajo con grandes conjuntos de datos? En caso afirmativo, ¿cómo es R tan popular entre los científicos de datos?
- ¿Cuál es un ejemplo de cómo usaste la ciencia de datos para resolver un problema, tomar una decisión u optimizar algo en tu vida personal?
- ¿Sería difícil hacer una aplicación que tome fotos de partituras y las reproduzca en el instrumento elegido?
Otros aspectos serán igualmente importantes, independientemente de si está aprendiendo Python para la ciencia de datos o no, como escribir funciones o controlar el flujo de su código con sentencias if / else o bucles.
Si está buscando las opciones de aprender Python para la ciencia de datos, considere consultar los tutoriales gratuitos de DataCamp (Tutoriales – Análisis e interpretación de datos en línea | DataCamp) o los cursos de Python, que están específicamente diseñados para enseñar Python para la ciencia de datos: Cursos de ciencia de datos : Tutoriales de análisis de R y Python | DataCamp