¿Qué marcos serían beneficiosos al usar Python para las ciencias de datos para principiantes?

Principiante o no, debe familiarizarse con numpy, matplotlib, sklearn y pandas. Si conoce estas bibliotecas y se siente familiarizado con ellas, puede comenzar a explorar la mayoría de los temas que le pueden interesar, como el aprendizaje automático, la mezcla de datos, la visualización de datos, el análisis exploratorio … y así sucesivamente. Cada una de esas bibliotecas cubre una función particular y generalmente funcionan mejor juntas.

matplotlib : para la visualización de datos, también puedes probar seaborn.

numpy : métodos numéricos y matemáticos (particularmente matrices). Muy importante.

pandas : cargar, transformar y operar sobre datos. Funciona bien con matplotlib y numpy, entre muchos otros.

sklearn : biblioteca estándar de aprendizaje automático, que incluye muchos algoritmos y también conjuntos de datos muy interesantes que están preparados para jugar con ellos.

Las primeras tres tecnologías están muy bien cubiertas en el libro Python para el análisis de datos, escrito por el autor principal de los pandas Wes McKinney (escribí más sobre el libro en esta respuesta).

Además de las bibliotecas, es posible que desee familiarizarse con los portátiles iPython y Jupyter. Son herramientas muy convenientes que realmente lo ayudan en sus tareas como científico de datos. También tienen sus inconvenientes, pero en general creo que es necesario aprender sobre ellos (especialmente porque hay un montón de trabajo increíble realizado en los cuadernos).

Debe intentar ver si es conveniente para usted, puede terminar prefiriendo trabajar con Spyder, PyCharm … y muchos otros.

Ciencia de datosLenguajes de programaciónProgramación informáticaPython

Related Content

Cómo proteger todos los datos de mi computadora para que cualquier persona sin la clave de acceso no pueda ver ni eliminar nada

¿Cuáles son los requisitos previos para una maestría en ciencia de datos?

¿Cuál es el mejor instituto para un curso de ciencia de datos en India?

¿En qué se diferencia una maestría en ciencia e ingeniería de datos de la analítica empresarial? ¿Cuál es mejor?

¿Dónde puedo obtener un conjunto de datos de muestra de la competencia de Deloitte, Kaggle, para predecir la pérdida de clientes en los dominios de seguros de vida?

Cómo configurar mi PC para encender remotamente (LAN) desde mi escuela (usando una Mac)

¿Revisará mi currículum para los puestos de Analista de datos / Científico de datos y proporcionará algunos comentarios?

Hola, he leído tu pregunta. Probablemente desee crear visualizaciones de datos, y quizás también desee codificar algunos programas de aprendizaje automático. Por lo tanto, lo siguiente probablemente sería más valioso:

numpy

matplotlib

escoria

pandas

ggplot

sklearn

Geoffrey Wade

More Interesting

¿Qué tipo de análisis de datos hay en R?

¿Cuál es la forma más eficiente de almacenar datos localmente en un Android (Programación de Android)?

¿Hay algún científico de datos en la Antártida?

¿Cuáles son las preguntas clave al crear un panel de datos?

Como aspirante a científico de datos, ¿qué lenguaje de programación debo aprender entre Python, R, C # y Java, dado que no tengo experiencia previa en programación? Tengo una licenciatura en economía y estadística y una maestría en administración.

¿Cuáles son las desventajas de Julia en comparación con Python?

¿Big Data es una gran BS?

¿Por qué necesitamos Python cuando R es tan brillante para el aprendizaje automático y la ciencia de datos?

¿Cuál es la diferencia entre un científico de datos y un analista de big data?

¿Qué hizo que Palantir fuera tan exitoso?

Cómo descubrir las características más importantes en un conjunto de datos con más de 500 predictores

¿Cómo comenzar a aprender Big Data Hadoop? ¿Hay alguna manera de que pueda aprender por mi cuenta o cualquier material o tutoriales, o necesito unirme a un instituto?

Aprendizaje profundo: ¿Cuándo aplicamos la eliminación de ruido en el codificador automático de eliminación de ruido?

¿Puedo aprender el análisis de datos sin el conocimiento de las estadísticas?

¿Una certificación de ciencia de datos es buena para una carrera?

Web Analytics