¿Qué tan bueno debería ser uno en Python para aprender Data Science?

Antes de leer esta publicación, debo advertirle que no soy un experto en aprendizaje automático. Soy como cualquier otro estudiante que está un poco loco por esta tecnología.

Ahora, sin más preámbulos, entraré directamente en el tema.

Data Science es más un modelo matemático. Básicamente, diseñas varios tipos de algoritmos con la ayuda de estadísticas, álgebra lineal, matemáticas (en general), etc. [Puedes buscar en esta lista en google].

Ahora python es solo otra herramienta (una muy buena, pero es una herramienta). La verdadera magia reside en esos conceptos teóricos y en perfeccionarlos para aumentar la precisión.

Para fines de la industria, python es algo muy útil, al igual que R (esto es específicamente para Data Science).

Python es un lenguaje de programación de propósito general. Con esto quiero decir que puedes usar Python para hacer muchas cosas como desarrollo web, ciencia de datos, reconocimiento de imágenes, desguace web, etc., y para cada una de estas tareas tienes bibliotecas o paquetes.

Además de la codificación normal (saber cómo usar python y desarrollar un programa pequeño y simple), debe aprender a usar estos paquetes.

Para la ciencia de datos, tiene el más famoso, incluso utilizado por los investigadores de Google: TensorFlow. Hay otros paquetes como: Theano, scikit, OpenCV, etc.

Solo saber codificar en Python no ayudará a nadie a desarrollar un programa de vanguardia para aplicaciones de ciencia de datos. Debes saber 2 cosas:

1. Comprensión teórica de conceptos (para aquellos interesados solo en la parte de la aplicación, puede tomar esto a la ligera)

2. Usando estos paquetes y escribiendo un código en Python para la aplicación de ciencia de datos. (Esto es obviamente importante, ya que necesita desarrollar algo después de aprenderlo: p)

Así que prepárate. Espero que disfrutes aprendiendo ciencia de datos 🙂

Aprendizaje automáticoAprendizaje de PythonAprendizaje para programarBig DataCiencia de datosLenguajes de programaciónMinería de datosProgramación informáticaPython

¿Qué matemáticas se necesitan para este curso de aprendizaje automático?

¿Qué hace la capa en línea y la capa de línea cercana del sistema Netflix para recomendación?

¿Qué tan grande es el mercado de consultoría de aprendizaje automático para nuevas empresas?

¿Por qué la devolución [matemáticas] G_t = R_ {t + 1} + \ gamma R_ {t + 1} + \ cdots [/ matemáticas] tiene la recompensa del siguiente paso?

¿La información almacenada como 1 y 0 en un disco duro es igual o diferente en diferentes sistemas operativos?

¿Dónde puedo comprar una unidad de disco HVD?

No tiene que tener un conocimiento íntimo de Python, en su mayor parte, las bibliotecas manejan la mayor parte del trabajo pesado. Además de los fundamentos de programación, las funciones y las estructuras básicas de datos de Python, tendrá que aprender sobre programación orientada a objetos, ya que la mayoría de las bibliotecas como scikit-learn: aprendizaje automático en Python, usan un marco orientado a objetos. Desarrollé un curso gratuito sobre Python Python para Data Science que debería ayudar.

Eric Johnson

Es muy buena pregunta. Solo tienes que tener buenas habilidades de programación en Python. Si conoce los conceptos básicos, puede aplicarlos fácilmente Learn Data Science. Lea Learn Python de manera fácil: una descripción completa para aprender los conceptos básicos de Python. Hay una descripción completa de Learning Python para el análisis de datos. Puede leerla para obtener una descripción general de Python. Y para los mejores paquetes de Python Data Science a continuación se encuentra el enlace.

La mejor plataforma de ciencia de datos: “Anaconda” es realmente mágica

Kiran Kannar

Probablemente no sea tan bueno cuando comienzas.

Esto solo se aplica a la programación general con Python, por supuesto.

Debe ser competente con la pila de ciencia de datos ( Pandas [1], Numpy [2] y Matplotlib [3], por nombrar algunos).

En algún momento, querrá / necesitará desarrollar herramientas nuevas o ampliar herramientas existentes.

En este punto, necesitarás mejores habilidades de Python. Los aprenderá cuando sea necesario.

Buena suerte.

Notas al pie

[1] Biblioteca de análisis de datos de Python

[2] NumPy – NumPy

[3] Trazado de Python: documentación de Matplotlib 2.0.2