Antes de leer esta publicación, debo advertirle que no soy un experto en aprendizaje automático. Soy como cualquier otro estudiante que está un poco loco por esta tecnología.
Ahora, sin más preámbulos, entraré directamente en el tema.
Data Science es más un modelo matemático. Básicamente, diseñas varios tipos de algoritmos con la ayuda de estadísticas, álgebra lineal, matemáticas (en general), etc. [Puedes buscar en esta lista en google].
- ¿Qué tan importante es la optimización de hiperparámetros en los modelos gráficos bayesianos, como la asignación de Dirichlet latente?
- Dada una oración, quiero encontrar la emoción de la persona que la dijo. ¿Cómo puedo hacer esto?
- ¿Cuál es una explicación intuitiva de un ingenuo clasificador de Bayes?
- ¿Cuál es una buena manera de entender las dos fórmulas con respecto a este modelo gráfico de probabilidad dado?
- ¿Cómo difiere la clasificación de la clasificación? ¿Cómo son similares?
Ahora python es solo otra herramienta (una muy buena, pero es una herramienta). La verdadera magia reside en esos conceptos teóricos y en perfeccionarlos para aumentar la precisión.
Para fines de la industria, python es algo muy útil, al igual que R (esto es específicamente para Data Science).
Python es un lenguaje de programación de propósito general. Con esto quiero decir que puedes usar Python para hacer muchas cosas como desarrollo web, ciencia de datos, reconocimiento de imágenes, desguace web, etc., y para cada una de estas tareas tienes bibliotecas o paquetes.
Además de la codificación normal (saber cómo usar python y desarrollar un programa pequeño y simple), debe aprender a usar estos paquetes.
Para la ciencia de datos, tiene el más famoso, incluso utilizado por los investigadores de Google: TensorFlow. Hay otros paquetes como: Theano, scikit, OpenCV, etc.
Solo saber codificar en Python no ayudará a nadie a desarrollar un programa de vanguardia para aplicaciones de ciencia de datos. Debes saber 2 cosas:
1. Comprensión teórica de conceptos (para aquellos interesados solo en la parte de la aplicación, puede tomar esto a la ligera)
2. Usando estos paquetes y escribiendo un código en Python para la aplicación de ciencia de datos. (Esto es obviamente importante, ya que necesita desarrollar algo después de aprenderlo: p)
Así que prepárate. Espero que disfrutes aprendiendo ciencia de datos 🙂