Los siguientes temas de informática son útiles:
- Algoritmos : la comprensión de enfoques estructurados para problemas de programación comunes es generalmente útil.
- Bases de datos: a menudo los datos del “mundo real” se almacenan en bases de datos SQL. Saber cómo consultar y administrar bases de datos es especialmente importante en la industria, donde los datos de usuarios y aplicaciones a gran escala se almacenan en bases de datos. Una de las habilidades básicas de los científicos de datos es conocer SQL. Saber cómo navegar por las bases de datos es menos importante en la academia, donde los conjuntos de datos son generalmente más pequeños y se almacenan en formas más fáciles de transferir (por ejemplo, archivo CSV).
- Computación distribuida : esto es útil para escalar algoritmos de aprendizaje automático. Un concepto importante es el modelo MapReduce [1].
- Computación en la nube: hoy en día, la mayoría de los proyectos o servicios de ML a gran escala se implementan en plataformas de computación en la nube como Amazon Web Services (AWS), Google Compute o Microsoft Azure. El paradigma de “función” sin servidor [2] es útil para desplegar aplicaciones ML.
- Cálculo numérico: las bibliotecas como TensorFlow, Theano o pyTorch se utilizan generalmente para implementar los cálculos subyacentes de los algoritmos de aprendizaje automático. Otras bibliotecas como NumPy o SciPy son útiles para manipular datos y específicamente matrices multidimensionales. ¡Esto puede ser intimidante para aprender!
- Programación dinámica: uso DP con frecuencia cuando implemento tuberías de aprendizaje automático.
Notas al pie
[1] MapReduce – Wikipedia
- ¿Qué podría ser el trabajo de investigación sobre autómatas (TOC)?
- ¿Cuáles son algunos avances recientes en la teoría de juegos?
- ¿Cuáles son los algoritmos más importantes que todo informático debe dominar?
- ¿Es posible que un estudiante con una disciplina que no sea informática con un CGPA de 5 sobre 10 haga una maestría en informática en una buena universidad extranjera?
- ¿Ha habido algún progreso en la arquitectura de subsunción desde que se introdujo?
[2] Computación sin servidor – Wikipedia