Depende del nivel que realmente quiera comprender el campo. Al ver muchas versiones de cursos de aprendizaje automático en el nivel universitario y en línea, creo que hay dos niveles diferentes de cursos de aprendizaje automático, cada uno de los cuales requiere diferentes niveles de madurez matemática.
El primer nivel de cursos es algo que me gusta llamar “aprendizaje automático”. El curso Coursera de Andrew Ng sobre aprendizaje automático es un ejemplo de dicho curso. Muchas versiones en línea de cursos de aprendizaje automático se encuentran en este nivel.
Estos cursos se centran más en aplicaciones prácticas, introducen algunas de las matemáticas detrás de él, pero no profundizan en las matemáticas. Y eso está bien. Para algunas personas, estos cursos son mejores para ellos y pueden sacar mucho provecho de estos cursos. Estos son los antecedentes matemáticos que recomendaría para estos cursos de “aprendizaje automático”:
- ¿Quién ideó el primer generador algorítmico de números aleatorios y cómo funciona?
- ¿Se está haciendo algún trabajo práctico sobre la integración del conocimiento potencial en grandes cantidades de datos (a través de algoritmos de aprendizaje automático, por ejemplo), diseño UX / UI y cómo el cerebro humano aprende para maximizar la eficiencia de la creación de conocimiento?
- ¿Qué tipo de trabajo hacen los buenos codificadores algorítmicos en las empresas de TI?
- ¿Cómo se usan las supercomputadoras?
- ¿Puedes explicar el procesamiento del lenguaje natural a un laico?
- Álgebra lineal básica: sepa cómo realizar operaciones con matrices, vectores, valores propios, vectores propios, etc.
- Cálculo multivariable: sepa qué derivadas parciales y gradientes son
- Probabilidad: conozca los conceptos básicos de modelado probabilístico, distribuciones gaussianas de variable única, etc.
Ahora, hay una segunda versión de los cursos de aprendizaje automático (estos cursos son más del nivel de posgrado, pero a veces también están abiertos para estudiantes universitarios). El curso de aprendizaje automático Berkeley CS 189 se encuentra en este nivel. El CS229 de Stanford: Machine Learning también se encuentra en este nivel. Estas clases profundizan mucho en por qué funcionan muchas de las técnicas en el aprendizaje automático moderno. Para comprender realmente una comprensión de los conceptos en este tipo de clases, será útil tener una formación matemática mucho más sólida:
- Fondo fuerte de álgebra lineal: siéntase cómodo con todo tipo de descomposiciones (por ejemplo, descomposición espectral, descomposición de valores singulares), cambio de bases, matrices simétricas, modelado, etc.
- Cálculo multivariable y matricial: sepa cómo tomar gradientes de expresiones que involucran matrices y vectores
- Probabilidad: probabilidad discreta y continua, variables aleatorias, distribuciones gaussianas multivariadas, estimación de máxima verosimilitud, estimación máxima a posteriori, límites de Chernoff, etc.
- Optimización: programación lineal, programación cuadrática, optimización convexa, que muestra la convergencia de diferentes técnicas de optimización, etc.
- Alguna teoría de la información es útil para comprender las funciones de pérdida, como la función de pérdida de entropía cruzada.
(1) es probablemente el más crucial, (2) y (3) son bastante importantes, mientras que (4) y (5) generalmente se pueden recoger a medida que avanza en estos cursos.
Al final del día, sin embargo, para comprender este campo, cuantos más antecedentes matemáticos tenga, mejor. En mi opinión, es mucho mejor pasar el tiempo extra teniendo los antecedentes suficientes que tratar de comprender los conceptos sin los antecedentes adecuados. Ese camino lo frustrará o lo engañará para que piense que comprende los conceptos cuando en realidad no lo hace en absoluto.