¿La teoría detrás del aprendizaje automático es matemáticamente aburrida?

Ah, la riqueza existe de la misma manera que está presente en la física y otras áreas de las matemáticas aplicadas, pero el material no siempre se explica de una manera que enfatiza la “belleza”.

Sí, el método de enseñanza es a menudo … existe este modelo, y este modelo, y si eso no funciona, entonces este modelo … lo que hace que el campo parezca disjunto y carente de la elegancia que busca.

¿Dónde está la “belleza”?

La estadística y la probabilidad se basan en la teoría de la medida, que es un tema extremadamente rico. Tiendo a reformular las estadísticas que veo en términos de teoría de la medida, lo que me permite generalizar más fácilmente.

Grados de libertad: ¿Qué es un grado de libertad? Una pregunta sorprendentemente difícil. Para regresión lineal: muy simple, ¿pero para modelos más extraños? Espero que las respuestas aquí tengan que ver con si su espacio de parámetros es o no una variedad diferenciable y si la función de error que considera es una función diferenciable.

Agrupación y topología algebraica: Hay investigaciones sobre cómo la homología persistente se relaciona con la agrupación: la homología es definitivamente hermosa.

Optimización / regularización L_1: Terrence Tao trabajó en esto … dijo nuff.

Sobre ese mismo tema, la separación de la estructura del ruido es un tema importante de discusión en el trabajo de Tao para encontrar progresiones en números primos.

En su mayor parte, con cualquier matemática aplicada (¡especialmente una materia más joven como el aprendizaje automático!) Necesita encontrar la belleza por sí mismo. Tome los problemas tal como se presentan y ajústelos a su forma de pensar acerca de las matemáticas. Hay mucho espacio para avanzar en el aprendizaje automático al brindar la profundidad y riqueza de las matemáticas. Incluso las áreas matemáticamente elegantes de la física eran menos que elegantes cuando se escribieron por primera vez.

La teoría detrás de esto no es matemáticamente aburrida. No se trata de probar cosas y encontrar lo que se pega, se trata de descubrir cómo ajustar su modelo para avanzar hacia el mejor ajuste. Claro, una técnica básica puede ser ajustar parámetros aleatoriamente y ver si mejoran las cosas, pero esto no es bueno.
Una regresión lineal calcula la pendiente local de la función de condición física y la usa para ajustar los parámetros, luego encuentra la nueva pendiente, esencialmente, deslizándose cuesta abajo para obtener el error mínimo
Las redes neuronales están descubriendo cómo el error en su salida necesita propagarse a través de varias capas para cambiar las ponderaciones.
Si recién está comenzando, pueden estar explicando cómo hacer las cosas, sin entrar en las matemáticas de por qué funciona. Esa matemática existe, y es bastante rica, involucrando cálculo, álgebra lineal y probabilidad baysiana.

Curso de aprendizaje automático sobre aprendizaje supervisado
Este curso de udacity entra en la teoría detrás de las cosas, especialmente en la lección 7. Si sus cursos actuales no le están dando la teoría detrás de esto, recomendaría echar un vistazo a esto.

Depende. Es un área de estadística y teoría de la probabilidad con algoritmos basados ​​en optimización y métodos numéricos, por lo que se aplica inherentemente. El análisis de datos topológicos se basa en gran medida en la topología diferencial y algebraica (que es bastante hermosa cuando se combina con estadísticas y otros métodos de aprendizaje automático; consulte aquí para obtener más detalles: https://www.slideshare.net/Colle …). También hay un gran trabajo en visión y animación por computadora que involucra derivadas externas discretas y otras versiones discretas de geometría diferencial (pruebe el grupo del Dr. Desbrun en Caltech), así como modelos de aprendizaje automático y estadísticos basados ​​en múltiples. Además, cada método viene con un comportamiento único definido por sus matemáticas, así como un comportamiento asintótico único.

More Interesting

¿Por qué la gente en Quora dice que dominar la programación de computadoras lleva 10 años?

¿Por qué los sistemas de recomendación comienzan a recomendar elementos solo después de un pequeño encuentro con un elemento similar?

¿Qué plataforma de bot es ideal para construir chatbots que admitan Facebook Messenger (todas las plantillas), slack, telegram y skype?

¿Qué es incrustar en Machine Learning? ¿Podría dar un ejemplo / explicación simple?

Cómo entrenar mi red neuronal para detectar si un equipaje está abandonado o no

Como aspirante a robotista, ¿qué trabajos académicos o libros debo leer para ponerme al día con los últimos avances tecnológicos en robótica?

¿Qué es la optimización de enjambre de partículas?

¿Cuál es tu opinión sobre los chatbots de IA? ¿Será un serio contendiente en el espacio tecnológico, o será solo una moda?

¿Cómo se codifica la información en la actividad neuronal?

¿Cuál es la diferencia entre una red bayesiana y una red neuronal artificial?

¿Podrían los robots de IA conscientes, en cierto modo, ser el siguiente paso lógico en la evolución humana?

¿Cuál es la implicación del teorema de aproximación universal sobre la metodología de aprendizaje profundo?

¿Cuál es la diferencia clave entre el aprendizaje supervisado y el no supervisado? ¿Por qué es más fácil hacer un aprendizaje supervisado (necesito pruebas matemáticas)?

¿Cómo cambiará la inteligencia artificial la biblioteca y la ciencia de la información?

¿Crees que un salario base universal es inminente con la evolución de la inteligencia artificial?