¿Serán útiles los antecedentes en estadística matemática y matemática pura en la investigación de IA?

Respuesta corta: útil, y cuanto más teórico sea, más útil.

En la investigación aplicada de IA, te ayudará a recoger los antecedentes detrás de los diversos algoritmos que aprenderás: la regresión logística, las redes neuronales, las redes bayesianas, la búsqueda de árboles de Monte Carlo, etc., son más fáciles de entender si puedes leer las matemáticas y le resultará más fácil comprender, por ejemplo, la diferencia entre la regularización L1 y L2.

En la investigación teórica, te ayudará aún más porque eso es principalmente hacer estadísticas matemáticas. Especialmente si entras en la teoría del aprendizaje, con temas como la optimización convexa en línea o el problema de los bandidos con múltiples brazos (revisa los temas en la conferencia COLT y mira si te interesan). El campo no está desprovisto de la teoría de la medida, y tal vez el mayor cambio con respecto a lo que está acostumbrado es que muchos análisis están adoptando el enfoque del peor de los casos en lugar de explorar la configuración del iid.

Buena suerte 🙂

More Interesting

¿Cuál es la forma más rentable de producir Inteligencia general artificial (AGI o IA general)?

¿Qué tan importante es la teoría en el aprendizaje automático?

¿Cómo funciona el reconocimiento de voz? ¿Qué avances en software / hardware deben hacerse para mejorarlo, o es solo una cuestión de construir una base de datos más grande?

¿Cuáles son algunos de los problemas importantes en el campo de la IA que deben resolverse para 2018 o 2023?

¿Pueden las computadoras y el software AI eliminar a los contadores? Si puede, ¿cuándo?

¿Cuál es la mejor manera de obtener experiencia con el aprendizaje automático y la ciencia de datos?

Cómo explicar la "extracción de información" en términos simples

¿Cuál es el mejor lenguaje para usar mientras aprende el aprendizaje automático por primera vez? Voy a tomar un curso sobre aprendizaje automático este trimestre y tengo la opción de elegir entre usar C, C ++, Java, Haskell, Lisp, Python o Matlab / Octave.

¿Por qué los modelos que funcionan mejor durante el entrenamiento dan resultados más pobres durante la implementación?

¿Cómo funciona la teoría de la información integrada y cuáles son las matemáticas detrás de ella?

¿Es posible para una máquina inteligente de Inteligencia Artificial componer música hoy que no se puede distinguir de una escrita por un humano?

¿Una computadora podrá tomar una decisión consciente en un futuro cercano?

¿Cómo será el Movimiento de Derechos de AI?

¿Qué cambios traerá al mundo la red neuronal profunda CUDA de Nvidia?

¿Podría la inteligencia artificial resolver el problema de unificar la teoría de la relatividad general con la mecánica cuántica o diría: 'Imposible'?