¿Cuál es la mejor manera de aprender la optimización numérica para el aprendizaje automático y el aprendizaje profundo?

Hay dos capítulos en el libro que son relevantes, el capítulo 4 y el capítulo 8. El capítulo 4 describe algunos de los problemas numéricos, como el error de redondeo y las matrices de Hesse mal condicionadas, que surgen en todo tipo de problemas de optimización. Tenga en cuenta que la optimización se usa para muchas cosas diferentes en la investigación de aprendizaje profundo, como la construcción de ejemplos adversos (mencionados brevemente en el capítulo 7) y la inferencia en modelos gráficos (capítulo 19). El uso principal de la optimización en el aprendizaje profundo es entrenar un modelo, y eso se describe principalmente en el capítulo 8.

El Capítulo 8 es muy completo y cubre todo lo que necesita saber sobre algoritmos de entrenamiento para redes neuronales.

El Capítulo 4 es apenas suficiente para asegurarse de que está pensando en problemas numéricos mientras depura su código de red neuronal. Si desea obtener más información sobre cuestiones numéricas en general, no estoy seguro de qué es lo mejor. Sobre todo aprendí sobre estos temas de la clase CS205 de Ron Fedkiw en Stanford. Creo que CS205A (Métodos matemáticos para robótica, visión y gráficos) es similar, pero tal vez no enfatice el estudio de los errores cometidos por estos métodos tanto como solía hacerlo.

More Interesting

¿Cuál es el trabajo de investigación sobre aprendizaje automático más emocionante que Yoshua Bengio leyó en 2015?

¿Cómo se puede aplicar el aprendizaje profundo a la clasificación de palabras?

¿De dónde obtienen los sistemas de conducción autónomos sus datos de entrenamiento?

¿Es estúpido cambiar de trabajo de programación en C a aprendizaje automático?

¿Existe algún modelo de aprendizaje profundo o algún otro método que ingrese como una colección de documentos y pueda predecir la probabilidad de un nuevo documento?

¿Cuál es una buena referencia para aprender cómo implementar y usar la búsqueda de línea para la optimización?

¿Qué hace la capa en línea y la capa de línea cercana del sistema Netflix para recomendación?

Cómo realizar un proyecto de predicción relacionado con la salud utilizando big data y machine learning

Optimización matemática: ¿Por qué el método de descenso más pronunciado usando el descenso de gradiente típico tiene problemas con la función de Rosenbrock?

Cómo recopilar datos para problemas de la vida real mientras se entrena un modelo de aprendizaje automático

Si alguien sin experiencia en programación quisiera aprender algoritmos y aprendizaje automático, ¿cuáles serían las mejores fases de estudio e investigación? ¿Sería mejor comenzar con el aprendizaje de la codificación? ¿Con qué idioma es mejor comenzar?

¿Cuáles son los beneficios de usar unidades lineales rectificadas frente a la función de activación sigmoidea típica?

¿Cuáles son los temas que debo saber antes de comenzar el aprendizaje automático?

¿Cuál es la relevancia de la factorización matricial en el aprendizaje profundo?

¿Cuál es el propósito de AdaGrad para la formación decente de la red neuronal de gradiente estocástico?