¿Qué debo hacer para comprender las matemáticas y los algoritmos detrás de la propagación inversa, CNN y RNN?

Hay dos ramas de las matemáticas con las que debería estar familiarizado.

Álgebra lineal
Cálculo multivariable

El álgebra lineal es la base de cómo funcionan estos modelos. La multiplicación de vectores matriciales es la base de cómo se representan los datos y los pesos, por lo que es importante comprender cómo multiplicar matrices y vectores.

El cálculo es para el lado de optimización de las cosas (es decir, el backprop). Tomar derivadas y gradientes parciales es fundamental para el funcionamiento de backprop. Comprender la regla de la cadena también es crucial para comprender la backprop en su totalidad. Backprop es esencialmente una aplicación muy grande de la regla de la cadena en muchas operaciones más pequeñas. Esto nos da gradientes de nuestra pérdida final con respecto a los pesos en varios pasos de nuestro modelo, lo que nos permite utilizar métodos de optimización basados en gradientes estándar para actualizar nuestros parámetros.

Hay muchos recursos en línea para aprender algo de álgebra lineal básica y cálculo multivariable. La mejor de las suertes

AlgoritmosAprendizaje automáticoInformáticosProgramación informáticaProgramadoresRedes neuronales artificiales

Related Content

¿Qué es exactamente el sobreajuste? ¿Por que sucede? ¿Cómo afecta a mi modelo?

¿Cómo funciona el sistema de recomendación de filtrado basado en contenido por word2vec usando etiquetas?

¿Qué temas y partes del libro 'Inteligencia artificial: un enfoque moderno', debo leer para aprender el aprendizaje automático y la PNL? ¿Necesito leer todo el libro?

¿Las estadísticas necesitan un cambio de marca en respuesta a la ciencia de datos y el aprendizaje automático, que están superando las estadísticas en términos de relevancia? ¿Por qué o por qué no?

¿Por qué TF (frecuencia de término) a veces da mejores puntuaciones F que TF-IDF para la clasificación de texto?

¿Por qué necesitamos usar cables separados, diferentes líneas para la transmisión de electricidad, teléfono, Internet?

El mejor ajuste de línea se puede encontrar analíticamente por el método de mínimos cuadrados. ¿Podemos decir que la regresión lineal (mínimos cuadrados) tiene un optimizador?

More Interesting

Cómo construir un proyecto de aprendizaje profundo en dos meses

¿Cuál es la relación entre K-means y PCA?

¿Cuál es el punto de probar los datos en k-fold cross validation?

¿Cómo debo interpretar la probabilidad bayesiana?

¿Cómo decidimos entre usar la factorización a priori o matriz para el filtrado colaborativo?

¿Qué es la precisión?

¿Qué modelos CNN necesitan una norma de lote pero son lo suficientemente pequeños como para hacer una prueba muy rápida?

¿Cuáles son los conceptos básicos de los campos aleatorios condicionales?

Podría ser el primer experto en aprendizaje automático en una empresa como consultor o a tiempo completo. En cualquier caso, ¿cuál debería ser mi tasa?

¿Cuáles son las principales diferencias entre la teoría de juegos y el aprendizaje por refuerzo?

¿Cuál es el mejor método de extracción de características para OCR en texto chino escrito a mano?

¿Cuál es el mejor enfoque e implementación para la detección y reconocimiento de objetos en la actualidad?

Como cuerpo técnico, ¿cómo se concilia el hecho de estar basado en datos, abrazar la diversidad de la fuerza laboral y contratar a los mejores?

En optimización, ¿cuáles son algunos ejemplos geniales de reformulación?

¿Por qué Google TensorFlow usa OpenCL y no OpenGL? ¿Cuáles son las ventajas?

Web Analytics