¿Cuál es la complejidad temporal del algoritmo de retropropagación para entrenar redes neuronales artificiales?

La complejidad temporal de una iteración única depende de la estructura de la red. Para un MLP estándar (perceptrón multicapa), el tiempo está dominado por las multiplicaciones de la matriz. Supongamos un algoritmo de multiplicación de matriz estándar (ingenuo), y dejemos que [math] d [/ math] sea el tamaño del mini-lote. En una sola capa con una dimensión de entrada [matemática] n [/ matemática] y una dimensión de salida [matemática] m [/ matemática], las propagaciones directa e inversa siempre serán [matemática] O (nmd) [/ matemática] suponiendo una matriz ingenua Algoritmo de producto. Suma esto sobre todas las capas para obtener el tiempo para un solo cálculo de backprop.

En general, por las garantías que puede encontrar en la literatura de diferenciación automática, la diferenciación automática en modo inverso es, como máximo, un factor constante más lento que el cálculo directo de la función de salida y pérdida de la red neuronal.

Todas las demás operaciones requeridas se pueden calcular en tiempo lineal en la dimensión (multiplicado por el tamaño del lote). Esto incluye operaciones basadas en elementos como ReLU, sigmoides, etc. y también softmaxes, que se pueden calcular en dos pasadas.

Sin embargo, si se refiere al tiempo hasta la convergencia, no hay garantías formales conocidas sobre el número de iteraciones requeridas.

Related Content

¿Cuál es la tesis central del libro de Douglas Hofstadter 'I Am a Strange Loop'?

¿Cómo pueden los robots tomar mejor los comandos verbales humanos?

¿Qué progreso se está haciendo en el campo de la robótica?

¿Cómo los robots artificialmente inteligentes mejorarán la sociedad?

Con un buen traductor automático, ¿debería lograrse el equilibrio mediante la primera ronda de inversión?

¿Cuáles son algunos algoritmos de inteligencia artificial necesarios para los desarrolladores de juegos?

¿Será el ser humano un obstáculo para el autodesarrollo de AI?

More Interesting

¿Lisp tendría ventajas sobre otros idiomas para construir una red neuronal?

En el universo de máquinas súper inteligentes de Star Wars, ¿por qué las máquinas funcionan para los humanos y no al revés?

¿Cuáles son los argumentos de Jitendra Malik contra las redes neuronales?

Cómo aplicar las redes neuronales artificiales en control

¿Deep Learning conducirá a un avance en la aplicación ML fuera del reconocimiento de voz y la visión por computadora?

¿Cómo modifica una red neuronal su peso sin entrar en un efecto de ping-pong?

Cómo ganar dinero haciendo investigación de IA, sin ningún título

¿Qué piensa Wikipedia sobre el empleo de inteligencia artificial para expandirse y corregirse a sí mismo?

¿Quiénes son algunos de los investigadores más notables de Machine Learning en India?

¿Cómo ser directo como en un programa de posgrado de IA / robótica? ¿Qué recursos debería mirar en mi tiempo libre?

¿El aprendizaje automático requiere mucho conocimiento matemático?

¿Cuál de estos cambiará nuestras vidas para siempre? Blockchain, AI, IOT o VR?

¿Crees que la IA puede resolver cualquiera de los problemas del milenio antes que los humanos?

¿Los robots reemplazarán a los gerentes y jefes?

¿Cómo usan las redes sociales la inteligencia artificial?

Web Analytics