¿La propagación hacia atrás proporciona pesos finales óptimos a nivel mundial solo si el espacio de la solución de adaptación es convexo?

No … es posible que la solución en una superficie no convexa sea el óptimo global. Sigue leyendo hay más …

Para aclarar, la propagación hacia atrás no es un método de optimización, sino una forma de calcular el gradiente de la función, que en su caso es una red neuronal. Esta no es la única forma de obtener la primera derivada de una función, ni es la forma más simple. La diferenciación automática es un método para calcular derivadas de manera eficiente para funciones arbitrarias, la acumulación inversa es una forma de propagación inversa.

Volviendo a la pregunta: quería preguntar si el Descenso de degradado, que es un método de optimización, solo puede concluir con un óptimo global si y solo el costo es convexo. Si bien el descenso por gradiente, o la mayoría de los otros métodos, tienden a atascarse en puntos locales en una superficie no convexa, con condiciones iniciales ventajosas, el descenso por gradiente puede concluir con un mínimo / máximo global.

Existen métodos con varios grados de eficiencia que pueden reducir el espacio de la solución a un área cercana al óptimo, proporcionando las condiciones iniciales correctas para el descenso del gradiente.

Espero eso ayude

Muchas veces esto se reduce a su función de pérdida. Si se trata de una función convexa, obtendrá una global, por lo que verá cosas como (real – esperado) ^ 2. La propagación hacia atrás se alimenta de los valores de la función de pérdida a través de la función de descenso de gradiente.

Depende de cómo se deriva esta información para filtrarla a través de las derivadas de las funciones, que es la función de pérdida.

More Interesting

¿En qué áreas los métodos del núcleo siguen siendo competitivos con el aprendizaje profundo?

Cuando la inteligencia artificial (IA) se negocia en los mercados de valores, ¿qué fuente de noticias siguen la mayoría de las IA?

¿Es posible que AI trabaje con un solo procesador?

¿Dónde aplicas la IA?

¿Se puede usar la red neuronal de convolución para clasificar las pinturas?

¿Hasta qué punto podrían Stephen Hawking y Elon Musk tener razón sobre los peligros de la inteligencia artificial? ¿Cuáles son tus pensamientos?

En el aprendizaje automático, ¿un 'espacio de características' es lo mismo que un 'espacio vectorial'?

¿Cómo se usan las redes neuronales en el procesamiento del lenguaje natural?

¿Qué tipo de matemática se usa en el aprendizaje automático y cómo se puede aprender?

Cómo conectar un chatbot (construido en BotFramework o api.ai) a un servicio web en AWS

¿Cuáles son algunos acertijos de inteligencia artificial interesantes y simples?

¿Cuál es el estado relativo de las publicaciones en revistas y conferencias en Robótica?

¿Existen las redes neuronales de Markov?

Teniendo en cuenta la cantidad de datos que genera un sitio Web2.0 todos los días y su valor en el escenario actual, ¿cree que el aprendizaje automático debería ser el núcleo de la tecnología de cualquier producto? Si es así, ¿qué arquitectura recomendaría en este tipo de casos?

Acabo de ingresar a la escuela de posgrado y quiero trabajar en el campo de ML, AI y minería de datos. Tengo un verano antes de que empiecen las clases. ¿Dónde debería comenzar?