Para un problema general de Primal en la siguiente forma,
[matemáticas] \ text {Minimizar} f (x) [/ matemáticas]
[matemáticas] \ text {st} g (x) \ leq 0, \ text {} x \ en X [/ math]
- ¿Qué es la indexación semántica latente?
- ¿Cuáles son los dominios en los que las técnicas de aprendizaje profundo podrían aplicarse además del procesamiento de la visión por computadora y el lenguaje / habla?
- ¿Por qué la función sigmoidea rara vez se usa en capas ocultas recientemente?
- He completado el curso para el aprendizaje automático. Quiero hacer un proyecto corto sobre aprendizaje automático. Actualmente estoy haciendo BE en CS. ¿Qué materia debo elegir?
- ¿Tiene alguna implementación de clasificación de una clase utilizando la red neuronal?
El problema dual se escribe como,
[matemáticas] \ text {Maximizar} \ phi (\ lambda) [/ matemáticas]
[matemáticas] \ text {st} \ lambda \ geq 0 [/ matemáticas]
donde, [math] \ phi (\ lambda) = inf_ {x \ in X} \ {f (x) + \ lambda g (x) \} [/ math] se llama lagrangiana del problema primario, con [math ] \ lambda [/ math] es un vector de multiplicadores lagrangianos .
El hecho de que el problema dual tiene el lagrangiano en la función objetivo podría probarse utilizando el Teorema de la dualidad débil que establece que:
Si [math] \ bar {x} [/ math] y [math] \ bar {u} [/ math] son soluciones factibles del problema primario (con función objetivo [math] f (x) [/ math]) y dual problema (con función objetivo [matemática] g (u) [/ matemática]) respectivamente, luego [matemática] g (\ bar {u}) \ leq f (\ bar {x}) [/ matemática].
Es bastante fácil notar que la forma en que se define lagrangiana se ajusta a la propiedad de la dualidad débil. Esto muestra POR QUÉ se usa lagrangiana como el doble objetivo.
[matemáticas] \ phi (\ bar {\ lambda}) = inf_ {x \ in X} \ {f (x) + \ bar {\ lambda} g (x) \} [/ math]
[matemáticas] \ Rightarrow \ phi (\ bar {\ lambda}) \ leq \ {f (\ bar {x}) + \ bar {\ lambda} g (\ bar {x}) \}, \ text {as} \ bar {x} \ en X [/ matemáticas]
[matemática] \ Rightarrow \ phi (\ bar {\ lambda}) \ leq f (\ bar {x}), \ text {as} g (\ bar {x}) \ leq 0 [/ math]
Llegando al punto sobre por qué está MAXIMIZADO, necesitamos recordar el corolario que establece que, si [matemática] x ^ * [/ matemática] y [matemática] u ^ * [/ matemática] son soluciones óptimas de problema primario y dual problema respectivamente, entonces [matemáticas] g (u ^ *) = f (x ^ *) [/ matemáticas]. Por lo tanto, [math] g (u ^ *) [/ math] es el valor máximo de [math] g (\ bar {u}) [/ math] dentro de la región factible.
Entonces, necesitamos encontrar el valor máximo de la función de doble objetivo, que es el lagrangiano en nuestro caso.
Resumiendo los dos puntos mencionados anteriormente, concluimos que requerimos la MAXIMIZACIÓN del Lagrangiano para obtener la solución óptima del problema dual.