Supongo que te refieres a ADMM, método multiplicador de dirección alterna. Es un método muy antiguo pero elegante para la programación convexa, y está ganando atención recientemente porque facilita la optimización convexa distribuida. Su forma general es algo como lo siguiente
Mínimo f1 (x1) + f2 (x2) +… + fm (xm)
St. x1 + x2 +… + xm = c.
- ¿Por qué no hay implementaciones de aprendizaje profundo (populares) escritas en Golang?
- ¿Qué necesito, como principiante, para comprender y construir un modelo generativo como WaveNet?
- ¿En qué se diferencia la teoría del "cuello de botella de información" del aprendizaje profundo del ejemplo conocido de tener una capa oculta de dimensión reducida en un codificador automático?
- ¿Cuáles son las revistas científicas mejor calificadas para Machine Learning / Data Science?
- ¿Cuándo funciona el aprendizaje conjunto?
Este problema puede descomponerse en un conjunto de pequeños problemas de optimización como
(Pk) min fk (xk) + p * || xk-yk || + Λ * xk, una función de Lagrange aumentada para min fk (xk) st xk = yk.
El algoritmo comienza con un punto (y1, … ym, Λ), luego resuelve (Pk) para todos los k en {1 … m}. Las soluciones xk * se envían a los agentes centralizados. Esos agentes centralizados comparan x1 * + x2 * +… + xm * contra c, y luego ajustan Λ por p * (c- (x1 * +… + xm *) – (puede que no sea preciso, consulte un libro de texto oficial). Ahora se completa una iteración, se alcanza un nuevo punto (y1, … my, Λ) y el algoritmo está listo para la próxima iteración, este proceso continúa hasta que converge.
Hay un par de puntos que vale la pena tener en cuenta.
- fk (xk) debe ser una función convexa, pero debe ser diferenciable. Por lo tanto, puede tomar la forma de fk (x) = {g (x) ∣ h (x) ≤0}. Puede pensarlo como un agente inteligente que intenta maximizar su propio beneficio mediante el intercambio de recursos en mercados abiertos, mientras que Λ puede considerarse como precios de los recursos, las manos invisibles. Cuando todos los mercados alcanzan sus precios de equilibrio, las restricciones generales x1 + x2 + … xm = c están garantizadas.
- Un agente inteligente solo expone información limitada, su solución óptima xk * a los agentes centralizados – mercados, dado el vector de precios Λ. Todos los demás datos se pueden guardar donde está el agente inteligente. Eso significa que la mayoría de los datos se distribuyen entre agentes inteligentes. Esta característica podría ser muy útil cuando maneja una gran cantidad de datos.
Puede descargar https://www.google.com.sg/url?sa… para leer más.