¿Qué es la minimización alterna en la optimización convexa?

Supongo que te refieres a ADMM, método multiplicador de dirección alterna. Es un método muy antiguo pero elegante para la programación convexa, y está ganando atención recientemente porque facilita la optimización convexa distribuida. Su forma general es algo como lo siguiente

Mínimo f1 (x1) + f2 (x2) +… + fm (xm)

St. x1 + x2 +… + xm = c.

Este problema puede descomponerse en un conjunto de pequeños problemas de optimización como

(Pk) min fk (xk) + p * || xk-yk || + Λ * xk, una función de Lagrange aumentada para min fk (xk) st xk = yk.

El algoritmo comienza con un punto (y1, … ym, Λ), luego resuelve (Pk) para todos los k en {1 … m}. Las soluciones xk * se envían a los agentes centralizados. Esos agentes centralizados comparan x1 * + x2 * +… + xm * contra c, y luego ajustan Λ por p * (c- (x1 * +… + xm *) – (puede que no sea preciso, consulte un libro de texto oficial). Ahora se completa una iteración, se alcanza un nuevo punto (y1, … my, Λ) y el algoritmo está listo para la próxima iteración, este proceso continúa hasta que converge.

Hay un par de puntos que vale la pena tener en cuenta.

  1. fk (xk) debe ser una función convexa, pero debe ser diferenciable. Por lo tanto, puede tomar la forma de fk (x) = {g (x) ∣ h (x) ≤0}. Puede pensarlo como un agente inteligente que intenta maximizar su propio beneficio mediante el intercambio de recursos en mercados abiertos, mientras que Λ puede considerarse como precios de los recursos, las manos invisibles. Cuando todos los mercados alcanzan sus precios de equilibrio, las restricciones generales x1 + x2 + … xm = c están garantizadas.
  2. Un agente inteligente solo expone información limitada, su solución óptima xk * a los agentes centralizados – mercados, dado el vector de precios Λ. Todos los demás datos se pueden guardar donde está el agente inteligente. Eso significa que la mayoría de los datos se distribuyen entre agentes inteligentes. Esta característica podría ser muy útil cuando maneja una gran cantidad de datos.

Puede descargar https://www.google.com.sg/url?sa… para leer más.

More Interesting

¿Qué harás cuando entrenes a tu modelo?

¿Existe una definición matemática para una máquina de vectores de soporte?

¿Pueden los algoritmos de aprendizaje automático realmente ayudar en el comercio?

¿Cuál es la mejor manera de normalizar los datos implícitos para un sistema de recomendación de música mediante el filtrado colaborativo?

Cómo dominar el aprendizaje automático para poder unirme a Google para puestos relacionados con el aprendizaje automático

¿Cuál es el atractivo de Python para ML y aplicaciones científicas en general?

¿Qué es el filtrado colaborativo en términos simples?

¿Cuáles son algunos buenos libros / recursos para que un principiante obtenga una buena introducción al aprendizaje automático?

Cómo reducir la dimensionalidad en la agrupación promedio global para que coincida con el tamaño de softmax

¿Es posible engañar a un automóvil autónomo para interpretar una señal de alto (como lo percibe el ojo humano) como una señal de velocidad?

¿Cuál es el flujo de trabajo típico para usar el aprendizaje profundo para resolver un problema?

¿Cuáles son algunos de los proyectos que uno puede hacer para comprender SVM y los trucos del kernel?

¿Cómo pudo la policía de Arizona llegar a una conclusión tan rápida que el auto Uber que se volcó no fue el culpable?

¿Cómo determina el algoritmo de aprendizaje automático de Quora la clasificación de la calidad de la pregunta?

¿Por qué es importante aprender el descenso de gradiente en el aprendizaje automático?