¿Cuál es el significado de las funciones de conjunto submodular?

Las funciones submodulares son extremadamente útiles en entornos donde se quiere modelar matemáticamente el concepto de “rendimientos decrecientes”. Una subclase particularmente útil de tales funciones es la clase de funciones submodulares monótonas : (para cada [matemática] A \ subseteq B, f (A) \ leq f (B) [/ math]). Algunas aplicaciones donde se usa dicho modelado se enumeran a continuación. Tenga en cuenta que esta lista no es exhaustiva.

  1. La función de rango de un matroide.
  2. Funciones modulares, que se conocen más popularmente como funciones de peso. Es decir, dada alguna [matemática] g: X \ to \ mathbb {R} ^ {+} [/ matemática], la función [matemática] f: 2 ^ {X} \ a \ mathbb {R} ^ {+} [/ math] dado por [math] f (S) = \ sum_ {x \ in S} g (x) [/ math] es modular (y por lo tanto, submodular). La composición de una función modular con una función cóncava (por ejemplo, la función [math] f (S) = \ sqrt {| S |} [/ math]) también es submodular. Más generalmente, la composición de una función submodular con una función cóncava también es submodular.
  3. Ubicación de las instalaciones. Supongamos que hay instalaciones [matemáticas] n [/ matemáticas] para clientes [matemáticas] m [/ matemáticas], y la utilidad de la instalación [matemáticas] i [/ matemáticas] para el cliente [matemáticas] j [/ matemáticas] está modelada por un valor no negativo [matemática] M_ {i, j} [/ matemática]. Entonces, la utilidad total para un subconjunto [matemática] S [/ matemática] de las instalaciones elegidas viene dada por [matemática] f (S) = \ sum_ {j = 1} ^ {m} \ max_ {i \ in S} M_ { i, j} [/ math], y esta función puede verse como submodular.
  4. La capacidad de un corte, tanto para gráficos dirigidos como no dirigidos.
  5. Funciones de cobertura.
  6. Entropía de Shannon de subconjuntos de un conjunto de variables aleatorias.

Muchos otros entornos (que abarcan árboles, emparejamientos, cubiertas de vértices, corte más escaso, mochila) también admiten funciones submodulares, cuyos resultados se pueden caracterizar utilizando la teoría de las funciones submodulares.

El problema de minimización submodular es computable en (fuertemente) tiempo polinómico [1] [2]. Para guiar la intuición, piense en calcular el corte mínimo en un gráfico.

El problema de maximización, por otro lado, se sabe que es NP-hard. Una vez más, un ejemplo simple es el problema de corte máximo. Existe una rica teoría basada en la búsqueda de algoritmos de aproximación para una gran variedad de problemas de maximización submodular. En particular, hay resultados que proporcionan factores de aproximación [matemática] (1-1 / e) [/ matemática] para la maximización submodular monótona con restricciones de capacidad [3] y restricciones matroides [4]. Ambos resultados utilizan el algoritmo codicioso obvio (mientras la restricción permanece insatisfecha, aumente el tamaño de su conjunto eligiendo un elemento que obtenga el valor diferencial máximo). Más generalmente, Buchbinder et al. mostró [5] que el problema general de maximización submodular no monótono sin ninguna restricción admite un algoritmo de aproximación [matemático] 1/2 [/ matemático].


Referencias
[1] S. Iwata, L. Fleischer y S. Fujishige, un algoritmo combinatorio fuertemente polinomial para minimizar las funciones submodulares, J. ACM 48 (2001), págs. 761-777.
[2] A. Schrijver, Un algoritmo combinatorio que minimiza las funciones submodulares en un tiempo fuertemente polinomial, J. Combin. Teoría Ser. B 80 (2000), págs. 346–355.
[3] GL Nemhauser, LA Wolsey y ML Fisher, Un análisis de aproximaciones para maximizar las funciones del conjunto submodular I, Programación matemática 14 (1978), 265–294.
[4] G. Calinescu, C. Chekuri, M. Pál y J. Vondrák, Maximizando una función de conjunto submodular sujeta a una restricción matroide, SIAM J. Comp. 40: 6 (2011), 1740-1766.
[5] N. Buchbinder, M. Feldman, J. Naor y R. Schwartz, Un tiempo lineal ajustado (1/2) – aproximación para la maximización submodular sin restricciones, Proc. de 53 FOCS (2012), pp. 649-658.

Para agregar una gran respuesta de Vignesh Natarajan en economía, las funciones supermodulares se pueden usar como una alternativa al teorema de la función implícita. En lugar de suponer que la función tiene una forma particular y es diferencial, se supone que la función es supermodular. Un resultado promovido por Topkis muestra que la argmax de un parámetro de elección endógena está aumentando en el parámetro exógeno.

De este modo, puede determinar cómo un conjunto de opciones óptimas, como la cantidad de producción, varía con un precio exógeno sin suponer que la función de beneficio es suave y convexa o cóncava, que es el método tradicional.

Para más detalles, me remito a Amir, R. (2005). Supermodularidad y complementariedad en economía: una encuesta elemental. Southern Economic Journal , 71 (enero de 2004), 636–660. doi: 10.2307 / 20062066

Las funciones submodulares tienen una amplia gama de aplicaciones en el estudio de la teoría de grafos y de las redes sociales tardías. En particular, se utilizan para comprender la difusión de información (podría ser un mensaje, un tweet o una enfermedad) a través de una red.

Una implicación particular de una función submodular es que, dado un conjunto de nodos de una red, la cantidad de ganancia / difusión / difusión de información no siempre aumenta de manera monotónica con la adición de nuevos nodos del conjunto. Esta propiedad es particularmente útil para estudiar la descomposición de la información y la tasa de propagación de la misma. Esto nos da una perspectiva interesante para estudiar las redes epidémicas y el concepto de viralidad en una red.

More Interesting

¿Por qué la investigación en informática en IIIT-H tiende a ser más aplicada que fundamental?

¿Qué podría mejorarse sobre la educación en informática?

¿Cuál es la mejor manera de leer un artículo de investigación de ingeniería eléctrica / informática para comprenderlo por completo?

¿El aprendizaje profundo realmente funciona? ¿Es solo promocionado por los investigadores que es impulsado por los fabricantes de GPU?

¿Es importante tener experiencia en investigación específica de CS para admisiones a escuelas de posgrado de CS?

¿Cuál es el mejor lugar para la investigación a tiempo completo en arquitectura de computadoras en Bangalore que no sea IISC? Estar en el campo de la enseñanza, ¿cuál es la mejor opción?

Si empiezo a leer artículos científicos, ¿cuáles son los documentos que deben leerse sobre la conversión de 'discurso a texto'?

Tengo problemas para escribir trabajos de investigación. ¿Qué tengo que hacer?

¿Cuáles son las diferencias entre la investigación de sistemas y la investigación en informática?

¿Puede un estudiante universitario llevar a cabo una 'investigación' en computación cuántica de forma independiente?

¿Cómo es el Grupo de Sistemas CS de la Universidad de Chicago?

¿Quiénes son los mejores profesores que trabajan en Computación Cuántica?

¿Cuál es la diferencia entre la complejidad del tiempo promedio y la complejidad del tiempo esperado?

¿Cuáles son los temas más candentes para la investigación en simulación y modelado de yacimientos?

Investigación: ¿Cuáles son los temas en los que se está llevando a cabo una investigación innovadora actualmente?