¿Qué deben saber las personas nuevas en el campo sobre el aprendizaje automático adversario?

En primer lugar, para comprender el contexto que debe conocer sobre Machine Learning y Deep Learning en general.

El aprendizaje automático adversario estudia varias técnicas en las que dos o más subcomponentes (clasificadores de aprendizaje automático) tienen una recompensa opuesta (o función de pérdida). Las aplicaciones más típicas del aprendizaje automático adversario son: GAN y ejemplos adversos. También puede encontrar aplicaciones de este enfoque en otros documentos de aprendizaje automático.

En GAN (red de confrontación generativa) tiene dos redes: generador y discriminador. El objetivo del generador es generar muestras realistas y el objetivo del discriminador es distinguir las muestras generadas y las reales.

Los ejemplos adversarios son muestras de entrada ligeramente perturbadas que causan una clasificación errónea. Los ejemplos adversarios generalmente se consideran en el contexto de la robustez y la seguridad del aprendizaje automático. Los dos subcomponentes con recompensas opuestas son los siguientes. Hay un clasificador de aprendizaje automático que generalmente está optimizado para lograr una alta precisión y una buena generalización, y hay un adversario cuyo objetivo es engañar al clasificador de aprendizaje automático perturbando la entrada.

Si desea obtener más información, hay una página de Github con una buena selección de documentos y materiales de lectura sobre aprendizaje automático adversario: yenchenlin / awesome-adversarial-machine-learning

Al principio, las técnicas de aprendizaje automático se diseñaron para entornos estáticos en los que se suponía que los datos de entrenamiento se generaban a partir de la misma distribución. Cuando el adversario, como malware, spam, etc., se adapta, este modelo falla en algún grado. Un malware puede manipular los datos de entrada al atacar vulnerabilidades específicas de los algoritmos de aprendizaje para alterar la seguridad de todo el sistema.

Por ejemplo, filtrado de spam, detección de troyanos, etc.

Esto es donde entra en juego el aprendizaje automático adverso. Es el encanto del aprendizaje automático y la seguridad informática. Esta descendencia tiene como objetivo permitir la implementación segura de técnicas de aprendizaje automático en entornos hostiles, también conocidos como adversarios, como el filtrado de spam, la detección de malware y el reconocimiento biométrico.

Si el atacante es aún más inteligente, apuntaría a los algoritmos de aprendizaje automático. Pero la investigación también se ha invertido en esa área.

Fuente: Aprendizaje automático adversario – Wikipedia

El diablo está en los detalles. [1] Especialmente con las redes de confrontación, las metodologías para la capacitación son cada vez más complejas y, a menudo, quedan fuera de los documentos de implementación. Si bien puede leer sobre las GAN de búsqueda de límites o las WAN de Wasserstein, la aplicación de la red a su propio problema será una tarea difícil pero creativa. El proceso de capacitación será engorroso, pero también productivo, ya que los ajustes que realice pueden acumularse para ser un cambio sustancial en la arquitectura general o la metodología de capacitación.

Notas al pie

[1] https://www.robots.ox.ac.uk/~vgg