Cómo fusionar el aprendizaje automático y la teoría de control

Hay tantas áreas superpuestas que aún no se han explorado.

Dos amplias categorías donde el aprendizaje automático contemporáneo (también conocido como aprendizaje profundo) y la teoría de control pueden tener un terreno común que viene a la mente, IMO, incluyen (i) aplicaciones de control predictivo de modelo no lineal y (ii) aplicaciones de control adaptativo no lineal.

Voy a ampliar sobre este último.

Control adaptativo

Las plantas LTI que usan controladores adaptativos exhiben una dinámica de circuito cerrado que no es lineal. Como resultado, las herramientas de análisis de polos, ceros y dominio de frecuencia que son muy confiables para analizar sistemas LTI se vuelven prácticamente inútiles. Gracias al análisis de Lyapunov desarrollado (Parks [1966]), podemos probar la estabilidad, establecer robustez y obtener márgenes de robustez y estabilidad que de otro modo serían difíciles de establecer utilizando métodos de análisis LTI.

En el control adaptativo de los sistemas LTI, es posible que nos adaptemos en gran medida a cualquier incertidumbre paramétrica que surja de una dinámica descuidada, principalmente porque complementamos el algoritmo de control adaptativo con una ley de control robusta. Cuando el sistema no es lineal, los límites de las posibles incertidumbres dinámicas no se pueden determinar fácilmente debido a la presencia de la no linealidad en el sistema.

La cuestión es que el control adaptativo fue concebido y desarrollado para plantas cuyos parámetros varían en el tiempo. El control adaptativo para sistemas no lineales no es tan sencillo como para los sistemas LTI y LTV. ¿Por qué esto es tan? Los sistemas adaptativos fueron diseñados para compensar los parámetros desconocidos en el sistema que se controla. En sistemas no lineales, sin embargo, las incertidumbres desconocidas no se deben a parámetros variables sino más bien debido a funciones no lineales desconocidas además de parámetros desconocidos . Como tal, el comportamiento del sistema adaptativo no lineal es complejo y el análisis es difícil. Karl Astrom lo dijo mejor en su libro cuando declaró que

“El progreso en la teoría ha sido lento, y queda mucho trabajo antes de que una teoría razonablemente completa y coherente esté disponible”.

La aplicación del control adaptativo a plantas no lineales puede verse desde dos ángulos: (i) cuando el sistema no lineal tiene funciones no lineales conocidas; y (ii) cuando tenemos sistemas no lineales con funciones no lineales desconocidas que se aproximan por funciones de base conocidas. En la primera categoría, hay herramientas bastante bien desarrolladas para resolver tales problemas. En la segunda categoría, confiamos en los aproximadores de funciones (y las redes neuronales son los jugadores más fuertes aquí). Las redes neuronales con una sola capa oculta disfrutan de mucha utilidad en el control adaptativo de sistemas no lineales. Se ha demostrado que son estables para aprender comportamientos adaptativos no lineales. Los ejemplos incluyen las redes de alimentación de capa oculta única y las redes de función de base radial. Sin embargo, el problema con estas redes es que lleva mucho tiempo modelar dinámicas no lineales complejas debido al número limitado de funciones de base de Lipschitz que contienen (también llamadas neuronas). Que es mas Cuando el sistema no lineal es muy complejo, una sola capa oculta como aproximador de funciones puede no ser suficiente para capturar adecuadamente la nomenclatura de un sistema no lineal.

Debido a su eficacia abrumadora en el modelado de funciones no lineales, las capas de redes neuronales, apiladas de manera compuesta para abstraer características de nivel inferior (popularmente llamadas aprendizaje profundo) son modelos poderosos para aprender la dinámica subyacente del sistema cuando existe una no linealidad inherente compleja en el sistema modelado Son las tecnologías de vanguardia en reconocimiento de objetos visuales, reconocimiento de voz, detección de objetos y varios campos, incluidos el descubrimiento de fármacos y la genómica. El aprendizaje profundo descubre una estructura compleja en grandes conjuntos de datos mediante el uso del algoritmo de retropropagación para indicar cómo una máquina debería cambiar sus parámetros internos (o pesos) para calcular la representación en cada capa a partir de la representación en una capa anterior. Con redes convolucionales profundas, hemos visto avances en el procesamiento de imagen, video, habla y audio, mientras que las redes recurrentes nos han mostrado cómo modelar de manera efectiva la dinámica temporal con resultados fascinantes en el reconocimiento de texto y voz.

Tales redes profundas tienen un costo como herramientas de modelado en sistemas de control, en mi opinión. Uno es su sensibilidad a los transitorios. Verá, las redes profundas están sobre-parametrizadas por pesos, lo que significa que pueden ser sensibles a la entrada o ser válidas solo para entradas que varían lentamente y niveles de operación de la planta. uno no puede relacionarlos con el proceso físico o puede resultar difícil idear controladores efectivos para tales modelos; Por lo tanto, la sensibilidad es un problema. En segundo lugar, ¿cómo se garantizan los problemas de estabilidad, como la delimitación final uniforme o el seguimiento asintótico garantizado como [math] t \ rightarrow \ infty [/ math] en una red profunda en presencia de perturbaciones? Hay tanto empirismo involucrado en el diseño de redes profundas que no lo hace suficiente para las especificaciones de diseño y las garantías de rendimiento que nos gustaría imponer a los sistemas de control.

Proporcionar un marco coherente y coherente, basado en hipótesis y pruebas matemáticas rigurosas, para los métodos de diseño de sistemas que cumplan con las especificaciones de diseño mientras se usan capas compuestas que abstraen la no linealidad de nivel inferior de manera profunda, es una forma en que creo que el aprendizaje automático y la teoría de control Una atención conjunta que es pragmática y teóricamente convincente: P.

Varias técnicas de optimización utilizadas en el aprendizaje automático también se aplican en los sistemas de control. En sistemas digitales o controlados por computadora, estos algoritmos se utilizan para estabilizar y controlar diversos procesos.

Los algoritmos de ML se vuelven cada vez más eficientes a medida que trata con más datos. Esto los hace útiles en sistemas que son altamente no lineales o expuestos a diversas perturbaciones al hacer que el control sea “inteligente” con el tiempo. Por lo tanto, el aprendizaje automático se utiliza para diseñar Sistemas de control inteligente.