Si y no.
Sí, la gente puede hacer esto, pero hasta ahora parece ser solo en entornos de laboratorio. Andrew Ng utilizó métodos de aprendizaje de refuerzo para hacer que un helicóptero no tripulado vuele boca abajo. Raffalleo D’andrea usa ML para mejorar el rendimiento de sus quadrotors. Russ Tedrake hace cosas similares con robots bípedos.
No, debido a la falta de garantías para los productos de ML. Claro, la gente muestra cosas como un buen comportamiento de la tasa de aprendizaje asintótico, pero estos son resultados académicos que equivalen a controles de cordura, no garantías prácticas.
- ¿Cómo aprendiste Machine Lerning?
- ¿Cuál es el mejor algoritmo para implementar un reconocimiento de voz robusto en entornos ruidosos?
- Cómo visualizar características de alto nivel en una red neuronal convolucional profunda
- ¿Cuál es la regla de entrenamiento para redes de perceptrón de capa única con umbral?
- En una explicación intuitiva, ¿cómo puedo calcular formas primarias y duales en SVM?
Por el contrario, cada vez que se puede aplicar un método de control tradicional, generalmente viene con un conjunto de garantías decente sobre lo que sucederá. Esta es quizás la razón por la cual ML no hará que los controladores PID sean obsoletos.
Otro problema es que los métodos de ML requieren una cantidad ridícula de datos de entrenamiento. En contraste, los métodos de control solo requieren un modelo de sistema suficientemente bueno. El control adaptativo y los métodos de identificación del sistema que preceden a ML se pueden usar para obtener los parámetros del modelo, cuando se desconocen.