IA y teoría del control: ¿Cómo se usan hoy en día en robótica y cómo puedo comenzar a aprender sobre ellos para implementar un proyecto?

Yo diría que la mejor intersección de las dos disciplinas es el aprendizaje óptimo de control / refuerzo … en muchos sentidos, estos son muy similares. El control óptimo se aborda desde el lado de la teoría del control y el aprendizaje por refuerzo del aprendizaje automático / IA. La idea es que defina alguna métrica de rendimiento (función de costo para OC o señal de recompensa para RL) … luego actualice gradualmente sus controles para minimizar el costo total / maximizar la recompensa total.

Hace un par de años comencé a interesarme por lo mismo y me llevó un tiempo encontrar los mejores recursos (en curso) … pero al final volví a la escuela …

Aquí hay algunos recursos … Comenzaría con el aprendizaje por refuerzo

Aprendizaje de refuerzo – Sutton, Barto

bueno para entender lo básico
descubrirá rápidamente que el enfoque CS para RL no siempre se extiende a los controles

Encuesta de aprendizaje por refuerzo para robótica (buena descripción general)
RL basado en trayectoria (mejor para robótica)

Gradientes de políticas
Mejora de políticas con integrales de ruta

Curso de robótica no entretenida sobre EdX / MIT OCW
Aprendizaje profundo + control óptimo: Sergey Levine y laboratorio de aprendizaje de robótica en Berkeley

O … también puede mirar NeuroEvolution / Neuro control.

Related Content

¿Cómo debo elegir una pista de informática?

¿Cuáles son algunos problemas no resueltos en la conversión de texto a imagen?

Informática: ¿De dónde viene la frase 'Roll your own' y por qué se usa en CS?

¿Qué sucede en mi computadora cuando visito un sitio web?

¿Se puede superar el problema del envejecimiento de la población de Europa aumentando el uso de la inteligencia artificial?

¿Cuáles son algunos buenos ejemplos de técnicas de liderazgo en informática e ingeniería?

¿Cómo cubren los aspirantes GATE temas a un ritmo tan rápido?

More Interesting

¿En qué está trabajando Alexander Stepanov en A9?

Tengo una idea para una aplicación de Realidad Virtual, ¿dónde puedo encontrar un desarrollador?

¿Qué pasa si usando una máquina del tiempo, dejo un teléfono inteligente nuevo el 1 de enero de cada año a partir de 1950? ¿Cuál es el primer año en que ese teléfono puede ser diseñado con ingeniería inversa antes del 31 de diciembre?

¿Cómo aprender análisis de datos con aprendizaje automático / minería de datos? ¿Están relacionadas la minería de datos y el aprendizaje automático?

¿Cómo es asistir al campamento de selección de indios para IOI?

¿Cuáles son algunas de las preguntas de muestra de la búsqueda de jóvenes talentos en programación de computadoras realizada por Computer Society of India?

¿Qué instituciones han estado produciendo una fuerte investigación en la intersección del aprendizaje automático y la biología computacional?

Soy un estudiante de secundaria interesado en trabajar en la exploración espacial. ¿Qué puedo hacer ahora para prepararme?

¿Cómo debe un ingeniero de control de calidad comenzar a aprender inteligencia artificial y aprendizaje automático?

¿Cómo es tomar una clase en línea de Stanford CS, como ml-class o ai-class?

¿Cuáles son algunos buenos regalos de Navidad relacionados con la informática?

Estoy muy interesado en buscar la interacción hombre-computadora. ¿Cuál sería un título universitario ideal para llegar allí?

¿Cómo configuro una ubicación personalizada / simulada en Android?

Teoría de gráficos: ¿Cuáles son algunas aplicaciones de la vida real en las que es necesario resolver el problema de corte máximo?

¿Cómo se utilizan las técnicas de aprendizaje automático en el comercio?

Web Analytics