Optimización de caminata con aprendizaje por refuerzo en humanoide TEO

Jaime Mas Santillan; Juan Carlos Victores; Carlos Balaguer Bernaldo de Quirós

Ayuda

Optimización de caminata con aprendizaje por refuerzo en humanoide TEO

Mas Santillan, Jaime ^[1] ; Gonzalez Victores, Juan Carlos ; Bernaldo de Quiros, Carlos Balaguer ^[1]
1. [1] Universidad Carlos III de Madrid
  
  Universidad Carlos III de Madrid
  
  Madrid, España
Localización: Jornadas de Automática, ISSN-e 3045-4093, Nº. 45, 2024
Idioma: español
Títulos paralelos:
- Optimization of Walking with Reinforcement Learning in Humanoid TEO
- Reinforcement Learning with the humanoid TEO
Enlaces
- Texto completo
Resumen
- español
  En los últimos años, el aprendizaje por refuerzo en entornos de simulación robótica ha emergido como una herramienta valiosa para entrenar plataformas robóticas en la ejecución de tareas complejas, como la marcha. El aprendizaje por refuerzo permite al robot descubrir un camino viable para realizar una tarea previamente definida, eliminando la necesidad de una programación exhaustiva y un control detallado de los movimientos.El propósito de este trabajo es mostrar la implementación de algoritmos de aprendizaje por refuerzo con el objetivo de conseguir que nuestro modelo del robot humanoide TEO aprenda a caminar sin necesidad de programar un controlador de manera explicita. Este artículo incluye como se ha desarrollado el modelo del humanoide, que medida de aprendizaje se ha desarrollado y que algoritmos se han implementado durante el entrenamiento, así como los resultados que se han obtenido de este entrenamiento.
- English
  In recent years, reinforcement learning in robotic simulation environments has emerged as a valuable tool for training robotic platforms to perform complex tasks, such as walking. Reinforcement learning allows the robot to discover a viable path to perform a predefined task, eliminating the need for exhaustive programming and detailed control of movements. The purpose of this work is to demonstrate the implementation of reinforcement learning algorithms with the aim of enabling our humanoid robot model TEO to learn to walk without the need for explicit controller programming. This paper includes the development of the humanoid model, the learning metric developed, and the algorithms implemented during training, as well as the results obtained from this training.