Ayuda
Ir al contenido

Dialnet


Optimización de caminata con aprendizaje por refuerzo en humanoide TEO

    1. [1] Universidad Carlos III de Madrid

      Universidad Carlos III de Madrid

      Madrid, España

  • Localización: Jornadas de Automática, ISSN-e 3045-4093, Nº. 45, 2024
  • Idioma: español
  • Títulos paralelos:
    • Optimization of Walking with Reinforcement Learning in Humanoid TEO
    • Reinforcement Learning with the humanoid TEO
  • Enlaces
  • Resumen
    • español

      En los últimos años, el aprendizaje por refuerzo en entornos de simulación robótica ha emergido como una herramienta valiosa para entrenar plataformas robóticas en la ejecución de tareas complejas, como la marcha. El aprendizaje por refuerzo permite al robot descubrir un camino viable para realizar una tarea previamente definida, eliminando la necesidad de una programación exhaustiva y un control detallado de los movimientos.El propósito de este trabajo es mostrar la implementación de algoritmos de aprendizaje por refuerzo con el objetivo de conseguir que nuestro modelo del robot humanoide TEO aprenda a caminar sin necesidad de programar un controlador de manera explicita. Este artículo incluye como se ha desarrollado el modelo del humanoide, que medida de aprendizaje se ha desarrollado y que algoritmos se han implementado durante el entrenamiento, así como los resultados que se han obtenido de este entrenamiento.

    • English

      In recent years, reinforcement learning in robotic simulation environments has emerged as a valuable tool for training robotic platforms to perform complex tasks, such as walking. Reinforcement learning allows the robot to discover a viable path to perform a predefined task, eliminating the need for exhaustive programming and detailed control of movements. The purpose of this work is to demonstrate the implementation of reinforcement learning algorithms with the aim of enabling our humanoid robot model TEO to learn to walk without the need for explicit controller programming. This paper includes the development of the humanoid model, the learning metric developed, and the algorithms implemented during training, as well as the results obtained from this training.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno