Alicante, España
En este trabajo se propone un nuevo algoritmo de aprendizaje por refuerzo para la planificación óptima de movimiento en vehículos no holonómicos.
El algoritmo es una extensión de la técnica CACM que incluye el aprendizaje del comportamiento dinámico del sistema en lugar de utilizar ecuaciones de estado como modelo. Este método es aplicable a sistemas continuos no lineales, en los cuales los métodos convencionales de aprendizaje por refuerzo presentan las mayores limitaciones. Los resultados, obtenidos mediante simulación, muestran el movimiento óptimo de un vehículo en presencia de obstáculos comparado con la técnica Q-learning.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados