Ayuda
Ir al contenido

Dialnet


Resumen de Entrenamiento, optimización y validación de una CNN para localización jerárquica mediante imágenes omnidireccionales

Juan José Cabrera, Sergio Cebollada López, Mónica Ballesta Galdeano, Luis Miguel Jiménez García, Luis Payá Castelló, Óscar Reinoso García

  • español

    El objetivo del presente trabajo es abordar la localización de un robot móvil mediante el entrenamiento de una Red Neuronal Convolucional (CNN) de manera que se obtengan unos resultados óptimos. El problema de localización se aborda de forma jerárquica empleando un sistema catadióptrico omnidireccional y se trabaja directamente con las imágenes capturadas sin pasar a panorámicas, ahorrando así el tiempo de cálculo asociado a este proceso. La localización se lleva a cabo en dos pasos y en ambos se emplea la arquitectura de la CNN con diferentes objetivos. Primero se lleva a cabo una localización gruesa que consiste en identificar la estancia en la que se encuentra el robot por medio de la CNN. Después se realiza una localización fina en dicha estancia, en la cual la CNN es empleada para la obtención de descriptores holísticos a partir de las capas intermedias de la red. Estos descriptores globales permiten encontrar la posición donde se encuentra el robot de manera más precisa por medio de una búsqueda del vecino más cercano, comparando el descriptor correspondiente de la imagen test con los descriptores de las imágenes capturadas en la estancia seleccionada en el primer paso. Con el fin de mejorar el desempeño de la red se recurre a un aumento de datos y a una optimización bayesiana de hiperparámetros. Estas técnicas demuestran ser una solución eficiente y robusta para afrontar el problema de localización tal y como se muestra en la sección de experimentos.

  • English

    The aim of this work is to address the localization of a mobile robot by training a Convolutional Neural Network (CNN) in order to obtain optimal results. The localization problem is approached in a hierarchical way by using an omnidirectional catadioptric system and working directly with the captured images without panoramic conversion, saving the computational time associated with this process. Localization is carried out in two steps, both using the CNN architecture for different purposes. First, a rough localization is carried out, which consists of identifying the room in which the robot is located by means of the CNN. Then a fine localization is performed in the room, in which the CNN is used to obtain holistic descriptors from the intermediate layers of the network. These global-appearance descriptors allow finding the position where the robot is located more precisely by means of a nearest neighbour search, comparing the corresponding descriptor of the test image with the descriptors of the images captured in the room selected in the first step. In order to improve the accuracy of the network, data augmentation and Bayesian hyperparameter optimisation are used. These techniques prove to be an efficient and robust solution to tackle the localization problem as shown in the experiments section.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus