New contributions on image fusion and compression based on space-frecuency representations = Nuevas contribuciones en fusión y compresión de imágenes basadas en representaciones espacio-frecuenciales

Rafael Redondo Tejedor

Ayuda

New contributions on image fusion and compression based on space-frecuency representations = Nuevas contribuciones en fusión y compresión de imágenes basadas en representaciones espacio-frecuenciales

Autores: Rafael Redondo Tejedor
Directores de la Tesis: María Jesús Ledesma Carbayo (dir. tes.), Gabriel Cristobal Pérez (dir. tes.)
Lectura: En la Universidad Politécnica de Madrid ( España ) en 2007
Idioma: español
Tribunal Calificador de la Tesis: Andres Santos Lleo (presid.), Carlos Óscar Sánchez Sorzano (secret.), Jesús Malo López (voc.), Filip Sroubek (voc.), Norberto Antonio Malpica Gonzalez (voc.)
Enlaces
- Tesis en acceso abierto en: Archivo Digital UPM
Resumen
- Joint representations have experimented a signi_cant height in signal processing during the last decades, to such an extent that there is no topic they have not been utilized for. Within a sea of joint representations existent in the literature, one of them concerns the present work: the log-Gabor multiresolution transform proposed in [70, 68]. Its low spectral overlapping, high selectivity in orientation and scalability, shift-invariance, self-invertibility and complex de_nition confers e_ciency, versatility and robustness against noise and a low presence of artifacts. Further on, the tight similarity of overcomplete log-Gabor _lters to the cortical area V1, together with the modeling of inhibitory/ facilitatory neuronal behaviors and sparse coding algorithms allow to achieve an approximation of the image based on the extraction of those salient features normally coincident with contours. This type of image representation based on multiscale contours traces new routes to solve image processing tasks, in particular in the areas of image compression and fusion. A recent compression paradigm postulates higher e_ciency from coding separately features present in images, such as luminance, contours or textures [19, 145, 240]. Following that paradigm, in this thesis a new compression method is proposed based on coding those multiscale contours extracted from the sparse log-Gabor transformation. In account of the nature of such features, a chain coding algorithm has been specially tailored to the stochastic and morphological peculiarities of multiscale contours. Thus, di_erent predictive techniques as well as pre_x and arithmetic coding have been combined according to each alphabet. Moreover, the proposed algorithm o_ers a complete compression scheme including low-pass coding as well as header bitstream allocation. Such coding rest on a model of the primary visual cortex in order to mitigate typical compression distortions usually produced by compression standards such as JPEG and JPEG2000. Multiresolution decompositions have proven their superiority against other traditional image fusion techniques. Nevertheless it does not exist any evident hegemony, often due to the lack of a reference image. In this thesis, several types of wavelets were compared to log-Gabor _lters, which succeeded remarkably, but they were never used before on account of its traditional lack of exact reconstruction. Further, a general algorithm for multiresolution schemes named multisize windows is proposed. It adapts the size of the averaging window according to the local features in the image and exploits the advantages of both small, i.e. precise, and big, i.e. robust, windows showing signi_cant reduction on errors in decision maps in contrast to traditional _xed window approaches. Finally, a novel contour-based fusion method is also proposed by integrating the multiscale contours to multiresolution fusion. This feature-based algorithm reduces the sensitivity to noise, blurring e_ects and misregistration artifacts. Las representaciones conjuntas han experimentado un notable apogeo durante las últimas décadas, hasta tal punto que no hay campo en el procesamiento de señales en el que no hayan sido utilizadas. Dentro del mar de representaciones existentes en la literatura, una de ellas concierne el presente trabajo: la implementación log-Gabor propuesta en [70, 68]. Su bajo solapamiento, alta sensibilidad en orientación y escalabilidad, invarianza a traslación, auto-invertibilidad y la de_nición compleja con_eren e_ciencia, versatilidad y robustez contra el ruido y la aparición de artefactos. Más allá, el estrecho parecido de los _ltros sobrecompletos log-Gabor con el área cortical V1 junto con el modelado de comportamientos neuronales de inhibición/facilitación y codi_cación escasa permiten conseguir una approximación de la imagen basada en la extracción de los rasgos más salientes normalmente coindidentes con los contornos. Este tipo de representaci ón, basada en contornos multiescala, traza una nueva ruta para resolver taréas de procesamiento de imágenes, en concreto, compresión y fusión de imágenes. Un nuevo paradigma de compresión postula una alta e_ciencia si los rasgos caracter ísticos de las imágenes son codi_cados separadamente, tales como luminancia, contornos o textura [19, 145, 240]. Siguiendo ese paradigma, en esta tesis doctoral se ha propuesto un nuevo método de compresión basado en codi_car dichos contornos multiescala extraídos de la transformación escasa log-Gabor. Teniendo en cuenta la naturaleza de tales rasgos, un algoritmo de codi_cación de cadenas ha sido especialmente diseñado según las peculiaridades estocásticas y morfológicas de dichos contornos. Para ello, di_erentes técnicas predictivas así como códigos pre_jos y aritméticos han sido combinados de acuerdo con cada alfabeto. Además, el algoritmo propuesto ofrece un completo esquema de compresión incluyendo la codi_cación del residuo paso-bajo y la colocación de cabezeras de la trama. Tal codi_cación se fundamenta en modelos del cortex visual primario para mitigar distorsiones de compresión típicamente producidas por los estandars de compresión JPEG ó JPEG2000. Las descomposiciones multiresolución han demostrado su superioridad contra otras técnicas tradicionales de fusión de imágenes. Sin embargo, no existe ninguna evidencia de hegemonia, a menudo debido a la falta de una imagen de referencia. En esta tesis, varios tipos de wavelets son comparadas con log-Gabor _lters exitosamente, los cuales nunca habían sido utilizados anteriormente debido a su tradicional falta de reconstrución exacta. Además, un algoritmo general para esquemas multiresolución llamado ventanas multitamaño ha sido propuesto, el cual adapta el tamaño de ventana a los rasgos locales en la imagen explotando las ventajas de ambas ventanas, pequeña o precisa y grande o robusta, reduciendo notablemente los errores en los mapas de decisión en contra de las tradicionales técnicas de tamaño _jo de ventana. Finalmente, un nuevo método orientado a contornos ha sido también propuesto incorporando los contornos multiescala al esquema de fusión multiresolución. Este algoritmo basado en rasgos reduce la sensibiliad al ruido, efectos de emborronamiento y artefactos de alineamiento.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: