Ayuda
Ir al contenido

Dialnet


Resumen de Design and implementation of fpga-based video encoding accelerators

Estefanía Fátima Alcocer Espinosa

  • Hoy en día poseer el último grito en dispositivos de vídeo e imagen no es nada sorprendente, de hecho, es la tendencia actual. Comercialmente, los dispositivos de altas prestaciones como televisores de muy alta resolución con una gran calidad de imagen o videocámaras que capturan a muy altas tasas de frames se ofertan y demandan cada vez más. Todos los días, se realizan millones de “selfies”, “gifs”, “boomerangs” que son inmediatamente subidos a redes sociales como Instagram, Facebook o Twitter; incluso transmitimos nuestra vida en directo con aplicaciones como PeriScope. También somo espectadores en primera persona de los deportes más extremos que son grabados en directo con cámaras del tipo Go-Pro. Es por ello, que el ámbito de la imagen y vídeo es un campo con futuro, en el cual cada día se aportan innumerables innovaciones y mejoras debido al consumo actual de dichos dispositivos comerciales.

    Aunque cada vez es más fácil encontrar dispositivos capaces de reproducir y capturar vídeos de muy alta resolución a altas tasas de frame, estas altas prestaciones suponen una mayor complejidad en los procesos de tratamiento de vídeo debido a la gran cantidad de datos que contienen. En este contexto, nos encontramos con varios problemas como son la imposibilidad de transmitir vídeo en tiempo real ya que se necesitaría un ancho de banda inasumible y la dificultad de almacenamiento en memoria que siempre es limitada.

    Con el fin de superar las limitaciones anteriores, se han desarrollado a lo largo de los años diferentes estándares de codificación de vídeo que tratan de adaptarse a las necesidades de cada momento. De manera muy general, los codificadores de vídeo comprimen la información para que pueda ser almacenada o transmitida ocupando el mínimo espacio posible. Como ejemplo, plataformas como Netflix utilizan el códec de compresión VP9 de Google para descargar películas y series que no ocupen demasiado y poder visualizarlas offline en cualquier dispositivo. Para conseguir dicha compresión, los codificadores aprovechan la alta redundancia de las secuencias de vídeo tanto en el dominio espacial como temporal, de manera que eliminando dicha información redundante, se consigue codificar de manera óptima el contenido de vídeo.

    Por tanto, debido a la gran cantidad de recursos requeridos y el consecuente aumento en la complejidad y el tiempo de procesado, en esta tesis se investiga el uso de aceleradores hardware basados en FPGAs sobre las partes más complejas y que requieren más tiempo de procesado en los codificadores de vídeo.

    En primer lugar, se ha diseñado un acelerador hardware para el cómputo de la estimación de movimiento de un codificador de vídeo HEVC. En este caso, el trabajo se ha centrado en el último estándar de codificación de vídeo HEVC, el cual muestra la mejor eficiencia de compresión respecto a sus predecesores. Al igual que en estándares anteriores, la eliminación de la redundancia temporal demanda un coste computacional abrumador, especialmente en secuencias de vídeo de alta resolución. Por ello, el bloque de estimación de movimiento del codificador (predicción Inter) es uno de los módulos más críticos en la compresión de vídeo. Partiendo de este contexto, nuestro diseño se basa en la implementación de la estimación de movimiento de un codificador HEVC sobre FPGA, proponiendo dos técnicas novedosas, tanto en el árbol de sumadores para el cálculo de la estimación, como en el orden de lectura de memoria. Los resultados muestran que utilizando nuestro módulo hardware de estimación de movimiento, un codificador HEVC es capaz de codificar secuencias de muy alta resolución a tasas de frame más altas que las que se requieren a tiempo real.

    En segundo lugar, se presenta una implentación hardware sobre FPGA de un códec muy sencillo llamado MPCM basado en la eliminación de la redundancia espacial (predicción Intra). Este códec presenta las mismas ventajas que la codificación PCM, reduciendo considerablemente el ancho de banda necesario y manteniendo la misma calidad de imagen. Los resultados experimentales obtenidos demuestran que nuestra implementación hardware permite la grabación continua a muy buena calidad en cámaras actuales de alta velocidad.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus