Resumen de High-throughput Computation through Efficient Resource Management

Ayuda

Resumen de High-throughput Computation through Efficient Resource Management

Sergio Iserte Agut

español
Esta propuesta aborda, desde dos enfoques distintos, la mejora de la productividad de centros de datos mediante una gestión eficiente de los recursos.

Por un lado, la combinación de tecnologías de virtualización remotas de GPUs junto con gestores de cargas de trabajos en clústeres HPC, demostró en la investigación llevada a cabo durante el periodo predoctoral un interesante incremento de productividad, en terminos de trabajos completados por unidad de tiempo. La disertación comienza con un estudio extendido de su impacto no sólo en la productivad, sino también en utilización de recursos y consumo energético. Así pues, una gestión eficiente del acceso a estos aceleradores es crucial para obtener un mayor ratio de trabajos completados por unidad de tiempo. Del mismo modeo, entornos de cloud computing (públicos o privados) también gestionan GPUs, ya que las máquinas virtuales pueden ir equipadas con estos dispositivos. Tal y como se detalla en este documento, la adopción de una tecnología de virtualización de GPUs junto con un gestor de recursos, introduce nuevos modos de trabajo dirigidos al incremento de la productividad global.

Por el otro lado, el segundo enfoque involucra reconfiguración de trabajos en terminos de modificar el número de procesos durante la ejecución (comúnmente referido como malleabilidad MPI) para incrementar la productividad del sistema. Actualmente, los trabajos MPI suponen un alto porcentaje del total de la carga en una instalación HPC. En el esfuerzo de facilitar la adopción de la maleabilidad en aplicaciones científicas, este manuscrito presenta dos soluciones, desde un enfoque del modelo de programación OmpSs y desde una sintaxis familiar a MPI, las cuales proveen de las herramientas necesarias para convertir fácilmente una aplicación en maleable. La evaluación de prestaciones revela un significativo incremento no sólo en la productividad, sino también en el tiempo de espera de los trabajos y del consumo energético.
English
This proposal addresses, from two different approaches, the improvement of data centers productivity through an efficient resource management. On the one hand, the combination of GPU remote virtualization technologies with workload managers in HPC clusters and cloud computing environments. On the other hand, job reconfigurations in terms of varying its number of processes during the execution. Performance evaluations reveal a non-negligible improvement not only in the throughput, but also, in the job waiting time and in the energy consumption.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Coordinado por: