Ayuda
Ir al contenido

Dialnet


Resumen de Técnicas de post-procesado de resultados en un sistema de diarización de locutores

David Tavarez Arriba, Eva Navas Cordón, Daniel Erro Eslava, Ibon Saratxaga Couceiro, Inmaculada Hernáez Rioja

  • español

    Este artculo presenta las tecnicas de postprocesado dise~nadas para mejorar los resultados de un sistema de diarizacion de locutores. Se han propuesto tres tecnicas de mejora: el re nado de la segmentacion voz/no voz, la asimilacion de los segmentos cortos y la fusion de los clusters del mismo locutor. Las tecnicas se han implementado en un modulo que se aplica como etapa de postprocesado y que ha mejorado un 22.3% el resultado del sistema base. El modulo se ha aplicado sin realizar ningun ajuste sobre otro sistema de diarizacion de arquitectura similar al sistema base con una mejora del 21% y sobre uno con arquitectura muy diferente sin conseguirse mejoras. Asimismo se ha utilizado con otra base de datos y se ha conseguido mejorar el DER un 17 %. Esto demuestra la validez de las tecnicas desarrolladas para la mejora de los resultados de la diarizacion.

  • English

    This paper presents the post-processing techniques designed to improve the results of a speaker diarization system. Three di erent techniques are proposed:

    re nement of speech vs. non speech segmentation, assimilation of short speech segments and fusion of clusters from the same speaker. These techniques have been implemented in a post-processing module that improves the result of the baseline system by 22.3 %. The same module has been applied to another speaker diarization system with a similar architecture to that of the baseline system with a DER improvement of 21% and to another one with a very di erent architecture where no improvement has been achieved. It has also been used with another database with an improvement of 17 %. These experiments prove the validity of the techniques developed.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus