Resumen de Sintesi de la parla per concatenacio basada en la seleccio

Ayuda

Resumen de Sintesi de la parla per concatenacio basada en la seleccio

Albert Ferrer

La conversión de texto o habla tiene el objetivo de imitar a un hablante en la capacidad de leer un texto, y permite trasladar la comunicación escrita entre las personas y las maquinas al habla. En el contexto de desarrollo del sistema de conversión de texto a habla del TALP (UPC), se ha desarrollado un sistema de síntesis del habla por concatenación basada en la selección de unidades.

La síntesis del habla de concatenación de unidades clásica dispone de una instancia de cada una de las diferentes unidades que utiliza, habitualmente difonemas. Entonces, la voz sintética se genera por concatenación de las unidades necesarias. Las limitaciones en la calidad del habla se deben a dos tipos de distorsión: a) de concatenación: los segmentos de voz utilizados están condicionados por la coarticulación con el contexto de donde se extraen(en general diferente del contexto donde se insertan), y b) de unidad: las características prosódicas de los segmentos de voz son en general diferentes a la prosodia requerida para el habla sintética (su modificación introduce distorsión). Una forma de resolver estos dos problemas consiste en poblar la base de unidades de varias instancias diferentes para cada una de las unidades, incrementando la variabilidad fonética y prosódica de los segmentos de voz disponibles para la concatenación.

En esta tesis se describe la generación de un corpus de unidades de síntesis, y el procedimiento y los criterios utilizados para seleccionar estas unidades.

La generación del corpus de unidades se basa en un análisis de diferentes unidades a considerar en la selección: difonemas, trifonemas y palabras, de las que se estudian los inventarios y distribuciones frecuenciales de las apariciones. Las unidades elementales para la la concatenación que se usan en el sistema implementado son los semifonemas, definidos como cada una de las dos partes de un fonema dependientes del contexto fonético adyacente.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Coordinado por: