En la estimación de la frecuencia fundamental de señales de voz usando transformada Wavelet es común usar el hecho de que ocurren máximos locales a través de las escalas de descomposición en la vecindad del instante de cierre glótico (Glottal Closure Instant-GCI). Dichos métodos se basan en la correlación de las posiciones de los máximos locales para varias escalas de descomposición; pero ello no es tan simple porque existen muchos máximos locales en una señal de voz y, además, las escalas correspondientes a las frecuencias altas son fácilmente afectadas por el ruido. Se propone un método basado en la determinación y correlación de las distancias para cada escala de descomposición, el cual funciona ante perturbaciones de ruido blanco gausiano. Su desempeño se compara respecto a la base de datos Keele Pitch Database con el método SIFT(Simplified Inverse Filtering Tracking) el cual es un método de estimación de la frecuencia fundamental comúnmente usado en sistemas comerciales.
We often use the analysis way local maxims, which are present trough the scales of decomposition in the neighbourhood of the Glottal Closure Instant (GCI) for the estimation of the fundamental frequency of speech signal. These methods use the correlation of the local maxima position for various scales of decomposition. This is not simple because there are many local maxims in the speech waveform and, therefore, the scales that correspond to high frequencies are easily affected by noise. A new method is proposed, based on the determination and correlation of distances for each decomposition scale, which works on white noise perturbations.
Its achievement is compared respect to the Keele Pitch Database with the Simplified Inverse Filtering Tracking method which is a method commonly used in commercial systems.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados