Résumé
L’utilisation combinée des informations sur la fréquence laryngienne, portées simultanément par le module de la transformée de Fourier court-terme et la fonction de distribution des fréquences instantanées, conduit à une meilleure précision dans l’estimation de cette fréquence. Deux paramètres sont définis : le coefficient de dissymétrie spectrale et la fonction d’intercorrélation. Ils introduisent une bonne discrimination dans la nature des tranches analysées assurant ainsi la détection exacte du voisement et du non-voisement. L’exploitation de la sensibilité de ces paramètres par rapport à la nature des tranches permet l’élaboration d’une décision voisé/mixte/non voisé et la spécification de la source mixte.
Abstract
Combined use of different laryngeal frequency information furnished simultaneously by short-time Fourier transform and by instantaneous frequency distribution function leads to a higher precision of the frequency estimation. Two parameters are defined : the spectral dissymmetry coefficient and the “inter-correlation function. These parameters give a clear insight into the nature of the analysed speech windows, leading to an exact detection of the voicing feature. The exploitation of the sensibility with respect to the nature of the speech windows enables the extraction of voiced/mixed/unvoiced decision and also the specification of the mixed source.
Similar content being viewed by others
Bibliographie
Fant (G.). The acoustics of speech, Third internat. Congress on acoustics, (1959), pp. 188-201.
Flanagan (J.L.), Golden (R.M.). Phase vocoder, Bell Syst. Tech. J., (nov. 1966),45, pp. 1493–1509.
Man mohan sondhi, New methods of pitch detection, IEEE Trans. AU. (juin 1968),16, pp. 262–266.
Gold (B.), Rabiner (L.). Parallel processing techniques for estimating pitch periods of speech in the time domain, JASA, (aug. 1969),46, pp. 442–448.
Welch (P.D.). The use of fast Fourier transform for the estimation of power spectra, IEEE Trans. AU., (1970),15, pp. 70–73.
Markel (J.D.). The sift algorithm for fundamental frequency estimation, IEEE Trans. AU., (dec. 1972),20, pp. 367–377.
Ross (M.J.), Shaffer (H.L.), Cohen (A.), Freudberg (R.), Manley (H.J.). Average magnitude difference function pitch extractor, IEEE Trans. ASSP, (oct. 1974),22, pp. 353–362.
Wise (J.D.), Caprio (J.R.), Parks (T.W.). Maximum likelihood pitch estimation, IEEE Trans. ASSP, (oct 1976),24, pp. 418–423.
Rabiner (L.R.), Cheng (M.J.), Rosenberg (A.), McGonegal (CA.). A comparative performance study of several pitch detection algorithms, IEEE Trans. ASSP, (oct. 1976),24, pp. 399–417.
Geckinli (N.C.), Yavuz (D.). Algorithm for pitch extraction using zero-crossing interval sequence, IEEE Trans ASSP, (dec. 1977),25, pp. 559–564.
Friedman (D.H.). Pseudo-maximum-likelihood speech pitch extraction, IEEE Trans ASSP, (juin 1977),25, n°3, pp. 213–221.
Seneff (S.). Realtime harmonic pitch detector, IEEE Trans. ASSP, (aug. 1978),26, n°4 56–59.
Guerin (B.), Boe (L.J.). Etude de l’influence du couplage acoustique source-conduit vocal surF0 des voyelles orales. Conséquence pour l’étude des caractéristiques intrinsèques,Phonetica, (1980),37, pp. 169–192.
Martin (Ph.) Mesure de la fréquence fondamentale par intercorrélation avec une fonction peigne, Actes des XIIéme JEP, Galf, Montréal, (1981),52 pp. 221–232.
Oppenheim (A.V.), Luis (J.S.). The importance of phase in signal, Proc. IEEE, (may 1981),69, n°5, pp. 529–541.
Nawab (S.H.), Quatieri (T.F.), Lim (J.S.). Signal reconstruction from short-time Fourier transform magnitude, IEEE Trans. ASSP, (aug. 1983),31, pp. 986–998.
Kwon (S.Y.), Goldberg (A.J.), Ouellette (D.Ng, K.). A robust realtime pitch extraction from the ACF of LPC residual error signal, IEEE Trans. ASSP, (aug. 1985),33, pp. 403–406.
Friedman (D.) Instantaneous-frequency distribution vs time : an interpretation of the phase structure of speech, IEEE Trans. ASSP, (aug. 1985),33.
Charpentier (F.J.). Pitch detection using the short-term phase spectrum, IEEE Trans. ASSP, (april 1986), pp. 113–116.
Gong (Y.), Haton (J.P.), Time domain harmonic matching pitch estimation using the time-dependent speech modeling, IEEE Trans ASSP, (oct. 1987),35, n° 10 56–59.
Boite (R.), Kunt (M.). Traitement de la parole, complément au traité d’électricité, Presses Polytechniques Romandes.
Chen (C.S.), Yuan (J.). A robust pitch boundary detector, IEEE Trans. ASSP, (sept. 1988) pp. 366–367.
Strik (H.), Boves (L.). Simultaneous control of fundamental frequency and intensity in speech, Procedings Speech’88, (aug. 1988), pp. 1115–1122.
Author information
Authors and Affiliations
Rights and permissions
About this article
Cite this article
Bengi, M.P., Boite, R. & Leich, H. Contribution à une meilleure approche dans la détection et l’estimation de la fréquence laryngienne. Ann. Télécommun. 46, 319–334 (1991). https://doi.org/10.1007/BF02999403
Received:
Accepted:
Issue Date:
DOI: https://doi.org/10.1007/BF02999403