Skip to main content
Log in

Contribution à une meilleure approche dans la détection et l’estimation de la fréquence laryngienne

Contribution to a better approach for laryngeal frequency detection and estimation

  • Published:
Annales des Télécommunications Aims and scope Submit manuscript

Résumé

L’utilisation combinée des informations sur la fréquence laryngienne, portées simultanément par le module de la transformée de Fourier court-terme et la fonction de distribution des fréquences instantanées, conduit à une meilleure précision dans l’estimation de cette fréquence. Deux paramètres sont définis : le coefficient de dissymétrie spectrale et la fonction d’intercorrélation. Ils introduisent une bonne discrimination dans la nature des tranches analysées assurant ainsi la détection exacte du voisement et du non-voisement. L’exploitation de la sensibilité de ces paramètres par rapport à la nature des tranches permet l’élaboration d’une décision voisé/mixte/non voisé et la spécification de la source mixte.

Abstract

Combined use of different laryngeal frequency information furnished simultaneously by short-time Fourier transform and by instantaneous frequency distribution function leads to a higher precision of the frequency estimation. Two parameters are defined : the spectral dissymmetry coefficient and the “inter-correlation function. These parameters give a clear insight into the nature of the analysed speech windows, leading to an exact detection of the voicing feature. The exploitation of the sensibility with respect to the nature of the speech windows enables the extraction of voiced/mixed/unvoiced decision and also the specification of the mixed source.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Similar content being viewed by others

Bibliographie

  1. Fant (G.). The acoustics of speech, Third internat. Congress on acoustics, (1959), pp. 188-201.

  2. Flanagan (J.L.), Golden (R.M.). Phase vocoder, Bell Syst. Tech. J., (nov. 1966),45, pp. 1493–1509.

    Google Scholar 

  3. Man mohan sondhi, New methods of pitch detection, IEEE Trans. AU. (juin 1968),16, pp. 262–266.

    Google Scholar 

  4. Gold (B.), Rabiner (L.). Parallel processing techniques for estimating pitch periods of speech in the time domain, JASA, (aug. 1969),46, pp. 442–448.

    Google Scholar 

  5. Welch (P.D.). The use of fast Fourier transform for the estimation of power spectra, IEEE Trans. AU., (1970),15, pp. 70–73.

    Google Scholar 

  6. Markel (J.D.). The sift algorithm for fundamental frequency estimation, IEEE Trans. AU., (dec. 1972),20, pp. 367–377.

    Google Scholar 

  7. Ross (M.J.), Shaffer (H.L.), Cohen (A.), Freudberg (R.), Manley (H.J.). Average magnitude difference function pitch extractor, IEEE Trans. ASSP, (oct. 1974),22, pp. 353–362.

    Article  Google Scholar 

  8. Wise (J.D.), Caprio (J.R.), Parks (T.W.). Maximum likelihood pitch estimation, IEEE Trans. ASSP, (oct 1976),24, pp. 418–423.

    Article  Google Scholar 

  9. Rabiner (L.R.), Cheng (M.J.), Rosenberg (A.), McGonegal (CA.). A comparative performance study of several pitch detection algorithms, IEEE Trans. ASSP, (oct. 1976),24, pp. 399–417.

    Article  Google Scholar 

  10. Geckinli (N.C.), Yavuz (D.). Algorithm for pitch extraction using zero-crossing interval sequence, IEEE Trans ASSP, (dec. 1977),25, pp. 559–564.

    Article  Google Scholar 

  11. Friedman (D.H.). Pseudo-maximum-likelihood speech pitch extraction, IEEE Trans ASSP, (juin 1977),25, n°3, pp. 213–221.

    Article  Google Scholar 

  12. Seneff (S.). Realtime harmonic pitch detector, IEEE Trans. ASSP, (aug. 1978),26, n°4 56–59.

    Article  Google Scholar 

  13. Guerin (B.), Boe (L.J.). Etude de l’influence du couplage acoustique source-conduit vocal surF0 des voyelles orales. Conséquence pour l’étude des caractéristiques intrinsèques,Phonetica, (1980),37, pp. 169–192.

    Article  Google Scholar 

  14. Martin (Ph.) Mesure de la fréquence fondamentale par intercorrélation avec une fonction peigne, Actes des XIIéme JEP, Galf, Montréal, (1981),52 pp. 221–232.

    Google Scholar 

  15. Oppenheim (A.V.), Luis (J.S.). The importance of phase in signal, Proc. IEEE, (may 1981),69, n°5, pp. 529–541.

    Article  Google Scholar 

  16. Nawab (S.H.), Quatieri (T.F.), Lim (J.S.). Signal reconstruction from short-time Fourier transform magnitude, IEEE Trans. ASSP, (aug. 1983),31, pp. 986–998.

    Article  Google Scholar 

  17. Kwon (S.Y.), Goldberg (A.J.), Ouellette (D.Ng, K.). A robust realtime pitch extraction from the ACF of LPC residual error signal, IEEE Trans. ASSP, (aug. 1985),33, pp. 403–406.

    Google Scholar 

  18. Friedman (D.) Instantaneous-frequency distribution vs time : an interpretation of the phase structure of speech, IEEE Trans. ASSP, (aug. 1985),33.

  19. Charpentier (F.J.). Pitch detection using the short-term phase spectrum, IEEE Trans. ASSP, (april 1986), pp. 113–116.

  20. Gong (Y.), Haton (J.P.), Time domain harmonic matching pitch estimation using the time-dependent speech modeling, IEEE Trans ASSP, (oct. 1987),35, n° 10 56–59.

    Google Scholar 

  21. Boite (R.), Kunt (M.). Traitement de la parole, complément au traité d’électricité, Presses Polytechniques Romandes.

  22. Chen (C.S.), Yuan (J.). A robust pitch boundary detector, IEEE Trans. ASSP, (sept. 1988) pp. 366–367.

  23. Strik (H.), Boves (L.). Simultaneous control of fundamental frequency and intensity in speech, Procedings Speech’88, (aug. 1988), pp. 1115–1122.

Download references

Author information

Authors and Affiliations

Authors

Rights and permissions

Reprints and permissions

About this article

Cite this article

Bengi, M.P., Boite, R. & Leich, H. Contribution à une meilleure approche dans la détection et l’estimation de la fréquence laryngienne. Ann. Télécommun. 46, 319–334 (1991). https://doi.org/10.1007/BF02999403

Download citation

  • Received:

  • Accepted:

  • Issue Date:

  • DOI: https://doi.org/10.1007/BF02999403

Mots clés

Key words

Navigation