Summary
The paper presents a new method of statistical longtime speech analysis based upon the filter band width of the ear, called critical bands. It's not the average power spectrum which we measure but rather the time during which a certain trigger level is reached within each frequency band. By the choice of different trigger levels we get some insight into energy distribution in every frequency group. The research comprises of normal male voices as well as female. The overall distribution shows differences between the two sexes due to correlations of filter band width and voice characteristics. The distribution shows 3 maxima in all cases, this means that frequency ranges with long durations for a certain trigger level alternate with those presenting only short durations. This structure is more obvious at higher trigger levels than at low ones. In the case of high trigger levels the first maximum is divided structure into 2 very fine maxima in the case of male, into 3 in the case of female voices. This is due to different fundamental frequences. Because of this correlation between filter band width and fundamental frequency on the one side and bandwidth and formant frequency on the other side, changes of the distribution in certain cases of speech and voice disorders can be predicted. Varied formant structure, as appears in the case of deaf persons, is characterised by small frequency ranges where certain trigger levels are reached. Noise components in oesophageal speech show long durations of even higher trigger levels in the upper frequency domain.
Zusammenfassung
In der vorliegenden Arbeit wird eine neue Methode der statistischen Langzeitanalyse vorgestellt, wobei die Filterwahl entsprechend der Frequenzanalyse des Ohres in Frequenzgruppen erfolgt. Dabei erhält man innerhalb jeder Frequenzgruppe die Gesamtenergie nach der Häufigkeit der einzelnen Pegel aufgeschliisselt. Die Gesamtverteilung weist bei gleichem Text charakteristische Unterschiede zwischen Männer- und Frauenstimmen, die sich aus der Wechselwirkung von Stimmanteilen und Filtern erklären lassen, auf. Auf Grund diesel Zusammenhanges lassen sich Änderungen in der Gesamtverteilung bei bestimmten Stimm- und Sprechstörungen voraussagen. Dies wird an Hand von 2 Beispielen vorgeführt.
Similar content being viewed by others
Literatur
Dunn, H. K., White, S. D.: Statistical measurements on conversational speech. J. acoust. Soc. Amer. 11, 278–288 (1940).
Engan, J. P., Miller, G. A., Stevens, S. S.: Methods of measuring speech spectra. J. acoust. Soc. Amer. 19, 771–780 (1947).
Feldtkeller, F., Zwicker, E.: Das Ohr als Nachrichtenempfänger, 2. Aufl. Stuttgart: Hirzel 1967.
Flanagan, J. L.: Speech analysis, synthesis and perception. Wien-New York: Springer 1965.
Guichard, J., Lafon, J. C.: Procédé pour mésurer les résultats de la thérapeutique de la voix, de la parole et du language. Foha phoniat. (Basel) 23, 81–154 (1971).
Luchsinger, R., Arnold, G. R.: Die Stimme and ihre Störungen, Bd. I. Wien-New York: Springer 1970.
Nessel, E.: Über das Tonfrequenzspektrum der pathologische veränderten Stimme. Acta oto-laryng. (Stockh.) Suppl. 157 (1960).
Winekel, F.: Die akustischen Grundlagen der Stimmbildung. In: R. Luchsinger and G. E. Arnold: Die Stimme and ihre Störungen, vol. I. Wien-New York: Springer 1970.
Author information
Authors and Affiliations
Rights and permissions
About this article
Cite this article
Müller, G. Statistische langzeitanalyse von sprechstimmen auf frequenzgruppenbasis Statistical longterm analysis of speech sounds based upon critical band width. Arch. Klin. Exp. Ohr.-, Nas.- U. Kehlk. Heilk. 204, 151–160 (1973). https://doi.org/10.1007/BF00302163
Received:
Issue Date:
DOI: https://doi.org/10.1007/BF00302163