Zusammenfassung
Merkmalextraktion und Klassifikation sind außerordentlich wichtige Verarbeitungsstufen für die Sprach- und Sprechererkennung; sie spielen darüber hinaus aber auch eine ebenso bedeutende Rolle bei jeglicher Form der Mustererkennung. Während die Merkmalextraktion vor allem dazu dient, das zu analysierende Datenmaterial (hier: Sprache) auf ein Minimum zu reduzieren, um auf diese Weise Verarbeitungsaufwand zu sparen sowie die wesentlichen Merkmale heraus zu „destillieren“, besteht die Aufgabe der Klassifikation darin, den analysierten Merkmalen Bedeutungen zuzuordnen. Es werden einige der wichtigsten Merkmalextraktionsverfahren vorgestellt. Bei der Klassifikation stehen statistische Klassifikatoren (Bayes-Klassifikator, Hidden-Markov-Modelle), neuronale Netze sowie Abstandsklassifikatoren, und schliesslich die dynamische Zeitnormierung im Vordergrund.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Literatur
Benesty J, Sondhi MM, Huang Y (Hrsg) (2008) Springer handbook of speech processing. Berlin, Heidelberg
Braun H, u. a (1996) Praktikum Neuronale Netze. Springer-Verlag, Berlin, Heidelberg, New York
Deller Jr JR et al (1993) Discrete-time processing of speech signals. Macmillan Publishing Company, New York
Euler S (2006) Grundkurs Spracherkennung. Friedr. Vieweg&Sohn Verlag, GWV FachverlageGmbH, Wiesbaden
Hardt D (2001) Textabhängige und phonetisch-basierte Sprecherverifizierung für den Einsatz in der Telekommunikation (Diss.). Wissenschaft&Technik Verlag, Berlin
Hermansky H (1990) Perceptual linear predictive (PLP) analysis of speech. J Acoust Soc Am 87(2)
Hermansky H et al (1992) RASTA-PLP speech analysis technique. Proceedings of the international conference on acoustics, signal and speech processing. San Francisco California
Hoffmann R (1998) Signalanalyse und -erkennung. Eine Einführung für Informationstechniker. Springer Verlag, Berlin, Heidelberg, New York
Itakura F (1975) Minimum prediction residual principle applied to speech recognition. IEEE Trans. on Acoustics, Speech and Signal Processing 23(1)
Jurafsky D, Martin JH (2009) Speech and language processing. Pearson Prentice-Hall, New Jersey
Kinnebrock W (1992) Neuronale Netze. Grundlagen, Anwendungen, Beispiele. R. Oldenbourg Verlag, München, Wien
Kohonen T (1988) The „neural“ phonetic typewriter. Computer 21:11–22
Kratzer KP (1990) Neuronale Netze. Grundlagen und Anwendungen. Carl Hanser Verlag, München, Wien
Lippmann RP (1987) An introduction to computing with neural nets. IEEE ASSP Magazine
Meyer-Brötz G, Schürmann J (1970) Methoden der automatischen Zeichenerkennung. R. Oldenbourg, München
Ohm JR, Lüke HD (2002) Signalübertragung, 8. Aufl. Springer Verlag, Berlin, Heidelberg usw
Paulus E (1998) Sprachsignalverarbeitung. Analyse, Erkennung, Synthese. Spektrum Akademischer Verlag, Heidelberg, Berlin
Pfister B, Kaufmann T (2008) Sprachverarbeitung. Grundlagen und Methoden der Sprachsynthese und Spracherkennung. Springer Verlag, Berlin, Heidelberg
Rabiner L, Juang BH (1993) Fundamentals of speech recognition. Prentice-Hall, Englewood Cliffs, N.J.
Rabiner LR (1989) A tutorial on hidden Markov models and selected applications in speech recognition. Proceedings of the IEEE 77(2)
Rabiner LR et al (1978) Considerations in dynamic time warping algorithms for discrete word recognition, vol. ASSP-26. IEEE Trans. on Acoustics Speech and Signal Processing
Rabiner LR, Juang BH (1986) An introduction to hidden Markov models. IEEE ASSP Magazine
Rabiner LR, Schafer RW (1978) Digital processing of speech signals. Prentice-Hall Inc., Englewood Cliffs, New Jersey
Rojas R (1993) Theorie der neuronalen Netze. Springer Lehrbuch. Springer Verlag, Berlin usw
Rosenblatt F (1958) The perceptron: A probabilistic model for information storage and organization in the brain, vol. 65. Psychol Rev
Rumelhart DE, McCelland JL (1986) Parallel distributed processing: Explorations in the microstructure of cognition. MIT Press, Cambridge, Mass
Ruske G (1988) Automatische Spracherkennung. Methoden der KLassifikation und Merkmalsextraktion. R. Oldenbourg Verlag, München. Wien
Sakoe H, Chiba S (1978) Dynamic programming algorithms optimization for spoken word recognition, vol. ASSP-26. IEEE Transactions on Acoustics, Speech and Signal Processing
Schukat-Talamazzini EG (1995) Automatische Spracherkennung. Friedr. Vieweg&Sohn Verlagsgesellschaft mbH, Braunschweig
Schürer T (1995) Sprecherunabhängige Ziffern- und Ziffernkettenerkennung über Telefonkanäle, Dissertation. TU Berlin D 83, Berlin
Sickert K (1983) Automatische Spracheingabe und Sprachausgabe. Verlag Markt und Technik, Haar b. München
Stanley J, Bak E (1991) Neuronale Netze. Computersimulation biologischer Intelligenz. Systhema Verlag GmbH, München
Wendemuth A (2004) Grundlagen der stochastischen Sprachverarbeitung. Oldenbourg Verlag, München
Widrow B, Hoff ME (1960) Adaptive switching circuits. IRE WESCON Convention Records, New York
Young S, Bloothooft G (1997) Corpus-based methods in language and speech processing. Kluwer Academic Publishers, Dordrecht, Boston, London
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2012 Springer-Verlag Berlin Heidelberg
About this chapter
Cite this chapter
Fellbaum, K. (2012). Merkmalextraktion und Klassifikation. In: Sprachverarbeitung und Sprachübertragung. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-31503-9_7
Download citation
DOI: https://doi.org/10.1007/978-3-642-31503-9_7
Published:
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-642-31502-2
Online ISBN: 978-3-642-31503-9
eBook Packages: Computer Science and Engineering (German Language)