Sprachkommunikation

  • Joachim Schenk
  • Gerhard Rigoll

Zusammenfassung

Wie im vorherigen Kapitel dargestellt, sind die wesentlichen Komponenten eines interaktiven Systems die Dialogkomponente zur Steuerung des Interaktionsverlaufs mit dem Benutzer und die Benutzerschnittstelle, über die das System die Eingaben des Benutzers erhält und die Systemrückmeldungen ausgibt. Ohne dieses Benutzerinterface wäre das System nicht kommunikationsfähig. Bereits in Kapitel 2 wurde gezeigt, dass die Ein-/Ausgabe über viele unterschiedliche Modalitäten realisiert werden kann, wobei die Interaktion über die Standardgeräte Bildschirm, Tastatur und Maus immer noch am populärsten ist. Bei den weiter fortgeschrittenen Kommunikationsmöglichkeiten ist die Sprachkommunikation diejenige Kommunikationsart mit dem größten Potenzial, da auch zwischen Menschen diese Kommunikationsform die am häufigsten verwendete ist [31]. Diese bietet sich somit als eine der natürlichsten Kommunikationsformen zwischen Mensch und Maschine an.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literaturverzeichnis

  1. [1]
    Ahmed, N. ; Natarajan, T. ; Rao, K. R.: Discrete Cosine Transform. In: IEEE Transactions on Computers 23 (1974), S. 90–93MATHCrossRefMathSciNetGoogle Scholar
  2. [2]
    Bakis, R.: Continuous Speech Word Recognition via Centi-Second Acoustic States. In: Proceedings of the ASA Meeting (1976)Google Scholar
  3. [3]
    Baum, L.E. ; Eagon, J. A.: An Inequality with Applications to Statistical Estimation for Probabilistic Functions of Markov Processes and to a Model for Ecology. In: Bulletin of the American Mathematical Society 73 (1967), Nr. 3, S. 360–363MATHCrossRefMathSciNetGoogle Scholar
  4. [4]
    Baum, L.E. ; Petrie, T.: Statistical Inference for Probabilistic Functions of Finite State Markov Chains. In: The Annals of Mathematical Statistics 37 (1966), Nr. 6, S. 1554–1563MATHCrossRefMathSciNetGoogle Scholar
  5. [5]
    Baum, L.E. ; Sell, G. R.: Growth Functions for Transformations on Manifolds. In: Pacific Journal of Mathematics 27 (1968), Nr. 2, S. 211–227MATHMathSciNetGoogle Scholar
  6. [6]
    Beale, R. ; Jackson, T.: Neural Computing – an Introduction. IOP Publishing Ltd., 1990Google Scholar
  7. [7]
    Bilmes, J. A.: A Gentle tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models. U.C. Berkely, TR-97-02, 1998Google Scholar
  8. [8]
    Bishop, C. M.: Pattern Recognition and Machine Learning. Springer, 2006Google Scholar
  9. [9]
    Bogert, B.P. ; Healy, M. J.R. ; Tukey, J.W.: The Quefrency Alanysis of Time Series for Echoes: Cepstrum, Pseudo-Autocovariances, Cross-Cepstrum and Sapge Cracking. In: Proceedings of the Symposium on Time Series Analysis (1963), S. 209–243Google Scholar
  10. [10]
    Childers, D.G. ; Skinner, D.P. ; Kemerait, R. C.: The Cepstrum: A Guide to Processing. In: Proceedings of the IEEE 65 (1977), Nr. 10, S. 1428–1443CrossRefGoogle Scholar
  11. [11]
    Davis, S.P. ;Mermelstein, P.: Comparison of Parametric Representations for Monosyllabic Word Recognition in Continuously Spoken Sentences. In: IEEE Transactions on Acoustics, Speech, and Signal Processing 28 (1980), Nr. 4, S. 357–366CrossRefGoogle Scholar
  12. [12]
    Dempster, A.P. ; Laird, N.M. ; Rubin, D. B.: Maximum Likelihood from Incomplete Data via the EM Algorithm. In: Journal of the Royal Statistical Society 39 (1977), Nr. 1, S. 1–38MATHMathSciNetGoogle Scholar
  13. [13]
    Duda, R.O. ; Hart, P.E. ; Stork, D. G.: Pattern Classification. 2. John Wiley & Sons, 2001Google Scholar
  14. [14]
    Duden: Aussprachewörterbuch. Bd. 6. Duden, 2006Google Scholar
  15. [15]
    Fink, G. A.: Mustererkennung mit Markov-Modellen. B. G. Teubner, 2003 (Leitfäden der Informatik)Google Scholar
  16. [16]
    Fisher, W. D.: On a Pooling Problem from the Statistical Decision Viewpoint. In: Econometrica 21 (1953), Nr. 4, S. 567–585MATHCrossRefMathSciNetGoogle Scholar
  17. [17]
    Forney, G. D.: Concatenated Codes. The MIT Press, 1967Google Scholar
  18. [18]
    Forney, G. D.: The Viterbi Algorithm. In: Proceedings of the IEEE 61 (1973), Nr. 3, S. 268–278CrossRefMathSciNetGoogle Scholar
  19. [19]
    Gower, L.C. ; Ross, G. J. S.: Minimum Spanning Trees and Single Linkage Cluster Analysis. In: Applied Statistics 18 (1969), Nr. 1, S. 54–64CrossRefMathSciNetGoogle Scholar
  20. [20]
    Gray, R. M.: Vector Quantization. In: IEEE ASSP Magazine 1 (1984), Nr. 4, S. 4–29CrossRefGoogle Scholar
  21. [21]
    Heincke, F.: Die Lokalformen und die Wanderungen des Herings in den europäischen Meeren. In: Naturgeschichte des Herings. 2. Verlag von Otto Salle, 1898 (Abhandlungen des Deutschen Seefischerei-Vereins), S. 1–223Google Scholar
  22. [22]
    Mahalanobis, P. C.: On the Generalised Distance in Statistics. In: Proceedings of the National Institute of Science of India 2 (1936), Nr. 1, S. 49–55MATHGoogle Scholar
  23. [23]
    Markov, A. A.: Rasprostranenie Zakona Bol’shih Chisel na Velichiny, Zavisyaschie Drug ot Druga. In: Izvestiya Fiziko-matematicheskogo obschestva pri Kazanskom Universitete 15 (1906), S. 135–156Google Scholar
  24. [24]
    Markov, A. A.: Extension of the Limit Theorems of Probability Theory to a Sum of Variables Connected in a Chain. In: Howard, R. (Hrsg.): Markov Chains Bd. 1. John Wiley and Sons, 1971, S. Appendix BGoogle Scholar
  25. [25]
    Meibauer, J. ; Demske, U. ; Geilfuss-Wolfgang, J.: Einführung in die germanistische Linguistik. 2. J. B. Metzler, 2007Google Scholar
  26. [26]
    Mermelstein, P.: Distance Measures for Speech Recognition, Psychological and Instrumental. In: Chen, R. C. H. (Hrsg.): Pattern Recognition and Artificial Intelligence. Academic Press, 1976, S. 374–388Google Scholar
  27. [27]
    Rabiner, L. R.: A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. In: Proceedings of IEEE 77 (1989), Nr. 2, S. 257–285CrossRefGoogle Scholar
  28. [28]
    Rabiner, L.R. ; Juang, B.-H.: Fundamentals of Speech Recognition. Prentice-Hall, 1993Google Scholar
  29. [29]
    Sakoe, H.; Chiba, S.: Dynamic Programming Algorithm Optimization for Spoken Word Recognition. In: IEEE Transactions on Acoustics, Speech and Signal Processing 26 (1978), S. 43–49MATHCrossRefGoogle Scholar
  30. [30]
    Viterbi, A.: Error Bounds for Convolutional Codes and an Asymptotically Optimum Decoding Algorithm. In: IEEE Transactions on Information Theory 13 (1967), Nr. 2, S. 260–267MATHCrossRefGoogle Scholar
  31. [31]
    Watzlawick, P. ; Beavin, J.H. ; Jackson, D. D.: Menschliche Kommunikation. Formen, Störungen, Paradoxien. 11. Hans Huber Verlag, 2007Google Scholar
  32. [32]
    Wendemuth, A.: Grundlagen der stochastischen Sprachverarbeitung. Oldenbourg, 2004Google Scholar

Copyright information

© Springer-Verlag Berlin Heidelberg 2010

Authors and Affiliations

  • Joachim Schenk
    • 1
  • Gerhard Rigoll
    • 1
  1. 1.Lehrstuhl für Mensch-Maschine-KommunikationTechnische Universität MünchenMünchenDeutschland

Personalised recommendations