Sprachausgabe

Fellbaum, Klaus

doi:10.1007/978-3-642-31503-9_9

Klaus Fellbaum²

4645 Accesses

Zusammenfassung

Wie der Name bereits ausdrückt, geht es hier um die gesprochene Ausgabe von gespeicherter Sprache, schriftlich vorliegendem Text oder anderer extern sowie intern vorhandener Information. Sehr wichtig ist die Unterscheidung, ob die auszugebende Information begrenzt ist oder inhaltlich beliebig sein kann. Im ersten Fall kann man die Sprachinformationen vorher aufzeichnen und dann wiedergeben (Sprachwiedergabe) im zweiten Fall muss die Sprache künstlich (synthetisch) zusammengesetzt werden (Sprachsynthese). Beide Formen der Sprachausgabe lassen sich nicht streng trennen; so arbeiten neuere Verfahren der Sprachsynthese mit mehr oder weniger langen Sprachsegmenten von natürlicher Sprache. Gegenstand aktueller Forschung bei der Sprachsynthese ist neben einer ständigen Verbesserung der Natürlichkeit auch die Generierung von emotionaler Sprache.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 84.99; Price excludes VAT (USA)

Hardcover Book: USD 109.00; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Literatur

Adriaens L (1991) Ein Modell deutscher Intonation. Eindhoven: Dissertation TU Eindhoven
Google Scholar
Benesty J, Sondhi MM, Huang Y (hrsg) (2008) Springer handbook of speech processing. Springer-Verlag, Berlin, Heidelberg
Google Scholar
Beutnagel M et al (1999) The AT&T next generation TTS system. Proc Joint Meeting of ASA
Google Scholar
Böcker H-D, u. a (1993) Mensch-Computer-Kommunikation. Springer-Verlag, Berlin, Heidelberg
Book MATH Google Scholar
Breidbach G (1985) Zur Sprachsynthese von deutschstämmigem Schrifttext mit Hilfe von Phonemklustern und dem LPC-Spracherzeugungsmodell. Diss. Berlin, D83, Berlin
Google Scholar
Breuer S (2009) Multifunktionale und multilinguale Unit-Selection-Sprachsynthese (Dissertation). Universität Bonn, Bonn
Google Scholar
Breuer S, Hess W (2010) The Bonn open synthesis system 3. Int J Speech Technol 13
Google Scholar
Burkhardt F (2011) Expressive synthetic speech. [Online] Zugegriffen 30 Nov 2011. http://emosamples.syntheticspeech.de/
Burkhardt F (2001) Simulation emotionaler Sprechweise mit Sprachsystemen (Diss.). Shaker Verlag, Aachen
Google Scholar
Campbell A, Black A (1995) Prosody and the selection of source units for concatenative synthesis. [Buchverf.] J van Santen (hrsg) Progress in speech synthesis. Springer Verlag, Berlin, Heidelberg
Google Scholar
Carstensen K-U, u. a (2010) Computerlinguistik und Sprachtechnologie. Spektrum Akademischer Verlag, Heidelberg
Book MATH Google Scholar
Charpentier F, Moulines E (1988) Text-to-speech algorithms based on FFT synthesis. Proc ICASSP New York
Google Scholar
Eckert W (1996) Gesprochener Mensch-Maschine-Dialog. Shaker Verlag, Aachen
Google Scholar
Eichner M (2007) Sprachsynthese und Spracherkennung mit gemeinsamen Datenbasen (Diss.). TUDpress, Dresden
Google Scholar
Fellbaum K (2008) Special issue: Electronic speech processing for persons with disabilities. Technol Disabil 20(2)
Google Scholar
Flanagan JL (1965) Speech analysis, synthesis and perception. Springer-Verlag, Berlin
Book Google Scholar
Hirschfeld D (2001) Universelle Datenaufbereitung und Bausteinauswahl für die konkatenative Sprachsynthese (Diss.). w.e.b. Universitätsverlag, Dresden
Google Scholar
Holmes J (1983) Formant synthesizers, cascade or parallel. Speech Commun
Google Scholar
Holmes JN (1991) Sprachsynthese und Spracherkennung. Oldenbourg-Verlag, München, Wien
Google Scholar
Höpfner D (2001) Evaluation der Qualität deutscher Sprachsynthesesysteme mit Hilfe auditiver Hörtests. [Buchverf.] Stöber W, Hess K. Elektronische Sprachsignalverarbeitung ESSV Bonn. w.e.b. Universitätsverlag, Dresden
Google Scholar
HUMAINE. Human Machine Interaction Network on Emotion. [Online] Zugegriffen 30 Nov 2011. http://emotion-research.net/association
Hunt AJ, Black AW (1996) Unit selection in a concatenative speech synthesis system using a large speech database, vol 1. Proc Int Conf Acoust Speech Signal Processing (ICASSP)
Google Scholar
ITG (1996) Terminologie der Sprachakustik ITG 4.5.1–01, Entwurf 1996–2
Google Scholar
Jurafsky Dl, Martin JH (2009) Speech and Language Processing. Pearson Prentice-Hall, New Jersey
Google Scholar
Jürgens C (1996) Sprachsynthese im Zeitbereich unter Verwendung von Phon- und Diphonclustern (Diss.). Wissenschaft und Technik Verlag Gross, Berlin
Google Scholar
Ketzmerick B (2007) Zur auditiven und apparativen Charakterisierung von Stimmen (Diss.). TUDpress, Dresden
Google Scholar
Klasmeyer G (1999) Akustische Korrelate des stimmlich emotionalen Ausdrucks in der Lautsprache (Diss.). Wiss. Buchhandlung Theo Hector GmbH&Co, Frankfurt a. M.
Google Scholar
Klatt DH (1987) Review of text-to-speech conversion for English. J Acoust Soc Am 5
Google Scholar
Klatt DH (1980) Software for a cascade/parallel formant synthesizer. J Acoust Soc Am 67(3):971–995
Article Google Scholar
Kraiss K-F (hrsg) (2006) Advanced man-machine interaction. Springer-Verlag, Berlin, Heidelberg
Google Scholar
Latorre (2006) A study of speaker-adaptable multilingual synthesis, PhD Thesis. Department oc Computer Science, Tokyo Institute of Technology, Tokyo
Google Scholar
LOQUENDO. Speech synthesis. [Online] http://www.loquendo.com/de/demo-center/tts-demo/. Zugegriffen 30 Nov 2011
Lüdtke T (2001) Messplatz für auditive Beurteilungsverfahren von Sprachqualität. Studienarbeit. Lehrstuhl Kommunikationstechnik, BTU Cottbus, Cottbus
Google Scholar
Lüdtke T (2001) Messplatz für auditive Beurteilungsverfahren von Sprachqualität. Studienarbeit am Lehrstuhl Kommunikationstechnik. BTU Cottbus, Cottbus
Google Scholar
MBROLA (2005) The MBROLA project. [Online] 2005. http://tcts.fpms.ac.be/synthesis/. Zugegriffen 30 Nov 2011
Möller S (2009) Quality engineering. Springer Verlag, Heidelberg usw
Google Scholar
Möller S (2005) Quality of telephone-based spoken dialogue systems. Springer Verlag, New York
Google Scholar
Moulines E, Charpentier F (1990) Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones. Speech Commun 9:453–467
Article Google Scholar
Müller AF (2003) Generierung prosodischer Marker für ein multilinguales Sprachsynthesesystem (Diss.). w.e.b. Universitätsverlag, Dresden
Google Scholar
Müller C, Hoffmeister J, Westkämper E (2008) Sprachtechnologie in der Anwendung-Sprachportale. Springer Verlag, Berlin, Heidelberg, New York
Google Scholar
Paeschke A (2003) Prosodische analyse emotionaler Sprechweise (Diss.). Logos Verlag, Berlin
Google Scholar
Paulus E (1998) Sprachsignalverarbeitung. Analyse, Erkennung, Synthese. Spektrum Akademischer Verlag, Heidelberg, Berlin
Google Scholar
Pfister B, Kaufmann T (2008) Sprachverarbeitung. Grundlagen und Methoden der Sprachsynthese und Spracherkennung. Springer Verlag, Berlin, Heidelberg
Google Scholar
Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones. Charpentier F, Moulines E (1989) s.n., Paris, EUROSPEECH
Google Scholar
Portele T (1996) Ein phonetisch-motiviertes Inventar zur Sprachsynthese deutscher Äußerungen (Diss.). Dissertation Rheinische Friedrich-Wilhelm-Universität Bonn, Bonn
Google Scholar
Romsdorfer H, Pfister B (2007) Text analysis and language identification for polyglot text-to-speech synthesis. Speech Commun 49(9)
Google Scholar
Rook J (1987) Linguistisch-phonetische Transkription auf der Basis von Graphem- und Phonclustern und Ermittlung einer Wortbetonung für ein Sprachsynthese-System. Dissertation TU Berlin D83, Berlin
Google Scholar
Rosenke K (1996) Realisierung der linguistisch-phonetischen Transkription für die Sprachsynthese durch neuronale Netze mit Multilayer-Perceptron-Struktur (Diss.). Verlag Dr. Köster, Berlin
Google Scholar
Rubin P, Baer T, Mermelstein P (1981) An articulatory synthesizer for perceptual research. J Acoust Soc Am 70
Google Scholar
Rusch M (1991) Zur Untersuchung prosodischer Merkmale im Sprachsignal anhand der Sprachgrundfrequenz und der Lautdauer. Dissertation TU Berlin, Berlin D83
Google Scholar
Saito T, Sakamoto M (2005) A voiceFont creation framework for generating gersonalized voices. IEICE Trans Inf & Syst 88-D(3)
Google Scholar
Samsudin N, Lee M (2011) Constructing a reusable linguistic resource for a polyglot speech synthesis. [Online] 2011. Zugegriffin 30 Nov 2011
Google Scholar
Schenk J, Rigoll G (2010) Mensch-Maschine-Kommunikation. Springer Verlag, Berlin, Heidelberg
Book Google Scholar
Schnell M (2006) Prosodiegenerierung für die datenbasierte Sprachsynthese (Diss.). TUDpress, Dresden
Google Scholar
Sejnowski TJ, Rosenberg CR (1986) NETtalk: A Parallel Network that learns to read aloud. Technical Report JHU/EECS-86/01. s.l. : John Hopkins University Department of Electrical Engineering and Computer Science
Google Scholar
Sproat R (1998) Multilingual Text-to-Speech Synthesis. The Bell Labs Approach. Kluwer Academic Publishers, Dordrecht, Boston, London
Google Scholar
Stöber K (2003) Bestimmung und Auswahl von Zeitbereichseinheiten für die konkatenative Sprachsynthese. Lang, Frankfurt a. M.
Google Scholar
Taylor P (2009) Text-to-speech synthesis. University Press, Cambridge
Book Google Scholar
Taylor PA (2000) Concept-to-speech synthesis by phonological structure Matching. http://www.cstr.ed.ac.uk/downloads/publications/2000/Taylor_2000_a.pdf. [Online] 2000. Zugegriffen 10 Feb 2012
Traber C et al (1999) From multilingual to polyglot speech synthesis. Proc Eurospeech
Google Scholar
Vary P, u. a. (1998) Digitale Sprachsignalverarbeitung. B.G. Teubner-Verlag, Stuttgart
Google Scholar
Wahlster W (hrsg) (2000) VERBMOBIL-Foundations of speech-to-speech translation. Springer Verlag, Berlin, Heidelberg, New York
MATH Google Scholar
Wolf HE (1981) Entwurf und Realisierung eines Formantsynthetisators mit paralleler Filterstrukturfür die Sprachsynthese nach Regeln (Diss.). Diss. TH Darmstadt, Darmstadt
Google Scholar
Wolff M (2004) Automatisches Lernen von Aussprachewörterbüchern (Diss.). w.e.b. Universitätsverlag, Dresden
Google Scholar

Download references

Author information

Authors and Affiliations

Tegeler Straße 20, 13467, Berlin, Deutschland
Prof. Dr. -Ing. Klaus Fellbaum

Authors

Prof. Dr. -Ing. Klaus Fellbaum
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Klaus Fellbaum .

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Fellbaum, K. (2012). Sprachausgabe. In: Sprachverarbeitung und Sprachübertragung. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-31503-9_9

Download citation

DOI: https://doi.org/10.1007/978-3-642-31503-9_9
Published: 09 February 2013
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-642-31502-2
Online ISBN: 978-3-642-31503-9
eBook Packages: Computer Science and Engineering (German Language)

Publish with us

Policies and ethics