Zusammenfassung
Wie der Name bereits ausdrückt, geht es hier um die gesprochene Ausgabe von gespeicherter Sprache, schriftlich vorliegendem Text oder anderer extern sowie intern vorhandener Information. Sehr wichtig ist die Unterscheidung, ob die auszugebende Information begrenzt ist oder inhaltlich beliebig sein kann. Im ersten Fall kann man die Sprachinformationen vorher aufzeichnen und dann wiedergeben (Sprachwiedergabe) im zweiten Fall muss die Sprache künstlich (synthetisch) zusammengesetzt werden (Sprachsynthese). Beide Formen der Sprachausgabe lassen sich nicht streng trennen; so arbeiten neuere Verfahren der Sprachsynthese mit mehr oder weniger langen Sprachsegmenten von natürlicher Sprache. Gegenstand aktueller Forschung bei der Sprachsynthese ist neben einer ständigen Verbesserung der Natürlichkeit auch die Generierung von emotionaler Sprache.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Literatur
Adriaens L (1991) Ein Modell deutscher Intonation. Eindhoven: Dissertation TU Eindhoven
Benesty J, Sondhi MM, Huang Y (hrsg) (2008) Springer handbook of speech processing. Springer-Verlag, Berlin, Heidelberg
Beutnagel M et al (1999) The AT&T next generation TTS system. Proc Joint Meeting of ASA
Böcker H-D, u. a (1993) Mensch-Computer-Kommunikation. Springer-Verlag, Berlin, Heidelberg
Breidbach G (1985) Zur Sprachsynthese von deutschstämmigem Schrifttext mit Hilfe von Phonemklustern und dem LPC-Spracherzeugungsmodell. Diss. Berlin, D83, Berlin
Breuer S (2009) Multifunktionale und multilinguale Unit-Selection-Sprachsynthese (Dissertation). Universität Bonn, Bonn
Breuer S, Hess W (2010) The Bonn open synthesis system 3. Int J Speech Technol 13
Burkhardt F (2011) Expressive synthetic speech. [Online] Zugegriffen 30 Nov 2011. http://emosamples.syntheticspeech.de/
Burkhardt F (2001) Simulation emotionaler Sprechweise mit Sprachsystemen (Diss.). Shaker Verlag, Aachen
Campbell A, Black A (1995) Prosody and the selection of source units for concatenative synthesis. [Buchverf.] J van Santen (hrsg) Progress in speech synthesis. Springer Verlag, Berlin, Heidelberg
Carstensen K-U, u. a (2010) Computerlinguistik und Sprachtechnologie. Spektrum Akademischer Verlag, Heidelberg
Charpentier F, Moulines E (1988) Text-to-speech algorithms based on FFT synthesis. Proc ICASSP New York
Eckert W (1996) Gesprochener Mensch-Maschine-Dialog. Shaker Verlag, Aachen
Eichner M (2007) Sprachsynthese und Spracherkennung mit gemeinsamen Datenbasen (Diss.). TUDpress, Dresden
Fellbaum K (2008) Special issue: Electronic speech processing for persons with disabilities. Technol Disabil 20(2)
Flanagan JL (1965) Speech analysis, synthesis and perception. Springer-Verlag, Berlin
Hirschfeld D (2001) Universelle Datenaufbereitung und Bausteinauswahl für die konkatenative Sprachsynthese (Diss.). w.e.b. Universitätsverlag, Dresden
Holmes J (1983) Formant synthesizers, cascade or parallel. Speech Commun
Holmes JN (1991) Sprachsynthese und Spracherkennung. Oldenbourg-Verlag, München, Wien
Höpfner D (2001) Evaluation der Qualität deutscher Sprachsynthesesysteme mit Hilfe auditiver Hörtests. [Buchverf.] Stöber W, Hess K. Elektronische Sprachsignalverarbeitung ESSV Bonn. w.e.b. Universitätsverlag, Dresden
HUMAINE. Human Machine Interaction Network on Emotion. [Online] Zugegriffen 30 Nov 2011. http://emotion-research.net/association
Hunt AJ, Black AW (1996) Unit selection in a concatenative speech synthesis system using a large speech database, vol 1. Proc Int Conf Acoust Speech Signal Processing (ICASSP)
ITG (1996) Terminologie der Sprachakustik ITG 4.5.1–01, Entwurf 1996–2
Jurafsky Dl, Martin JH (2009) Speech and Language Processing. Pearson Prentice-Hall, New Jersey
Jürgens C (1996) Sprachsynthese im Zeitbereich unter Verwendung von Phon- und Diphonclustern (Diss.). Wissenschaft und Technik Verlag Gross, Berlin
Ketzmerick B (2007) Zur auditiven und apparativen Charakterisierung von Stimmen (Diss.). TUDpress, Dresden
Klasmeyer G (1999) Akustische Korrelate des stimmlich emotionalen Ausdrucks in der Lautsprache (Diss.). Wiss. Buchhandlung Theo Hector GmbH&Co, Frankfurt a. M.
Klatt DH (1987) Review of text-to-speech conversion for English. J Acoust Soc Am 5
Klatt DH (1980) Software for a cascade/parallel formant synthesizer. J Acoust Soc Am 67(3):971–995
Kraiss K-F (hrsg) (2006) Advanced man-machine interaction. Springer-Verlag, Berlin, Heidelberg
Latorre (2006) A study of speaker-adaptable multilingual synthesis, PhD Thesis. Department oc Computer Science, Tokyo Institute of Technology, Tokyo
LOQUENDO. Speech synthesis. [Online] http://www.loquendo.com/de/demo-center/tts-demo/. Zugegriffen 30 Nov 2011
Lüdtke T (2001) Messplatz für auditive Beurteilungsverfahren von Sprachqualität. Studienarbeit. Lehrstuhl Kommunikationstechnik, BTU Cottbus, Cottbus
Lüdtke T (2001) Messplatz für auditive Beurteilungsverfahren von Sprachqualität. Studienarbeit am Lehrstuhl Kommunikationstechnik. BTU Cottbus, Cottbus
MBROLA (2005) The MBROLA project. [Online] 2005. http://tcts.fpms.ac.be/synthesis/. Zugegriffen 30 Nov 2011
Möller S (2009) Quality engineering. Springer Verlag, Heidelberg usw
Möller S (2005) Quality of telephone-based spoken dialogue systems. Springer Verlag, New York
Moulines E, Charpentier F (1990) Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones. Speech Commun 9:453–467
Müller AF (2003) Generierung prosodischer Marker für ein multilinguales Sprachsynthesesystem (Diss.). w.e.b. Universitätsverlag, Dresden
Müller C, Hoffmeister J, Westkämper E (2008) Sprachtechnologie in der Anwendung-Sprachportale. Springer Verlag, Berlin, Heidelberg, New York
Paeschke A (2003) Prosodische analyse emotionaler Sprechweise (Diss.). Logos Verlag, Berlin
Paulus E (1998) Sprachsignalverarbeitung. Analyse, Erkennung, Synthese. Spektrum Akademischer Verlag, Heidelberg, Berlin
Pfister B, Kaufmann T (2008) Sprachverarbeitung. Grundlagen und Methoden der Sprachsynthese und Spracherkennung. Springer Verlag, Berlin, Heidelberg
Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones. Charpentier F, Moulines E (1989) s.n., Paris, EUROSPEECH
Portele T (1996) Ein phonetisch-motiviertes Inventar zur Sprachsynthese deutscher Äußerungen (Diss.). Dissertation Rheinische Friedrich-Wilhelm-Universität Bonn, Bonn
Romsdorfer H, Pfister B (2007) Text analysis and language identification for polyglot text-to-speech synthesis. Speech Commun 49(9)
Rook J (1987) Linguistisch-phonetische Transkription auf der Basis von Graphem- und Phonclustern und Ermittlung einer Wortbetonung für ein Sprachsynthese-System. Dissertation TU Berlin D83, Berlin
Rosenke K (1996) Realisierung der linguistisch-phonetischen Transkription für die Sprachsynthese durch neuronale Netze mit Multilayer-Perceptron-Struktur (Diss.). Verlag Dr. Köster, Berlin
Rubin P, Baer T, Mermelstein P (1981) An articulatory synthesizer for perceptual research. J Acoust Soc Am 70
Rusch M (1991) Zur Untersuchung prosodischer Merkmale im Sprachsignal anhand der Sprachgrundfrequenz und der Lautdauer. Dissertation TU Berlin, Berlin D83
Saito T, Sakamoto M (2005) A voiceFont creation framework for generating gersonalized voices. IEICE Trans Inf & Syst 88-D(3)
Samsudin N, Lee M (2011) Constructing a reusable linguistic resource for a polyglot speech synthesis. [Online] 2011. Zugegriffin 30 Nov 2011
Schenk J, Rigoll G (2010) Mensch-Maschine-Kommunikation. Springer Verlag, Berlin, Heidelberg
Schnell M (2006) Prosodiegenerierung für die datenbasierte Sprachsynthese (Diss.). TUDpress, Dresden
Sejnowski TJ, Rosenberg CR (1986) NETtalk: A Parallel Network that learns to read aloud. Technical Report JHU/EECS-86/01. s.l. : John Hopkins University Department of Electrical Engineering and Computer Science
Sproat R (1998) Multilingual Text-to-Speech Synthesis. The Bell Labs Approach. Kluwer Academic Publishers, Dordrecht, Boston, London
Stöber K (2003) Bestimmung und Auswahl von Zeitbereichseinheiten für die konkatenative Sprachsynthese. Lang, Frankfurt a. M.
Taylor P (2009) Text-to-speech synthesis. University Press, Cambridge
Taylor PA (2000) Concept-to-speech synthesis by phonological structure Matching. http://www.cstr.ed.ac.uk/downloads/publications/2000/Taylor_2000_a.pdf. [Online] 2000. Zugegriffen 10 Feb 2012
Traber C et al (1999) From multilingual to polyglot speech synthesis. Proc Eurospeech
Vary P, u. a. (1998) Digitale Sprachsignalverarbeitung. B.G. Teubner-Verlag, Stuttgart
Wahlster W (hrsg) (2000) VERBMOBIL-Foundations of speech-to-speech translation. Springer Verlag, Berlin, Heidelberg, New York
Wolf HE (1981) Entwurf und Realisierung eines Formantsynthetisators mit paralleler Filterstrukturfür die Sprachsynthese nach Regeln (Diss.). Diss. TH Darmstadt, Darmstadt
Wolff M (2004) Automatisches Lernen von Aussprachewörterbüchern (Diss.). w.e.b. Universitätsverlag, Dresden
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2012 Springer-Verlag Berlin Heidelberg
About this chapter
Cite this chapter
Fellbaum, K. (2012). Sprachausgabe. In: Sprachverarbeitung und Sprachübertragung. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-31503-9_9
Download citation
DOI: https://doi.org/10.1007/978-3-642-31503-9_9
Published:
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-642-31502-2
Online ISBN: 978-3-642-31503-9
eBook Packages: Computer Science and Engineering (German Language)