Advertisement

Sound

Theorie des Filmtons
  • Rasmus GreinerEmail author
  • Winfried Pauleit
Living reference work entry
Part of the Springer Reference Geisteswissenschaften book series (SPREFGEIST)

Zusammenfassung

Die Theorie des Filmtons beinhaltet zahlreiche Diskurse, die eng mit der filmhistorischen Entwicklung verknüpft sind. Anhand von ausgewählten Filmbeispielen werden vier Forschungsfelder vorgestellt. Neben dem Zusammenspiel von fotografischen und phonographischen Verfahren während des Übergangs zum Tonfilm wird das Verhältnis von Filmton und außerfilmischer Realität im New Hollywoodkino fokussiert. Die ästhetische und politische Dimension der Stimme, sowie die Gestaltung und Rezeption des Sound Designs werden am Beispiel zeitgenössischer Filme theoretisch erschlossen. Alle vier Forschungsfelder werden in je einem Kapitel dargestellt und in Kurzanalysen greifbar gemacht.

Schlüsselwörter

Sound Sound Design Ton Filmton Audio-Vision 

1 Einleitung

Der Diskurs um den Filmton hat sich insbesondere seit den 1980er-Jahren immer stärker zu einem relevanten Forschungsfeld der Filmwissenschaft entwickelt. Allerdings berücksichtigt die Forschung vor allem Fragestellungen zur Technologie, Produktion und Ästhetik des Auditiven (Chion 1982, 1985, 2012; Flückiger 2001; Altman 1992; Segeberg und Schätzlein 2005). Während die Sound Studies den Ton weitgehend vom Bild abgetrennt betrachten, kann eine Theorie des Filmtons nicht ohne das Filmbild gedacht werden (Chion 2009; Altman 2004; Rabenalt 2014). So ergibt sich aus dem Zusammenspiel der differierenden Bedeutungsproduktion von visueller und auditiver Ebene ein Mehrwert („valeur ajouté“, Chion 2012, S. 17), der durch den Prozess des synchronen Sehens und Hörens auch asynchrone Bild-Ton-Verhältnisse miteinander verschmilzt. Die eine Sinneswahrnehmung beeinflusst die andere: „Man ‚sieht‘ nicht das Gleiche, wenn man gleichzeitig hört; man ‚hört‘ nicht das Gleiche, wenn man gleichzeitig sieht“ (Chion 2012, S. 11). Bereits die frühe Filmtheorie sah hierin ein grundlegendes Prinzip des Tonfilms (Pudovkin 1985), dessen Spezifik darauf aufbauend als „Audio-Vision“ bzw. als das „Audio-Logo-Visuelle“ verstanden wurde (Chion 2012, S. 170–171). Diese Grundlagen einer Theorie des Filmtons sind eng verwoben mit filmgeschichtlichen Parametern. Vor diesem Hintergrund betrachten wir im Folgenden eine Reihe von Forschungsfeldern, die wesentlich durch medientechnologische Umbrüche wie die Einführung des standardisierten Tonfilmverfahrens Ende der 1920er-Jahre, die Entwicklung des Sound Designs im Kontext des New Hollywoodkinos der 1970er-Jahre, sowie in jüngster Zeit durch die Digitalisierung des Kinos mitbestimmt wurden.

2 Zusammenspiel von fotografischen und phonographischen Verfahren

Die Filmtonproduktion ist Teil einer umfassenden Ästhetik des Films. Gleichwohl arbeitet sie mit Verfahren, deren Techniken und kulturelle Praktiken der Geschichtlichkeit unterliegen, und damit sich in ihrem Klang wandelnde Tonproduktionen hervorbringen. Sie sind zudem gekennzeichnet von größeren Umbrüchen, wie der Einführung des standardisierten Tonfilmverfahrens, des Stereo-Sounds, des Sound Designs und der Digitalisierung des Tons. Eines dieser Verfahren ist seit der Einführung des Tonfilms die Aufnahme von prä-filmischen Stimmen, Musiken und Geräuschen mittels Mikrofon, die intentional zur Gestaltung des Filmtons – und auch des digitalen Sound Designs – angefertigt werden. In diese Aufnahmen finden historische Marker und Tonereignisse Eingang, zum Beispiel Stimmen von Schauspielern oder bekannten Persönlichkeiten der Zeitgeschichte und Musikstücke. Eine weitere Dimension der Tonaufnahme bildet das „Rauschen des Realen“, also jener Teil der Tonproduktion, der sich zufällig beziehungsweise nicht intentional aus den Apparaturen und Gegebenheiten der Aufnahmeanordnung ergibt (Kittler 1986, S. 26). Gleichwohl erlaubt dieses Rauschen Rückschlüsse auf die Entstehungszeit und -umstände des Films, aber auch auf die Technikgeschichte, die sowohl Teil der Produktionsgeschichte des Films als auch Teil der Zeitgeschichte ist. In modernen Produktionen werden beide Bereiche in die Gestaltung des Sound Designs einbezogen. Für Stimmen, Musik und Geräusche in der Filmproduktion gilt zudem, dass sie historischen Moden und Konventionen unterliegen, die sich wiederum in Wechselwirkung mit der Zeitgeschichte befinden.

Aus diesen Verfahren und ihren nachträglichen Bearbeitungen entstehen ‚Tonspuren‘ für den Film. Dass man in diesem Kontext von Tonspuren spricht, hat vermutlich in erster Linie mit der Platzierung des Tons auf dem Filmstreifen des analogen Tonfilms zu tun. Um ein synchrones Abspielen des Tons zu gewährleisten, wurde für den Ton neben dem Bildstreifen eine Spur eingerichtet, die – ganz ähnlich wie bei Eisenbahngleisen – neben einer synchronen Verbindung von Ton und Bild entlang des Filmstreifens auch eine einheitliche Spurweite, also immer den gleichen Abstand zwischen Ton- und Bildspur festlegt. Die Einrichtung einer Tonspur auf dem Filmstreifen im Zuge der Einführung des Tonfilms verändert allerdings auch die Zeitlichkeit der Produktionspraxis beim Ton. Denn bis Ende der 1920er-Jahre wurde der Ton während der Kinoaufführung performativ erzeugt, durch einsprechende Filmerklärer, Geräuschemacher und musikalische Begleitung. Mit der Einführung des Tonfilms wurde diese performative Tonproduktion von der Aufführung getrennt. Der Ton für den Film wird seither (wie das Bild) an einem anderen Ort vorab produziert und bei der Aufführung vom Filmstreifen – als Spur einer vorausgehenden Produktion und Einschreibung – abgetastet oder aus dem digitalen Datensatz ausgelesen. Der Begriff der Tonspur gibt diesen Aspekt seiner Zeitlichkeit (des Einschreibens und Auslesens) treffend wieder.

Die Präsenz von Mikrofonen, Lautsprechern und Tonaufnahmegeräten im Film erzeugt ein selbstreflexives Potenzial, das in der Filmrezeption auf die kulturelle Leistung des Produktionsprozesses zurückweist. Der Filmton wird dadurch als Produkt aus präfilmischen Klängen, deren Aufnahmen und weiteren Bearbeitungen gekennzeichnet. Diese Formen der Selbstreflexion liefern historische Zeugnisse und Modelle von den apparativen Anordnungen und Verfahren der Filmtonproduktion, die durch den Film selbst erfahrbar werden. Sie verbürgen zudem die kulturellen Handlungen, das heißt die Geschichte der performativen Prozesse der Arbeit mit Techniken und Apparaturen der Tonerzeugung und ihre Inszenierungen.

Dies gilt bereits für den Stummfilm und seine Aufführungspraxis mit Musikbegleitung. Aber auch jenseits aktueller Musikbegleitung im Kinosaal legt die Suggestion von Geräuschen und menschlicher Sprache durch Bilder, Musik und Zwischentitel eine Grundlage für den modernen Umgang mit dem Filmton. Dies unterscheidet den Film von der Fotografie, mit der sich Ton und Klang – aufgrund ihrer Zeitlichkeit als Momentaufnahme – nur unter bestimmten Voraussetzungen verbinden. Eine solche Voraussetzung ist gegeben, sobald Fotografien im Film auftreten (Pauleit 2004). Filme zeigen beispielsweise die Produktion und den Gebrauch von Fotografien – und geben diese auch zu hören – wenn auch manchmal nur als Tonrauschen der Apparatur oder als filmische Stille, die eine kontemplative Betrachtung einer Fotografie für Momente begleitet. Solche oder ähnliche Bezugnahmen von Film auf Fotografie werden häufig unter dem Begriff Intermedialität verhandelt und dann als ein Beziehungs- oder Differenzverhältnis zwischen zwei Medien und ihren je unterschiedlichen ästhetischen Produktionen untersucht (Nessel und Pauleit 2011).

Anhand von Menschen am Sonntag (Robert Siodmak und Edgar G. Ulmer, D 1930) kann geradezu prototypisch das mediale Differenzverhältnis von Film und Fotografie nachgezeichnet werden: Fotografie als Schnitt durch Zeit und Raum und Film als kadriertes Zeitbild (vgl. hierzu Bellour 2010). Menschen am Sonntag kennzeichnet eine Ästhetik der Kameraeinstellungen, die insbesondere die Fotoavantgarde der 1920er-Jahre aufnimmt (Prümm 1999). Doch auch die Phonographie war schon zu Stummfilmzeiten in das Differenzverhältnis von Fotografie und Filmbild eingeschrieben und kennzeichnet auch Menschen am Sonntag. Ihre Bedeutung geht in diesem Fall über eine musikalische Stummfilmbegleitung und über zusätzliche Soundeffekte deutlich hinaus. Sie entfaltet sich vielmehr als ein zweites Differenzverhältnis zwischen einer kulturellen Praxis der Filmtonproduktion im Kino und anderen phonographischen Verfahren, die im Film als Gebrauch des Grammophons sichtbar werden, beziehungsweise durch Zwischentitel verbürgt sind (Lange und Bromberg 2003; Pauleit et al. 2018, S. 28–35). Die Uraufführung von Menschen am Sonntag wurde 1930 noch von einem Stummfilmorchester begleitet und der Film ohne eigene Tonspur produziert. Doch im Plot des Films werden der Gebrauch von Grammophon und Schallplatte explizit dokumentiert. Zwei zentrale Szenen, in denen der Film auf seine eigene Klanglichkeit verweist, inszenieren das Differenzverhältnis von Filmton und Phonographie auf besondere Weise. Zudem gruppieren sich diese Szenen um die zwei expliziten Referenzen auf die Fotografie. In der Streitszene mit den Starpostkarten gibt es ‚Soundeffekte‘, diese sind zunächst visuell inszeniert als tropfender Wasserhahn und als eine sich eigenständig öffnende Schranktür. Ein Bild suggeriert ein Geräusch, das hierdurch implizit wird. Diese durchaus gängige Strategie des Stummfilms basiert auf automatischen Bild-Ton-Assoziationen des Zuschauers (Chion 2009, S. 5–7), die während der Filmaufführung durch Musik oder Geräusche zusätzlich akzentuiert werden können. Dieser illustrative Effekt produziert eine zusätzliche Präsenz und öffnet sie gleichzeitig für die Zuschauer, in denen der Ton imaginär nachklingt. Der betreffende Part der Musik muss gar nicht genauso klingen wie eine Schranktür. Es genügt, mit musikalischen Akzenten die Idee einer sich öffnenden Schranktür zu erzeugen (Chion 2009, S. 7). Der Soundeffekt fungiert als Hybrid, sozusagen als „sonic icon“ (Pauleit et al. 2018; Currid 2006, S. 102), das hier die Funktion hat, mit ästhetischen Verfahren des Filmtons einen komplexen filmischen Bedeutungsraum zu öffnen. Im Unterschied zu Brian Currid ist mit einem erweiterten Verständnis von „sonic icons“ das ganze Feld der Überlagerungen der Differenzverhältnisse Film/Fotografie und Film/Phonographie gemeint (Pauleit und Greiner 2015). Der erweiterte Begriff wird damit ähnlich gefasst, wie Tom Mitchells Begriff des „imagetext“ (Mitchell 1994). Mitchell unterstreicht mit dieser Setzung, dass es keine reinen Bild- oder Textformen gibt, sondern nur Hybride (Nessel und Pauleit 2011). Michel Chion geht in seinen Überlegungen zur „Audio-Vision“ ebenfalls davon aus, dass Ton und Bild nie getrennt untersucht werden können (Chion 2012), ebenso wie Michael Wedels (2007, S. 244–251) archäologische Spurensuche zur „Musikalisierung des frühen Tonfilms“ als Verflechtung von Technikinnovation, Wirtschaftsgeschichte und Ästhetik.

Menschen am Sonntag zeigt schließlich eine Serie bewegter audio-visueller Porträts, die sich mit dem Gebrauch von Grammophon und Schallplatte verbinden, und so in den Stummfilm eine ‚Tonspur‘ einschreiben. Im Bild wird dadurch eine Phonographie sichtbar, die konkret nicht zu hören ist, deren Rhythmus aber in den bewegten Portraits der zum Grammophon Tanzenden wahrnehmbar wird. In der Großaufnahme verbinden sich dabei die Mikrobewegungen eines Gesichtes mit den Rillen einer Schallplatte und der Nadel des Tonabnehmers. In diesen sonic icons führt Menschen am Sonntag die Geschichte des Musikfilms unter avantgardistischen Vorzeichen fort. Während der Musikfilm dieser Zeit mit seiner Verarbeitung von Schlagern und Operetten als Ausdruck der institutionellen Verflechtung von Tonfilm-, Rundfunk- und Schallplattenindustrie gelesen werden kann, die sich damit eine wechselseitige Werbefunktion sichern (Wedel 2007, S. 244), wendet sich der „Experimentierfilm“ Menschen am Sonntag (LichtBildBühne 1929) der Reportage-Form zu, die die Gesangsnummer zunächst in den diskursiven Prolog des Films als Texttafel verschiebt und die Schallplatte als visuelles Objekt und akustische Spur einbindet. Auch die Sprache ist folglich in das Zusammenwirken von Bild und Ton eingebunden. Selbst die typografische Gestaltung der Zwischentitel kann eine bestimmte Betonung und ein bestimmtes Verständnis des Geschriebenen evozieren (Chion 2009, S. 12). Die untrennbar miteinander verbundenen Elemente des „Audio-Logo-Visuellen“ stehen somit in einem triangulären Verhältnis zueinander (Chion 2012, S. 192). Folgt man der These, dass das Kino „wortzentriert“ ist, erweitert sich das theoretische Feld der Filmtonforschung um Überlegungen zum „Text“ (Chion 2012, S. 17). Hieran schließen sich die Fragen an, wie sich das Verhältnis von Bildern, Tönen und Texten im Laufe der Filmgeschichte verändert hat – sei es bezüglich des Stummfilms (Altman 2004) oder mit Bezug auf die kulturellen und ökonomischen Veränderungen durch die Einführung des Tonfilms (Gomery 2005). Gleichzeitig gibt es sowohl Versuche, eine „Dramaturgie und Geschichte des Filmtons“ (Rabenalt 2014) zu entwerfen, als auch danach zu fragen, wie technische (Müller 2003) und ästhetische Aspekte (Chion 2009) das Zusammenspiel der auditiven und der visuellen Ebenen des Films beeinflusst haben.

3 Filmton als Einschreibung physischer Realität

Rick Altman hat nachdrücklich darauf hingewiesen, dass der Ton des Films nicht einfach auf prä-filmische Klangereignisse zurückführbar ist (Altman 1992). In diesem Zuge hat er die Vorstellung einer Indexikalität des Filmtons grundlegend kritisiert. In der Debatte – so Altman – werden Indexikalitätskonzepte von der Fotografie unreflektiert auf Verfahren des Filmtons übertragen. Dabei wird vorausgesetzt, dass die Fotografie – wenngleich nicht unumstritten – im Allgemeinen als historische Spur des Zeitgeschehens akzeptiert wird und als Visual History bereits Einzug in die Geschichtswissenschaft gehalten hat (Paul 2006). In den Diskursen zur Fotografie wird die historische Spur eines Ereignisses am pointiertesten in Roland Barthes Diktum „Es-ist-so-gewesen“ gefasst (Barthes 1989, S. 86–87). Ohne an dieser Stelle die Gültigkeit solcher Setzungen für die Fotografie zu diskutieren, lässt sich dennoch festhalten, dass die Präsenz von Mikrofonen, Tonaufnahmegeräten usw. eine Analogie von fotografischer Aufnahme und Tonaufnahme für den Film mehr als nahelegen. Die zur Schau gestellte technische Apparatur demonstriert geradezu, dass der Tonaufnahme eine ähnliche Qualität der Einschreibung wie der fotografischen Bildaufnahme mit einer Kamera zukommt – und zwar allein dadurch, dass sie darauf verweist, dass der Ton des Films vorab (und an einem anderen Ort) produziert wurde.

In seiner Kritik Viereinhalb Trugschlüsse stellt Altman die weite Verbreitung solcher Analogieschlüsse unter der Überschrift „Ein halber Trugschluss“ heraus (Altman 2013, S. 45). Altman kritisiert dabei im Wesentlichen Auffassungen von Indexikalität, die auf einem naiven Abbildrealismus gründen und diesen auf den Ton übertragen. Zudem führt er die Digitalisierung ins Feld, die tatsächliche Bild- und Tonaufnahmen zunehmend entbehrlich mache, womit seiner Ansicht nach die Zeiten indexikalischer Einschreibung durch Kamera- und Mikrofoneinsatz historisch werden und ihre Gültigkeit verlieren. Altmans Kritik ist gleichwohl nur als „halber Trugschluss“ vorgetragen. Denn sie greift nicht für komplexere Vorstellungen von Indexikalität, die davon ausgehen, dass historische Ereignisse in Bild- oder Tonaufnahmen nicht einfach zugänglich bleiben, wie Ereignisse der Gegenwart, sondern nur im Sinne einer Differenz – als vergangene und damit unzugängliche Ereignisse – erschlossen werden können (Pauleit et al. 2018). Roland Barthes spricht in Bezug auf die Fotografie von einer „Verrücktheit“ im Sinne einer doppelten zeitlichen Kodierung (Barthes 1989, S. 126–127). Übertragen auf den Ton ist damit gemeint, dass – unter bestimmten Voraussetzungen – der Filmton historische Spuren entfalten kann. In der Filmwahrnehmung wird in solchen Momenten das Gehörte doppelt kodiert und dabei gleichzeitig als gegenwärtiger Klang und als (unzugängliche) Spur erfasst. Auch Altmans Hypothese, dass Kamera- und Mikrofoneinsatz im Zuge der Digitalisierung ihre Relevanz verlieren, bleibt ein halber Trugschluss. Denn das digitale Sound Design hat sich bis heute nicht von der Arbeit mit Tonaufnahmen verabschiedet. Gerade zur Gestaltung von spezifischen Toneffekten werden Tonaufnahmen aus der physischen Welt (Gesänge, Schreie, Tierstimmen oder andere Klänge) eigens angefertigt und/oder weiterverarbeitet (Flückiger 2006).

Der Film The Conversation (Francis Ford Coppola, USA 1974) fasst die Vorstellungen von der Indexikalität der Tonaufzeichnung in einem audio-visuellen Diskurs über phonographische Anwendungsverfahren zusammen. Erzählt wird die Geschichte des privaten Überwachungsspezialisten Harry Caul (Gene Hackman), der in die Fallstricke seines Metiers und seiner eigenen Perfektion gerät. Jenseits der Handlung dokumentiert der Film zeitgenössische Gerätschaften zur Video- und Audioüberwachung, indem er das Filmset kurzerhand auf eine Messe für Überwachungstechnologie verlegt. Darüber hinaus handelt es sich um einen modernen Film, der sein eigenes Gemacht-sein in Szene setzt und dabei insbesondere selbstreflexiv von den Innovationen des New Hollywood-Kinos berichtet, das seit den 1970er-Jahren die hierarchische Ordnung von Bild und Ton in Frage gestellt hat (Elsaesser und Hagener 2007, S. 177). In diesem Umfeld hat Francis Ford Coppola zusammen mit Walter Murch die Grundlagen für die Entwicklung des Sound Designs in Hollywood gelegt (Flückiger 2001, S. 19). In The Conversation wird eben diese Arbeit am Sound Design selbst zum Thema gemacht. Die Tonaufnahmen einer Abhöraktion werden durch ein spezifisches Sound Design charakterisiert, das den Richtmikrofonen der Privatdetektive ein artifizielles Eigengeräusch zuschreibt, das immer auch als Störgeräusch der Aufnahme gekennzeichnet ist. Diese ästhetische Gestaltung von Störungen verweist auf der narrativen Ebene auf die Schwierigkeiten bei der Abhöraktion und trägt so zu einem realistischen Eindruck bei (Chion 2013, S. 62). Sie verweist aber gleichzeitig auch auf ein grundlegendes Problem der Tonaufnahme und -gestaltung beim Film: Aus der Diskrepanz zwischen Realitätsreferenz und glaubwürdiger Akustik (Chion 2013, S. 61) erwächst die Notwendigkeit zur gestaltenden Nachvertonung mit Geräuschen. Ein bekanntes Beispiel hierfür ist die Notwendigkeit der akustischen Gestaltung von Gewehr- oder Pistolenschüssen für den Film, da die Ergebnisse von einfachen Tonaufzeichnungen in diesem Falle wenig überzeugend klingen. Aus technischen Gründen – wie z. B. der begrenzten Lautstärke- und Frequenzamplitude des Mikrofons – kann das Geräusch nicht so aufgenommen werden, wie wir es in der Realität hören würden. Hinzu kommen filmische Konventionen, die oft ganz anders klingen als ihre realen Vorbilder, aber konkrete Klangerwartungen erzeugen. Bei eben diesen Klangerwartungen setzt auch The Conversation an, wenn der Point of View einer der drei Abhöreinheiten wie der Blick durch das Zielfernrohr eines Gewehrs gestaltet ist. Dieser Blick lässt das Klangereignis eines Schusses erwarten und erzeugt in dieser (Klang-)Erwartung eine dramatische Bedrohung. Anstelle des erwarteten Schusses sind aber nur die zunächst nicht einzuordnenden artifiziellen Störgeräusche zu hören, die das Gespräch der Zielpersonen überlagern. Erst nach einer Weile lässt sich die Verbindung der visuellen Gestaltung des Zielfernrohrs mit den artifiziellen Störgeräuschen als akustische Gestaltung der Überwachungseinheit entschlüsseln. Diese Tongestaltung ist emblematisch und in mehrfacher Hinsicht interessant: zunächst im Sinne der Verschiebung der Klangerwartung, die Spannung erzeugt, um dann ein ganz neues „Klangobjekt“ (Flückiger 2001) hervorzubringen, das die Abhöreinheit charakterisiert. Denn für eine Abhöreinheit gibt es zu diesem Zeitpunkt weder eine Konvention der akustischen Darstellung, noch hat sie reale klangliche Eigenschaften, auf die bei der Gestaltung zurückgegriffen werden könnte. Klangerwartung und -gestaltung treten also in ein produktives Spannungsverhältnis. Schließlich prägt The Conversation den Tatbestand der akustischen Überwachung mit seinem Sound Design im Sinne eines sonic icons, das über die filmische Narration hinausweist und auch das politische Zeitgeschehen (Watergate-Affäre) ästhetisch modelliert und codiert.

Der Ton von The Conversation wurde mit einem Mehrspurverfahren produziert. Ein ähnliches Verfahren wird auch auf der Handlungsebene audio-visuell inszeniert. Anders als in der Story wurden allerdings nicht die Tonaufnahmen eines wirklichen Ereignisses von unterschiedlich positionierten Mikrofonen zusammengeführt, um ein Gespräch zu rekonstruieren, sondern es wurden Aufnahmen unterschiedlicher Takes zu einem Score zusammengesetzt. In der Wiederholung des Dialogs im Verlaufe des Films sind folglich nie exakt dieselben Tonaufnahmen zu hören, sondern eine Reihe von Varianten, die aus unterschiedlichen Mustern der Tonaufnahme stammen. Während also die Story behauptet, das Originalereignis zu rekonstruieren, wird das Hörereignis für die Rezipienten genau entgegengesetzt gestaltet: in den Wiederholungen werden hörbare klangliche Differenzen ästhetisch herausgestellt, die zu jeweils anderen Interpretationen der Handlung führen. Die ständige Wiederkehr von Fragmenten ein und desselben Dialogs mit geringen Abweichungen sensibilisiert für die Vielgestaltigkeit des Tons und schult ein genaues Hinhören, das in den kleinsten Details Hörvarianten der klanglichen Gestaltung zu entdecken vermag. Diese Vorgehensweise verweist selbstreflexiv auf den Gestaltungsprozess und unterstreicht, dass Tonaufnahmen im Film nicht Reproduktionen, sondern Repräsentationen und Modellierungen sind: „Jede Aufnahme legt eine Interpretation des ursprünglichen Klangs nahe, welche von der Wahl des Aufnahmeorts, des Mikrofontyps, des Aufnahmesystems, der Bearbeitung der Postproduktion, dem Speichermedium, sowie den Bedingungen und dem Ort der Wiedergabe abhängen“ (Altman 2013, S. 42). The Conversation macht auf diese Weise darauf aufmerksam, dass die Einheit von Bild und Ton im Film (meist) nur eine Illusion ist (Chion 2013). Insbesondere durch die Möglichkeiten der elektronischen Veränderung und Simulation von Klängen kann in Bezug auf den Filmton nicht von Indexikalität in einem strengen Sinne gesprochen werden (Altman 2013, S. 47). Diese selbstreflexive Note ist insofern von besonderer Bedeutung, als der Bereich Ton bis zu diesem Zeitpunkt im Rahmen von Hollywood-Produktionen noch nicht als kreative oder künstlerische Tätigkeit galt (Flückiger 2001, S. 18).

The Conversation beschäftigt sich schließlich auch mit der Rezeptionsseite. Die Tonaufnahme des Gesprächs wird von der Hauptfigur im Laufe des Films immer wieder abgehört, analysiert und interpretiert. Mit dem Ziel eines besseren Verständnisses wird sie schließlich auch manipuliert und verändert. Die Analogie besteht in diesem Falle darin, dass die Hauptfigur in ihrem Metier als beobachtender Zuschauer und lauschender Zuhörer gezeigt wird und die Filmzuschauer ebenfalls als „Seherhörer“ (Butzmann und Martin 2012, S. 13) adressiert werden. Der Film verknüpft die Auswertung der Tonaufnahme durch den Überwacher (auf der Suche nach einer fiktiven Wirklichkeit) mit der ästhetischen Wahrnehmung des Zuschauers (Varianz unterschiedlicher Hörbeispiele) und bindet diese gleichzeitig an das historische Zeitgeschehen des Watergate-Skandals zurück, das die Tonaufzeichnung zum zentralen Beweismittel und damit zur Spur der Wirklichkeit stilisiert. Beide (Überwacher und Zuschauer) befinden sich im Modus der Deutung. Harry Caul versucht, wie ein Privatdetektiv die Wirklichkeit zu entziffern. Die Zuschauer versuchen die Klangobjekte zu entschlüsseln. Ästhetische Wahrnehmung von Tonvarianzen und detektivische Detailarbeit werden wie in einer Pendelbewegung miteinander verschränkt. Das Spiel mit den Tonvarianzen ist so angelegt, dass es eine neue Realität umkreist, diese beschreibt und medien-philosophisch zu ergründen sucht. Diese neue Realität kann man als Zeitalter der Bild- und Tonüberwachung (Levin 2002; Pauleit 2001) charakterisieren, dem die Vorstellung einer Einschreibung von Wirklichkeit zugrunde liegt.

4 Politik der Stimme

Bereits während der Einführung des Tonfilms war die Stimme ein Politikum, das auch als Gradmesser für die ästhetische Qualität eines Films herangezogen wurde. Rudolf Arnheim formulierte den Vorwurf, dass sogenannte Sprechfilme die ästhetische Gestaltung des Bildes zugunsten einer besseren Verständlichkeit vernachlässigen und damit einen Rückschritt in der künstlerischen Entwicklung des Mediums darstellen würden (Arnheim 2002, S. 256–258). Zwar erforderte die Schalldämpfung der Aufnahmeapparatur (z. B. in speziellen Gehäusen „geblimpte“ Kameras) zunächst einige Zugeständnisse – die Filmtechnik überwand jedoch schnell diese kurzfristigen Einschränkungen.

Schon bald begannen die Filme mit den neuen Gestaltungsmöglichkeiten selbstreflexiv zu spielen: Thomas Elsaesser und Malte Hagener demonstrieren am Beispiel von Das Lied einer Nacht (Anatole Litvak, D 1931), wie der Film die Ablösung und Verschaltung von Stimme und Körper als Stilmittel in die Bedeutungsproduktion integriert und subtil kommentiert (Elsaesser und Hagener, S. 163–164). Die Stimme wird produktiv gemacht, um die Tonspur vom Bild zu emanzipieren. Vor allem im europäischen Kino spiegelt sie wiederholt die allgemeine Verunsicherung angesichts der Krisen nach dem Ersten Weltkrieg und dem erstarkenden Faschismus wider, wie unter anderem die sich überschlagende Stimme von Peter Lorre als Kindermörder in Fritz Langs M (D 1931) zeigt. Die Enthierarchisierung von Bild und Ton im modernen Kino bot somit schon früh die Möglichkeit subtiler politischer Untertöne, insbesondere in brechenden Stimmen und solchen, die sich nicht mehr im filmischen Raum lokalisieren lassen und hierdurch eine unheimliche Macht verliehen bekommen. Michel Chion bezeichnet dieses Phänomen als akusmatische Figur (Acousmetre) (Chion 1982, 1999). Auszüge aus Chions wegweisendem Werk La voix au cinéma (1982) erschienen erstmals in deutscher Sprache in der Zeitschrift Meteor No.6 (Chion 1996) und in einer erweiterten Fassung im Sammelband Medien/Stimmen (Epping-Jäger und Linz 2003). Die Herausgeberinnen integrieren Chion in eine Sammlung weitgehend kulturwissenschaftlicher Texte, die die Medialität der Stimme in den Fokus nehmen (vgl. dazu auch Butte und Brandt 2011). Der Sammelband Resonanz-Räume schließt hier eine Dekade später an (Bulgakowa 2012). Die Untersuchung der Stimme als mediales Phänomen zeigt einerseits, dass sie als Artefakt nicht exklusiv dem Film zugeordnet werden kann. Andererseits wird auch deutlich, dass die filmwissenschaftliche Auseinandersetzung mit der Stimme bisher eher von den Rändern und Grenzen zu anderen Disziplinen her erschlossen wird; beispielsweise in den psychoanalytisch-feministischen Ansätzen Kaja Silverman (1988) oder den kulturhistorischen Überlegungen Richard Dyer (2008, 2012).

Die Wahrnehmung der Stimme kann aber auch als affektiver Prozess beschrieben werden, der den Zuschauer emotional „mitschwingen“ lässt (Krämer 2003; Böhme 2009). Begreift man den Filmton ausgehend von filmanalytischen Ansätzen als „emotional wirksames Klangbad“ (Flückiger 2001, S. 58), dann muss auch die Stimme eine wichtige Rolle in der Politik der filmisch evozierten Affekte und Gefühle spielen. Der Anfang von The Great Gatsby (Baz Luhrmann, USA 2013) zeigt, wie sich die affektgeladene, unheilvoll-melancholische Musik bis ins Bild auszubreiten scheint. Die blendenden Reflexe eines weit entfernten grünen Lichts werden hierbei von einem hohen, lang gezogenen Ton auditiv gespiegelt und mit dem Plätschern der Wellen abgemischt. Die menschliche Stimme wird in diese komplexe Tonkonstruktion eingebettet und ist selbst ein essenzieller Teil davon: Ein männlicher Voice-over-Erzähler paraphrasiert den Anfang von F. Scott Fitzgeralds Buchvorlage sowie einige Zeilen aus dem Essay My Lost City (1932). Die gesamte Tonmischung ist auf die zentrale Rolle der Voice-over-Stimme ausgerichtet. Alle anderen Elemente der Tonspur werden der menschlichen Stimme untergeordnet (Chion 2012, S. 17). Zwar wurden bereits in der frühen Filmtheorie Klang, Timbre, Rhythmus und Körperlichkeit der Stimme als „Tongeste“ beschrieben (Balázs 1972, S. 210). Dennoch bleiben diese Merkmale in der Filmrezeption außerhalb der bewussten Wahrnehmung und werden häufig mit der Rede verwechselt (Chion 1999, S. 1). Doch gerade die Modulation und der Klang der Stimme vermitteln präzise Eindrücke zum emotionalen Zustand des Sprechers (Butzmann und Martin 2012, S. 49) – und bauen ein spezifisches Verhältnis zum Körper auf, welcher sich als ‚Rauheit‘ in die Sprache förmlich ‚einschreibt‘ (Barthes 1998, S. 307). Gleichzeitig handelt es sich beim Voice-over um eine besondere Form des filmischen Sprechaktes: Es verknüpft textuelle, auditive und visuelle Ausdrucksebenen des Films und kann daher als spezifisch filmisches Erzählverfahren beschrieben werden. Definiert als eine Stimme, deren Ursprung sich in einer anderen zeitlichen und räumlichen Dimension als die visuelle Ebene befindet (Kozloff 1988, S. 3), wird dem Voice-over überdies eine „Komplizenschaft“ mit dem Zuschauer zugeschrieben (Doane 1980, S. 42).

Der Voice-over-Kommentar kann unter bestimmten Umständen auch als akusmatische Figur identifiziert werden – eine Stimme, die zum Bild spricht und jederzeit dort auftauchen könnte, gleichzeitig jedoch weder innerhalb, noch außerhalb der Leinwand zu verorten ist (Chion 2012, S. 107). Dieser besondere Schwebezustand ist nur im Kino zu beobachten (Chion 1982, S. 4). Akusmatische Figuren besitzen in der filmischen Fiktion eine große Macht; sie sehen alles, wissen alles und kontrollieren die audiovisuelle Ausgestaltung der Erzählung (Chion 2012, S. 108). In The Great Gatsby äußert sich dies in einem engen Zusammenspiel mit weiteren klanglichen und visuellen Elementen des Films. Windgeräusche verstärken die eisige Atmosphäre am Anfang des Films. Betrachtet man die Darstellung solcher Umwelteinflüsse als symbolische Figurationen – dann ist das Geräusch des Windes als Code für eine psychische Grenzerfahrung zu verstehen. Und in der Tat fährt die Kamera nach einer Weißblende auf ein Sanatorium zu, in dem die Figur Nick Carraway (Tobey Maguire) als Verkörperung des Voice-over-Erzählers sichtbar wird. Die De-Akusmatisierung beraubt den Erzähler seiner Omnipotenz. Indem Michel Chion seine Analyse akusmatischer Figuren (Chion 1982) von der anthropologischen Erfahrung des Säuglings im Mutterleib herleitet (vgl. hierzu auch Epping-Jäger und Linz 2003), öffnet er den filmwissenschaftlichen Diskurs zur ästhetischen und politischen Dimension der Stimme für kulturwissenschaftliche Ansätze. Die Verwendung unsichtbarer Stimmen birgt ein analytisches Potenzial, das besonders geeignet ist, die ideologischen Mechanismen filmischer Illusionsbildung zu durchbrechen (Doane 1980; Silverman 1988). So zeigen Filme wie Hiroshima mon amour (F 1959, Alain Resnais), wie die hierarchischen Geschlechterlogiken vieler klassischer Spielfilme unterwandert werden können: Eine weibliche und eine männliche Voice-over-Stimme stehen in permanenter Gegenrede. Sie umkreisen einander – ohne, dass eine von beiden dauerhaft die Oberhand behalten könnte. Es sind die Stimmen, die Gegenwart und Vergangenheit zu einem scheinbar zeitlosen Bild des Sich-Erinnerns und Empfindens transformieren (Heiser 2014, S. 116). Der eng mit den Filmbildern und den übrigen Elementen des Tons verwobene Dialog zwischen einer Französin und einem jungen Mann aus Hiroshima eröffnet persönliche Erinnerungsdiskurse, die mit historischen Ereignissen abgeglichen und auf ihre Tauglichkeit als Elemente einer Historiografie geprüft werden. Der Regisseur und Filmtheoretiker Éric Rohmer bezeichnete Hiroshima mon amour aufgrund dieser auditiven Diskursebene als „den ersten modernen Tonfilm“ (Jones 2003). Die voice of God eines allwissenden Erzählers wird abgelöst von einer reflexiven Konstellation mehrerer Stimmen. Die diskursive Anordnung des Dialogs trägt maßgeblich zur „Demokratisierung der Wahrnehmung“ bei, die auch in den europäischen Bewegungen zur Erneuerung des Kinos hervortritt (Kappelhoff et al. 2010).

5 Sound Design und Zuschauer

Der Ursprung des Sound Designs ist in der gegenseitigen Beeinflussung des europäischen und des amerikanischen Kinos zu suchen. Inspiriert durch Erneuerungsbewegungen wie die Nouvelle Vague in Frankreich setzte sich eine neue Generation von Filmemachern – unter ihnen George Lucas, Francis Ford Coppola, Steven Spielberg und Martin Scorsese – seit den 1970er-Jahren für eine Aufwertung der Tongestaltung ein. Neben innovativen technischen Verfahren wurden „elektrisch veränderte, geräuschhafte Klänge“ (Flückiger 2001, S. 17) der zeitgenössischen Musikindustrie entlehnt. Überzeugt von der suggestiven Kraft des Sounds versuchten die Filmemacher New Hollywoods, „ein ähnliches Vokabular für die filmische Tonspur zu entwickeln“ (Flückiger 2001, S. 17). Das Berufsbild des Sound Designers war geboren, dessen Ressort maßgeblich dazu beitrug, den Filmton zu einer eigenständigen, dem Bild gleichberechtigten Ausdrucksebene zu erheben. Dieser Vorstoß war durchaus erfolgreich. Die Erben New Hollywoods und auch große Teile des modernen Mainstreams zeichnen sich in der Regel durch individuelle ästhetische Konzepte der Tonspur und elaborierte Soundscapes aus. Das Sound Design organisiert die auditive Zeichenproduktion und erweitert sie in ihren Ausdrucksmitteln und ihrer Komplexität. Die Tonspur fungiert als eigenständige Bedeutungsebene und ist grundlegender Bestandteil der Filmerfahrung. Zwar argumentiert Vivian Sobchack in ihrer Phänomenologie des Films mit einer klar auf das Auge fokussierten Begrifflichkeit (The Address of the Eye), sie geht aber von einer verkörperten Filmerfahrung aus, die unseren Wahrnehmungsapparat sowohl über die visuellen als auch die auditiven Sinneskanäle anspricht (Sobchack 1992, S. 4). Folglich realisiert sich erst im synästhetischen Zusammenwirken von Filmbild und -ton die sinnliche Darstellung eines körperlichen In-der-Welt-Seins.

Im Science Fiction Film Gravity (Alfonso Cuarón, USA 2013) wird die Astronautin Dr. Ryan Stone (Sandra Bullock) während der Explosion ihres Shuttles unkontrolliert ins All geschleudert. Die Teilnahme an Stones Wahrnehmung und ihren panischen Reaktionen wird insbesondere mithilfe des Sound Designs konstruiert (Greiner 2016). Der Ton erzeugt dabei ein belebtes, relatives Off. Michel Chion bezeichnet solche unsichtbaren, aber spürbaren filmischen Räume als „Extension“ (Chion 2012, S. 76). Sie werden vor allem durch Klanglandschaften, Atmos aber auch durch einzelne Klangobjekte gebildet (Flückiger 2001, S. 153). Die Größe dieses Ton-Raumes kann selbst innerhalb einer einzelnen Sequenz variieren: Als die Kamera in einer langsamen Annäherungsbewegung in das Innere von Stones Helm vordringt, taucht die Audiospur den Zuschauer in die hektische Ton-Umgebung des Raumanzugs. Solche Veränderungen der Extension sprengen den Rahmen einer rigiden Raumlogik und sind gleichzeitig eigenständige narrative Manifestationen zur Beschreibung eines Orts und der Befindlichkeit einer Figur (Flückiger 2001, S. 157). Warnsignale, Funkfragmente, Stones Atmung, ihre Stimme und dumpfe Bewegungslaute geben Auskunft über die klaustrophobische Umgebung und Stones Reaktionen. Hinzu kommen Soundeffekte und die damit vermischte Musik. Voraussetzung für solch eine komplexe Anordnung ist die Funktionsweise des Stereosounds, später des Surround Sounds (Abdel Rahman 1999, 2000), dessen Gestaltungsmöglichkeiten im New Hollywood Kino der 1970er-Jahre von Soundgestaltungspionieren wie Walter Murch erprobt wurden. Von zentraler Bedeutung ist das veränderte Raumkonzept: „Im Monoformat müssen die Klangobjekte entlang einer einzigen Achse angeordnet werden, gestuft nur durch unterschiedliche Lautstärke und allenfalls noch entfernungsmarkierende Raumindikatoren. Das Stereoformat hingegen öffnet einen neuen Horizont von 30° bis 360°, in dem die Klangobjekte angeordnet werden können. Stereoaufnahmen präsentieren ein transparentes Klangbild, in dem die Hörer ihre Aufmerksamkeit gezielt fokussieren können, denn die räumliche Position der Schallquelle ist eine der wichtigsten Grundlagen zur auditiven Entflechtung komplexer Klanggemische“ (Flückiger 2001, S. 53). Die sich hierdurch ergebenden Möglichkeiten des Sound Designs werden durch moderne Surround-Sound-Systeme noch erweitert. Insbesondere die Einführung des Dolby-Rauschunterdrückungssystems ging mit einer flächendeckenden Verbreitung des Surround-Sounds (Sergi 2004) und einer umfangreichen Veränderung der Kinoarchitektur einher: Plüschbestuhlung, Teppichböden, Vorhänge und die Vermeidung von parallelen Flächen trugen dazu bei, die raumdefinierenden Eigenschaften der Säle weitgehend zu unterdrücken, während diffuse Surround-Lautsprecher für eine homogene Beschallung sorgen (Flückiger 2001, S. 58). Mithilfe des Sound Designs können Surround-Sound-Systeme einen form- und gestaltbaren Raum erzeugen. Dabei zielen sie jedoch nicht auf die wirklichkeitsgetreue akustische Simulation von realen Räumen, sondern lassen den Zuschauer in die diegetische Welt des Films eintauchen. Der Surround-Sound vermittelt ein umfassendes Gefühl für einen Ort und eine Zeit (Butzmann und Martin 2012, S. 104–105). Dieses Potenzial ermöglicht eine intensivere Arbeitsteilung zwischen Bild und Ton – zum Beispiel kann mitunter auf den Establishing Shot verzichtet werden, weil der Handlungsort über Geräusche dargestellt wird (Butzmann und Martin 2012, S. 106).

Während in Gravity der großvolumige Hall der Musik eine Vorstellung von der Weite des Weltraums gibt, trägt der Surround-Sound dazu bei, die Figuren im filmischen Raum zu verorten. Als Stone in ihrem Raumanzug unkontrolliert ins All geschleudert wird, unterstreicht ein zyklisch lauter und wieder leiser werdender Basston die schnelle Rotation der Astronautin um die eigene Achse, die analog dazu durch die Spiegelung der immer wieder auf dem Visier des Helms auftauchenden und verschwindenden Erde verdeutlicht wird. Visuelle und auditive Informationen – hier der tiefe Toneffekt und die gleichzeitig sichtbar werdende Erde – verschmelzen miteinander im Sinne von Michel Chions Begriff der Synchrèse, die Verbindung von Sychronisation und Synthese (Chion 2012, S. 58 f.). In einer subjektiven Perspektive wird zudem ein audio-visueller Zusammenhang zwischen den amplitudenhaft vibrierenden, synthetischen Streichern des Scores und der vorbeihuschenden Erde hergestellt. In Kombination mit der Bewegung im dreidimensionalen Bild kann hierdurch eine Verwirrung des Innenohrs bis hin zu Schwindelgefühlen hervorgerufen werden. Der Ton dient also nicht nur dazu, den Zuschauer „im Raum zu stabilisieren, sondern kann auch desorientieren und aus dem Gleichgewicht bringen“ (Elsaesser und Hagener 2007, S. 179). Der Zuschauer wird durch den Filmton „umhüllt“ und durch tiefe Bässe „überflutet“ (Flückiger 2001, S. 209). Der Klang ist nicht nur auditiv, sondern mit dem ganzen Körper wahrnehmbar. Das Kino verfügt hierdurch über eine „neue sensorielle Qualität“ (Chion 2012, S. 125), deren Potenzial bereits in den 1970er-Jahren ausgelotet wurde. Filme wie Earthquake (Mark Robson, USA 1974) experimentierten mit Infraschallklängen, um eine Eigenresonanz des Kinomobiliars und des Zuschauerkörpers herbeizuführen. Das Sound Design und die bassstarke Wiedergabetechnologie machten das titelgebende Erdbeben für den Zuschauer körperlich spürbar. Der taktile Reiz wurde also nicht nur auditiv simuliert, er ergänzte Bild und Ton als weiterer Sinneskanal.

Sound und Körper können in noch weiteren Zusammenhängen stehen. Die materiellen Aspekte des Klangs suggerieren Körperhaftigkeit und Haptik (Flückiger 2001, S. 331). Laura Marks Annahme, das Sehen würde selbst eine taktile Wahrnehmung hervorrufen – als könne man die Welt des Films mithilfe der Augen berühren (Marks 2000, S. XI) –, kann folglich im Sinne einer auditiven Haptik erweitert werden. Der Ton macht Dinge durch ihren Klang in ihrer Materialität spürbar, in Gravity beispielsweise das Metall des Werkzeuges, das sich durch dumpfe Schläge äußert. Gleichzeitig wird in den Raumanzügen ein spezifischer ‚Body Sound‘ hörbar. Der von der lebensfeindlichen Umgebung des Weltraums bedrohte menschliche Körper wird durch die Atemgeräusche und das Herzklopfen der Astronautin sinnlich erfahrbar gemacht. Das Sound Design trägt demzufolge maßgeblich dazu bei, dass der Zuschauer „nicht länger ein passiver Empfänger narrativer Informationen [ist], der dem Film äußerlich bleibt, sondern ein Körperwesen, das akustisch, räumlich, somatisch in die Textur des Filmes verwoben ist“ (Elsaesser und Hagener 2007, S. 166).

Die Entwicklung des Sound Designs in den 1970er-Jahren hat ähnlich wie die Einführung des Tonfilms Ende der 1920er-Jahre die Gestaltung und Erfahrung des Films noch einmal grundlegend verändert (Beck 2016). Die Tonspur nimmt seither in der filmischen Bedeutungsproduktion eine eigenständige Rolle ein. Das Sound Design organisiert die auditiven Zeichen und erzeugt komplexe filmische Räume. Ein vom Bild unabhängiges, relatives Off erweitert die belebte filmische Welt um eine auditive Sphäre, die einen entscheidenden Part in der Filmerfahrung einnimmt. Das hat auch die Theorie des Filmtons vor neue Herausforderungen gestellt. Zwar weist Rick Altman darauf hin, dass die Digitalisierung mit Systemen wie MIDI und Synclavier bereits Mitte der 1980er-Jahre Einzug in die auditive Gestaltung des Films gefunden hat (Altman 2013, S. 47). Dennoch scheinen erst die Diskurse um die Digitalisierung des Bildes die Aufmerksamkeit auf die Abkehr von Vorstellungen einer indexikalen Definition des Filmtons zu lenken. Diese verspätete epistemologische Berücksichtigung kann auf die spezifische Weltverbundenheit des Filmtons zurückgeführt werden. Die materielle Qualität des Auditiven macht die filmische Welt „ertastbar“ und entwickelt Strategien zur körperlichen Wahrnehmung. Ergänzend zu technischen und ästhetischen Annäherungen an das Raumkonzept des Stereo- und Surround-Sounds (Abdel Rahman 1999, 2000; Sergi 2004), kann die theoretische Ergründung des Filmtons somit auch an phänomenologische Ansätze angebunden werden (vgl. z. B. Sobchack 1992).

6 Ausblick

In der Filmwissenschaft verstärkt sich seit den 1980er-Jahren das Interesse am Auditiven. Dieser Wandel lässt sich nicht allein durch Umbrüche auf der Produktionsseite des Films erklären, wie z. B. durch die Entwicklung des Sound Designs seit den 1970er-Jahren. Er korrespondiert vielmehr mit anderen Veränderungen in der Theorielandschaft und in der Filmgeschichtsschreibung, die einer neuen Aufmerksamkeit für den Ton des Films Rechnung tragen. Hierzu zählen beispielsweise die Erweiterungen des dominierenden Textparadigmas in der Filmtheorie um Ansätze zum Bewegungs- und Zeitbild (Deleuze 1989, 1991), um Ansätze, die Film und Kino als Ereignis betrachten (Altman 1992; Nessel 2008), sowie um Ansätze, die den Körper ins Zentrum der Filmwahrnehmung stellen (Sobchack 1992; Shaviro 1993; Morsch 2011). Prägnant auf den Punkt gebracht hat diese Korrespondenzen Rick Altman (1992), indem er seine Publikation Cinema/Sound von 1980, die noch stark von einem Verständnis von Film als Text geprägt ist (Altman 1980), zu seiner aktuellen Forschung von 1992 unter der Überschrift „Cinema as Event“ ins Verhältnis setzt. Damit gehört er zu den wenigen Theoretikern, die nicht nur die theoretischen Defizite in der Forschung zum Filmton markieren und durch neue Forschungsansätze bereichern, sondern diesen Wandel in der Theorie auch selbstreflexiv beschreiben. Ähnliche Korrespondenzen finden sich mit Blick auf die Filmgeschichtsschreibung und ihre kritische Erweiterung unter dem Begriff „New Film History“ (Elsaesser 1986; Hickethier 1989; Kusters 1996) später „New Cinema History“ (Maltby et al. 2011). Auch in diesem Zuge wurde eine neue Aufmerksamkeit für den Ton formuliert, so z. B. durch Untersuchungen der Verflechtung von Musik- und Filmindustrie (Wedel 2007; Dyer 2012) oder durch die Befragung des Verhältnisses von Film- und Geschichtswissenschaft (Pauleit et al. 2018). Vor dem Hintergrund dieses Wandels verdienen für die Theorie des Filmtons auch all jene Überlegungen verstärkte Aufmerksamkeit, die den Film explizit oder implizit nicht auf ein Konzept herunterbrechen (Film als Text, Film als Bild, Film als Audiovision etc.), sondern ihn vielmehr explizit als multi-diskursiv, heterogen oder hybrid beschreiben (Altman 1992, S. 113–125) – als etwas Zusammengesetztes und von Leerstellen geprägtes wie es etwa in Wortschöpfungen wie „Das Audio-Logo-Visuelle“ (Chion 2012, S. 169–204), „imagetext“ (Mitchell 1994) bzw. „soundimagetext“ (Pauleit et al. 2018) zum Ausdruck kommt. Mit diesen Hybridbildungen wird – ähnlich wie in den Verfahren der Dekonstruktion – ein Denken kritisch reflektiert, das glaubt zwischen Bild, Ton und Text im Film sauber unterscheiden zu können. Nur so kann es gelingen, ein theoretisches Reflexionsfeld zu eröffnen, das die Multi-Diskursivität und Vielgestaltigkeit filmischer Formen ins Zentrum rückt.

Literaturverzeichnis

  1. Abdel Rahman, Nora. 1999. Cinerama oder eine kleine Geschichte vom ‚travelling sound‘. In Nach dem Film 1. http://geschichte.nachdemfilm.de/content/cinerama-oder-eine-kleine-geschichte-vom-‘travelling-sound‘. Zugegriffen am 22.03.2018.
  2. Abdel Rahman, Nora. 2000. ‚larger-than-life‘ oder wie real ist das Kino. In Nach dem Film 2. http://geschichte.nachdemfilm.de/content/‘larger-life‘-oder-wie-real-ist-das-kino. Zugegriffen am 22.03.2018.
  3. Altman, Rick, Hrsg. 1980. Yale French Studies 60. Cinema/Sound. New Haven: Yale University Press.Google Scholar
  4. Altman, Rick. Hrsg. 1992. Sound theory sound practice. New York: Routledge.Google Scholar
  5. Altman, Rick. Hrsg. 2004. Silent film sound. New York: Columbia University Press.Google Scholar
  6. Altman, Rick. 2013. Viereinhalb Trugschlüsse. In Ton. Texte zur Akustik im Dokumentarfilm, Hrsg. Volko Kamensky und Julian Rohrhuber, 36–48. Berlin: Vorwerk 8.Google Scholar
  7. Arnheim, Rudolf. 2002 [1932]. Film als Kunst. Frankfurt a. M.: Suhrkamp.Google Scholar
  8. Auszüge in dt. Übers.: Michel Chion. 2003. Mabuse – Magie und Kräfte des acousmêtre. In Medien/Stimmen, Hrsg. Cornelia Epping-Jäger und Erika Hinz, 124–159. Köln: DuMont.Google Scholar
  9. Balázs, Béla. 1972. Der Film: Werden und Wesen einer neuen Kunst. Wien: Globus Verlag.Google Scholar
  10. Barthes, Roland. 1989. Die helle Kammer. Bemerkungen zur Photographie. Frankfurt a. M.: Suhrkamp.Google Scholar
  11. Barthes, Roland. 1998. Die Rauheit der Stimme. In Aisthesis. Wahrnehmung heute oder Perspektiven einer anderen Ästhetik, Hrsg. Karlheinz Barck, 299–309. Leipzig: Reclam.Google Scholar
  12. Beck, Jay. 2016. Designing sound. Audiovisual aesthetics in 1970s American cinema. New Brunswick: Rutgers University Press.Google Scholar
  13. Bellour, Raymond. 2010. Zwei Minuten Ungewissheit in Menschen am Sonntag. In Viva Fotofilm – bewegt/unbewegt, Hrsg. Thomas Tode, Gusztáv Hámos und Katja Pratschke, 39–54. Marburg: Schüren.Google Scholar
  14. Böhme, Gernot. 2009. Die Stimme im leiblichen Raum. In Stimm-Welten. Philosophische, medientheoretische und ästhetische Perspektiven, Hrsg. Doris Kolesch, Vito Pinto und Jenny Schrödl, 23–32. Bielefeld: transcript.Google Scholar
  15. Bulgakowa, Oksana, Hrsg. 2012. StimmBrüche. Marlon Brando, Innokenti Smoktunowski und der Klang der 1950er- Jahre. In Resonanz-Räume. Die Stimme und die Medien, 81–98. Berlin: Bertz + Fischer.Google Scholar
  16. Butte, Maren, und Sabina Brandt, Hrsg. 2011. Bild und Stimme. Paderborn: eikones.Google Scholar
  17. Butzmann, Frieder, und Jean Martin. 2012. Filmgeräusch: Wahrnehmungsfelder eines Mediums. Hofheim: Wolke-Verlag.Google Scholar
  18. Chion, Michel. 1982. La voix au cinema. Paris: Éd. de l’Étoile.Google Scholar
  19. Chion, Michel. 1985. Le son au cinema. Paris: Éd. de l’Étoile.Google Scholar
  20. Chion, Michel. 1996. Das akusmatische Wesen. Magie und Kraft der Stimme im Kino. Meteor 6: 48–58.Google Scholar
  21. Chion, Michel. 1999. The voice in cinema. New York: Columbia University Press.Google Scholar
  22. Chion, Michel. 2009. Film, a sound art. New York: Columbia University Press.Google Scholar
  23. Chion, Michel. 2012. Audio-Vision. Ton und Bild im Kino. Berlin: Schiele & Schön.Google Scholar
  24. Chion, Michel. 2013 [1991]. Wirklichkeit und Wiedergabe. In Ton. Texte zur Akustik im Dokumentarfilm, Hrsg. Volko Kamensky und Julian Rohrhuber, 58–63. Berlin: Vorwerk 8.Google Scholar
  25. Currid, Brian. 2006. A national acoustics. Music and mass publicity in Weimar and Nazi Germany. Minneapolis: University of Minnesota Press.Google Scholar
  26. Deleuze, Gilles. 1989. Das Bewegungs-Bild. Kino 1. Frankfurt a. M.: Suhrkamp.Google Scholar
  27. Deleuze, Gilles. 1991. Das Zeit-Bild. Kino 2. Frankfurt a. M.: Suhrkamp.Google Scholar
  28. Doane, Mary Ann. 1980. The voice in the cinema. The articulation of body and space. Yale French Studies 60. Cinema/Sound: 33–50.Google Scholar
  29. Dyer, Richard. 2008. Singing prettily. Lena horne in hollywood. In Word and flesh. Cinema between text and the body, Hrsg. Sabine Nessel, Winfried Pauleit, Christine Rüffert, Karl-Heinz Schmid und Alfred Tews, 126–135. Berlin: Bertz + Fischer.Google Scholar
  30. Dyer, Richard. 2012. In the space of a song. The uses of song in film. London/New York: Routledge.Google Scholar
  31. Elsaesser, Thomas. 1986. The new film history. Sight and Sound 55(4): 246–251.Google Scholar
  32. Elsaesser, Thomas, und Malte Hagener. 2007. Filmtheorie zur Einführung. Hamburg: Junius.Google Scholar
  33. Epping-Jäger, Cornelia, und Erika Linz, Hrsg. 2003. Medien/Stimmen. Köln: DuMont.Google Scholar
  34. Flückiger, Barbara. 2001. Sound Design. Die virtuelle Klangwelt des Films. Marburg: Schüren.Google Scholar
  35. Flückiger, Barbara. 2006. Sound Effects – Zu Theorie und Praxis des Film-Sound Designs. Barbara Flückiger im Gespräch mit Winfried Pauleit. In Sound Art. Zwischen Avantgarde und Popkultur, Hrsg. Anne Thurmann-Jajes, Sabine Breitsameter und Winfried Pauleit, 219–227. Bremen/Köln: Salon Verlag.Google Scholar
  36. Gomery, Douglas. 2005. The coming of sound. New York: Routledge.CrossRefGoogle Scholar
  37. Greiner, Rasmus. 2016. Ästhetik des Funks: Zur historischen Dimension der Audiospur in Gravity. In Die Zukunft ist jetzt. Science-Fiction-Kino als audio-visueller Entwurf von Geschichte(n), Räumen und Klängen, Hrsg. Aidan Power, Delia González de Reufels, Rasmus Greiner und Winfried Pauleit, 172–180. Berlin: Bertz + Fischer.Google Scholar
  38. Heiser, Christina. 2014. Erzählstimmen im aktuellen Film. Strukturen, Traditionen und Wirkungen der Voice-Over-Narration. Marburg: Schüren.Google Scholar
  39. Hickethier, Knut, Hrsg. 1989. Filmgeschichte zwischen Kunst- und Mediengeschichte. In Filmgeschichte schreiben. Ansätze, Entwürfe und Methoden, 7–23. Berlin: Edition Sigma.Google Scholar
  40. Jones, Kent. 2003. Hiroshima mon amour: Time Indefinite. The Criterion DVD Collection. http://www.criterion.com/current/posts/291-hiroshima-mon-amour-time-indefinite. Zugegriffen am 14.04.2018.
  41. Kappelhoff, Hermann, Bernhard Groß, und Daniel Illger, Hrsg. 2010. Demokratisierung der Wahrnehmung? Das westeuropäische Nachkriegskino. Berlin: Vorwerk 8.Google Scholar
  42. Kittler, Friedrich. 1986. Grammophon/Film/Typewriter. Berlin: Brinkmann & Bose.Google Scholar
  43. Kozloff, Sarah. 1988. Invisible storytellers: Voice-over narration in American fiction film. Berkeley: University of California Press.Google Scholar
  44. Krämer, Sibylle. 2003. Negative Semiologie der Stimme. Reflexionen über die Stimme als Medium der Sprache. Freie Universität Berlin. http://userpage.fu-berlin.de/~sybkram/media/downloads/Negative_Semiologie_der_Stimme.pdf. Zugegriffen am 14.04.2018.
  45. Kusters, Paul. 1996. New Film History. Grundzüge einer neuen Filmgeschichtswissenschaft. montage AV 5(1): 39–60.Google Scholar
  46. Lange, Eric, und Serge Bromberg. 2003. Les premiers pas du cinéma. A la recherche du son. (DVD), 52 min. Frankreich: lobsterfilms.Google Scholar
  47. Levin, Thomas Y, Hrsg. 2002. Rhetoric of the Temporal Index: Surveillant Narration and the Cinema of ‚Real Time‘. In CTRL SPACE. Rhetorics of Surveillance from Bentham to Big Brother, 578–593. Cambridge, MA: ZKM and MIT Press.Google Scholar
  48. LichtBildBühne 147, 21.06.1929. Zitiert nach Berlin.Dokument (Zeughaus Kino). https://www.dhm.de/fileadmin/medien/relaunch/zeughauskino/07._Handout._Menschen_am_Sonntag-1.pdf. Zugegriffen am 23.03.2018.
  49. Maltby, Richard, Daniel Biltereyst, und Philippe Meers, Hrsg. 2011. Explorations in new cinema history. Approaches and case studies. Chichester: Wiley-Blackwell.Google Scholar
  50. Marks, Laura. 2000. The skin of the film. Intercultural cinema, embodiment, and the senses. Durham/London: Duke University Press.Google Scholar
  51. Mitchell, William J. Thomas. 1994. Picture theory. Essays on verbal and visual representation. Chicago: University of Chicago Press.Google Scholar
  52. Morsch, Thomas. 2011. Medienästhetik des Films. Verkörperte Wahrnehmung und ästhetische Erfahrung im Kino. München: Fink.Google Scholar
  53. Müller, Corinna. 2003. Vom Stummfilm zum Tonfilm. München: Fink.Google Scholar
  54. Nessel, Sabine. 2008. Kino und Ereignis. Das Kinematografische zwischen Text und Körper. Berlin: Vorwerk 8.Google Scholar
  55. Nessel, Sabine, und Winfried Pauleit. 2011. Jenseits von Intermedialität. In Blickregime und Dispositive audiovisueller Medien, Hrsg. Nadja Elia-Borer, Samuel Sieber und Georg Christoph Tholen, 209–221. Bielefeld: transcript.Google Scholar
  56. Paul, Gerhard, Hrsg. 2006. Von der Historischen Bildkunde zur Visual History. Eine Einführung. In Visual History. Ein Studienbuch, 7–36. Göttingen: Vandenhoeck & Ruprecht.Google Scholar
  57. Pauleit, Winfried. 2001. Videoüberwachung und postmoderne Subjekte. Ein Hypertext zu den Facetten einer Bildmaschine. In Nach dem Film 3. http://geschichte.nachdemfilm.de/content/videoüberwachung-und-postmoderne-subjekte. Zugegriffen am 22.03.2018.
  58. Pauleit, Winfried. 2004. Filmstandbilder. Passagen zwischen Kunst und Kino. Frankfurt a. M.: Stroemfeld.Google Scholar
  59. Pauleit, Winfried, und Rasmus Greiner. 2015. Audio History des Films. Eine Forschungsskizze. In Nach dem Film 14, 2015. http://www.nachdemfilm.de/issues/text/audio-history-des-films. Zugegriffen am 22.03.2018.
  60. Pauleit, Winfried, Rasmus Greiner, und Mattias Frey. 2018. Audio History des Films. Sonic Icons – Auditive Histosphäre – Authentizitätsgefühl. Berlin: Bertz + Fischer.Google Scholar
  61. Prümm, Karl, Hrsg. 1999. Stilbildende Aspekte der Kameraarbeit. Umrisse einer fotografischen Filmanalyse. In Kamerastile im aktuellen Film, 15–50. Marburg: Schüren.Google Scholar
  62. Pudovkin, Vsevolod. 1985 [1929]. Asynchronism as a principle of sound film. In Film sound. Theory and practice, Hrsg. Elisabeth Weis und John Belton, 86–91. New York: Columbia University Press.Google Scholar
  63. Rabenalt, Peter. 2014. Der Klang des Films. Dramaturgie und Geschichte des Filmtons. Berlin: Alexander Verlag.Google Scholar
  64. Segeberg, Harro, und Frank Schätzlein, Hrsg. 2005. Sound: zur Technologie und Ästhetik des Akustischen in den Medien. Marburg: Schüren.Google Scholar
  65. Sergi, Gianluca. 2004. The dolby era: Film sound in contemporary hollywood. Manchester: Manchester University Press.Google Scholar
  66. Shaviro, Steven. 1993. The cinematic body. Theory out of bound. Minneapolis: University of Minnesota Press.Google Scholar
  67. Silverman, Kaja. 1988. The Acoustic Mirror. The Female Voice in Psychoanalysis and Cinema. Bloomington: Indiana University Press.Google Scholar
  68. Sobchack, Vivian. 1992. The address of the eye. A phenomenology of film experience. Princeton: Princeton University Press.Google Scholar
  69. Wedel, Michael. 2007. Der deutsche Musikfilm. Archäologie eines Genres. München: text + kritik.Google Scholar

Copyright information

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019

Authors and Affiliations

  1. 1.Institut für Kunstwissenschaft – Filmwissenschaft – KunstpädagogikUniversität BremenBremenDeutschland

Section editors and affiliations

  • Bernhard Groß
    • 1
  • Thomas Morsch
    • 2
  1. 1.Professur für FilmwissenschaftFriedrich Schiller Universität JenaJenaDeutschland
  2. 2.Seminar für FilmwissenschaftFreie Universität BerlinBerlinDeutschland

Personalised recommendations