1 Einleitung

Die empirische Untersuchung geistiger Fähigkeiten von nicht-menschlichen Tieren ist ein lebendiges, stetig wachsendes Forschungsgebiet. Insbesondere die Erforschung komplexer kognitiver Vermögen wie Intentionalität stellt die Wissenschaft jedoch vor verschiedene Herausforderungen, da hierbei ein nicht raum-zeitliches und nicht unmittelbar beobachtbares Phänomen mittels empirischer, naturwissenschaftlicher Methoden erfasst werden soll. Damit dies gelingen kann, verfolgt die Forschung eine Vereindeutigungsstrategie, mit der sie die grundsätzliche Fülle und Mehrdeutigkeit des lebendigen Phänomenbereichs einzuhegen versucht.

Mehr noch, die Beobachtungen und deren Befunde sollen als Teil der Forschungspraxis in Beschreibungen überführt, also z. B. von flüchtigen einmaligen Lautereignissen in fixierte, wiederholt rezipierbare textuelle Zeichen transformiert werden: in Buchstaben, Tabellen, Abbildungen, Fotos, Diagramme, Zeichnungen, Formeln etc. Damit diese textuellen Zeichen zur Erkenntnisgewinnung beitragen können, werden transkriptive Verfahren eingesetzt, die insofern als angemessen gelten können, als sie dem Anspruch einer möglichst präzisen Darstellung gerecht werden und damit über eine freie onomatopoetische Umschrift von Tierlauten weit hinausgehen.

Wenn wir im vorliegenden Beitrag danach fragen, wie genau Tierlaute in wissenschaftliche Texte kommen, dann sind in besonderer Weise epistemische Fragen berührt, die mit Aspekten der multimodalen Wissenschaftskommunikation verbunden sind. Deshalb rekonstruieren wir im Rahmen der exemplarischen Analyse eines Fallbeispiels den komplexen Prozess der Vereindeutigung, über den die flüchtigen akustischen Laute von Schimpansen transkribiert und in eine Fach-Publikation eingebunden werden, um als zentraler Beleg für das Vorhandensein von Intentionalität gelten zu können.

Unser Beitrag beginnt in Kapitel 2 mit einer Darstellung des anthropologischen Kontextes der empirischen Tierforschung. In Kapitel 3 erläutern wir das Fallbeispiel aus dem Bereich der empirischen Tierforschung, das im Zentrum unserer Analyse steht. Die Analyse in Kapitel 6 bereiten wir vor, indem wir in Kapitel 4 die vielfältigen Möglichkeiten der Sichtbarmachung von Tierlauten in Texten sondieren und in Kapitel 5 unser theoretisches Fundament legen. Hierzu greifen wir auf Bruno Latours Begriff der Inskription und Ludwig Jägers Theorie der Transkriptivität zurück. Die Verbindung dieser zwei Zugänge ermöglicht es uns, die Erkenntnisgewinnung und das sprachlich-kommunikative Handeln von Forscher*innen nicht als voneinander isolierte wissenschaftliche Praktiken erscheinen zu lassen, sondern vielmehr die epistemische Dimension von transkriptiven Prozessen und die intermedial-transkriptive Dimension des Erkenntnisprozesses als miteinander verwoben zu begreifen.

2 »To Know More About Humans«

Ein zentraler Ausgangspunkt der empirischen Erforschung geistiger Vermögen von Tieren als eigenständige wissenschaftliche Disziplin liegt im ausgehenden 19. Jahrhundert. Von verschiedenen Seiten einer sich zunehmend professionalisierenden naturwissenschaftlichen Forschung, aber auch unter Beteiligung interessierter Laienforscher*innen, wird zu dieser Zeit um eine angemessene Methodologie und Theorie der vergleichenden Psychologie gestritten. In der Historiografie der Disziplin gelten in der Regel die beiden britischen Naturforscher und Psychologen George J. Romanes und C. Lloyd Morgan als ›Gründerväter‹ (vgl. Thorpe 1979, S. 25; Karin-D’Arcy 2005, S. 179): Deren umfassende Arbeiten werden als Übergang von einer als unsystematisch und anekdotisch verfahrenden Naturgeschichtsschreibung hin zu einer methodologisch reflektierten, systematisch arbeitenden Naturwissenschaft erachtet (vgl. Boring 1957 [1929]; Richards 1987). Beide Forscher berufen sich in ihren jeweiligen Hauptwerken aus den Jahren 1882 respektive 1894 auf die noch junge Evolutionstheorie Charles Darwins als wesentliche theoretische Rahmung und wissenschaftliche Legitimation, welche es erlauben sollte, »the facts of animal intelligence in relation to theory of Descent« (Romanes 1882, S. vi) zu betrachten, bzw. »the relation of the psychology of man to that of the higher animals« (Morgan 1894, S. ix) zu diskutieren. Mit dieser Grundüberlegung stellt sich die empirische Erforschung geistiger Fähigkeiten von Tieren von Beginn an in den philosophisch-anthropologischen Kontext der Frage nach ›dem Menschen‹. Dies trifft in besonderem Maße für die Erforschung von Menschenaffen zu, also der Gattungen Gorilla, Orang-Utan und Schimpanse inklusive der Unterart der Bonobos, als – mittlerweile ein Gemeinplatz – ›unseren nächsten lebenden Verwandten‹: Da sie die Grenzzone zwischen Natur und Kultur besetzten, so die Zoologin und Wissenschaftshistorikerin Donna Haraway, würden sie vor allem in europäischen, amerikanischen und japanischen Gesellschaften einer anhaltenden kulturspezifischen Befragung darüber unterzogen, was es bedeute, ›fast Menschen‹ zu sein (vgl. Haraway 1989, S. 2). Der Gestaltpsychologe Wolfgang Köhler betont dieses Motiv in seinen wegbereitenden Intelligenzprüfungen an Menschenaffen von 1921, wenn er an prominenter Stelle in seiner Einleitung schreibt, dass »in den etwaigen Intelligenzleistungen von Anthropoiden […] der natürliche Ausgangspunkt theoretischen Verstehens« sichtbar werde und somit durch die Erforschung von Schimpansen die »Natur von Intelligenzleistungen« (Köhler 1973 [1921], S. 1) selbst hervortrete. Dieses anthropologisch motivierte Forschungsinteresse lässt sich als Konstante bis in die Gegenwart verfolgen und ist heute so selbstverständlich geworden, dass der Psychologe Richard W. Byrne im Jahr 2000 auf die Frage, weshalb man sich der Erforschung von Primaten widme, kaum eine andere Antwort finden kann als diese: »I would assert, with exception of those biologists who are interested in seed dispersal or guts, everyone who studies specifically primates does so for only one good reason: to know more about humans.« (Byrne zit. n. Interview in: Strum/Fedigan 2000, S. 138)

Die in diese Perspektive eingeschriebene »rückwirkende Naturalisierung des Menschen« (Becker 2018, S. 126) befragt auch immer wieder die Annahme einer Sonderstellung der Menschen trotz oder gerade aufgrund ihrer sonstigen Ähnlichkeit mit den anderen Tieren. So gestellt, richtet sich die Frage, ob bestimmte Tiere über bestimmte geistige Vermögen verfügen oder nicht, auf die anthropologische Differenz. Sie fragt nach jenen Vermögen, die, bei allen Gemeinsamkeiten, eventuell sogar die evolutionäre Kontinuität überspringen und Menschen grundsätzlich von allen anderen Tieren unterscheiden. Der Vergleichende Psychologe und Entwicklungspsychologe Michael Tomasello betont: »Die sechs Millionen Jahre, die uns Menschen von anderen Menschenaffen trennen, sind, evolutionär betrachtet, eine sehr kurze Zeitspanne, vor allem im Hinblick darauf, daß der moderne Mensch mit dem Schimpansen ungefähr 99 Prozent des genetischen Materials teilt.« (Tomasello 2006 [1999], S. 14) Unter solchermaßen komparatistischen Vorzeichen ist Tomasello in seiner Jahrzehnte umspannenden Forschung mittels kontrastiver experimenteller Untersuchungen von menschlichen Kleinkindern und erwachsenen Schimpansen sowohl dem gemeinsamen, naturgeschichtlichen Ursprung, als auch dem – qualitativen oder quantitativen – Unterschied bestimmter geistiger Vermögen bei Menschen und Schimpansen nachgegangen. Die Fähigkeiten, konative oder kognitive Zustände wie Absichten, Wünsche oder Überzeugungen anderer zu erkennen (Theory of Mind), geteilte Ziele zu verfolgen oder über kollektive Intentionalität zu verfügen, sind einige der von Tomasello untersuchten Vermögen, die sich immer wieder insbesondere in kommunikativen Akten ausweisen lassen. Entsprechend tragen seine Monografien Titel wie The Cultural Origins of Human Cognition (1999), Origins of Human Communication (2008), A Natural History of Human Thinking (2014) oder Becoming Human: A Theory of Ontogeny (2019). Auffällig an Tomasellos Forschung ist, dass er im Kontrast zu zahlreichen, insbesondere innerhalb der analytischen Philosophie des Geistes diskutierten Vorschlägen, nicht die menschliche Sprache als anthropologische Differenz herausstellt, auf deren Basis dann weitere geistige Vermögen von Menschen, wie eine Theory of Mind, geteilte Ziele oder kollektive Intentionalität, erklärt werden könnten. Stattdessen argumentiert Tomasello (2009) genau umgekehrt, dass auf Kommunikation basierende Vermögen, wie das Verfolgen gemeinsamer Ziele oder geteilter Absichten, vielmehr die vorsprachliche Bedingung der Möglichkeit zur Entwicklung einer natürlichen Sprache seien.

Forschungsansätze wie der von Tomasello unterscheiden sich von jener Forschung, derzufolge geistige Vermögen unmittelbar an Sprache gekoppelt sind, und die danach fragt, inwiefern man Menschenaffen als nicht-sprachlichen Tieren ein menschliches Sprach- oder Symbolsystem antrainieren kann. Diese Ansätze haben gemein, dass sie es zumeist mit sprechunfähigen Tieren zu tun haben, was eine besondere methodologische Herausforderung darstellt, der sie mit zwei gegensätzlichen Strategien begegnen (vgl. Dupré 1991). Die eine Strategie beantwortet die Herausforderung analog zum Fall sprechunfähiger Menschen über das Lehren einer natürlichen Gebärdensprache, womit Forschende und Tiere im Idealfall in eine kommunikative Beziehung zueinander treten können, bei der die Tiere auf gesprochene und gebärdete Sprache mittels eigener Gebärden reagieren können. Die andere Strategie greift auf konstruierte Symbolsprachen zurück, was es den Tieren erlaubt, auf gesprochene Sprache mittels Lexigrammen zu reagieren. Dabei handelt es sich um zumeist auf einer Tastatur angeordnete arbiträre Symbole, die jeweils einzelne Worte repräsentieren. Beide Strategien haben mit Tomasellos Ansatz gemein, dass die Forschung jeweils an bzw. mit domestizierten Referenztieren stattfindet. Auch die Erforschung geistiger Vermögen an wildlebenden Menschenaffen hat eine lange Tradition, die spätestens mit der Feldforschung der Primatologinnen Jane Goodall zu Schimpansen, Dian Fossey zu Gorillas und Birutė Galdikas zu Orang-Utans einsetzt.

Alle genannten Ansätze sehen sich analog den Überlegungen von Romanes und Morgan mit der epistemisch-methodologischen Herausforderung konfrontiert, dass geistige Vermögen nicht unmittelbar empirisch erfasst werden können, sondern auf diese immer nur vermittelt über das in Raum und Zeit beobachtbare Verhalten geschlossen werden kann. Die Grundherausforderung der Forschung besteht folglich darin, Unsichtbares vor Augen zu führen und so Unbeobachtbares unter Zuhilfenahme bestimmter methodischer Mittel zum Vorschein zu bringen: Verschiedenste Versuchsanordnungen, Beobachtungssituationen, experimentelle Konstruktionen, Apparaturen und Messvorrichtungen wurden und werden entwickelt, um die nicht unmittelbar beobachtbaren kognitiven Vermögen der Tiere ›sichtbar‹ zu machen. Dabei ist die im 19. Jahrhundert noch als grundlegend verstandene Frage danach, inwiefern Beobachtende vom beobachtbaren Verhalten überhaupt angemessen und in der Sache zutreffend auf die dahinterliegenden nicht-beobachtbaren Vermögen schließen können, zunehmend vernachlässigt worden: In der Forschung wird in der Regel vorausgesetzt, dass die jeweiligen Befunde die »active voice of their subjects« (Haraway 1989, S. 8) wiedergeben. Eine dieser beobachtbaren Verhaltensweisen sind Lautäußerungen, deren Rolle innerhalb des Forschungsprozesses wir im Folgenden anhand eines ausgewählten Fallbeispiels beleuchten wollen.

3 »Chimpanzee Alarm Call Production Meets Key Criteria for Intentionality«

Im Fokus der folgenden Beispielanalyse steht der 2013 in der Online-Fachzeitschrift PLOS ONE veröffentlichte Artikel »Chimpanzee Alarm Call Production Meets Key Criteria for Intentionality« der Psychologin Anne Marijke Schel, der Evolutionsbiolog*innen Simon W. Townsend und Zarin Machanda, des Psychologen und Neurowissenschaftlers Klaus Zuberbühler sowie der Psychologin Katie E. Slocombe. Ähnlich wie Tomasello interessiert sich die Forschungsgruppe für den evolutionären Ursprung bestimmter menschlicher Vermögen, nämlich für die Fähigkeit, intentionale Zustände anderen mittels Lautäußerungen zu vermitteln. Im Abstract des Artikels heißt es entsprechend:

»Determining the intentionality of primate communication is critical to understanding the evolution of human language. […] Our results demonstrate that certain vocalisations of our closest living relatives qualify as intentional signals, in a directly comparable way to many great ape gestures. We conclude that our results undermine a central argument of gestural theories of language evolution and instead support a multimodal origin of human language.« (Schel et al. 2013a, S. 1)

Das Forschungsinteresse des Ansatzes reiht sich in den von uns skizzierten wissenschaftlichen Traditionsstrang ein: Eindeutig wird die eigene Forschungsfrage in den weiteren anthropologischen Kontext des naturgeschichtlichen Ursprungs menschlicher Fähigkeiten eingebettet, die – aufgrund der benannten evolutionären Verwandtschaftsbeziehung zum Menschen – stellvertretend an Schimpansen durchgeführt werden kann. Die empirische Feldforschung, die der Veröffentlichung des Artikels vorausging, fand zwischen Januar 2010 und Dezember 2011 im Budongo Forest Reserve, Uganda, statt. Beforscht wurden 13 einer zu diesem Zeitpunkt 73 Tiere umfassenden, habituierten, also aufgrund von Begegnungen mit Einheimischen, Forscher*innen und Tourist*innen an menschlichen Kontakt gewöhnten Schimpansenpopulation. Der Lebensraum der nach einem lokalen Bach als Sonso Community bezeichneten Population zeichnet sich durch eine dichte Bewaldung mit schmalen Trampelpfaden aus, die sowohl von Menschen als auch den Schimpansen der Sonso Community verwendet werden (vgl. Schel et al. 2013a, S. 4). Diese Pfade sind für die Versuchsanordnung der durchgeführten Experimente insofern zentral, als die Forschungsgruppe an einem dieser schmalen, nur hintereinander begehbaren Pfade die Attrappe eines Felsenpythons unter Laub platzierte:

»We manufactured a model of an African Rock Python (Python sebae), a non-venomous but lethal ambush predator that is common in the Budongo Forest, using the conserved skin of a dead python donated to us by the Uganda Wildlife Education Centre (UWEC). […] Transparent fishing line attached to the head of the python model allowed us to move the model from a distance.« (Schel et al. 2013a, S. 4)

Die Versuchsanordnung der Forschungsgruppe sah es vor, individuelle Schimpansen der Schlange in verschiedenen sozialen Konstellationen auszusetzen, nämlich entweder allein (Kontrollversuch) oder als jeweils erstes oder letztes Individuum einer kleineren Gruppe (vgl. Schel et al. 2013a, S. 4). Im Fokus der Versuche stand das jeweilige Verhalten des mit der Schlange konfrontierten Individuums unter den Forschungsfragen, ob, und falls ja, wie es nach der Entdeckung der Gefahrenquelle mit anderen Mitgliedern interagiert, wobei der Fokus auf der lautlich-kommunikativen Interaktion lag:

»The focal individual was filmed from a minimum of two different angles. After thorough training, all observers gave reliable real time commentary on the looking direction and vocal and antipredator behaviour […] of the focal individual and other group members present, either onto a video recorder or a dictaphone […]. Observer 2 additionally sound recorded vocalizations with a Sennheiser ME67 microphone and Marantz PCM661 solid state recorder.« (Schel et al. 2013a, S. 5)

Am Ende der Datenerhebungsphase hat die Forschungsgruppe »[a]n average of 190.0 hours (min = 34.5; max = 405.4; SD = 112.9) of focal data […] collected on each experimental focal individual« (Schel et al. 2013a, S. 5). Um zu entscheiden, ob die Lautäußerungen eine Form intentionalen Verhaltens darstellen, wurden auf Basis dieses umfangreichen Datenmaterials die akustisch und audiovisuell aufgezeichneten Lautäußerungen hinsichtlich dreier Kriterien beurteilt:

  1. a)

    soziale Orientierung, d. h. sie werden nur in Anwesenheit, nicht aber in Abwesenheit von Begleittieren produziert;

  2. b)

    Rezeptionsorientierung, d. h. sie werden von Körperbewegungen und Blickrichtungswechseln des Fokustieres zwischen Gefahrenquelle und den anderen Individuen der Gruppe begleitet;

  3. c)

    Zielorientierung, d. h. sie werden dann und erst dann beendet, wenn alle begleitenden Individuen der Gruppe außerhalb des Gefahrenbereiches sind (vgl. Schel et al. 2013a, S. 5).

Das gewählte Fallbeispiel erweist sich für unser Vorhaben aus drei Gründen als äußerst fruchtbar:

Erstens stehen die Lautäußerungen der Schimpansen sowohl im methodologischen als auch epistemischen Zentrum des Forschungsansatzes. Er setzt voraus, dass es sich bei den Lautäußerungen nicht um wirkungsarme oder gar wirkungslose Begleitphänomene einer anderen, tatsächlich wirkrelevanten Verhaltensäußerung handelt. Vielmehr wird vorausgesetzt, dass es sich bei Lautäußerungen in dem genannten Untersuchungsszenario um wirkmächtige Verhaltensanteile handelt, die zudem für die Beobachtenden die intentionale Qualität des Verhaltens anzeigen. Auf Grundlage dieser Einschätzung geht es darum, eine Methode zur Operationalisierung, Beschreibung, Differenzierung und Beurteilung der Funktion von Lautäußerungen (in dieser Reihenfolge) zu entwickeln und anzuwenden.

Zweitens verbindet der Forschungsansatz verschiedene methodologische Grundüberlegungen, indem einerseits die Versuchsanordnung konzeptionell an den Gütekriterien der experimentellen Laborforschung als einem epistemischen Ideal angelehnt ist (z. B. weitestgehende Kontrolle der Randbedingungen, Reproduzierbarkeit und Wiederholbarkeit der Versuche), andererseits jedoch Beobachtungsmethoden der Feldforschung berücksichtigt werden (z. B. weitestgehend authentische Situation, Sammeln von Beobachtungseindrücken) – kurzum: Das Verhalten und damit eben insbesondere die Lautäußerungen der Tiere sollen sowohl experimentell gemessen als auch beobachtend beschrieben werden können.Footnote 1

Drittens ist der Artikel in einer Online-Zeitschrift publiziert worden. Hierbei handelt es sich um ein Medium, welches ein weitaus breiteres Spektrum multimodaler Darstellungsformen für Lautäußerungen ermöglicht, als es eine papiergebundene Zeitschriftenveröffentlichung erlauben würde. Hierzu zählt insbesondere die Implementierung von drei Audio- (Schel et al. 2013b, c, d) und zwei Videoaufnahmen (Schel et al. 2013f, g) in den Text. Der Text ist zudem um eine erläuternde Anhangdatei (Schel et al. 2013e) ergänzt.

Im Hinblick auf diese Gründe wird das Fallbeispiel insbesondere dadurch ergiebig, dass es sich in besonderer Weise durch eine transparente und reflektierte Darstellung des wissenschaftlichen Arbeitens auszeichnet. Dadurch liefert der Text auch für unser Erkenntnisinteresse ein umfangreiches Datenmaterial zur Beantwortung der von uns gestellten Fragen.

4 »There is a Lack of Clarity in How Chimpanzee Alarm Calls Have Been Described and Labelled in the Literature«

Wie der Soziologe und Wissenschaftsforscher Bruno Latour (2000b, S. 358) pointiert kommentiert, befinden sich niemals die beobachteten Tiere zwischen den Buchdeckeln der Arbeiten, die von ihnen handeln. Dies gilt im selben Sinne auch für das beobachtete Verhalten. In seinem Grundriß der vergleichenden Verhaltensforschung aus dem Jahr 1967 spricht der Verhaltensforscher Irenäus Eibl-Eibesfeldt (1967, S. 17) entsprechend davon, dass »Verhaltensweisen erst künstlich durch Film und Tonband in Raumstrukturen übergeführt werden müssen, damit auch sie als Präparat und bleibendes Dokument« vorliegen. Für die Forschung bedarf es also, mit dem Sprachwissenschaftler Konrad Ehlich gesprochen, einem »Mittel der Überlieferung« (2007 [1983], S. 541). Die von Texten dominierte Publikationstradition nicht nur der vergleichenden Psychologie und (Kognitiven) Ethologie verlangt wiederum, dass die akustischen und audiovisuellen ›Präparate‹ in geeigneter Weise zu Papier gebracht werden – wie sich noch zeigen wird, in aktuellerer Forschung ergänzt um Möglichkeiten weiterer nicht-papiergebundener Darstellungsformen, wie sie eine digitale Publikationspraxis bereithält.

4.1 Vom Laut zum Papier als alltagsweltliche Praxis

Das Sichtbarmachen von tierlichen Lauten auf Papier (bzw. einem digitalen Äquivalent) stellt zunächst keine Praxis dar, die dem wissenschaftlichen Feld exklusiv vorbehalten ist und mit der ausschließlich Wissenschaftler*innen der empirischen Tierforschung in Kontakt kommen. Verschriftlichte Laute finden sich u. a. auch in populären Sachbüchern, Erklärungstafeln in Zoos und Museen, Schulungsmaterialien für den Umgang mit Haustieren, Unterrichtsmaterialien aus dem Fach Biologie oder Comics und anderer erzählenden Literatur, in der Tiere als Figuren auftreten. Entscheidend ist dabei aber offenkundig, dass nicht jedes Verfahren der Aufzeichnung und Sichtbarmachung von Tierlauten auch ein wissenschaftliches Verfahren ist und wissenschaftlichen bzw. epistemischen Zwecken genügt. Dass wir darauf dennoch an dieser Stelle eingehen, dient der ersten Annäherung und der Abgrenzung unseres Untersuchungsgenstandes.

Prinzipiell sehen sich auch Personen, die nicht im Bereich der empirischen Tierforschung tätig sind, dazu in der Lage, einen tierlichen Laut auf Papier zu bringen. Dies wollen wir im Folgenden anhand einer kleinen explorativen Untersuchung (n=22) veranschaulichen, die wir 2022 im Rahmen einer germanistischen Tagung durchgeführt haben. Ohne Möglichkeit der Vorbereitung wurde den Proband*innen dazu ein Erhebungsbogen ausgehändigt und zweimal derselbe tierliche Laut vorgespielt. Hierbei handelt es sich um die Audioaufnahme des sogenannten »Alarm Hoos« eines Schimpansen (Dauer: 00:01 min; Schel et al. 2013c), der auch im Zentrum der von uns im Folgenden fokussierten Forschung durch Schel et al. (2013a) steht. Die zu Beginn mündlich dargestellte und während der Erhebung mittels einer PowerPoint-Folie visualisierte Transkriptions-Aufgabe (vgl. Kap. 5.2) lautete:

  1. 1.

    Nehmen Sie einen Stift und einen unserer Erhebungsbögen zur Hand.

  2. 2.

    Hören Sie genau hin, wenn wir Ihnen zweimal einen Tierlaut vorspielen.

  3. 3.

    Bringen Sie den gehörten Laut mit dem Stift auf den Bogen.

Um den gehörten Laut mit einem Stift auf Papier zu bringen, hatten die Proband*innen zwei Minuten Zeit. In der Auswertung der Erhebungsbögen lassen sich die verschiedenen Darstellungsformen gruppieren (Abb. 1): 3 Proband*innen verwendeten schriftsprachliche/onomatopoetische Darstellungsformate, 8 verwendeten rein grafische Darstellungen von Linien bzw. Kurvenverläufen, 5 eine Kombination grafischer und schriftsprachlicher/onomatopoetischer Darstellungen, 5 zeichneten die vermutete Quelle der Laute und ein*e Proband*in brachte einen als Frage formulierten Satz zu Papier (»Affe ruft mittel erregt?«).

Abb. 1
figure 1

Exemplarische Fälle der vier Darstellungsformen

Die Ergebnisse dieser kleinen Untersuchung weisen darauf hin, dass auch außerhalb der empirischen Tierforschung nicht nur ein Wissen darüber existiert, wie tierliche Laute transkribiert werden können, sondern die Proband*innen zeigen sich auch alle in der Lage dazu, dieses Wissen praktisch anzuwenden. Dabei korrespondieren, wie wir im folgenden Kapitel noch zeigen werden, die gewählten Darstellungsformen teilweise durchaus mit denen jener Disziplinen, die sich typischerweise Tierlauten als Untersuchungs- und Erkenntnisgegenstand zuwenden. Da allerdings die Proband*innen anders als die Wissenschaftler*innen dieser Disziplinen dabei qua Aufgabe nicht mit einer eigenen Erkenntnisabsicht vorgehen, handelt es sich ganz offenkundig nicht um eine epistemische Transkription (vgl. Kap. 5.2). Die erhobenen, von einer eigenen Forschungsabsicht der Proband*innen losgelösten Transkripte mögen dadurch zwar visuelle Ähnlichkeiten mit den Ergebnissen epistemischer Transkription aufweisen, sind mit diesen jedoch nicht identisch. Dies liegt aus einer Handlungsperspektive etwa daran, dass im Rahmen unserer Untersuchung die Transkriptionen wenig exakt frei Hand erfolgten. Gütekriterien wissenschaftlicher Praxis, so etwa die Nachvollziehbarkeit und Exaktheit, Ideale der Naturtreue oder Objektivität, werden dabei offenkundig nicht erfüllt.Footnote 2 Dies ist weiterhin darin begründet, dass die erstellten Transkripte auch nicht die Funktion eines Arguments und Belegs erfüllen und entsprechend der Aufgabenformulierung auch nicht zu erfüllen brauchten. Wenn wir uns im Folgenden sprachwissenschaftlich und wissenschaftsphilosophisch anhand eines ausgewählten Beispiels mit der Frage beschäftigen, wie Tierlaute in die Texte kommen, dann fokussieren wir damit dezidiert auf wissenschaftliche Praktiken mit dem Ziel der Erkenntnisgewinnung. Dabei gehen wir davon aus, dass diese epistemischen Transkriptionen anders als jene unserer kleinen Untersuchung mit klarer Zielsetzung professionalisiert und reflektiert durchgeführt werden.

4.2 Vom Laut zum Papier als wissenschaftliche Praxis

In der Forschungsliteratur lassen sich verschiedene Darstellungsformen finden, mittels derer tierliche Laute auf Papier gebracht werden. Um die Vielfalt der angewendeten Darstellungsformen anzudeuten, seien einige Arbeiten exemplarisch angeführt. In den insbesondere für die Feldforschung wegweisenden Arbeiten der Primatologin Jane Goodall greift diese bei der Fixierung und zur Differenzierung der Lautäußerungen der von ihr beobachteten Schimpansen (Pan troglodytes, Gombe-Nationalpark, Tansania) auf verschiedene Darstellungsformate für verschiedene Lautäußerungen zurück: schriftsprachliche/onomatopoetische Darstellungen – »Wraaa«, »Hoo« –, Beschreibungen der Lautproduktion – »Tooth Clack«, »Lip Smack« – und der menschlichen Lebenswelt entnommene Bezeichnungen für verschiedene Artikulationsweisen – »Whimper«, »Scream« (Goodall 1986, S. 127).

Die mit ihren Forschungen das Feld der Untersuchungen zur Theory of Mind bei nicht-menschlichen Primaten prägenden Verhaltensforscher*innen Dorothy L. Cheney und Robert M. Seyfarth verwenden zur Darstellung dreier distinkter Lautäußerungen von Grünen Meerkatzen (Cercopithecus aethiops; Amboseli-Nationalpark, Kenia) ebenfalls verschiedene Formate. Sie setzen diese jedoch in wechselseitiger Kombination ein: Klangbeschreibungen, angelehnt an menschliche Lauterzeugungen oder die anderer Tiere – »a loud barking call«, »a short, double-syllable cough«, »a chutter« (Cheney/Seyfarth 1990, S. 102 f.) –, Onomatopoetika – »rraup« (Cheney et al. 1980, S. 1073), »wrr« (Cheney/Seyfarth 1988, S. 477) – sowie die Abbildungen von Sonogrammen (vgl. Cheney et al. 1980, S. 1074). Auch die Verhaltensbiolog*innen Hélène Bouchet, Catherine Blois-Heulin und Alban Lemasson verwenden eine Kombination verschiedener Darstellungsformen in ihrer Forschung zu Variationen von Ruf-Mustern am Beispiel dreier Arten von in Gefangenschaft lebenden Meerkatzen (Cercopithecus neglectus; Wildpark Port Lympne, England; Cercopithecus campbelli und Cercocebus torquatus; Forschungsstation Paimpont, Frankreich): Einerseits ordnen sie die Lautäußerungen anhand von Funktionszuweisungen drei Kategorien zu – »Alarm Calls«, »Threat Calls«, »Contact Calls« (Bouchet et al. 2013, S. 5) – und stellen diese dann schriftsprachlich/onomatopoetisch dar: »Whoop-Gobble«, »WaHoo«, »Ti+(Uh)« (Bouchet et al. 2012, S. 48). Andererseits unterteilen sie die Lautäußerungen in diskrete Einheiten wie »units«, »calls« und »sequences« (Bouchet et al. 2012, S. 47), abhängig davon, ob Units einmalig verwendet, wiederholt oder mit anderen Units kombiniert werden. Die Basiseinheit des Unit wird dabei unter Verwendung von sonographischen Darstellungen definiert als »the basic element of a call, represented as a continuous tracing along the temporal axis of the sonogram« (Bouchet et al. 2013, S. 4).

Dass die schriftsprachliche Fixierung der eben nicht auf einer Schriftsprache basierenden Äußerungen der jeweiligen Tiere trotz aller Bemühungen stark von den Forscher*innen und deren Hör- und Darstellungsgewohnheiten abhängt, diskutiert der Zoologe Karl Meißner bereits 1976 am Beispiel von Vogelstimmen. Zunächst zählt er eine ganze Reihe verschiedener Darstellungsformen innerhalb der Fachpublikationen auf, die teilweise miteinander kombiniert werden: »Laute und Silben der Menschensprachen«, »besondere[] Zeichen und Zeichenreihen (·−·−·−·, ·····, ′′′′′, /·//·///·/·//· …)«, der Einsatz »spezieller Geräte (Pegelschreiber, Oszillograph, Spektrograph)«, die die »dreidimensionalen Lautmuster in zweidimensionale optische Muster« umwandeln, »zusätzliche Lautmalerei« sowie individuelle Ansätze einzelner Forscher*innen, wie die Notation mit »Noten, um den melodischen Bau der Vogellieder genauer zur Darstellung zu bringen« (Meißner 1976, S. 46–49). Aufgrund dieser Breite möglicher Darstellungen sieht Meißner zwar die grundsätzliche Möglichkeit, tierliche Lautäußerungen »entweder identisch oder in Grenzen reproduzierbar« (Meißner 1976, S. 46) zu machen. Dennoch weist er auf die individuellen Unterschiede bei einzelnen Forscher*innen hin, die dasselbe Phänomen verschieden festhalten, wie er am Beispiel der Darstellung des Gesangs des Teichrohrsängers illustriert (Abb. 2).

Abb. 2
figure 2

Die schriftsprachlichen/onomatopoetischen Darstellungen in a‑c unterscheiden sich in ihrer konkreten Realisierung. Die nichtsprachlichen Darstellungen in d‑f hingegen variieren im jeweiligen Darstellungsmodus: ein Notenbild d und zwei Oszillogramme e, f (e ist auch im Original schwer zu erkennen). Quelle: Abbildung aus Meißner (1976, S. 50)

Diese individuellen Unterschiede können z. B. in der erstsprachlichen Prägung der Rezipierenden begründet sein, wie Meißner zumindest anekdotisch aufzeigt: »Nach einer Mitteilung von Koehler (1973) ›entrüstete‹ sich eine Französin, die das Kikeriki deutscher Hähne hören wollte: Schon der erste rief Cacadoulidou, genauso wie die Hähne ihrer Heimat.« (Meißner 1976, S. 49) Wie die Variationen in Abb. 2 offenlegen, kann die Erstsprache allerdings nicht das einzige Kriterium darstellen.

Entsprechend halten auch Schel et al. (2013a, S. 4) fest: »There is a lack of clarity in how chimpanzee alarm calls have been described and labelled in the literature.« Diesen Mangel an Einheitlichkeit erachten wir jedoch nicht als reines Problem einer bislang ausbleibenden Systematik und Standardisierung von Verschriftlichungspraktiken. Vielmehr geht – so unsere These – jede Form der Sichtbarmachung tierlicher Lautäußerungen explizit oder implizit mit methodologischen, konzeptionellen/sprachlichen und epistemischen Festschreibungen einher, weshalb es sich neben einem verschriftlichenden immer auch um einen epistemischen Prozess handelt. Um dies zu verdeutlichen, gilt es näher auszuführen, welche epistemische Relevanz mit der zentralen Frage dieses Aufsatzes einhergeht: Wie kommen Tierlaute in einen Text?

5 »The Transformation of Chimps into Paper«

5.1 Sichtbarmachung und Inskription

Das Wissen darüber, ob bestimmte Tiere über bestimmte geistige Fähigkeiten verfügen, ist in zweifacher Hinsicht ein vermitteltes Wissen. Einerseits insofern, als bei der Bezugnahme auf dieses Wissen eine enge Bindung zu den empirischen Befunden der jeweiligen Wissenschaften besteht, das Wissen also zumeist von der empirisch verfahrenden Tierforschung übernommen wird. Vermittelt ist dieses Wissen andererseits insofern, als die wissenschaftliche Forschung selbst ihre Einsichten nur in jeweils methodisch vermittelter Form erlangt, indem sie das Unbeobachtbare methodisch beobachtbar zu machen versucht (vgl. Böhnert/Köchy 2021, S. 10 f.). Demzufolge richtet sich ein wesentlicher Aspekt der von uns untersuchten Forschung auf die Sichtbarmachung – im wörtlichen wie im übertragenen Sinne – geistiger Fähigkeiten von Tieren bzw. die für das Vorhandensein dieser Fähigkeiten möglicherweise als Beleg dienenden Lautäußerungen der Tiere. Die Sichtbarmachung der tierlichen Lautäußerungen mittels Klangbeschreibungen, Onomatopoetika, sonographischen Abbildungen oder Übersetzungen in ein Notensystem ist jedoch nicht allein Ergebnis eines längeren Forschungsprozesses, auch wenn sich unseres Erachtens der von Schel et al. angesprochene Mangel an Einheitlichkeit innerhalb der Fachliteratur hierauf richtet, denn:

»Der Begriff der Sichtbarmachung impliziert ein zweifaches Verhältnis von Bild und Tat: Er bezeichnet zugleich den Prozess der Visualisierung und als Ergebnis dessen bestimmte Sichtbarkeiten. Als solcher eröffnet er die Möglichkeit, das Bild nicht nur als fertiges Produkt zu untersuchen, sondern eben jene Tätigkeiten zu analysieren, die zu seiner Genese geführt haben.« (Heumann/Hüntelmann 2013, S. 284, Herv. F.B./M.B.)

Gerade in dem Verhältnis von Produkt und Prozess des Sichtbarmachens liegt ein Teil der epistemischen Relevanz, auf welche wir uns beziehen: Als überlieferbares Produkt ist die je gewählte Form der Darstellung Teil der Argumentation, verfügt über eine eigene eingeschriebene oder zumindest zugesprochene Beleg- oder Beweiskraft aufgrund ihres Abbildungscharakters: »You doubt of what I say? I’ll show you« (Latour 1986, S. 13). Wissenschaftstheoretisch lässt sich das Produkt der Sichtbarmachung dem Context of Justification zuweisen, also Praktiken der wissenschaftsinternen Rechtfertigung von Thesen und Theorien. Somit tragen in unserem Fallbeispiel konkrete Formen der Sichtbarmachung tierlicher Lautäußerungen – Verschriftlichung, grafische Darstellung, akustische oder audiovisuelle Aufnahmen etc. – im Detail dazu bei, die Zuschreibung von Intentionalität bei Schimpansen zu rechtfertigen. Die Sichtbarmachung im Kontext einer Publikation (oder einer anderen wissenschaftlichen Form der Überlieferung) schafft »dadurch Fakten, dass sie diese durch ihre Anschaulichkeit beleg[t]« (Heumann/Hüntelmann 2013, S. 289). Während der Sichtbarmachung als Produkt eine Abbildungsfähigkeit der PhänomeneFootnote 3 attestiert wird, verliert sie unter Berücksichtigung ihres Entstehungs- und Herstellungszusammenhangs – dem Context of Discovery – die damit verbundene Passivität.Footnote 4 Als Prozess wird die versteckte Rückseite sichtbar, nämlich die im Produkt in der Regel unsichtbaren Handlungen, Entscheidungen und Praktiken hinter den Darstellungen: Sichtbarmachungen sind »›Tat-Sachen‹, also Ergebnisse gezielten wissenschaftlichen Handelns und komplexer soziotechnischer Interventionen« (Borck 2009, S. 318 f.). Im Fall der tierlichen Lautäußerungen werden die jeweiligen Sichtbarmachungen aus den raum-zeitlich bedingten und methodisch provozierten Interaktionen eines Netzwerks menschlicher, tierlicher und technischer Aktanten im Sinne von Latour (2000a, S. 372) heraus entwickelt. Sie basieren auf Begegnungen, Beobachtungen, Entscheidungen und Handlungen aller am Netzwerk beteiligter Aktanten: Forscher*innen, Schimpansen, Schlangenattrappe, Angelschnüre, Aufnahmegeräte etc. (siehe Kap. 6). Diese situierte Forschungsauffassung eines »dance of relating« (Haraway 2008, S. 25) bricht auch die traditionelle Auffassung eines erkennenden Subjekts und eines zu erkennenden Objekts auf und schließt (zumindest) die beobachteten Tiere als aktiv an der Forschungsarbeit beteiligte »working subjects« (Haraway 2008, S. 80) ein. Die Forschenden, so lässt sich mit Haraway sagen, transformieren diese Interaktionen schließlich in wissenschaftliche Befunde (vgl. Haraway 1989, S. 4–5), indem sie diese in wissenschaftliche – und damit menschliche – Darstellungsformate überführen. Aufgrund dieser Handlungen sind Sichtbarmachungen – Produkt und Prozess, Ergebnis und Herstellung – Tat-Sachen, die selbst Tatsachen schaffen (vgl. Heumann/Hüntelmann 2013, S. 289). Diese Praxis lässt sich als eine spezifische wissenschaftliche Handlung und Intervention begreifen, auf die auch Latour (1986, S. 3 f.) aufmerksam macht: »I was struck, in a study of a biology laboratory, by the way in which many aspects of [scientific] practice could be ordered by looking […] at the transformation of rats [und im selben Sinne auch »chimps«] into paper.« Auch in unserem Fallbeispiel werden die zu erforschenden Phänomene – je nach Beobachtungsebene Schimpansen, Lautäußerungen oder Intentionalität – »into paper« transformiert: Tabellen, Skizzen, Beschreibungen, Abbildungen, Diagramme, Fotografien, Tonaufzeichnungen etc. Insbesondere im Kontext seiner Arbeiten zur Wissenschaftsforschung verwendet Latour (2000a, S. 375) zur Beschreibung dieser spezifischen wissenschaftlichen Handlung den Begriff der Inskription, um damit auf »all jene Transformationen, durch die eine Entität in einem Zeichen, einem Archiv, einem Dokument, einem Papier, einer Spur materialisiert wird«, zu referieren.

Der Begriff der Inskription verweist damit auf drei Aspekte, die auch für unser Vorgehen relevant sind, weshalb wir im Folgenden diesen Begriff zur allgemeinen Bezeichnung desjenigen wissenschaftlichen prozessualen Handelns verwenden wollen, das zur Sichtbarmachung der untersuchten Phänomene vom Beginn der Forschung bis zu deren vorläufigem Endpunkt, der wissenschaftlichen Publikation, führt. Erstens ermöglicht dieser Begriff eine Bezugnahme auf Text und Schreiben in einem weiten Sinne, der nicht nur Fotografien und Diagramme mit einschließt, sondern die Geräte und Instrumente berücksichtigt, die an der Inskription und somit auch beim Schaffen der Tat-Sachen im obigen Sinne beteiligt sind (»Inskriptionsmittel« (Latour 2006, S. 282)).Footnote 5 Zweitens verweist Latour darauf, dass Inskriptionen sich überlagern, kombinierbar sind, sich in andere Zeichen übersetzen und in neue Konstellationen verschieben lassen. Damit stehen sie nicht nur in Beziehung zu den durch sie transformierten Phänomenen, sondern sind immer auch mit anderen Inskriptionen verwoben, indem sie über sich hinausweisen, sich wechselseitig verstärken, an andere Forscher*innen überliefert werden und von diesen aufgegriffen, erweitert, korrigiert, fortgeschrieben oder infrage gestellt werden (vgl. Latour 2000a, S. 381 f.).Footnote 6 Drittens betont der Begriff der Inskription noch deutlicher als jener der Sichtbarmachung, dass es sich bei der wissenschaftlichen Praxis um einen aufwendigen und durch Entscheidungen geprägten, aktiven Prozess handelt, der die zu erforschenden Phänomene in wissenschaftliche Objekte überführt: »In Differenz zu […] Repräsentations- bzw. Abbildungsmodellen wird vielmehr betont, dass die Praxis (und auch die entscheidende Leistung) der wissenschaftlichen Arbeit darin besteht, häufig noch undefinierte und diffuse Objekte zu artikulieren und in Tabellen, Bilder, Diagramme oder eben Texte zu übersetzen.« (Gertenbach/Laux 2019, S. 26)

Der Begriff der Inskription erlaubt für unser Vorhaben also, die divergierenden Darstellungs- oder Sichtbarmachungspraxen innerhalb der Fachliteratur nicht als schlichten Mangel einer ergebnisbezogenen Standardisierung zu begreifen. Denn mit der Frage nach der konkreten Verschriftlichung als Ergebnis geht auch immer die Frage nach der Herstellung der jeweiligen Darstellungsform einher, bei der bestimmte Spuren der beobachteten Phänomene herausgegriffen und diesen abhängig vom Erkenntnisinteresse der Forscher*innen eine bestimmte Bedeutung verliehen wird. Erst die Inskription verleiht dem flüchtigen Phänomen die nötige Stabilität und die Eigenschaft einer stabilen Überlieferbarkeit, um es zu einem epistemischen Ding im Sinne von Hans-Jörg Rheinberger (2018, S. 566) und so in bedeutungsvoller Weise begrifflich greifbar und operationalisierbar zu machen: »Der Begriff des Epistemischen verweist auf den fundamentalen Sachverhalt, dass diese Dinge nicht unabhängig von den Mitteln und Medien gedacht werden können, denen sie ihre Manifestation letztlich verdanken.« (Rheinberger 2018, S. 566) Dem Begriff der Inskription möchten wir im Folgenden einen zweiten Begriff zur Seite stellen, der es uns erlaubt, konkrete Schritte dieses wissenschaftlichen prozessualen Handelns in den Blick zu nehmen: die Transkription.

5.2 Inskription und Transkription

Während Latour mit Inskription einen Oberbegriff für die Vielfalt möglicher Transformationen im Vollzug des Forschungsprozesses mit besonderem Blick auf der Vertextlichung bereitstellt, hilft die Theorie der Transkriptivität des Sprach‑, Medien- und Kulturwissenschaftlers Ludwig Jäger, konkrete einzelne Transformationen innerhalb dieses Prozesses genauer zu beschreiben und zu verstehen. Transkription als Handlung begreift Jäger (2004, S. 72) dabei als »Verfahren der intra- und intermedialen Kopplung und Bezugnahme«. Beispiele für solche Kopplungen und Bezugnahmen aus dem wissenschaftlichen Kontext stellen das Zitieren und Paraphrasieren anderer Publikationen ebenso dar wie forschungsprozessinternes Aufgreifen und Transformieren von Audio‑/Videoaufnahmen, Memos, Analysen, visuellen Darstellungsformen usw. zur Erkenntnisgewinnung. Dabei setzen Transkriptionen »immer ein (relatives) Defizit voraus […], das den Bedarf an (anderer) Lesbarkeit entstehen lässt« (Holly 2010, S. 397). Diese Voraussetzung korrespondiert nicht nur mit dem Startpunkt wissenschaftlichen Handelns, der typischerweise in einem Wissens- und Erkenntnisdefizit besteht. Wenn Transkriptionen überdies zugeschrieben wird, dieses Defizit lösen zu können, weist dies außerdem darauf hin, dass sie eben nicht bloß abbildender Natur sind und sein können, sondern stets bedeutungsgenerierend und damit auch -verändernd fungieren (vgl. Jäger 2004, S. 72).

Inwiefern derartige Transkriptionen als Teilhandlungen der Inskription epistemisch sind, d. h. zum Erkenntnisgewinn beitragen, wird an dieser Stelle beispielhaft und idealtypisch am Verlauf eines empirischen Forschungsprozesses veranschaulicht. Wollen Wissenschaftler*innen herausfinden, ob Schimpansen in ihrem natürlichen Lebensraum intentional miteinander kommunizieren, dann reicht es nicht aus, einfach solche Geräusche als Lautäußerungen zu identifizieren, die für die Bearbeitung dieses Erkenntnisinteresses relevant sind – wobei selbst dies schon eine eingreifende und bedeutungsgenerierende Handlung ist. Vielmehr stehen sie vor der Aufgabe, folgende und ggf. weitere Transkriptionen durchzuführen:

  • die als Lautäußerungen identifizierten Geräusche als Daten erheben

  • die erhobenen Daten in geeigneter Form speichern/sichern

  • diese gesicherten Daten für die Analyse aufbereiten und kodieren

  • die aufbereiteten Daten analysieren und dabei die Analyseergebnisse festhalten

  • die Analyseergebnisse für eine Publikation auswählen und aufbereiten

  • die Analyseergebnisse publizieren

Werden diese Aufgaben umgesetzt, wird notwendigerweise transkribiert. Dabei wird ein einmal geäußerter, flüchtiger, sich räumlich verbreiteter Laut technisch erfasst, auf einem Trägermedium in einem geeigneten Format gespeichert, sodass er nicht nur wiederholt abgespielt, sondern auch weitergegeben und innerhalb der Forschungsgruppe verbreitet werden kann. Die Aufnahmen werden geschnitten und somit in der Länge verändert, mittels verschiedener technischer Verfahren analysiert, die Ergebnisse werden erst entsprechend der Vorstellungen der Forschenden, dann gemäß den Möglichkeiten und Vorgaben des anvisierten Publikationsmediums aufbereitet, verschriftlicht und visualisiert, schließlich publiziert und im besten Fall auf verschiedenen Endgeräten oder gedrucktem Papier rezipiert. Aufgrund ihrer Publikationstradition können derartige Handlungen in Summe als ein sukzessiver Prozess verstanden werden, der die konkrete Vertextlichung als Ergebnis hat. Jägers Theorie der Transkriptivität erlaubt es, diese Handlungen zudem als sukzessiven Prozess wiederholter und, wie wir es nennen wollen, epistemischer Transkription zu beschreiben, d. h. als einen Prozess der wiederholten inter- und intramedialen Transformation der in diesem Prozess erfassten, aufbereiteten, analysierten und publizierten Daten. Latours und Jägers Ansätze miteinander verschränkend, begreifen wir die epistemischen Transkriptionen als konkrete Teilhandlungen der Inskription, die sukzessive die Lautäußerungen von Schimpansen »into paper« (Latour 1986, S. 4) transformieren: Erheben, speichern, aufbereiten, analysieren, auswählen und publizieren, umgesetzt mittels der hierzu jeweils notwendigen Inskriptionsmittel, die das Vorhandensein der wissenschaftlichen Objekte bzw. epistemischen Dinge bedingen. Für die Analyse eines solchen Prozesses der Inskription durch wiederholte epistemische Transkription ist entscheidend: »Neutrale Inhalte bzw. Informationen, die gleichsam unversehrt (›originaliter‹) zwischen verschiedenen Medien übertragen werden können, sind nicht denkbar, weil es nur mediale Varianten von Inhalten gibt, für die kein prämediales Original existiert« (Jäger 2010, S. 314). Vielmehr kommen im Zuge jeder der verschiedenen Transkriptionen globale und lokale Verfahren der Bedeutungskonstitution und damit auch der -veränderung zum Einsatz. Unter die globalen Verfahren lassen sich Veränderungen der medialen Bedingungen ebenso fassen wie Veränderungen in Hinblick auf die relevanten Zeichenressourcen (z. B. vom Schallereignis zum Buchstaben). Zu den lokalen Verfahren gehören dann etwa die Fokussierung eines Ausschnitts (vgl. Jäger et al. 2008, S. 303) oder das Versehen dieses Ausschnitts »mit neuen Rahmungen und neuen Adressen und damit mit neuen lokalen Bedingungen ihrer semantischen und ästhetischen Rezipierbarkeit« (Jäger et al. 2008, S. 304, Herv. i.O.). Im besten Fall wird dabei das Ergebnis erreicht, ein »in einer gewissen Hinsicht unlesbare[s] Präskript[]« – in unserem Fall die tierliche Lautäußerung – »in den Status der Lesbarkeit« (Jäger et al. 2008, S. 303) zu versetzen und somit im Forschungsprozess Erkenntnis zu gewinnen. Gerade aufgrund dieser vielfachen epistemischen Transkriptionen, die in der Herstellung, nicht aber notwendigerweise auch im Ergebnis der Inskription sichtbar werden, ist es nicht zulässig, zu behaupten, dass sich die erforschten Tiere, deren Äußerungen und deren sonstiges Verhalten zwischen den Buchdeckeln der Arbeiten, die von ihnen handeln, befinden würden (vgl. Latour 2000a, S. 358). In der Publikation von Schel et al. findet sich also nicht mehr der einmalige, flüchtige, sich im Raum ausbreitende Laut eines Schimpansen wieder, der an andere Schimpansen gerichtet ist (oder auch nicht), sondern das an ein spezifisches menschliches Publikum adressierte epistemische Ding als Ergebnis empirischer Tierforschung, aufbereitet für eine immer wieder rezipierbare digitale Zeitschrift. Wie es dazu gekommen ist, wird im Folgenden genauer dargestellt.

6 »The Budongo Forest Reserve, Uganda (1°35′ and 1°55′N and 31°08′ and 31°42′E)«

Um der Frage nachgehen zu können, wie die Tierlaute im von uns ausgewählten Fallbeispiel in rezipierbare epistemische Dinge transformiert werden, wie sie also in den Text gelangen, oder besser, zu Inskriptionen werden, setzen wir eine Prämisse voraus: Es ist in dem Umfang grundsätzlich möglich, vom Ergebnis auf die Herstellung der Inskription zu schließen, also anhand des rezipierbaren Produktes den Prozess in einigen zentralen Zügen nachzuzeichnen, wie das Ergebnis noch Spuren der Herstellung in sich trägt oder andere Hinweise bereithält. Konkret bedeutet dies, durch eine sorgfältige textinterpretative Rekonstruktion wissenschaftlicher Publikationen einzelne Transkriptionsschritte, verwendete Inskriptionsmittel, forschungsleitende Vorüberlegungen und methodologische Entscheidungen herausarbeiten zu können, anhand derer sich begründete Rückschlüsse auf den epistemischen Transkriptionsprozess ziehen lassen (vgl. Böhnert/Köchy 2021, S. 11). Dies kann im besten Fall eine kontextsensible Ausdeutung der jeweiligen Befunde erlauben – in unserem Fall also ein klareres Verständnis dafür, weshalb Schel et al. dafür argumentieren (können), dass die Alarmrufe der von ihnen erforschten Schimpansen die Schlüsselkriterien für Intentionalität erfüllen.

Mit der Ankunft der Forschungsgruppe im Forschungsareal, der, so lässt sich mit großer Sicherheit vermuten, ein technisch und logistisch zu organisierender Transport von Gütern, Informationen und Personen vorausgeht, wird eine Transformation des Ortes vollzogen. Zwar begeben sich die Forschenden im Kontrast zu Ansätzen der Laborforschung, bei denen die zu untersuchenden Tiere in eine von Menschen gemachte Forschungsumgebung geführt werden, in den Lebensraum der zu untersuchenden Tiere, doch wird durch die eingreifende Umgestaltung des Ortes mit kontrollierbaren Parametern und künstlichen Begegnungssituationen eine Art von Feldlabor realisiert: »the Budongo Forest Reserve, Uganda (1°35′ and 1°55′N and 31°08′ and 31°42′E)« (Schel et al. 2013a, S. 3). Hierdurch überlagern sich der Lebensraum der Schimpansen und der Forschungsort der Forscher*innen, wodurch für eine begrenzte Zeit ein neuer, mehrdimensional verschachtelter Raum entsteht, der nicht mehr mit dem natürlichen Lebensraum der Sonso Community identisch ist.Footnote 7 Spätestens mit dem Platzieren der Schlangenattrappe »under a pile of local leaves and bark just to side of the focal individual’s anticipated travelling path« (Schel et al. 2013a, S. 4) ist auch das Netzwerk menschlicher, tierlicher und technischer Aktanten konstituiert, welches der Forschung als Bedingung der Möglichkeit vorausgeht und gleichzeitig handlungsbestimmender Teil des Forschungsprozesses ist, indem es das gewünschte und zu erforschende Verhalten bewirkt.

Für die Datenerhebung und -sicherung als erste Transkriptionsschritte sind eine ganze Reihe von Inskriptionsmitteln notwendig, die in der vorliegenden Publikation detailliert angeführt werden und so die Rekonstruktion des Herstellungsprozesses erleichtern: Es werden i) Motorola GP340 Handfunkgeräte zur Koordination der Forschenden untereinander eingesetzt (vgl. Schel et al. 2013a, S. 4); ii) Sennheiser ME67 Mikrofone, iii) Marantz PCM661 Aufnahmegeräte und eine iv) nicht weiter spezifizierte Videokamera kommen für die Aufzeichnung der Bewegungen und Lautäußerungen der Schimpansen zum Einsatz (vgl. Schel et al. 2013a, S. 5); v) nicht näher spezifizierte Diktaphone werden von einzelnen Forscher*innen verwendet, um die beobachteten Lautäußerungen in Echtzeit vor Ort zu kommentieren (vgl. Schel et al. 2013a, S. 5); vi) Geräte zum Anfertigen von Fotografien, die zwar nicht explizit im Text erwähnt werden, deren Produkte jedoch in den Supporting Information Files abgebildet sind (vgl. Schel et al. 2013e, S. 8), werden genutzt und schließlich wird vii) ein Kompass angeführt, jedoch nicht zur Navigation, sondern als in den Fotografien festgehaltener Maßstab zum späteren Größenvergleich der je im Versuch sichtbaren Bereiche der Schlangenattrappe (vgl. Schel et al. 2013a, S. 5, e, S. 8). Mindestens diese sieben benannten technischen Aktanten haben in relevanter Hinsicht Teil an den ersten Transkriptionsschritten: Es ist beispielsweise fototechnisch wie elektroakustisch wenig überraschend, dass unterschiedliche Aufnahmegeräte die aufgenommenen Signale unterschiedlich verarbeiten und sichern, oder besser: dass verschiedene Inskriptionsmittel je spezifische Transkriptionen ermöglichen.

Diese erhobenen und gespeicherten Daten – nicht trivial zu bemerken: es handelt sich spätestens von nun an um mediale Varianten der im Budongo Forest Reserve geäußerten Tierlaute – werden anschließend für die softwaregestützte Analyse codiert, d. h. mittels bedeutungsgenerierender Handlungen weiter transkribiert. Dieser Schritt formt aus den vorliegenden Daten weiter jene epistemischen Dinge, welche später als Argument für oder gegen die Erfüllung der titelgebenden Schlüsselkriterien für Intentionalität herangezogen werden können. Denn neben der Codierung von sich auf Raum und Zeit beziehender Bewegungen der Schimpansen – »Focal proximity to the snake«, »Focal looking behaviour«, »Focal Movement« etc. – werden auch die bereits als alarmbezogen charakterisierten Lautäußerungen in drei verschiedene Kategorien eingeteilt: ihrer klanglichen Qualität entsprechend – »Soft Huu (SH)« – onomatopoetisch-referenziell – »Waa Bark (WB)« – und anhand ihrer zugeschriebenen kommunikativen Funktion: »Alarm Huu (AH)« (vgl. Schel et al. 2013a, S. 4).

»To ensure calls were classified correctly, two expert chimpanzee vocal researchers, A[nne Marijke] S[chel] (3 years experience) and K[atie] S[locombe] (10 years experience) independently classified all 1273 focal alarm-related calls that occurred across trials. KS coded the calls blind to the trial type and other behaviour coding. We obtained high agreement on the classification of calls (Cohen’s Kappa = 0,87) and the 78 disagreements all concerned calls from neighbouring classes (SH/AH disagreement = 25; AH/WB disagreement = 53; SH/WB disagreement = 0). KS and AS reviewed all 78 calls where there was disagreement and reached a mutually agreed final classification for these calls, resulting in a final set of 876 SH, 229 AH and 168 WB.« (Schel et al. 2013a, S. 5)

Der kurze Auszug verdeutlicht zwei interessante Punkte mit Blick auf diesen Transkriptionsschritt: Erstens wird klar herausgestellt, dass es für die ›korrekte Klassifizierung‹ nicht einfach nur unspezifischer menschlicher Aktanten bedarf, sondern eben auch solcher mit der spezifischen Fähigkeit, »expert chimpanzee vocal researchers« zu sein. Diese Fähigkeit wird ausschließlich an der mehrjährigen Erfahrung der genannten Forscherinnen festgemacht – 3 Jahre respektive 10 Jahre. Diese Bezugnahme auf persönliche Erfahrungswerte einzelner Subjekte ist nicht völlig ungewöhnlich in dem Forschungsfeld der Schimpansenforschung,Footnote 8 ist aber dennoch außergewöhnlich für einen Forschungsansatz, der großen Wert auf die Reproduzierbarkeit, Wiederholbarkeit und Objektivität legt:Footnote 9 An keiner zweiten Stelle wird auf die Individualität der Forscher*innen Bezug genommen. Ganz im Gegenteil, es wird eine gewisse Entsubjektivierung dieser vorgenommen, indem etwa die die Beobachtung durchführenden Mitglieder der Forschungsgruppe durchnummeriert als Observer 1 bis 4 bezeichnet werden oder in einer grafischen Darstellung der Versuchsanordnung die Forscher*innen als arbiträre Symbole (Asterisk) dargestellt werden, während für die zu beobachtenden Schimpansen und die verwendete Schlangenattrappe eine ikonische Darstellungsform (Zeichnung) verwendet wird (vgl. Schel et al. 2013a, S. 4).

Zweitens wird transparent gemacht, dass die Klassifizierung der Lautäußerungen nicht eineindeutig verläuft, sondern Zweifelsfälle bestehen – selbst, wenn dies nur bei 78 von 1273 Lautäußerungen der Fall ist –, was die aktive (Bedeutungs‑)Zuschreibung im Zuge dieses Transkriptionsschrittes unterstreicht. Denn nicht nur bei der Klärung dieser Zweifelsfälle – die Forschungslogik scheint Mehr- und Uneindeutigkeiten auszuschließen – sind forschungspraktische (vermutlich kommunikative) und damit immer auch epistemische Entscheidungen zu treffen. Die so kodierten Daten von Lautäußerungen, Körperbewegungen und Blickrichtungen werden im nächsten Transkriptionsschritt softwaregestützt analysiert. Die hierzu verwendeten Inskriptionsmittel finden im Artikel erneut explizit Erwähnung: Observer XT 10.0, Noldus Information Technology (vgl. Schel et al. 2013a, S. 5), Matman Software Package (version 1.1, Noldus Information Technology) (vgl. Schel et al. 2013e, S. 3) und PASW 18 Statistik-Software (vgl. Schel et al. 2013a, S. 7).

Über die von Jäger und Latour eher technisch-medial beschriebenen Transkriptionsschritte und Inskriptionsmittel hinaus, erachten wir eine weitere, eher theoretisch-methodologische Komponente des epistemischen Transkriptionsprozesses für relevant: die vorausgesetzten theoretischen Überlegungen dazu, was eigentlich unter den beiden zentralen Begriffen der Intentionalität und Kommunikation innerhalb des konkreten Forschungsansatzes verstanden wird. Dies ist in zweierlei Hinsicht epistemisch relevant: Einerseits, weil diese Vorüberlegungen der Diskussion und Interpretation der wiederholt epistemisch transkribierten und als Inskription vorgelegten Tierlaute den nötigen Rechtfertigungsrahmen liefern, um sie als Argumente für oder gegen die Zuschreibung von Intentionalität zu verwenden (Context of Justification). Denn darüber, ob die Schimpansen über Intentionalität verfügen oder nicht, kann die Empirie Auskunft geben. Was jedoch unter Intentionalität zu verstehen ist, lässt sich nicht empirisch erfassen. Andererseits bestimmen diese Vorüberlegungen aber auch, was es im Budongo Forest Reserve überhaupt zu beobachten gilt, welches tierliche Verhalten es als Bestandteil kommunikativer und intentionaler Akte zu transkribieren gilt (Context of Discovery). Diese Selektionsentscheidungen für eine bestimmte Theorie und damit auch stets gegen alternative theoretische Ansätze sind Teil des charakteristischen, individuellen Forschungsprofils – der methodologischen Signatur (vgl. Böhnert 2020) – eines Ansatzes und wir möchten diese als eine Art nicht medial-technisches Inskriptionsmittel begreifen. Analog zu den technischen Inskriptionsmitteln – für die ebenfalls gilt, dass man sich aus guten Gründen für diese und gegen andere entschieden hat – sind auch die theoretisch-methodologischen Inskriptionsmittel im Text explizit benannt: Schel et al. (2013a, S. 1) berufen sich auf die Theorie intentionaler Systeme des Philosophen Daniel Dennett und auf die Bedeutungstheorie von Paul Grice.Footnote 10

Nachdem wir den Herstellungsprozess anhand einzelner Transkriptionsschritte und verwendeter Inskriptionsmittel nachgezeichnet haben, möchten wir nun das Ergebnis dieses Prozesses beleuchten: die im publizierten Artikel sichtbar gemachten Tierlaute.

Es finden sich verschiedene Transkripte als Ergebnisse verschiedener Transkriptionen nebeneinander, die sich in vier Kategorien einteilen lassen.

  • Audiovisuell. In zwei Videoaufzeichnungen (*.AVI) sind Schimpansen zu sehen und es ist die tierliche Lautrealisierung zu hören (vgl. Schel et al. 48,49,f, g). Dabei handelt es sich laut Beschreibung in Video S1 (Dauer: 00:08 min) um ein Soft Huu, in S2 (Dauer: 00:11 min) um ein Waa Bark (vgl. Schel et al. 2013a, S. 9). In den Videos realisiert zudem eine menschliche Person, die von der Kamera nicht visuell erfasst ist, mehrere Laute mit dem ihr zur Verfügung stehenden menschlichen Sprechapparat. In Video S1 ist dabei eine weibliche, in Video S2 eine männliche menschliche Stimme zu hören.

  • Auditiv: In drei Audioaufzeichnungen (*.WAV) sind drei tierliche Lautrealisierungen zu hören (vgl. Schel et al. 44,45,46,b, c, d). Dabei handelt es sich laut Beschreibung in Audio S1 (Dauer: 00:01min) um ein Soft Hoo, in Audio S2 (Dauer: 00:01 min) um ein Alarm Hoo und in Audio S3 (Dauer: 00:01 min) um ein Waa Bark (vgl. Schel et al. 2013a, S. 9). Das Klangbild dieser Audioaufzeichnungen ist nicht mit dem der Audiospur der Videoaufzeichnungen identisch.

  • Graphisch (schriftlich): Im publizierten Text sind die tierliche und menschliche Lautrealisierung in Buchstabenschrift (onomatopoetisch) wiedergegeben und schriftlich weiter charakterisiert, etwa mit Blick auf die kommunikative Funktion, die Äußerungsqualität, die Dauer und die Frequenz.

  • Graphisch (bildlich): Die Ergebnisse einer spektrographischen Analyse dreier tierlicher Lautrealisierungen, die als Soft Huu, Alarm Huu und Waa Bark bezeichnet werden, werden als Bilddateien wiedergegeben. Das Ergebnis liegt dabei zugleich in vier verschiedenen Dateiformaten vor (*.PDF, *.PPT, *.PNG, *.TIFF) (vgl. Schel et al. 2013a, S. 3). Die bildliche Darstellung bildet dabei den Ausgangspunkt für eine ergänzende schriftliche Charakterisierung und Differenzierung.

Varianzen in der tierlichen Lautrealisierung finden sich bereits zwischen den audiovisuellen und auditiven Verfahren. Hinzu kommt in den Videoaufzeichnungen die Reproduktion des tierlichen Lautes durch menschliche Personen (»huuing«). Auch dies stellt bereits eine Form epistemischer Transkription dar, weil die menschliche Person den gehörten tierlichen Laut damit als für die Forschung relevant setzt und somit bereits vor Ort zu einem epistemischen Ding formt.

Die Varianzen im graphischen Bereich gehen über die Erfassung verschiedener Lautrealisierungen hinaus. Indem im Rahmen der graphisch-bildlichen Darstellung auf verschiedene Dateiformate zurückgegriffen wird, kommen verschiedene Verfahren der Speicherung und Komprimierung zum Einsatz. Die verschiedenen Darstellungsformen desselben Analyseergebnisses sind aufgrund des Einsatzes verschiedener technischer (transkriptiver) Verfahren daher nicht identisch. Während in diesen Fällen die Varianzen vor allem Details betreffen, die erst bei starker Vergrößerung sichtbar werden, treten bei der Transkription der Lautrealisierungen in Buchstabenschrift die Varianzen offenkundiger zu Tage. Diese schriftsprachlichen Transkriptionen sind dabei mit der Benennung der Laute eng verbunden. So erhält der tierliche Laut, der im Fokus der Analyse steht, wechselweise den zweiteiligen Namen Alarm Huu oder Alarm Hoo (auch: AH) (Schel et al. 2013a, S. 3). Er ist somit zugleich adjektivisch und onomatopoetisch charakterisiert. Weitergehend sind auch der Soft Huu (auch: Soft Hoo oder SH) sowie der Waa Bark (auch: WB) schriftsprachlich transkribiert und zweiteilig benannt (Schel et al. 2013a, S. 3). Indem die Reproduktion durch einen Menschen einteilig als huuing (Schel et al. 2013a, S. 9) bezeichnet wird, wird damit eine eindeutige Abgrenzung von der tierlichen Lautrealisierung vorgenommen.

Die Qualität der tierlichen Laute wird über die zweiteilige Benennung hinaus schriftsprachlich beschrieben (vgl. Schel et al. 2013a, S. 3). Im Rahmen dieser Beschreibung finden sich wiederum direkte Verweise auf das visualisierte Ergebnis der spektrographischen Analyse oder die beigefügten Audiodateien. Dabei verweisen Schel et al. auf Varianzen in der Lautrealisierung der Waa Barks: »They typically start with a low frequency ›w‹ introduction at call onset, followed by considerable frequency modulation in the subsequent higher frequency element that can sound like an ›aa‹ ›aow‹ or ›aoo‹ sound to the human ear.« (Schel et al. 2013a, S. 3)

Dem offenkundig reflektierten Umgang mit den Transkripten zum Trotz sind kein klares Regelwerk der Transkription und keine Systematik zu bemerken, wann welche Variation im Text verwendet wird – obgleich dies ja einer der zentralen Kritikpunkte der Forschungsgruppe an der bestehenden Fachliteratur ist. Auch bleibt angesichts der mehrsprachigen Forschungsgruppe unklar, in welche Sprache hinein überhaupt transkribiert wird. Anzunehmen ist, dass die Laut-Graphem-Zuordnung in einem freien onomatopoetischen Verfahren erfolgt, bei dem, wie bereits in Kapitel 4.2 gezeigt, in großem Umfang individuelle Unterschiede bei der Transkription zu erwarten sind, zumal nicht in einer Lautschrift (z. B. IPAFootnote 11), sondern unter Verwendung der Buchstaben des Alphabets transkribiert wird und, selbst wenn die Zielsprache bekannt wäre, nicht von einer eindeutigen Graphem-Phonem-Korrespondenz ausgegangen werden kann.

Dass vor diesem Hintergrund der Laut Soft Huu/Soft Hoo/SH mit schriftlich transkribierten Lautrealisierungen, wie sie in anderen Artikeln des Forschungsdiskurses zu finden sind, verglichen wird, ist bemerkenswert: »These soft calls […] are comparable with the ›huu vocalizations‹ described by Goodall [11] as well as the alert hoos reported in Crockford et al. [10]« (Schel et al. 2013a, S. 3). Dies ist insbesondere auffällig, weil Goodalls (1986) als gedruckter Text publizierte Arbeit nicht im selben Umfang ergänzende audiovisuelle, auditive und grafisch-visuelle Transkripte enthält. Auffällig ist hierbei zudem, dass Schel et al. den von ihnen identifizierten Laut Soft Huu/Soft Hoo/SH und den von Catherine Crockford, Roman M. Wittig, Roger Mundry und Klaus Zuberbühler (2012) identifizierten Alert Hoo als vergleichbar auffassen. Anders als Crockford et al. weisen sie aber nicht diesem Laut per Namensgebung das kommunikative Handlungsziel ›Alarmgeben‹ zu, sondern einem anderen Laut, nämlich dem als Alarm Huu/Alarm Hoo/AH bezeichneten. Soft Huu/Soft Hoo/SH (Schel et al. 2013a) und Alert Hoo (Crockford et al. 2012) mögen deshalb zwar Ähnlichkeit auf der Ausdrucksseite aufweisen, inhaltsseitig unterscheiden sie sich aber grundlegend.Footnote 12 Aus semiotischer Perspektive muss deshalb davon ausgegangen werden, dass es sich offenkundig nicht um dieselben sprachlich-kommunikativen Zeichen handelt.

7 Textbezogenes Fazit

Wie die Analyse zeigen konnte, binden Schel et al. die in der Publikation thematisierten Laute unterschiedlicher modaler und kodaler Form in den Text. Zum Einsatz kommen neben schriftsprachlichen Transkripten Video‑, Audio- und Grafikdateien. Zur Beschreibung der verschiedenen Laute wird dabei auf die verschiedenen Darstellungsformen verwiesen. Die lautbezogene Wissensmodellierung im Text erfolgt somit hochgradig multimodal.

Mit Blick auf die schriftsprachliche Transkription ist kein Regelwerk und keine klare Systematik zu erkennen. Unklar ist außerdem, wer genau die Transkriptionen aus welcher menschlichen Sprache heraus in welche menschliche Sprache hinein vorgenommen hat. Wie relevant diese Aspekte für das Ergebnis der Transkription ist, konnte mit Verweis auf ältere Forschung gezeigt werden.

Im Text wird nur auf eine Auswahl von Lauten eingegangen. Diese Laute erhalten Namen, wobei diese stets zwei Elemente aufweisen. Sie bestehen aus einem onomatopoetischen (insbesondere »Huu«, »Hoo«, »Waa«) und einem weiteren Element, das durch die Qualität des Lauts (»soft«), eine Assoziation zu anderen Tierarten (»bark«) oder die zugeschriebene kommunikative Funktion (»alarm«) motiviert ist. Die Reihenfolge dieser Elemente unterscheidet sich von Namen zu Namen. Die menschliche Wiederholung eines Lauts wird nicht in gleicher Weise benannt und enthält lediglich das onomatopoetische Element (»huuing«). So ist auf schriftsprachlicher Ebene eine deutliche Trennung der tierlichen und menschlichen Lautrealisierung zu erkennen.

Ob andere tierliche Laute im Forschungsprozess vergleichbar transkribiert wurden, sowie wann und wie die Entscheidung darüber getroffen worden ist, bleibt offen. So lässt sich festhalten, dass bereits durch die Auswahl, mehrfache Transkription und Namensgebung einzelner Laute in der Publikation der Forschungsergebnisse genau diesen Lauten von den beteiligten Forscher*innen die Bedeutung zugeschrieben wird, für die Forschung bedeutsam bzw. relevant zu sein. Wenngleich also Strategien der Vereindeutigung am Ausgangspunkt der Forschung stehen, die darauf ausgerichtet sind, Mehrdeutigkeiten und interpretatorische Unsicherheiten in der menschlichen Begegnung mit den Schimpansen einzuhegen, entsteht am vorläufigen Endpunkt der Forschung eine neue Mehrdeutigkeit: Denn gerade in den hierzu angewandten Verfahren epistemischer Transkription wird neue Bedeutung generiert und somit ein Mehr an Deutungsmöglichkeiten erzeugt, das dem erforschten Phänomen in seinen lebenspraktischen Kontexten zunächst nicht zukommt. Ganz unabhängig davon, wie erfolgreich die Vereindeutigungsstrategien der Forschung sind, lässt sich also überlegen, ob Mehrdeutigkeiten – am Anfang sowie am Ende der Forschung – überhaupt überwunden werden können oder ob Forschung stattdessen unweigerlich zu einer Veränderung oder Verschiebung von Mehrdeutigkeiten beiträgt.

8 Epistemisches Fazit

So wenig, wie sich die Schimpansen in den wissenschaftlichen Texten befinden, von denen diese handeln, so wenig befinden sich deren Laute in diesen. Der Titel unseres Aufsatzes führt also in die Irre, denn auch wenn die Tierlaute im Forschungsprozess von zentraler Relevanz sind, sind sie – wie wir gezeigt haben – weder unbedingter Ausgangspunkt noch Ergebnis des Forschungsprozesses. Was sich hingegen in den Texten befindet, sind epistemische Dinge: Es sind nicht intentionale (oder nicht-intentionale) Lautäußerungen, hervorgebracht von einzelnen Schimpansen, adressiert an andere Schimpansen, um diese vor einer (vermeintlichen) Gefahr zu warnen. Sondern Alarm Huus und War Barks als Objekte des wissenschaftlichen Interesses, hervorgebracht und mit Bedeutung versehen in einem sukzessiven Prozess wiederholter, iterierender epistemischer Transkriptionen eines Netzwerks menschlicher, tierlicher und technischer Aktanten, adressiert an Forscher*innen, um als Argument in einer fortlaufenden Debatte zum naturgeschichtlichen Ursprung der menschlichen Sprache zu dienen. Entsprechend schwenkt der Fokus im Fazit des Artikels von Schel et al. weg von der Erforschung der Schimpansen aus der Sonso Community, hin zu einer genuin anthropologischen Debatte:

»We have shown that AH and WB production is sensitive to the composition of the audience and that these calls are directed at specific individuals and goaldirected. We therefore conclude that some chimpanzee vocal signals qualify as intentional signals, in contrast to the traditional characterisation of great ape vocal behaviour as an inflexible, reflexive, involuntary, zero-order intentional process. We believe that our findings are inconsistent with central arguments of gestural theories of language origins and instead support a multimodal origin for human language.« (Schel et al. 2013a, S. 9)

Es lässt sich vor diesem Hintergrund durchaus fragen: Weshalb wird überhaupt der dargelegte Transkriptionsaufwand zur Sichtbarmachung der Lautäußerungen betrieben, wenn auch ohne eine feindifferenzierte Zuordnung von Lautäußerungen in Verbindung mit den beobachtbaren Körperbewegungen und Blickrichtungen für Intentionalität argumentiert werden könnte? Eine mögliche Antwort mag diese sein: Der epistemische Transkriptionsprozess umspannt einen fortschreitenden Akt der Bedeutungsausformung. Begonnen beim Identifizieren, Erheben und Sichern von Daten, über deren Aufbereitung und Kodierung bis zur Auswahl und Publikation bestimmter als besonders überzeugend und eindeutig erachteter Fälle sollen die Inskriptionen letztlich zeigen, was der Text nur sagen kann (vgl. Latour 1987, S. 47).

»[S]o much energy and time is devoted by scientists […] [since] the cost of dissenting increases with each new collection, each new labelling, each new redrawing. This is especially true if the phenomena we are asked to believe are invisible to the naked eye; quasars, chromosomes, brain peptides, leptons, gross national products, classes, coast lines« – und zu dieser Reihung lassen sich auch geistige Vermögen von Schimpansen zählen – »are never seen but through the ›clothed‹ eye of inscription devices. Thus, one more inscription […] might be enough, all things being equal, to swing the balance of power and turn an incredible statement into a credible one which would then be passed along without further modification. The importance of this cascade of inscriptions may be ignored when studying events in daily life, but it cannot be overestimated when analyzing science and technology.« (Latour 1986, S. 17, Herv. i.O.)

Die epistemischen Transkriptionsschritte, die als Inskriptionen in die wissenschaftlichen und auch gesellschaftlichen Debatten einfließen, haben weitreichende Konsequenzen: Abhängig davon, in welche Richtung die im Zitat angesprochene Machtbalance schwingt, ob Schimpansen anhand ihrer Lautäußerungen Intentionalität zugeschrieben wird oder nicht, muss die Frage nach der anthropologischen Differenz, die die Forschung immer begleitet, neu verhandelt werden. Auch die Frage nach Formen des Geistes, nach möglichen Unterschieden zwischen menschlichem und tierlichem Geist, muss neu diskutiert werden. Und letztlich hat eine solche Zuschreibung auch ethische Konsequenzen, zumindest bei jenen Ansätzen, in denen der moralische Status eines Individuums von dessen Vermögen abhängt und insbesondere intentionale Zustände wie Überzeugungen, Hoffnungen und Wünsche eine moralische Berücksichtigung nahelegen.