1 Conceptual Issues

In Literature, Measured hat Franco Moretti  das revolutionäre Potenzial der Digitalen Literaturwissenschaft in einer „radicalization of our relationship to concepts“ verortet.Footnote 1 Damit wiederholt er seine Prognose, nach der „the encounter of computation and criticism“ und also die Arbeit nach dem „measurement“-Paradigma in der Literaturwissenschaft vorerst nicht zu einem „change“ der Literaturgeschichte, sondern zu einem „change“ der „theory of literature“ führen werde:

I assumed, like so many others, that the new approach would change the history, rather than the theory of literature; and, ultimately, that may still be the case. But as the logic of research has brought us face to face with conceptual issues, they should openly become the task of the day countering the pervasive clichés on the simple-minded positivism of digital humanities. Computation has theoretical consequences – possibly, more than any other field of literary study. The time has come, to make them explicit.Footnote 2

Was im Folgenden, einige Studien der dlina-ArbeitsgruppeFootnote 3 rekapitulierend, dargelegt wird, ist zugleich bekräftigender wie problematisierender Kommentar zu dieser Prognose. Auch in der dlina-Arbeitsgruppe waren wir, „like so many others“, am Beginn unserer Studien zur Netzwerkanalyse von Dramen der Überzeugung, bald einen neuen Blick auf die Geschichte der deutschsprachigen Dramatik vom Anfang der Aufklärung bis in die Frühe Moderne zu gewinnen. Und auch wir sind im Zuge unserer Analysen ins Rabbit Hole der „conceptual issues“ gefallen, die eine Eigendynamik entwickelt haben, die theoretische Konsequenzen haben könnte – Konsequenzen für die Weise, wie die Digitale Literaturwissenschaft Begriffsarbeit und -politik betreibt, Konsequenzen also nicht nur für die Verwendung, sondern auch für die Einführung und Definition, für die Positionierung und Profilierung von Begriffen, bei der die Digitale Literaturwissenschaft etwa vor der Frage steht, wie sie mit ihrem experimentellen, spielerischen, möglicherweise häretischen Potenzial umgehen soll.Footnote 4

Worin könnte ein solches häretisches Potenzial der Begriffsarbeit in digital-empirischen Studien liegen? Auf den ersten Blick sicher in jener Forschungslogik, die auch andere empirische Wissenschaften prägt und die aus Sicht einer vornehmlich qualitativen Forschung als bloßer Reduktionismus, aus Sicht einer quantitativen Forschung hingegen als ein, sagen wir: fröhlicher Reduktionismus erscheinen muss. Gegenüber den traditionell „holistischen Phänomenerfahrungen des Literaturwissenschaftlers“Footnote 5 sind die systematisch in ihrer Reichweite eingeschränkten Aussagen, die in der digital-empirischen Analyse erarbeitet werden, dürftig. Diese Dürftigkeit als Chance für eine Phänomenerkenntnis von bisher ungekannter empirischer Güte und bemerkenswerter Exaktheit zu begreifen, ist, denke ich, begründendes Moment der als häretisch empfundenen Fröhlichkeit zahlreicher Arbeiten aus der Digitalen Literaturwissenschaft.Footnote 6

Für Moretti jedoch sind diese empirische Güte sowie die Präzision der Aussagen in der digital-empirischen Analyse nebensächlich. Die Provokation, die die ‚Computerisierung‘ sowie die damit einhergehende transparente und quantifizierende Operationalisierung von Begriffen für die Literaturwissenschaft darstellt, liege, so Moretti, nicht darin, dass bisher unscharfe Aussagen durch exakte Messungen präzisiert werden. „[I]f this is all measurement can do, then its role within literary study will only be a limited and ancillary one; making existing knowledge somewhat better, but not really different.“Footnote 7

Bemerkenswert ist nun, dass Moretti darauf verzichtet, ein Argument anzuführen, das an dieser Stelle zu erwarten ist, weil Moretti selbst es in seinen Distant-Reading-Studien kultiviert hat: das Argument der Large Scale, des „great unread“.Footnote 8 Denn die Operationalisierung von Begriffen im Sinne des Measurement-Paradigmas führt nicht nur zu einem neuen Grad von Exaktheit, sie ermöglicht auch die Ausweitung des Begriffsgebrauchs auf große, praktisch unlesbare Korpora. Während die bisher in der Literaturwissenschaft übliche Begriffsarbeit den Gebrauch der Begriffe an einen intransparenten und argumentationsaufwendigen hermeneutischen Prozess delegiert, lassen sich die nach dem Measurement-Paradigma operationalisierten Begriffe automatisiert anwenden. Dass der begriffsintensionale Reduktionismus der digital-empirischen Analyse insofern das Potenzial hat, die begriffsextensionalen Begrenztheiten der üblichen literaturwissenschaftlichen Praxis zu überwinden, ist dementsprechend ein verbreitetes Argument für die Digitale Literaturwissenschaft. Moretti sieht die „radicalization of our relationship to concepts“ jedoch weder darin, dass die digital-empirische Analyse die tradierten Begriffe formalisiert, reduziert, abbaut, also empirisch dekonstruiert (was ja tatsächlich das Verhältnis zu den Begriffen ändert, da ein wesentlicher Teil der Begriffsarbeit nun auf die Formulierung von strikten Regeln und Arbeitsschritten für den konkreten Gebrauch entfällt), noch darin, dass sie deren Anwendbarkeit durch Automatisierung ausweitet.

Worin die Provokation, die von der Begriffsarbeit der Digitalen Literaturwissenschaft ausgehen könnte, Moretti zufolge liegt, lassen die Beispiele erahnen, die er im sechsten Pamphlet anführt. So erwägt er unterschiedliche Operationalisierungen für den Begriff des Protagonisten, wobei seine Analysen zu einer Verschiebung des Fokus führen, der sich vom ‚Protagonisten‘ hin zu einem allgemeinen Konzept von Zentralität bewegt, was ihn zu einem Umbau in der literaturwissenschaftlichen Begriffshierarchie veranlasst („the ‚protagonist‘ […] is only a special instance of the more general category of ‚centrality‘Footnote 9). In einem anderen Beispiel spielt Moretti Operationalisierungen des Begriffs der ‚tragischen Kollision‘ über die „most distinctive words“ durch, wobei er sich aufgrund der Ergebnisse zu einer Korrektur Hegels veranlasst sieht („this time, god forgive me, the mistake was Hegel’s“Footnote 10).

In beiden Fällen ist es keineswegs so, dass Moretti bestehende Begriffe explizit verwirft, vielmehr wird die Operationalisierung zum Motor einer Begriffsdynamik, die zur Verschiebung der Begriffe oder, so im Fall der Zentralität, zur Einführung neuer, flankierender Begriffe führt.Footnote 11 Dabei wird die Operationalisierung als Motor dieser Begriffsdynamik unter anderem durch die Logik der Programme angetrieben, an die der Begriffsgebrauch im Zuge der Operationalisierung teilweise delegiert wird. Ins Spiel kommt damit, so Moretti, „the programming imagination“: „a form of thinking that fuses together the formulation and the operationalization of concepts, leaving them often half-implicit as concepts, while liberating their full force as algorithms.Footnote 12 Zentralität, wie Moretti sie im sechsten Pamphlet diskutiert, ist so ein Fall: Als literaturwissenschaftlicher Begriff (noch) vage, diffus, als netzwerkanalytischer Algorithmus hingegen präzise bestimmt.

Morettis Überlegungen gewinnen an Kontur, wenn man zwei Szenarien der digital-empirischen Begriffsarbeit in der Literaturwissenschaft einander gegenüberstellt: Beim ersten Szenario steht zunächst ein tradierter Begriff, für den eine digital-empirische Operationalisierung entwickelt wird; dann wird geprüft, wie gut diese Operationalisierung den Begriff ‚abbildet‘ (etwa durch den Vergleich mit hermeneutischen Begriffsverwendungen und die Angabe von Precision und Recall), was gegebenenfalls zu einer Korrektur der Operationalisierung führt. Auch wenn eine vollständige ‚Abbildung‘ in den meisten Fällen unmöglich sein wird, ist das Ziel doch eine möglichst adäquate Operationalisierung. Im zweiten von Moretti umkreisten Szenario stehen zu Beginn zwar auch ein tradierter Begriff und dessen digital-empirische Operationalisierung. Dann jedoch übernimmt die Operationalisierung die Führung. Sie wird nicht durch die stete Rückkopplung an den tradierten Begriff justiert, ihre Eigendynamik wird freigesetzt, was auch bedeutet, der Logik der verwendeten Algorithmen (im engen Sinne von Programmen wie im weiten Sinne von definierten Arbeitsschritten) zu folgen. Dies führt zu einer Art Concept Trouble: etwa zu einer Verschiebung des Begriffs, zum Auftauchen neuer Begriffe oder zu einer Proliferation, zu einer Wucherung von Begriffen und zu einem Abdriften in andersartige terminologische Umwelten, in denen sich die eigene Arbeit zu bewegen, zu behaupten, zu erklären hat.

Die beiden Studien aus dem dlina-Projekt,Footnote 13 die im Folgenden referiert werden, können zeigen, wie sich ein solches Abdriften vollzieht. Getrieben durch den methodischen Ansatz dieses Projekts, die formale Netzwerkanalyse, deren Zugriff auf die Objekte sich mit gegenstandsspezifischen Fragen und Begriffen vermengte, emergierten in diesen beiden Studien Begriffe, die in der Literaturwissenschaft bisher fremd sind. Wie das geschehen konnte, legen die beiden Studien dar, die in Abschn. 3 und 4 referiert und in Abschn. 5 kommentiert werden. Zuvor werden in Abschn. 2 einige Voraussetzungen dargelegt.

2 Modellierung und Preprocessing

Die Netzwerkanalyse beschreibt ihren Gegenstand (oder anders gesagt: sie konstituiert ihr ‚epistemisches Ding‘) als eine Struktur aus Elementen und Relationen (auch: Knoten/Nodes und Kanten/Edges). Sowohl Elemente als auch Relationen können mit quantitativen wie qualitativen Attributen versehen werden; Relationen können darüber hinaus gerichtet oder ungerichtet sein. Netzwerke lassen sich als Graphen visualisieren und mathematisch beschreiben.

Gegenstand der Netzwerkanalyse in der dlina-Arbeitsgruppe sind dramatische Texte, derzeit aus der deutsch-, der französisch- und der russischsprachigen Literatur, wobei es im Folgenden um deutschsprachige Dramen gehen wird. Das deutschsprachige Korpus, das in den beiden Studien untersucht wurde und 465 Dramen aus der Zeit 1731 bis 1929 umfasst, haben wir auf Grundlage des TextGrid Repository erstellt,Footnote 14 wobei wir die Daten aus diesem Repositorium noch einmal regelbasiert überarbeitet haben.Footnote 15 Derzeit bauen wir das Korpus vollständig neu auf.Footnote 16 Die im Folgenden referierten Ergebnisse beziehen sich jedoch noch auf das sog. dlina-Corpus 15.07.

Die Netzwerke, die wir aus den dramatischen Texten extrahiert haben, setzen als Elemente die Figuren eines Dramas, sofern diese Figuren innerhalb des Dramas einen Sprechakt vollziehen, d. h. sofern sie in der TEI-Struktur der Datei innerhalb eines <speaker>-Tags als Sprecher ausgewiesen werden. Als Relation zwischen zwei Figuren haben wir eine bestimmte Form der ‚Interaktion‘, die wir ‚szenische Kopräsenz‘ nennen, definiert: Eine solche ‚szenische Kopräsenz‘ und damit eine Relation zwischen zwei Figuren liegt demnach dann vor, wenn beide Figuren innerhalb eines durch die Struktur des Dramas vorgegebenen Segments (d. h. in der Regel: innerhalb einer Szene bzw. eines Auftritts; liegt keine Szenen- bzw. Auftritt-Unterteilung vor, wurde der Akt bzw. der Aufzug als Segment angesetzt) jeweils mindestens einen Sprechakt vollziehen.

Selbstverständlich gibt es ‚reichere‘ Optionen der Modellierung dramatischer Texte als Netzwerke. So wird bei unserer Operationalisierung von ‚Interaktion‘ nicht erfasst, ob Figuren tatsächlich miteinander sprechen. Auch die Ebene der Konfiguration wird von unserer szenen-, im Einzelfall sogar aktbasierten Segmentdefinition ignoriert. Schon die Art, wie der Untersuchungsgegenstand modelliert wird, ist also ein Beispiel für den fröhlichen Reduktionismus – mit all seinen Nachteilen und Vorteilen.

Präzise beschreiben ließen sich mit den Daten, die nach dieser Modellierung mithilfe des von Christopher Kittel und Frank Fischer entwickelten Tools dramavisFootnote 17 erhoben wurden, einige basale Entwicklungen in der Dramengeschichte, denen sich die ersten Analysen der Arbeitsgruppe widmeten. Berechnet wurde z. B. die Netzwerkgröße, also die Menge der Elemente in einem Netzwerk, d. h. die Figurenanzahl pro Drama, wobei in Abb. 1 jeweils für die Dramen einer Dekade der Median sowie die Standardabweichung dargestellt sind. Ebenfalls berechnet wurde der Average Degree: Dessen Grundlage ist der Degree jeder Figur (also hier die Anzahl der Relationen einer Figur zu anderen Figuren); der Average Degree eines Dramennetzwerks ist dann der Mittelwert der Degrees sämtlicher Figuren eines Dramas. Auch hier wurden Mediane und Standardabweichung pro Dekade gebildet (Abb. 2).

Abb. 1
figure 1

Netzwerkgröße der Dramen im dlina-KorpusFootnote

Median und Standardabweichung pro Dekade.

Abb. 2
figure 2

Average Degree der Dramen im dlina-KorpusFootnote

Median und Standardabweichung pro Dekade.

Die untersuchten Dramennetzwerke werden im Verlauf der Jahrhunderte nicht nur insgesamt umfangreicher (Abb. 1), die Figuren interagieren im Durchschnitt auch mit einer größeren Anzahl anderer Figuren (Abb. 2). Das hatten wir erwartet. Der Zeitraum, den das untersuchte Korpus abdeckt, ist nicht zuletzt eine Phase der umfassenden Modernisierung der Gesellschaft, einhergehend mit einem entsprechenden Komplexitätszuwachs sowie einer Ausdifferenzierung sozialer Beziehungen. Dass Literatur mit diesen sozialen Transformationsprozessen irgendwie interagiert (sie ‚abbildet‘, sie ‚widerspiegelt‘, sie ‚reflektiert‘, sich zu ihnen ‚homolog verhält‘ etc.), ist ein Basistheorem nicht nur von sozialgeschichtlich orientierten Literaturtheorien.

Auch die meisten Schwankungen in den Medianen waren wenig überraschend, so der Anstieg der Kurven in der zweiten Hälfte des 18. Jahrhunderts, in dem sich der Übergang vom Drama der Frühaufklärung u. a. zum sozialen Drama des Sturm und Drang abzeichnet; oder, in Hinblick auf die Netzwerkgröße, die ersichtlichen Spitzen in den 1810er, 1820er und 1830er Jahren, in denen sich die große Rolle des Historischen Dramas zeigt; oder das Absacken der Netzwerkgröße in und nach den 1840er Jahren, ein erwartbarer Effekt des Rückzugs ins Private in Folge der gescheiterten Revolution; sowie das in beiden Diagrammen zu beobachtende, erneute Absacken der Kurven in den 1890er Jahren, in denen die naturalistische Dramatik sowie andere, avantgardistische Experimente für kleine Off-Bühnen zu verorten sind.

Die Kurven der Standardabweichung differenzieren dieses Bild etwas: Das Ansteigen und Abfallen der Kurven deutet darauf hin, dass es wiederholt zu Phasen der Ausdifferenzierung der Dramen in umfangreichere und beschränktere Typen kommt, auf die dann jeweils eine Phase der Homogenisierung folgt, so etwa – mit Blick auf die Netzwerkgröße – in den Jahren 1750 bis 1780, in denen der Typus des offenen Dramas zunächst langsam an die Seite des Dramas der Aufklärung tritt, das dann später verschwindet. Ähnliche Entwicklungen lassen sich beim Average Degree in den 1760 und 1770er Jahren oder 1810er und 1820er Jahren ausmachen. Starke Ausschläge, wie der bei der Netzwerkgröße in den 1830er Jahren, führen dabei das Auftreten von Extremtypen, in diesem Fall der Grabbe-Dramen Napoleon und Hannibal sowie Goethes Faust II, vor Augen (und machen zudem die dann doch beschränkte Größe des untersuchten Korpus deutlich).

Zu den Diagrammen lassen sich ohne Weiteres Literaturgeschichten erzählen. Diese sind allerdings bekannt; das Wissen besteht bereits und wird auf die Daten angewendet.Footnote 20 Ganz überraschungsfrei ist das nicht, in der Regel aber lässt sich, was zunächst als Überraschung erscheint, durch Eigenarten der Korpuszusammensetzung erklären,Footnote 21 womit sich wiederum das ‚alte‘ Wissen durchsetzt. Das bedeutet nicht, dass solche datengestützten Wiedererzählungen bekannter Literaturgeschichten unbefriedigend sind. Und doch gilt hier der oben bereits angeführte Schluss Morettis: „[I]f this is all measurement can do, then its role within literary study will only be a limited and ancillary one; making existing knowledge somewhat better, but not really different.“Footnote 22

3 Small Worlds

Eine andere Dynamik gewannen die Arbeiten im dlina-Projekt erst etwas später, als wir die strukturelle Komposition der Dramen in den Blick nahmen. Diese war bereits einmal in den Vorstudien zum dlina-Projekt adressiert worden, dort ausgehend von der in der Literaturwissenschaft etablierten typologischen Unterscheidung in eine offene und geschlossene Form des Dramas, wie sie Volker Klotz in den 1960er Jahren entwickelt hat.Footnote 23 Klotz’ typologische Begriffe sind multidimensional angelegt, sie umfassen u. a. die Aspekte ‚Handlung‘, ‚Zeit‘, ‚Raum‘ usw. Daneben thematisiert Klotz aber auch den Aspekt ‚Komposition‘, dessen Bestimmungen sich gut für die quantitative Operationalisierung eignen. Ein Beispiel für eine dieser Operationalisierungen sei hier angeführt:

Geht man davon aus, dass im offenen Drama eine Figur „[f]ast in jeder neuen Szene […] anderen Personen gegenüber[steht]“, von diesen anderen Personen bzw. Figuren jedoch viele „nur in einer einzigen Szene auf[treten]“, dann ist zu erwarten, dass eine oder wenige Figuren (z. B. das von Klotz so genannte ‚zentrale Ich‘) in relativ vielen Beziehungen stehen, mithin einen hohen Degree aufweisen, wohingegen zahlreiche Figuren (die von Klotz so genannten ‚atmosphärischen Figuren‘) in relativ wenigen Beziehungen stehen, mithin einen niedrigen Degree aufweisen. Diese Streuung der Degrees im offenen Drama müsste sich dabei in einer relativ hohen Standardabweichung (Standard Deviation, SD) niederschlagen.Footnote 24

Neben diesem Indikator wurden drei weitere formuliert und schließlich exemplarisch anhand von vier Dramen auf ihre Anwendbarkeit überprüft. Goethes Drama Götz von Berlichingen erwies sich, ganz im Sinne von Klotz, als Prototyp der offenen Form (die Standardabweichung der Degrees war hier z. B. 7,14), wohingegen sich Goethes Iphigenie auf Tauris als Prototyp der geschlossenen Form zeigte (Standardabweichung der Degrees: 0).Footnote 25 Erneut war es wie erwartet. Erneut war das Wissen im Grunde unverändert geblieben.

Doch die von Klotz ausgehende typologische Analyse war ein Einfallstor für eine Analyseperspektive auf die Dramen, die im Verlauf der weiteren Untersuchung etwas anderes erkennbar werden ließ. Die in der oben angeführten Operationalisierung verwendete Analyse der „Streuung der Degrees“, so zeigte sich, war in der Netzwerkanalyse ein übliches Verfahren. Zur Anwendung kam sie auch dort im Kontext der Typologisierung von Netzwerken: als Node Degree Distribution (NDD). Eine bestimmte Form der NDD, konkret eine NDD mit Power-Law-Verteilung, gilt als Kriterium für sog. Scale-Free-Netzwerke.Footnote 26 Scale-Free-Netzwerke werden als eine spezifische Variante von Small-World-Netzwerken begriffen. Und mit diesem in der Netzwerktheorie seit einem Artikel von Duncan J. Watts und Steven H. Strogatz etablierten Begriff begann das Abdriften des dlina-Projekts;Footnote 27 die im Zuge der Studie zu Klotz’ Typen bereits erfolgte Operationalisierung lockte gewissermaßen in ein Rabbit Hole, in dem eine ganz neue Begriffswelt wartete.

Im Zentrum dieser Begriffswelt steht die Small World.Footnote 28 Auf ihr Vorkommen hin (sowie auf das der spezifischen Variante, des Scale-Free-Netzwerks), so war das Ziel der Studie, sollte das dlina-Korpus untersucht werden, was auch deshalb sinnvoll erschien, weil dieser Typus von Watts und Strogatz als „widespread in biological, social and man-made systems“Footnote 29 – und warum also nicht auch in der Literatur – charakterisiert wurde.Footnote 30 Small-World-Netzwerke (Abb. 3b) sind in Relation zu zwei anderen Netzwerktypen definiert: das reguläre (Abb. 3a) und das Random-Netzwerk (Abb. 3c). Charakteristisch für ein Small-World-Netzwerk sind zwei Eigenarten: Erstens gibt es in Small Worlds kleinere, dicht verbundene Bereiche, sogenannte Cliquen oder Cluster (Abb. 4). Zweitens sind diese Cluster untereinander nur selten direkt verbunden, sondern zumeist vermittelt durch einige sehr zentrale Knoten, sogenannte Netzwerkhubs (Abb. 5).

Abb. 3
figure 3

a. Reguläres Netzwerk (links) – Small World (Mitte) – Random-Netzwerk (rechts) b. Small World c. Random-Netzwerk

Abb. 4
figure 4

Beispiel für ein Charakteristikum von Small-World-Netzwerken – Cliquen

Abb. 5
figure 5

Beispiel für ein Charakteristikum von Small-World-Netzwerken – zentrale Knoten (Hubs)

Die Eigenarten lassen sich quantifizieren. Watts und Strogatz definieren Small Worlds als Klasse von Netzwerken, die „highly clustered, like regular lattices“ sind (und damit stark von Random-Netzwerken abweichen), „yet have small characteristic path lengths, like random graphs“.Footnote 31 Die Werte zu Abb. 3a bis 3c veranschaulichen dies (s. Tab. 1). Die beiden Kriterien wurden für die Analyse folgendermaßen formuliert:

Tab. 1 Exemplarische Werte (C und APL) für ein reguläres Netzwerk (links), ein Small-World-Netzwerk (Mitte) und ein Random-Netzwerk (rechts)
  • Kriterium 1: Der Clustering Coefficient (C) des beobachteten Netzwerks, also des jeweiligen Dramen-Netzwerks, ist signifikant höher als der C eines entsprechenden Random-Netzwerks.

  • Kriterium 2: Die Average Path Length (APL) des beobachteten Netzwerks weicht nicht signifikant ab von der APL eines entsprechenden Random-Netzwerks.

Um auch nach dem spezielleren Typus der Scale-Free-Netzwerke zu fragen, wurde zudem ein drittes Kriterium formuliert, das zusätzlich eine Power-Law-Verteilung der NDD verlangt, die als Differentia Specifica dieses Netzwerk-Typs gilt.Footnote 32 Vereinfacht bedeutet eine Power-Law-Verteilung dabei, dass es sehr wenige Figuren mit einem sehr hohen Degree – also sehr wenige sehr gut vernetzte Figuren – gibt und zugleich sehr viele Figuren mit einem sehr geringen Degree. Erfüllt war dieses Kriterium dann, wenn

  • Kriterium 3: die Node-Degree-Distribution sich am besten (im Sinne des höchsten Bestimmtheitsmaßes R2) mit einer Power Law-Regression beschreiben ließ.

Im Folgenden wurden das dlina-Korpus auf diese Kriterien hin überprüft. Zunächst wurde jedes der 465 Dramen-Netzwerke randomisiert, wobei – mittels einer Implementierung im dramavis-Tool – zu jedem Netzwerk nach dem Erdős-Rényi-Modell (‚G(n, M)‘ Model) 1000 Random-Netzwerke berechnet und dann die Mittelwerte für CC und für APL dieser Random-Netzwerke erhoben wurden. Damit waren die Tests auf die Kriterien 1 und 2 möglich. Dafür wurde jeweils der Quotient aus dem CC bzw. dem APL des beobachteten Dramen-Netzwerks und des Mittelwerts für das tausendfach randomisierte Netzwerk berechnet. Daraufhin wurden einfache Signifikanztests durchgeführt: Zunächst wurden diejenigen Dramen-Netzwerke ausgewählt, deren CC signifikant von den CC des randomisierten Netzwerks abwichen, bei denen der berechnete Quotient also bemerkenswert hoch war (Grenze für die Signifikanz war ‚Mittelwert + 2 × Standardabweichung‘). Im Ergebnis erfüllten 23 Dramen aus unserem Korpus dieses Kriterium 1 (vgl. Tab. 2). Im anschließenden Schritt wurden aus diesen 23 Dramen all jene aussortiert, bei denen eine signifikante Abweichung von der APL der randomisierten Netzwerke vorlag (Grenze für die Signifikanz war ‚Mittelwert + /− 2 × Standardabweichung‘)Footnote 33 – sechs Dramen schieden infolgedessen aus, sodass 17 Dramen übrig blieben, die sowohl Kriterium 1 als auch Kriterium 2 erfüllten und insofern als Small Worlds gelten können (vgl. Tab. 2). In einem letzten Schritt erfolgte die Überprüfung dieser 17 Dramen auf das Scale-Free-Kriterium 3. Dabei erwies sich, dass sich lediglich bei fünf Dramen die NDD am besten mit einer Power-Law-Verteilung beschreiben lässt (vgl. Tab. 2).

Tab. 2 Ergebnisse des Tests auf die drei Kriterien

Im Grunde war unsere Analyse damit erfolgreich beendet. Es ließen sich tatsächlich sowohl Small-World-Netzwerke als auch die spezielleren Scale-Free-Netzwerke in unserem Dramen-Korpus finden. Und es war keineswegs so, dass wir damit lediglich Dramen mit einem besonders großen Umfang des Personals, also mit vielen Figuren, identifiziert hatten, wie ein Blick auf Abb. 6 und 7 zeigt, bei denen jedes Kreuz für ein Drama steht: mit dem Erscheinungsdatum auf der Abszisse und der Netzwerkgröße (Figurenanzahl) auf der Ordinate. Auch wenn, was wir erwartet hatten, Small-World- und Scale-Free-Strukturen gehäuft bei größeren Dramen auftreten, scheinen sie doch eine davon unabhängige Eigenart bestimmter Dramen zu sein, deren Erscheinen im Fall der Scale-Free-Netzwerke auch noch historisch auf die Goethe-Zeit beschränkt ist (vgl. Abb. 7). Darüber hinaus identifizierten die Analysen auffällig viele Faust-Dramen (4 von 17) sowie ebenso viele Zauberspiele bzw. Zauberpossen (Nestroy, Gleich, die beiden Raimund-Dramen) als Small Worlds. Allerdings erschöpfte sich unsere Klassifizierung nicht in diesen beiden genreartigen Textgruppen. Was aber hatten wir dann eigentlich gemessen, was für einen Dramen-Typus hatten wir identifiziert?

Abb. 6
figure 6

17 Small-World-Netzwerke im dlina-Korpus

Abb. 7
figure 7

5 Scale-Free-Netzwerke im dlina-Korpus

Zu dem Concept Trouble, der sich bei der Reflexion über diese Frage einstellte, gehört, dass wir immer wieder zurückgeworfen wurden auf die Einsicht, dass es eben dramatische Small Worlds sind, die wir identifiziert hatten. Sicher, die Struktur eines Small-World-Dramas lässt sich mit tradierten dramenästhetischen Begriffen, wie dem ‚zentralen Ich‘,Footnote 34 in Verbindung bringen (vgl. noch einmal Abb. 6); auch finden sich in ihr weitere Aspekte der dramatischen Tektonik der offenen Form, die Klotz beschrieben hat, etwa die „Streuung des Geschehens“,Footnote 35 wie sie sich in den Clustern der Small Worlds abzeichnet. Doch geht die dramatische Small World in diesen tradierten Begriffen und Beschreibungen nicht auf. Zum unvertrauten Charakter dessen, was mit dem Begriff beobachtet wird, trägt zudem bei, dass die dramatische Small World ein Konstrukt ist, das auf der spezifischen Modellierung der Netzwerke über die szenische Kopräsenz basiert. Der verwendete Small-World-Begriff bezeichnet also keineswegs etwa eine bestimmte Art der ‚objektiven Sozialstruktur‘ in der dargestellten Welt, sondern eine Weise der ästhetischen Inszenierung von Figureninteraktion auf der Bühne. In die hier analysierte Struktur der Dramen-Netzwerke sind, anders gesagt, Effekte der dramatischen Komposition – z. B. auch der Handlungsführung, die veranlasst, dass eine Figur mit dieser oder jener anderen Figur zusammentrifft – eingeflossen.

Diese Reflektionen machen deutlich, dass es schwerfällt, den Begriff der dramatischen Small World und also die Ergebnisse unserer Analysen in tradiertes literaturwissenschaftliches Wissen zu integrieren, zu unvertraut sind die Gegenstandsmodellierung und die Begriffsoperationalisierung, die zugrunde gelegt wurden. Entstanden sind stattdessen zunächst einmal neue Informationen über literarische Texte, von denen unsicher ist, ob ihnen der Status literaturwissenschaftlichen Wissens zugeschrieben werden kann, wobei eine solche Zuschreibung letztlich Mechanismen der disziplinären Anerkennung und Anschlusskommunikation voraussetzen würde. Das provokative Potenzial jenes Concept Troubles, den man bei Moretti angedeutet findet, liegt aber womöglich darin, die Frage, ob und wie man sich noch im disziplinären Horizont der Literaturwissenschaft bewegt, für den Moment zu suspendieren – und sich von der Eigenlogik der Operationalisierung, der Programme und der Methoden noch weiter treiben zu lassen, ohne die Reflexion über die Beziehung zu den tradierten Konzepten aufzugeben.

Im Fall der Small World-Studie bedeutete das, dass wir in einem weiteren Schritt genauer auf die Node Degree Distribution blickten, die in das Kriterium 3 eingeflossen war. Im Rahmen der Studie war ein spezifischer Typus dieser NDD identifiziert worden: die Power-Law-Verteilung, bei der es wenige Figuren gibt, die mit sehr vielen anderen Figuren szenisch kopräsent sind, und sehr viele Figuren, die mit wenigen anderen Figuren szenisch kopräsent sind, so wie bei Goethes Götz der Fall (Abb. 8a und 8b). Aber was für andere Degree-Verteilungen gibt es? Was für andere, so könnte man auch fragen, Typen der quantitativen Strukturierung des Personals lassen sich in den Dramen des dlina-Korpus finden?

Abb. 8
figure 8

a. Graph zu Goethe: Götz (1773) b. NDD-Diagramm zu Goethe: Götz (1773)

Die Abb. 10a bis 13 zeigen Graphen und NDD-Diagramme von drei weiteren Typen der quantitativen Strukturierung des Personals, die sich – nach der Funktion der Regressionslinie, die die Verteilung mit dem höchsten Bestimmtheitsmaß beschreibt – als quadratische Verteilung (Abb. 9a und 9b), als polynomische (4. Grad) bzw. quartische Verteilung (Abb. 10a und 10b) und als umgekehrte Power-Law-Verteilung (Abb. 11a und 11b) bezeichnen lassen.

Abb. 9
figure 9

a. Graph zu Hebbel: Maria Magdalene (1844) b. NDD-Diagramm zu Hebbel: Maria Magdalene (1844)

Abb. 10
figure 10

a. Graph zu Schiller: Die Räuber (1781) b. NDD-Diagramm zu Schiller: Die Räuber (1781)

Abb. 11
figure 11

a. Graph zu Mühsam: Judas (1921) b. NDD-Diagramm zu Mühsam: Judas (1921)

Gegenüber dem Small-World-Konzept sind diese Verteilungstypen deutlich schlichter definiert; und was sie zeigen, ist vermutlich auch deutlich ‚griffiger‘ für den literaturwissenschaftlichen Diskurs, so etwa wenn man das Drama des großen Individuums,Footnote 36 also Goethes Götz (Abb. 8a und 8b), und dessen aristokratische Struktur mit dem Drama der Masse und dessen, wie man sagen könnte: kommunistischer Struktur vergleicht, wie sie sich in Erich Mühsams ‚Arbeiterdrama‘ Judas zeigt (Abb. 11a und 11b). Zudem erweist sich die Analyse der Degree-Verteilung als deutlich kompatibler zu vorliegender Fachterminologie, insbesondere zu Manfred Pfisters Analysekategorie der „quantitativen Dominanzrelation“,Footnote 37 in die sie einfließen könnte. Und vielleicht bedarf die Idee der Small World ja einer solchen Zerlegung in ihre Bestandteile bzw. Kriterien, um wiederum literaturwissenschaftlich anschlussfähig zu werden, jedenfalls im Sinne eines fröhlichen Reduktionismus, aus dem nicht unbedingt neue, aber sicher quantitativ-empirische Begriffe der Haupt-, der Neben-, der Episoden-Figuren usw. hervorgehen könnten.Footnote 38 Das Irritationspotenzial des Small-World-Begriffs, der den Diskurs auf befremdende Weise öffnet für eine allgemeine Strukturphänomenologie anthropogener Netzwerke, wäre damit allerdings vom Tisch.

4 Change Rates

Die Betrachtung von literarischen Texten als Netzwerke hat, das zeigen etwa auch vergleichsweise unbefriedigende Versuche der Genreklassifikation mittels Netzwerkmaßen,Footnote 39 etwas Kontraintuitives, was nicht zuletzt an der ‚strukturalistischen Intuition‘Footnote 40 der Netzwerkanalyse und dem damit einhergehenden Zug zur formalen Abstraktion liegt, der den Gegenstand der Analyse stärker hermeneutisch verfremdet als bedeutungsbezogene Verfahren wie die Stylometrie oder das Topic Modeling. Auch deshalb spitzt sich das provokative Potenzial der digital-empirischen Begriffsarbeit bei Verfahren der Netzwerkanalyse zu: Sind die Berechnungen etwa des Clustering Coefficients oder der Average Path Length, selbst bei entsprechender Toleranz gegenüber der Quantifizierung, wirklich angemessene Operationen angesichts ästhetischer Artefakte?

Diese offene Frage ist ein Motor jener Pendelbewegung im dlina-Projekt, die uns nach dem vorläufigen Ende der experimentellen Small-World-Studie zurück zu einem reichen literaturwissenschaftlichen Begriff brachte – und von dort, dem Sog der netzwerkanalytischen Eigenlogik ebenso folgend wie der „programming imagination“, wieder ins Rabbit Hole der Operationalisierung fallen ließ.

Dass die Netzwerkanalyse das (provokative) Potenzial bergen könnte, einen neuen Ansatz zur Plot Analysis zu offerieren, hatte Moretti bereits im Titel seines zweiten Pamphlets angekündigt, um dann das Scheitern an diesem Anspruch effektvoll zu inszenieren.Footnote 41 Ein Grund für dieses Scheitern schien uns, als wir uns der Frage nach der Plot Analysis zuwandten, offensichtlich: Moretti hatte, wie auch wir bis dahin, statische Netzwerke betrachtet. Plot jedoch, wie immer man diesen Begriff konkret versteht, hat eine temporale Dimension: „the repeated attempts to redefine parameters of plot reflect both the centrality and the complexity of the temporal dimension of narrative“, heißt es bei Hilary Dannenberg;Footnote 42 und Karin Kukkonen versteht Plot als ein Konzept zur Beschreibung der „progressive structuration“ von Texten.Footnote 43 Nicht Struktur also, sondern Strukturierung, nicht statische Netzwerke, sondern dynamische. Eine solche Analyse dynamischer Netzwerk – Dynamic Network Analysis – hat bereits eine Tradition, deren Anfänge unter anderem in der Analyse von Terrornetzwerken liegen.Footnote 44 Inspiriert von diesen Analysen und den dort implementierten Algorithmen begannen wir, für die Dramen in unserem Korpus zahlreiche Werte zu berechnen: den Central Character Entry Index, den All-in Index, das Final Scene Size Measure oder die Drama Change Rate. Die meisten Werte waren dabei von einfachen literaturwissenschaftlichen Fragen abgeleitet: Wann tritt die Figur mit den höchsten Zentralitätswerten das erste Mal auf (Central Character Entry Index)? Wann war jede Figur mindestens einmal auf der Bühne (All-in Index)? Wie viele Figuren des Personals treten in der letzten Szene auf (Final Scene Size Measure)? Die Drama Change Rate hingegen war rein netzwerkanalytisch, wenn nicht algorithmisch inspiriert. Sie war es, die im Folgenden eine besondere Dynamik entwickelte.

Die Drama Change Rate, wie wir sie netzwerkanalytisch definieren, ist ein Maß für die Veränderung der Teilmenge des Personals, das sich in den vorgegebenen Segmenten eines Dramas (hier in der Regel Szenen bzw. Auftritte) auf der Bühne befindet. Grundlage für die Berechnung der Drama Change Rate ist die Segment Change Rate, die beschreibt, wie sich die Menge der auf der Bühne präsenten Teilmenge des Personals zwischen zwei aufeinanderfolgenden Segmenten verändert. Berechnet wird hier eine modifizierte Levenshtein-Distanz, die zwischen zwei Segmenten die Editieroptionen ‚delete‘ und ‚add‘, also ‚Abtritt einer Figur‘ und ‚Auftritt einer Figur‘, zulässt. Betrachtet man etwa die erste und die zweite Szene von Goethes Iphigenie auf Tauris, dann ist in der ersten Szene nur Iphigenie auf der Bühne; in der zweiten Szene sind es Iphigenie und Arkas. Die Segment Change Rate beträgt in diesem Fall 0,5: Es liegt ein Edit vor, bei einer Gesamtmenge von zwei involvierten Figuren: 1/2 = 0,5 (vgl. Abb. 12). Die Segment Change Rate zwischen zweiter und dritter Szene von Goethes Drama beträgt 0,66. Es finden zwei Edits statt; drei Figuren sind insgesamt involviert: 2/3 = 0,66 (Abb. 13). Die Segment Change Rate ist normalisiert; sie bewegt sich stets zwischen 0 (= keine Änderungen der Figuren auf der Bühne) und 1 (= sämtliche Figuren werden zwischen den Segmenten ausgetauscht).

Abb. 12
figure 12

Berechnung der Segment Change Rate, Beispiel 1

Abb. 13
figure 13

Berechnung der Segment Change Rate, Beispiel 2

Aus sämtlichen Segment Change Rates eines Dramas wird die Drama Change Rate berechnet, für die es zwei Varianten gibt: Die Drama Change Rate (Mean) gibt den Mittelwert an, die Drama Change Rate (SD) die Standardabweichung. Diese Werte wurden im Folgenden für 331 Dramen aus dem dlina-Korpus erhoben, wobei die Reduktion der Korpusgröße sich daraus ergibt, dass die Analysen auf Dramen mit mehr als fünf Segmenten beschränkt wurden. Die entsprechenden Ergebnisse erwiesen sich als historisch weitgehend unauffällig, eindeutige Trends zeichneten sich nicht ab, wie Abb. 14 und 15 zeigen, in denen jedes Kreuz für ein Drama steht (Abszisse: Erscheinungsdatum; Ordinate: Wert für Drama Change Rate [Mean] bzw. für Drama Change Rate [SD]) und die Linien den Mittelwert für alle Dramen eines Zeitraums von jeweils 20 Jahren.

Abb. 14
figure 14

Drama Change Rate (Mean) – Verteilung im dlina-KorpusFootnote

Linie: Mittelwert pro 20 Jahre.

Abb. 15
figure 15

Drama Change Rate (SD) – Verteilung im dlina-KorpusFootnote

Linie: Mittelwert pro 20 Jahre.

Auffälliger als die historische war die typologische Verteilung, zeigen doch beide Diagramme, dass es zahlreiche Dramen mit extremen Werten gibt. Deren Betrachtung macht es möglich, eine Typisierung vorzunehmen, bei der jeweils Dramen mit besonders hohen und mit besonders niedrigen Werten als Typen angesetzt werden. Die Eigenart dieser vier Dramen-Typen lässt sich dabei anhand der von uns sog. Beat Charts darstellen: Das sind Diagramme, die die Entwicklung der Segment Change Rate im Verlauf des Dramas auftragen (durchgehende Linie) und zugleich den Wert für die Segment Change Rate (Mean) in einer horizontalen gepunkteten Linie markieren.

Der erste Typ (Abb. 16a, 16b, 16c und 16d), das hochdynamische Drama, zeichnet sich durch eine besonders hohe Drama Change Rate (Mean) aus; typisch ist hier, dass im Übergang von einem Segment zum nächsten ein großer Teil der Figurenmenge wechselt. Bei Extremtypen wie Goethes Egmont (Abb. 16a) wird – mit Ausnahme einer Szene – tatsächlich bei jedem Segmentübergang die gesamte Figurenmenge ausgetauscht.

Abb. 16
figure 16

a. Goethe: Egmont (1788) – Mean: 0,99 / SD: 0,02 b. Grabbe: Napoleon (1831) – Mean: 0,98 / SD: 0,03 c. Tieck: Verkehrte Welt (1800) – Mean: 0,95 / SD: 0,08 d. Goethe: Götz (1773) – Mean: 0,90 / SD: 0,17

Der zweite Typ (Abb. 17a, 17b, 17c und 17d), das niedrigdynamische Drama, zeichnet sich demgegenüber durch eine sehr niedrige Drama Change Rate (Mean) aus; typisch ist hier, dass stets nur ein (kleiner) Teil der Figurenmenge wechselt, mitunter bleibt die Figurenmenge beim Segmentübergang sogar identisch (vgl. die Nullwerte). Die Beispiele, die hier für diesen Typ angeführt sind, weisen dabei eine durchgängige liasion des scenes auf, was auch daran liegt, dass dieser Typ vor allem aus Ein- (Abb. 17a und 17b) bzw. Zweiaktern (Abb. 17c und 17d) besteht.

Abb. 17
figure 17

a. Goethe: Der Bürgergeneral (1793) – Mean: 0,40 / SD: 0,18 b. Stephanie: Der Schauspieldirektor (1786) – Mean 0,38 / SD: 0,14 c. Benedix: Die Hochzeitsreise (1849) – Mean: 0,38 / SD: 0,13 d. Rilke: Ohne Gegenwart (1898) – Mean: 0,22 / SD 0,22

Mit dem dritten Typ (Abb. 18a, 18b, 18c und 18d) richtet sich die Aufmerksamkeit auf die Drama Change Rate (SD), wobei eine hohe Standardabweichung das starkrhythmische Drama charakterisiert. Typisch ist hier, dass die Menge der Figuren, die beim Übergang von einem Segment zum folgenden ausgetauscht wird, stark variiert: Mal werden, wie im ersten Beispiel zu sehen (Abb. 18a), sämtliche Figuren ausgetauscht (die durchgezogene Linie berührt den oberen Rand des Diagramms), mal keine (die durchgezogene Linie berührt den unteren Rand), was zu einer starken Rhythmisierung führt.

Abb. 18
figure 18

a. Benkowitz: Die Jubelfeier der Hölle (1801) – Mean: 0,68 / SD: 0,33 b. Goethe: Faust I (1808) – mean: 0,64 / SD: 0,33 c. Büchner: Leonce und Lena (1838) – Mean: 0,70 / SD: 0,33 d. Dulk: Die Wände (1848) – Mean: 0,54 / SD: 0,37

Beim vierten Typ schließlich (Abb. 19a, 19b, 19c und 19d) – zu dem auch einige der Dramen des ersten Typs, allen voran Goethes Egmont zu zählen sind –, dem schwachrhythmischen Drama, liegt eine sehr niedrige Drama Change Rate (SD) vor. Typisch ist hier, dass stets der tendenziell gleiche (normalisierte) Anteil der Figurenmenge ausgetauscht wird, prototypisch umgesetzt im ‚Reigen‘-Prinzip von Schnitzlers gleichnamigen Drama (Abb. 19a), bei dem – mit Ausnahme des Übergangs zur letzten Szene – stets zwei Figuren auf der Bühne sind, wobei beim Szenenwechsel eine dieser Figuren abtritt und eine neue hinzutritt.

Abb. 19
figure 19

a. Schnitzler: Der Reigen (1902) – Mean: 0,68 / SD: 0,03 b. Thoma: Die Medaille (1901) – Mean: 0,35 / SD: 0,07 c. Schnitzler: Anatol (1893) – Mean: 0,71 / SD: 0,08 d. Uhland: Ludwig der Bayer (1819) – Mean: 0,92 / SD: 0,08

Die vier Extremtypen konturieren einen fünften Typ, den man als Normaltyp – mit moderater Dynamik und moderater Rhythmik – bezeichnen kann (Abb. 20a, 20b, 20c und 20d) und der sowohl bei der Drama Change Rate (Mean) als auch bei der Drama Change Rate (SD) nah an den entsprechenden Mittelwerten für das Gesamtkorpus liegt.Footnote 47

Abb. 20
figure 20

a. Gottsched: Die Pietisterey (1736) – Mean: 0,64 / SD: 0,20 b. Schiller: Wallensteins Tod (1799) – Mean: 0,65 / SD: 0,22 c. Ganghofer: Der Herrgottschnitzer (1880) – Mean: 0,65 / SD: 0,23 d. Sudermann: Der Bettler von Syrakus (1911) – Mean: 0,66 / SD: 0,21

Ein Grund für diese spezifische quantitative Charakteristik des Normaltyps zeigt sich, wenn man in den Beat Chart die Aktgrenzen einträgt, wie – in Form vertikaler Linien – in Abb. 21 bei Ludwig Ganghofers ‚Volksschauspiel‘ Der Herrgottschnitzer von Ammergau geschehen. Hier wird deutlich, dass in diesem Drama Extremausschläge nach oben häufig mit Aktgrenzen zusammenfallen, bei denen es in der klassischen Dramenästhetik zu Ortswechseln oder (geringfügigen) Zeitsprüngen und, damit einhergehend, einem vollständigen Austausch der Figuren kommen darf, wohingegen innerhalb der Akte das Prinzip der liasion des scenes dominiert.

Abb. 21
figure 21

Ganghofer: Der Herrgottschnitzer (1880) – mit Aktgrenzen (vertikale Linien)

Dieser Beobachtung könnte nun systematisch nachgegangen werden: Wie schreiben sich Aktgrenzen in die Drama Change Rate ein? Weiterfragen ließe sich dann, ob sich bei klassisch segmentierten Dramen (also, sagen wir: Dramen mit fünf- oder dreiaktiger Struktur und aktinterner Szenenunterteilung) bestimmte Charakteristika von Akten beschreiben lassen, etwa Akte, die typischerweise besonders dynamisch bzw. besonders rhythmisch ausfallen; oder typische Formen der Dynamik bzw. Rhythmik im ersten Akt, die womöglich mit unterschiedlichen Expositionstypen in Verbindung gebracht werden könnten.

Einer solchen Vertiefung der Analysen sei an dieser Stelle jedoch die Reflexion vorgeschaltet. Denn was mit der Frage nach einer netzwerkanalytischen Operationalisierung von Plot begann, mündete – getrieben von der Idee der ‚progressiven Strukturation‘, dem Maß der Drama Change Rate und den Beat-Chart-Diagrammen – in einer unvertrauten Beschreibungsweise, von der sich, wie bei der Small-World-Studie, in tradierten literaturwissenschaftlichen Begriffen nicht recht sagen lässt, was sie eigentlich beschreibt.

5 Vier Irritationen

Was folgt aus dieser begrifflichen Heimatlosigkeit, in die sich beide Studien sehenden Auges manövriert haben und die sich als eine der „theoretical consequences“ erweist, die aus diesem „encounter of computation and criticism“ folgt? Eine Strategie, sich dieser Frage nach den Konsequenzen zumindest vorerst zu entziehen, bestünde in einer Rhetorik des Aufschubs: Noch stehen diese digitalen Textanalysen am Anfang, noch bedarf es der systematischen Anwendung der Begriffe und Verfahren auf größere Korpora, noch bedarf es der Verfeinerung der Operationalisierungen und der Algorithmen, bedarf es der tieferen Auszeichnung der Texte; und es bedarf noch der gründlichen und aufmerksamen Interpretation der Daten, die im Zuge all der Begriffserprobungen und Korpuserkundungen gewonnen wurden und werden. All diese ‚Nochs‘ sind nicht von der Hand zu weisen, jedenfalls mit Blick auf die beiden Studien aus dem dlina-Projekt, die hier referiert wurden. Nicht auszuschließen ist dabei, dass einige der Erprobungen und Erkundungen sich in diesem Zustand des ‚Nochs‘ erschöpfen werden – gefangen im (selbstgegrabenem) Rabbit Hole der „programming imagination“, wo sie schon bald dem Vergessen anheimfallen werden, ähnlich einiger Vorgängerarbeiten, in deren Tradition das dlina-Projekt verortet werden kann.Footnote 48

Die zu Beginn dieses Essays eingeführte Position von Moretti schert sich allerdings nicht um ein solch mögliches Schicksal, sie besteht auf einer Suspension des Zukünftigen und damit auf einer Ignoranz gegenüber jenen Versprechen auf kommendes Wissen, die in all den ‚Nochs‘ stecken. Stattdessen fordert sie in einer Art metaisierender Verschiebung dazu auf, das, was im Zuge all der zukunftsungewissen Studien geschieht, als konzeptuelle Umbauten am Begriffsgebäude der Literaturwissenschaft zu beobachten und zu reflektieren.

Vier Erfahrungen, vier Irritationen seien hier, daran anschließend, festgehalten.

Dass, erstens, Zahlen für die Begriffsarbeit der digitalen Analyse literarischer Texte eine mindestens ebenso große Rolle spielen wie Bedeutungen, ist trivial. Dass statistische Operationen den Bedeutungskern der Begriffe dominieren, ist dennoch bemerkenswert: Die Begriffe der Digitalen Literaturwissenschaft sind in Teilen aufgelöst in spezifische Maßzahlen, in Measures. Die dramatische Small World z. B. definiert sich über zwei netzwerkanalytische Maße, die (einfachen) Signifikanztests unterzogen werden. Im Zuge dessen wird eine tausendfach randomisierte Variante des formalisierten ästhetischen Objekts ‚Drama‘ zum Vergleich herangezogen. Diese statistische Durchdringung der Begriffe, und also der Objekte, hat Konsequenzen: Zum einen führt sie eine relationale Logik in die Begriffsverwendung ein. Begriffe können nur dann auf Objekte angewendet werden, wenn die Daten zu diesen Objekten auf eine definierte, formalisierte Weise in signifikanter Differenz o. Ä. zu den Daten stehen, die zu anderen Objekten erhoben wurden: wenn etwa der Clustering Coefficient eines Dramennetzwerks signifikant vom Clustering Coefficient der randomisierten Variante dieses Dramennetzwerks abweicht. Diese relationale, statistisch infiltrierte Logik von Begriffsanwendungen, wie sie etwa auch der auf Ähnlichkeitsmaßen basierenden Arbeit mit generischen Begriffen zugrunde liegtFootnote 49 (von den aktuellen Machine-Learning-basierten Ansätzen ganz zu schweigen), ist ein Effekt, dessen theoretische Konsequenzen zu reflektieren sind. Zu diesen Konsequenzen gehört, zum anderen, auch, dass die Anwendung von Begriffen stets eine Bezugsgröße erfordert. Im Fall der Small World-Studie wie im Fall der Change Rate-Typologisierung ist dies das Korpus, dessen Teil das einzelne Objekt ist. Anders gesagt: Der Begriff der dramatischen Small World kann auf Goethes Götz nur in Bezug auf das dlina-Korpus angewendet werden, zu dem dieser Text hinsichtlich der entscheidenden Werte in signifikanter Abweichung steht. Und ein Change Rate-Normaltypus wie Ganghofers Herrgottschnitzer ist ‚normal‘ zunächst nur innerhalb jenes Korpus, zu dem es in Bezug gesetzt wurde. Damit aber erweist sich die statistische Durchdringung der Begriffsarbeit in der Digitalen Literaturwissenschaft wesentlich geprägt durch eine numerische, an quantifizierten Ähnlichkeits-, Abstands- oder Differenzmaßen orientierte Variante der Logik aus Norm und Abweichung.Footnote 50 Und als zutiefst durchdrungen von jenen literaturwissenschaftlichen Fragen der Korpusbildung, die in jüngerer Zeit unter dem Titel ‚Wertung und Kanon‘ diskutiert werden.

Im Grunde bereits impliziert im ersten Punkt ist, zweitens, eine radikale ‚Anästhetisierung‘ der Objekte – also der literarischen Kunstwerke – im Zuge der Begriffsarbeit. Selbst dort, wo es, wie in den dlina-Studien, um Aspekte der Komposition geht, verschwindet das ästhetische Objekt, weil es im Distant Reading der Erfahrbarkeit als literarisches Werk konstitutiv entzogen ist. Eine ähnliche Anästhetisierung lässt sich für den Stil-Begriff beobachten.Footnote 51 Dabei bedeutet die Anästhetisierung des Objekts keineswegs, dass dieses nicht in seinem spezifischen Artefakt-Charakter betrachtet wird. Wenn etwa in der Small World-Studie die Spezifik der dramatischen Netzwerke in Abhebung zu deren randomisierten Varianten untersucht wird, dann zielt eine solche Analyse gerade darauf, die Nicht-Zufälligkeit und also die Intentionalität der Formung zu erfassen, ihr Gestaltetsein.

Der Anästhetisierung der Objekte korrespondiert, drittens, eine Aisthetisierung der Begriffsanwendung, ihre Diagrammatisierung.Footnote 52 Dieser Aspekt der digitalen Analyse und ihrer Visualität wird derzeit u. a. von Johanna Drucker kritisch reflektiert.Footnote 53 Auch Bildlichkeit ist für die Begriffsarbeit deshalb von besonderer Bedeutung, weil das Anschaulichwerden der Daten in der Visualisierung stets eine Interpretation ist, in der Objekt und Begriff auf spezifische Weise zusammenkommen. Die oben abgebildeten Beat Charts etwa fungieren als Mittel, durch das die Maßzahlen der Segment Change Rate und der Drama Change Rate mit den typologischen Begriffen des hochdynamischen, niedrigdynamischen etc. Dramas visuell amalgamiert werden: Die Beat Charts sind gewissermaßen das Medium, das den gemessenen Daten Sinn und ‚Sinnlichkeit‘ geben soll – das Begriffe sinnlich und Anschauungen (Daten) verständlich macht. Das aber ist, darauf hat Drucker mit Nachdruck hingewiesen, alles andere als ein konventionalisierter Modus der Begriffsverwendung in den Geisteswissenschaften, wobei keineswegs geklärt ist, inwieweit sich die Konventionalisierung der diagrammatischen Begriffsarbeit in der Digitalen Literaturwissenschaft einfach in der Übernahme jener Konventionen erschöpfen kann, die etwa die Natur- oder Sozialwissenschaften ausgebildet haben.

Was schließlich, viertens, irritiert wie fasziniert, sind Modus, Duktus und Gestus der Begriffsarbeit, wie sie in Studien aus dem Feld der digital-empirischen Literaturanalyse vorherrschen, und das unabhängig von der Tatsache, dass diese Begriffsarbeit in der Regel statistisch, anästhetisch und diagrammatisch ist. Denn es gibt auch eine Art Rhetorik der digital-empirischen Literaturanalyse. Dies betrifft auf der einen Seite jene ‚Paper‘ der Digitalen Literaturwissenschaft, die, in streng empirischer Manier, aus argumentativer, stilistischer und layouterischer Sicht kaum zu unterscheiden sind von den Veröffentlichungen der Science-Disziplinen. Es betrifft auf der anderen Seite auch jene Pamphlets, Blogposts, Github-Repositories, Korpus-Server usw., die dem Versuchsweisen, dem Unfertigen, dem Offenen verpflichtet sind. Gemeinsam ist beiden Publikationsformen, so scheint mir, eine Verschiebung vom Ergebnis zum Prozessualen, auch zum Performativen. Nicht der Abschluss der wissenschaftlichen Untersuchung, sondern ihr Aufschub: ihr Suchen und Versuchen prägt die Veröffentlichungen der Digitalen Literaturwissenschaft. Als hätte man noch nicht so recht begriffen, wie sich Argumentationen zu dieser Art von Daten entwickeln lassen, in welche Narrationen diese literarischen Daten eingebunden, mit welchen Darstellungsformen sie in welche Communities kommuniziert werden sollen. Als wäre noch unsicher, worauf diese interdisziplinäre, kollaborative, aber im Ansatz philologische Arbeit an Methoden und Begriffen eigentlich hinauslaufen könnte.

Man mag die statistische, anästhetische, diagrammatische, rhetorische Alterität der Digitalen Literaturwissenschaft aus guten Gründen zurückweisen. Die Literaturgeschichte geändert haben wir bisher gewiss nicht. Was sich im Rabbit Hole der „programming imagination“ ereignete, mag eine Verwirrung – vielleicht eine grundsätzliche, vielleicht eine vorübergehende – der Art, des Stils, der Weise sein, wie Literaturwissenschaft betrieben wird. Um Ausschließlichkeit ginge es dabei nicht. Niemand hat die Absicht, das hermeneutische, philologische, kritische o. ä. Paradigma der Literaturwissenschaft abzulösen, das ästhetische, diskursive, kommunikative o. ä. Objekt zum Verschwinden zu bringen.

Eher geht es darum, die ohnehin bestehende Multidimensionalität der Begriffe auszuweiten, und damit auch die Interpretationswürdigkeit der Objekte, mit denen sich die Literaturwissenschaft befasst, weiter – nun quantitativ – auszureizen. Was das ‚Drama‘ ist, hat sich für uns im Verlauf der Studien jedenfalls keineswegs reduziert, sondern erweitert. Es ist uns zuletzt unmöglich geworden, ein Drama nicht auch als eine Netzwerkstruktur zu begreifen. Ob das eine Bereicherung ist, mögen jene beurteilen, die vor dem Rabbit Hole sitzen.

Ergänzung 2021

Die Studien der dlina-Arbeitsgruppe, deren Resümee der hier publizierte Aufsatz von 2017 in gewisser Hinsicht bereits zog, waren der Idee des Rapid Prototyping verpflichtet. Korpus und Software wurden entlang einer Reihe von experimentellen Studien er-, über- und ausgearbeitet, mit denen wir ausloten wollten, welche Beobachtungen, Fragen und Forschungsszenarien sich aus der Engführung von Dramen mit den Erkenntnispraktiken der Netzwerkanalyse ergeben – wobei wir uns dynamisch, auch sprunghaft der wissenschaftlichen Neugier überließen. Wie sich das Dramen-Korpus und die v. a. von Christoph Kittel verantwortete Software dramavis im Verlauf der Studien aus den Jahren 2015 bis 2018 entwickelten, war also weniger von einem übergreifenden Plan oder einer langfristigen Strategie bestimmt, sondern vielmehr von der Attraktion des jeweiligen Erkenntnisinteresses getrieben, das sich ganz wesentlich auch aus den Irritationspotenzialen des epistemischen Objektes ‚Dramennetzwerk‘ speiste.Footnote 54

Die Irritationspotenziale normalisierten sich, das Erkenntnisinteresse weitete sich. Schon die folgende dlina-Studie zur quantitativen Figurentypologie (s. Fischer/Trilcke/Kittel u. a. 2018)Footnote 55 argumentierte sowohl mit Netzwerkmaßen als auch mit wortfrequenzbasierten Maßzahlen; eine Studie zu den Bühnenanweisungen (s. Trilcke/Kittel/Reiter/Maximova/Fischer 2020) operierte schließlich überhaupt nicht mehr mit den Verfahren der Netzwerkanalyse, sondern griff auf Methoden und Tools aus dem Natural Language Processing zurück, u. a. auf das im QuaDramA-Projekt erarbeitete Tool DramaNLP (Reiter/Pagel 2020).

Mit der Pluralisierung der computationellen Methoden unserer Dramenforschung, die sich in diesen Studien abzeichnete, konnte unser Korpus aus präzise edierten Strukturdaten (in Gestalt des dlina-‚Zwischenformats‘) nicht mehr mithalten. Was man als die ‚Korpuskrise‘ der dlina-Arbeitsgruppe bezeichnen könnte, war dabei eine der Urszenen für die Aufnahme der Arbeiten am Drama Corpora Project (DraCor),Footnote 56 das auf dem Konzept der ‚Programmable Corpora‘ beruht (s. Fischer/Börner/Göbel u. a. 2019). Mit DraCor begann letztlich alles noch einmal neu.

Dabei sind zahlreiche Forschungen und Entwicklungen der dlina-Studien in die DraCor-Plattform eingegangen, bis hin zu den Metriken, die die in DraCor eingebauten Dienste berechnen. Zugleich aber setzt DraCor eben noch einmal neu an, tritt auch einen Schritt zurück und blickt in Richtung einer Infrastruktur, die auf die Ermöglichung breiterer, multidimensionaler (Dramen-)Forschung zielt – und sich von Beginn an einer ambitionierten Idee von reproduzierbarer Forschung verpflichtet, die nicht zuletzt auf der Bereitstellung einer spezifischen API gründet.

Mittlerweile ist auch DraCor eingebettet in einen größeren Kontext. Seit März 2021 ist die in DraCor prototypisch realisierte Idee der ‚Programmable Corpora‘ eines der konzeptionellen Zentren, die in dem von der Europäischen Kommission geförderten Horizon 2020-Projekt „CLS INFRA. Computational Literary Studies Infrastructure“Footnote 57 erforscht und entwickelt werden.