Betrachtungen zum Raum beschäftigen Forschende schon sehr lange. Bereits Aristoteles stellte sich die Frage, was Orte und Räume eigentlich sind. Was aber kann man heute einer bereits mehr als zweitausend Jahre währenden Forschungsarbeit unterschiedlicher Disziplinen noch hinzufügen? Das Forschungsfeld der Digital Humanities bietet eine Reihe von Methoden, die sich in besonderem Maße dazu eignen, alte Fragen auf neue Art und Weise zu betrachten, nämlich mit Hilfe von Computern und computationellen Verfahren (zur Computational Narratology (vgl. Mani, 2013, 84 ff) und zur computationellen Textanalyse (Gius und Jacke, 2015, passim)). Der Computer wird geradezu zum sokratischen Gegenüber – selber unwissend und darum immer wieder ein Spiegel für den Forschenden, der seine Fragen präziser formulieren, genauer fassen, immer weiter verfeinern muss, um schließlich im Laufe des Fragenstellens dem Erkenntnisinteresse ein Stückchen näher zu kommen. Zunächst einmal wissen Computer nichts über Orte und Räume und trotz der zahlreichen räumlichen Metaphern wie z. B. „das Netz“, „der Cyberspace“, „der Chatroom“ oder „die Cloud“ nehmen viele Aspekte des virtuellen Datentransfers keinen physischen Ort ein. Auf der einen Seite gibt es also eine Fülle von zum Teil jahrtausendealten Erkenntnissen, auf der anderen eine tabula rasa, die dabei helfen kann, diese auf neue Weise zu nutzen und auf einen klar definierten Forschungsgegenstand anzuwenden. Eine solche Verknüpfung theoretischer Traditionen und neuer informationstechnologischer Methoden zeigt auch diese Untersuchung. Dabei sind alle drei Parameter – Tradition, digitale Methoden und die Verknüpfung von beidem – in gleichem Maße von Bedeutung.

Seitdem Lessing im Jahre 1766 seine Laokoon-These aufgestellt hat, ist häufig der Gegenbeweis dafür angetreten worden. In zahlreichen Einzeltextanalysen, Analysen kleinerer Korpora oder theoretischen Betrachtungen wurde immer wieder dafür argumentiert, dass Rauminformationen für Literatur von ebenso großer Bedeutung sein können wie zeitliche Aspekte. In der Tat kann aus heutiger Sicht die Annahme, dass Rauminformationen in Erzähltexten immer bedeutsam sind, als literaturwissenschaftliche Tatsache angenommen werden. Dennoch kann das Thema Raum in der Literatur nicht als abschließend erforscht und Lessings Laokoon-These weder eindeutig als verifiziert noch als falsifiziert betrachtet werden. Ein Grund dafür liegt darin, dass Lessing der Literatur nicht gänzlich abgesprochen hat, auch Referenzen auf den Raum zu enthalten (vgl. Lessing, 2012). Vielmehr stellte er fest, dass die Repräsentationsform von Raum in der Literatur eine andere sei als in der bildenden Kunst, was auch an der Linearität der textuellen Ausdrucksform läge. Poesie könne räumliche Aspekte immer nur aus einer Perspektive zeigen („Regel von der [...] Sparsamkeit in den Schilderungen körperlicher Gegenstände“ (vgl. Lessing, 2012, 87)). Es kommen also qualitative und quantitative Aspekte zusammen; es mangelt der literarischen Raumdarstellung einerseits an Plastizität und andererseits werden räumliche Aspekte weniger ausführlich beschrieben als sie in der bildenden Kunst ausgedrückt werden. Bis heute ist noch keine Methode entwickelt worden, mit Hilfe derer der Referenzierung von Rauminformationen in Erzähltexten ein Wert zugewiesen werden kann, der einen Hinweis darauf gibt, wie groß der Anteil an Raumausdrücken und -hinweisen in einem Erzähltext tatsächlich ist. So konnte bisher auch noch nie eine komplexe Analyse sämtlicher Darstellungsweisen von Raum in der Literatur über ein vergleichsweise großes Korpus hinweg durchgeführt werden. Diese Lücke versucht diese Studie zu schließen. Verbunden mit der Frage nach dem Stellenwert von Raum in Erzähltexten wird betrachtet, ob sich der Anteil an Raumausdrücken und -beschreibungen im Laufe der Literaturgeschichte gewandelt hat. Zurückgreifend auf Lessings Laokoon-These aus dem Jahre 1766 und die vor allem nach dem spatial turn der Kultur- und Literaturwissenschaften zunehmenden Ansätze, die seine These falsifizieren (vgl. z. B. Genette, 1976, 43–48 und Sasse, 2009, 225) oder im Gegenteil auch verifizieren (vgl. Frank, 1977, passim), möchte ich die Arbeitshypothese aufstellen, dass zu Lessings Lebzeiten, also im 18. Jahrhundert, die Darstellung von Raum einen kleineren Anteil an Erzähltexten hatte als an zeitgenössischen und dass die Entwicklung zu stärker von Raumdarstellungen dominierten Erzähltexten diachron verlief. Darüber hinaus werden Muster von Rauminformationen in literarischen Texten betrachtet. Einzelne Wörter und Phrasen, in denen Informationen zum Raum enthalten sind, werden aus der Linearität der Texte extrahiert, um sie in ihrer Gesamtheit zu betrachten und so die grundsätzliche Beschaffenheit der Raumdarstellung in ihrer Mehrdimensionalität beschreiben zu können.

Gegenstand der Betrachtung ist ein Textkorpus, bestehend aus 100 Romanen des 18.–21. Jahrhunderts. Romane wurden als epische Langform unter der Vorannahme ausgewählt, dass sie nicht nur eine besondere Häufung von Informationen zum Raum beinhalten, sondern auch die größte Varianz in der Art der Darstellung zeigen. Um einerseits einen Querschnitt durch die Literatur eines bestimmten Jahrhunderts zu erhalten, andererseits aber die Gesamtmenge der Texte in einem im Rahmen dieser Studie und mit den gewählten Tools betrachtbaren Umfang zu halten, wurde dieser auf 100 Texte festgelegt. Aus jedem der vier betrachteten Jahrhunderte werden also 25 Texte vergleichend im Hinblick auf den Stellenwert der Raumdarstellungen analysiert. Um dieses Textkorpus in einem angemessenen zeitlichen Rahmen betrachten zu können, wurden digitale Methoden eingesetzt, mit Hilfe derer die Raumausdrücke und -hinweise in den Erzähltexten ausfindig gemacht wurden.

„Welchen Stellenwert hat die Referenzierung von Rauminformationen in Romanen des 18.–21. Jahrhunderts?“, mit dieser Leitfrage möchte ich das dieser Untersuchung zu Grunde liegende Korpus systematisch und umfassend digital untersuchen. Diese Herangehensweise schließt bewusst einige Aspekte des Themas Raum in der Literatur aus. Da Raum hier ausschließlich auf Ebene des literarischen Textes betrachtet wird, ist weder die Perspektive des Schreibraums noch die des Leseraums von Interesse. Sowohl sehr stark autor*innenzentrierte als auch rezeptionsästhetische Ansätze werden also nicht betrachtet. Da aber das literarhistorisch uneinheitliche Korpus die Vermutung nahe legt, dass unterschiedliche Erkenntnisse zum Thema Raum bei der Textproduktion auch die textimmanenten Referenzen auf den Raum beeinflusst haben können, kann hier eine historische Perspektive nicht unberücksichtigt bleiben. Der wissenschaftsgeschichtliche Kontext, in dem ein Werk entstanden ist, findet also durchaus Berücksichtigung (und damit auch indirekt das Raumverständnis der Autor*innen).

Die Leitfrage impliziert aber auch, dass ein quantitativ erfassbarer Wert ermittelt werden kann, der den Anteil von Raumdarstellungen in Romanen messbar macht. Wie bereits erwähnt, wurde dazu in den Literaturwissenschaften bisher keine Methode entwickelt. Darum wurde hier anschließend an die Modellentwicklung ein Verfahren erdacht, um die unterschiedlichen Darstellungsweisen von Raum, die mit Hilfe des operationalisierbaren Modells kategorisiert werden können, im Hinblick darauf, wie explizit Raum referenziert wird, zu bewerten. Dem Ansatz liegt die Idee zu Grunde, dass nicht binär zwischen Raumausdruck und nicht-Raumausdruck unterschieden werden kann, sondern dass Wörter und Phrasen mehr oder weniger explizit Rauminformationen referenzieren können. Dieser Gedanke findet sich ebenfalls schon bei Lessing in der Feststellung, dass die Schilderung von Körpern in der Literatur zwar auch Hinweise auf den Raum gebe, aber nur andeutungsweise, nämlich durch Handlungen (vgl. Lessing, 2012, 87). Das angewendete Verfahren, die unterschiedlichen Kategorien von Raumdarstellungen quantitativ einzuschätzen, stützt sich auf die Grundlagen der „fuzzy set theory“. Diese wird im Bereich der spatial humanities, einer primär am Raum interessierten Forschungsrichtung der digitalen Geisteswissenschaften, z. B. dazu genutzt, eine Landschaft nicht in klar voneinander abgrenzbare Regionen (wie z. B. Berg – nicht-Berg) einzuteilen. Stattdessen werden diskrete Einheiten entwickelt, die zwischen diesen Polen liegen und die darüber hinaus auch quantifiziert werden können (vgl. Bodenhamer et al., 2010, 55). Ein Beispiel für die Quantifizierung einer räumlichen Einheit wie der eines Berges, wäre, Regionen, die als definitiv-nicht-Berg kategorisiert werden können, den Wert 0 zuzuweisen, der Spitze des Berges den Wert 5 und dazwischen Abstufungen einzuführen (vgl. Bodenhamer et al., 2010, 55).

Mit Hilfe eines eigens dafür entwickelten CRF-Classifiers wurden Indikatoren für die narrative Darstellung von Raum in allen 100 Erzähltexten des Korpus automatisch annotiert. Das Korpus ist diachron gegliedert in vier Teilkorpora, die Texte aus dem 18., 19., 20. und 21. Jahrhundert beinhalten. Diese Aufspaltung ermöglicht es einerseits, den Classifier so zu trainieren, dass dieser unabhängig von Epochen- und Genrespezifika der Texte eine relativ hohe Erkennungsgenauigkeit erreicht und gleichzeitig mit Trainingsdaten zu arbeiten, die den sprachlichen Wandel nicht gänzlich außer Acht lassen. Die Aufteilung in jahrhundertspezifische Korpora ist nicht inhaltlich bedingt, sondern orientiert sich an statistischen Tests während des Machine-Learning-Trainings, die gezeigt haben, dass Trainingsdaten mit einem ähnlichen Entstehungskontext wie Testtexte einen deutlichen Performanz-Gewinn zeigen. Da die entwickelte Methodik die Technik des maschinellen Lernens beinhaltet, ist es von Vorteil, wenn Trainingstexte und untersuchte Texte sprachlich ähnlich sind (mehr dazu im Kapitel 6). Die 100 Erzähltexte wurden zufällig aus einem größeren Korpus von 400 Erzähltexten ausgewählt. Weitere 80 zufällig ausgewählte Texte aus ebendiesem Korpus wurden als (ebenfalls diachron unterteilte) Trainingsdaten zur Entwicklung der Methodik genutzt. Auf Basis der digital unterstützten Analyse wurde für jeden Roman im Korpus ein Raumindexwert (RIW) ermittelt, der einen Hinweis darauf gibt, wie hoch der Anteil von Raumdarstellungen im gesamten Erzähltext ist. Anhand dieser Werte können die Romane vergleichend analysiert und interpretiert werden.

Dieses Buch dokumentiert also eine Analyse auf der Grundlage interdisziplinärer Betrachtungen des Raumes, die einen Beitrag zum Forschungsfeld der digitalen Literaturwissenschaften leistet. Die Verknüpfung von Literaturwissenschaft (insbesondere Erzähltheorie) und Digital Humanities wurde etwa seit Beginn des Jahrtausends fruchtbar gemacht (vgl. z. B. Meister, 2008 und Mani, 2013) und kann damit noch als relativ neue Herangehensweise betrachtet werden. Es ist eines der Hauptanliegen dieser Studie, aufzuzeigen, dass diese Verbindung bidirektional genutzt werden kann. Auf der einen Seite werden Konzepte aus der literaturwissenschaftlichen Forschung so aufbereitet, dass sie maschinenlesbarFootnote 1 sind und zur Weiterentwicklung von Programmen aus dem Bereich der Digital Humanities genutzt werden können. Auf der anderen Seite führt das Training dieser Programme zur Schärfung der Konzepte. Der Erfolg dieser beidseitigen Weiterentwicklung hängt stark davon ab, dass stets beide Felder mitgedacht werden. Den Kern der Untersuchung macht ein Mixed-Methods-Ansatz aus, der hermeneutische und informationstechnologische Verfahren so eng miteinander verknüpft, dass diese kaum noch auseinander gehalten werden können.

Wegweiser für diesen Band

Dieses Buch ist in insgesamt drei Teile untergliedert. Im ersten Teil steht zunächst die Operationalisierung narrativer Raumdarstellung im Fokus. Ein Ziel der hier dokumentierten Studie war es, ein Modell zu entwickeln, das Indikatoren für narrative Darstellung von Raum an der Oberfläche von Texten definiert und in ein Kategoriensystem überführt, das zur Analyse literarischer Texte dienen kann. Grundsätzlich kommen in dieser Studie zwei unterschiedliche Modell-Begriffe zur Anwendung. Im ersten Teil wird der Begriff hauptsächlich für das literaturwissenschaftliche Raummodell genutzt (ein theoriegetriebenes Modell wie bei Heßbrüggen-Walter, 2017 erwähnt). Im zweiten Teil geht es dann vor allem um die Classifier-Modelle, die beim NER-Training entstehen (ein Datenmodell nach Jannidis, 2017, 100). Um die Modell-Begriffe klar voneinander abzugrenzen wird für letztere die Spezifizierung „CRF-Modell“ genutzt. Das theoriesbasierte Modell und das darin eingearbeitete Kategoriensystem für die Analyse narrativen Raumes wird in Abschnitt 2.1 vorgestellt. Anschließend wird die Herleitung des Modells begründet, die grundsätzlich aus zwei Perspektiven erfolgt: Der literaturwissenschaftlichen und der phänomenologischen. Bei der Modellentwicklung folge ich zunächst Traditionslinien der analogen, nicht-digitalen Forschung. Vom Gegenstand ausgehend wird zuerst die literaturwissenschaftliche Forschung daraufhin untersucht, ob sie operationalisierbare Aspekte narrativer Raumdarstellung beinhaltet, die die Definition von Indikatoren narrativer Raumdarstellung und damit auch das Modell unterstützen. Ausgehend von der Frage, ob Erzähltexte vielleicht sogar ganz ohne Darstellungen des Raumes auskommen können (Abschnitt 2.2), nähere ich mich der Bedeutung dieses Phänomens für die Literatur. Ausgangspunkt ist auch hier Lessings Laokoon-These:

Wenn es wahr ist, daß die Malerei zu ihren Nachahmungen ganz andere Mittel, oder Zeichen gebrauchet, als die Poesie; jene nämlich Figuren und Farben in dem Raume, diese aber artikulierte Töne in der Zeit; wenn unstreitig die Zeichen ein bequemes Verhältnis zu dem Bezeichneten haben müssen: So können neben einander geordnete Zeichen, auch nur Gegenstände, die neben einander, oder deren Teile neben einander existieren, auf einander folgende Zeichen aber, auch nur Gegenstände ausdrücken, die auf einander, oder deren Teile auf einander folgen. (Lessing, 2012)

Lange Zeit war Lessings Standpunkt richtungsweisend, sodass es heute mehr literaturwissenschaftliche Arbeiten zur Thematik der Zeit als zu der des Raumes gibt. Seit der zweiten Hälfte des 20. Jahrhunderts, spätestens seit dem sogenannten spatial turn in den 1970ern (vgl. Günzel, 2009a, 10–11 und Dennerlein, 2009, 6), wurden aber zunehmend Ansätze zum Raum erarbeitet, von denen für diese Arbeit hauptsächlich kulturwissenschaftliche, narratologische und Digital-Humanities-Analysen relevant sind. Bei der Auswertung der literaturwissenschaftlichen Forschung wird stets die Frage mitberücksichtigt, inwiefern die gewonnenen Erkenntnisse so aufbereitet, d. h. operationalisiertFootnote 2, werden können, dass sie für die computergestützte Analyse zugänglich sind. Unter dieser Perspektive betrachte ich den symbolischen, kulturellen und metaphorischen Raumbegriff, Raumthemen, Raum als Strukturphänomen von Texten und die Konstruktion literarischen Raumes zwischen Text und Leser*in.

Es folgt in Abschnitt 2.3 ein interdisziplinärer Überblick zum Phänomen des Raumes, wie es jenseits der Literaturwissenschaften erforscht wurde. Ansätze aus den Kulturwissenschaften, der Soziologie, der Physik, der Mathematik, der Philosophie und der Archäologie werden so zusammengefasst, dass deutlich wird, welche unterschiedlichen Raum-Konzepte bestehen. In dieser Auswertung wird herausgearbeitet, wie z. B. der objekt-zentrierte, der relationale oder der soziale und kulturelle Raumbegriff im Gesamtdiskurs nebeneinander, einander überlagernd und zum Teil auch einander widersprechend bestehen. Das entwickelte Raummodell dient als Schlüssel für und Bindeglied zur digitalen Methodik, die im zweiten Teil dieser Studie einen Schwerpunkt bildet. An die theoriegeleiteten Betrachtungen anschließend, werden in Kapitel 3 die erzähltheoretischen Grundlagen dieser Arbeit dargelegt. Der Gegenstand dieser Arbeit wird in zwei Schritten definitorisch erfasst: Zuerst wird die Frage beantwortet, wie in dieser Studie der Begriff der Erzählung verstanden wird (Abschnitt 3.1) und dann wird noch einmal konkret zusammengefasst, was – dem theoriebasierten Modell folgend – die Referenzierung von Rauminformationen in Erzähltexten ausmacht (Abschnitt 3.2). Der erste Teil dieses Buches schließt in Kapitel 4 mit den Annotationsguidelines für die im Modell integrierten sechs Kategorien literarischen Raumes und für Raummetaphern ab. Hier werden die Kategorien narrativer Raumindikatoren definiert, Annotationsspannen festgelegt und Beispiele gezeigt. Diese Annotationsguidelines bilden die Basis für das Machine-Learning-Training, das im zweiten Teil dieses Buches beschrieben wird.

Im zweiten Teil der Studie steht dann die digitale Methode im Vordergrund. Das Studiendesign folgt einem Mixed-Methods-Ansatz, bei dem eine Machine-Learning-Methode (Named Entity Recognition) im Zentrum steht und während der Analyse bedarfsorientiert durch weitere Methoden ergänzt wird. Die Grundlagen dieser Kernmethode, deren bisherige Anwendung in den Literaturwissenschaften und eine Methodenkritik werden in Kapitel 5 dargelegt. Im darauf folgenden Kapitel 6 wird der Machine-Learning-Prozess ausführlich dokumentiert. Dieser Prozess ist für diese Studie zentral, denn er wird keinesfalls als rein technisches Prozedere zur Optimierung einer Software verstanden, sondern, wie oben bereits erwähnt, als Kern eines Erkenntnisprozesses (zur Bedeutung informationstechnologischer Methoden für hermeneutische Forschungsprozesse vgl. Gius und Jacke, 2015). Das im ersten Teil der Arbeit entwickelte theoriebasierte Raummodell und der im Machine-Learning-Prozess für die automatische Annotation von Raumdarstellungen optimierte Classifier werden gemeinsam zur Basis einer in Kapitel 7 entwickelten Formel, mit Hilfe derer Rauminformationen in literarischen Erzähltexten quantifiziert werden können.

Den dritten Teil dieses Buches bildet eine analytische Anwendung der entwickelten Methode. Anhand einer Auswahl von 100 literarischen Erzähltexten des 18.–21. Jahrhunderts, die hier als Forschungsgegenstand dienen und darum als Kernkorpus bezeichnet werden, werden in Kapitel 8 beispielhaft Analysen auf drei Ebenen und aus drei Perspektiven durchgeführt. Auf Ebene des gesamten Kernkorpus (Abschnitt 8.1) werden unterschiedliche Aspekte literarischen Raumes, wie z. B. dessen grundsätzlich relationaler Aufbau, die Darstellung von Innen- und Außenwelten oder der diachrone Wandel einzelner Begriffe und deren Bedeutungszusammenhänge untersucht. In diesem Teilkapitel findet die Frage nach der Anschlussfähigkeit der Datenauswertung des digital unterstützen Ansatzes an traditionellere, nicht digitale literaturwissenschaftliche Forschung besondere Berücksichtigung. Im Abschnitt 8.2 wird auf Ebene von vier jahrhundertspezifischen Teilkorpora (je 25 Romane des 18.,19.,20. und 21. Jahrhunderts) eine explorative Untersuchung durchgeführt. Hier steht die Frage im Fokus, inwiefern auch eine textimmanente, datenzentrierte Betrachtung literaturwissenschaftlich relevante Einsichten hervorbringen kann. Abschließend zeigt Abschnitt 8.3 auf Ebene einzelner Textbeispiele, auf welche Weise Ausreißer-Phänomene, unabhängig von den in 8.1 und 8.2 gewählten Forschungsperspektiven, die Ergebnisse beeinträchtigen und sogar erheblich verzerren können. Anschließend an diese Tradition und digitale Methodik verknüpfende Anwendung wird zum Abschluss in Kapitel 9 der Bogen zurück zum Ausgangspunkt geschlagen, der Frage nach der Quantifizierung narrativer Raumdarstellung. Mit Hilfe der in Kapitel 7 entwickelten Formel werden für jeden Text im Kernkorpus Indexwerte für die Referenzierung von Rauminformationen entwickelt. Der Vergleich dieser Werte zeigt die diachrone Entwicklung literarischer Raumdarstellung nicht anhand einzelner Phänomene, sondern in Form eines relationalen Wertes, der alle Phänomene (oder auch eine Gruppe von Phänomenen) literarischen Raumes zusammenfasst und so den literarhistorischen Vergleich ermöglicht.

Inwiefern die angestrebte Verknüpfung theoretischer Traditionen und digitaler Methoden geeignet ist, um zu neuen Antworten auf alte Fragen zu kommen und wie die hier erstellten Tools, Methoden und Daten nachgenutzt werden können, die Beantwortung dieser Fragen schließt diesen Band in Kapitel 10 ab. Die drei Teilaspekte von Forschungstradition, Innovation und Erkenntnisgewinn durch Verknüpfung derselben werden hier vor allem in ihrer Relevanz für die derzeitige literaturwissenschaftliche Forschung bewertet.