Ausgehend von den sechs Kategorien der Darstellung von Raum in Erzähltexten – Ort, Relation, relationales Verb, Raumhinweis, Raumbeschreibung und Raumthema – habe ich eine einfache Formel entwickelt, mit Hilfe derer für jeden Erzähltext im Korpus ein Raumindexwert (kurz: RIW) errechnet werden kann. Basis der Berechnung sind zwei Grundannahmen:

  1. 1.

    Wörter, die Rauminformationen vermitteln, machen einen Anteil des gesamten Wortmaterials von Erzähltexten aus.

  2. 2.

    Explizite Raumausdrücke referenzieren Rauminformationen stärker als implizite, da sie weniger von der Interpretation der Lesenden abhängen. Explizit und implizit werden hier nicht als rein binäre Werte verstanden, sondern als zwei Enden einer Skala, die eine Reihe von Zwischenwerten enthält.Footnote 1

Aus der Grundannahme eins folgt, dass der prozentuale Anteil der Wörter und Phrasen, die eine raumreferenzierende Funktion haben, an der Gesamtwortmenge eines Erzähltextes ein Indikator für die Intensität ist, mit der von dem konkret vorliegendem Erzähltext Rauminformationen vermittelt werden. Die relative Berechnung ist hier ein wichtiger Faktor, um mit einzubeziehen, dass die Texte im Korpus unterschiedlich lang sind. Aus der Grundannahme zwei folgt, dass die Raumausdrücke nicht einfach quantitativ in Form natürlicher, gleichwertiger Zahlen summiert werden können. Darum werden sie anhand einer Skala von 0–1 gewichtet. Raumhinweise sind implizit und ihre Deutung in Bezug auf die Raumdarstellung hängt stark von der lesenden Person ab. Außerdem vermitteln sie neben Informationen über den Raum auch noch mindestens eine weitere Bedeutung, die sogar die primäre Bedeutung des jeweiligen Ausdrucks sein kann. Ihnen wird darum ein Wert von 0,5 zugeschrieben. Bei beschreibenden Raumausdrücken stehen Rauminformationen etwas stärker im Vordergrund als bei Raumhinweisen. Allerdings gibt es auch hier häufig sehr starke andere Bedeutungen. Der Satz „er fuhr ein großes Auto“ sagt zwar etwas über die räumliche Ausdehnung des Autos aus, kann aber z. B. auch etwas über den Status des Fahrers verraten. Beschreibenden Raumausdrücken wird hier darum der Wert 0,6 zugewiesen. Raumthemen sind expliziter als Raumhinweise und beschreibende Raumausdrücke, aber weniger konkret. Sie tragen mehr zur Raumdarstellung bei und Ausdrücke und Phrasen, die Raumthemen kommunizieren, dienen meist primär zur Vermittlung räumlicher Aspekte (auch wenn sie noch weitere Bedeutungsebenen haben können). Ihnen gebe ich den Wert 0,7. Relationen enthaltende Verben tragen viel zur Ausgestaltung des relationalen Raumes einer Erzählung bei. Aber auch hier schwingen oft andere Bedeutungsebenen mit. Das Verb „fortgehen“ z. B. drückt zwar eine relationale Bewegung aus, kann aber auch Aspekte wie Melancholie, Zwang oder auch Sehnsucht nach etwas Neuem beinhalten. Da die räumliche Komponente hier aber vergleichsweise stark und andere Bedeutungsebenen impliziter sind, bekommt diese Kategorie hier den Wert 0,8 zugewiesen. Sowohl Relationen als auch Ortsbezeichnungen können als explizite Raumdarstellungen gelten. Ob der Raum eher relational oder eher objektorientiert charakterisiert wird, ist, wie die Ausführungen in Abschnitt 2.3 gezeigt haben, von der theoretischen Perspektive abhängig. Da beide Seiten gleichwertige Argumente für einen relativen oder absoluten Raum vorgelegt haben, bewerte ich Relationen und Nennungen von Orten hier gleich. Beiden Kategorien wird also der Wert 1 zugewiesen. Die Einschätzung der Explizitheit und des daraus resultierenden Faktors folgt den Überlegungen zu den Raumkategorien in Abschnitt 2.1. Abbildung 7.1 zeigt die Bewertung im Überblick und ruft die visuellen Metaphern der Ortskategorien in Erinnerung.

Eine Quantifizierung der Raumeinheiten in Erzähltexten wird mit dieser Berechnung nicht angestrebt. Darum bleibt der Einwand von Genette, dass in detaillierten Beschreibungen (Genette und Knop, 1998, 118) Häufungen von Raumausdrücken auftreten können, die aber nur auf einen einzigen Ort verweisen, unberücksichtigt.

Der RIW jedes Textes im Korpus wird auf dieser Basis wie folgt berechnetFootnote 2:

$$\begin{aligned} RIW = \frac{0,5 \times RH + 0,6 \times RB + 0,7 \times RT + 0,8 \times rV+R+O}{100 \times Wortzahl\ des\ Textes} \end{aligned}$$
(7.1)
Abbildung 7.1
figure 1

Raumkategorien, visuelle Metaphern und Einschätzung des Explizitheitswerts

Mit Hilfe dieser Formel wird in der vorliegenden Studie jedem Text ein RIW zugewiesen, der theoretisch zwischen 0 und 100 liegen kann (auch wenn es im höchsten Maße unwahrscheinlich ist, dass die Extremwerte erreicht werden). Anhand ihrer Raumwerte kann die Ausprägung der räumlichen Dimensionen in Texten miteinander verglichen werden. Der Vergleich der Raumwerte kann einen Hinweis darauf geben, ob in einer bestimmten literarhistorischen Zeitspanne der relative Anteil an Raumdarstellung tendenziell größer war als in anderen. Außerdem können die RIWs anzeigen, ob es eine generelle Tendenz des Anteils von Raumausdrücken in Romanen gibt oder ob die räumliche Dimension individuell sehr unterschiedlich stark ausgeprägt ist.

Zwei Probleme treten bei der Anwendung dieser Formel auf, wenn die Datenbasis, wie hier, durch die eingesetzte Methode der automatisierten Erkennung nicht akkurat ist. Erstens werden nicht alle Kategorien gleich gut erkannt. Zweitens funktioniert die Erkennung nicht bei allen Texten gleich gut. Die erste Problematik ist eine der Ambivalenzen der Raumkategorien, die zweite eine der Standardisierung der Referenzierung von Rauminformationen im Roman. Die Ambivalenzproblematik, so hat sich durch den Abgleich von F1-Score und Inter-Annotator-Agreement gezeigt, liegt hier in einem Umfang vor, der dem der (Un-)Einigkeit zwischen zwei Literaturwissenschaftler*innen entspricht. Einfach ausgedrückt, ist das Ergebnis der automatischen Annotation, gemessen an der Treffergenauigkeit, ebenso gut wie die Annotation eines anderen menschlichen Annotators oder einer Annotatorin. Dieser Faktor wird hier darum nicht weiter beachtet. Stattdessen werden die erzielten Annotationen als zu 100% genau (für einen abweichenden Annotierenden) angenommen. Um den zweiten Störfaktor besser einschätzen zu können, wurde der RIW zweier Testtexte berechnet. Einer dieser Testtexte, Schillers Geisterseher erreichte die höchste Übereinstimmung mit der automatischen Annotation, der andere, Hubers Luise die niedrigste. Der RIW bei manueller Annotation von Schillers Geisterseher liegt bei 10,34, bei automatischer Annotation bei 10,85. Die Abweichung ist erwartungsgemäß sehr niedrig. Der RIW bei manueller Annotation von Hubers Luise liegt bei 5,63, bei automatischer Annotation bei 9,63. Das heißt, es ist mit einer Abweichung der RIWs um in der Regel bis zu 4 Prozentpunkte zu rechnen. Diese Ungenauigkeit wird hier in Kauf genommen, um das Bild einer generellen Tendenz zeichnen zu können. Im Hinblick auf Nachnutzung des Tools wurde hier außerdem ein Text ins Kernkorpus integriert, der auch im Trainingskorpus enthalten ist (Hölderlins Hyperion Fragment). Dadurch ergibt sich einerseits ein realistisches Szenario der Anschlussnutzung, da bei nachgenutzten Tools nicht immer sichergestellt werden kann, dass Trainings- und Forschungsdaten sich nicht überschneiden. Auf der anderen Seite konnten so eventuell dadurch entstehende Verzerrungen im Blick behalten werden.

Der RIW bezieht sich auf den dieser Arbeit zu Grunde liegenden relativ weit gefassten Raumbegriff. Die Auswertung der literaturwissenschaftlichen Forschung zum Thema Raum hat gezeigt, dass Raum aber sehr unterschiedlich (eng) definiert werden kann. In einer umfassenden Studie, die es sich zum Ziel gesetzt hat, zu zeigen, welchen Stellenwert die Referenzierung von Rauminformationen in literarischen Texten hat, reicht es nicht, lediglich den eigenen, eher weit gefassten Raumbegriff, zu untersuchen. Darum wird für alle Texte des Kernkorpus auch noch der Anteil der Ortsnennungen im jeweiligen Roman berechnet

$$\begin{aligned} OIW = \frac{Anzahl\ Orte}{Gesamtwortzahl\ des\ Textes} \end{aligned}$$
(7.2)

Auf diese Weise wird das engste mit dem hier entwickelten Modell operationalisierbare Raumverständnis ebenfalls in Form eines Indexwertes betrachtet. Dieser zweite Wert wird Orts-Index-Wert genannt (OIW) und die Höhe dieser Werte wird mit denen der RIWs abgeglichen. Auf ähnliche Weise und basierend auf den Grundannahmen, die der Formel des RIWs zu Grunde liegen, werden noch zwei weitere Indexwerte berechnet, der Relationen-Index-Wert (RelIW) und der Raumthemen-Index-Wert (ThIW). Beide Werte werden analog zu RIW und OIW berechnet. Im RelIW werden allerdings zwei Kategorien zusammengefasst, nämlich die Relationen und die relationalen Verben

$$\begin{aligned} RelIW = \frac{Anzahl\ Relationen + Anzahl\ relationale\ Verben \times 0,8}{Gesamtwortzahl\ des\ Textes} \end{aligned}$$
(7.3)

Dem ThIW liegt die Kategorie der Raumthemen zu Grunde

$$\begin{aligned} ThIW = \frac{Anzahl\ zu\ Raumthemen\ gehoeriger\ Woerter \times 0,7}{Gesamtwortzahl\ des\ Textes} \end{aligned}$$
(7.4)

Die vier Indexwerte werden pro Text berechnet und dann einzeln und zusammen diachron über das gesamte Kernkorpus verglichen. Wie in Kapitel 9 gezeigt werden wird, kann über die unterschiedlichen Teilaspekte eine Cross-Validierung von Thesen zur Bedeutung literarischen Raumes im diachronen Zeitverlauf vorgenommen werden. Berechnung, Auswertung und Analyse der Indexwerte schließen in Kapitel 9 die nun zuerst folgende Interpretation der Raum-Annotationen im Kernkorpus ab.