Mit der Digitalisierung verändern sich Gegenstände und Herangehensweisen eines Fachs. Auch in der Germanistik mit ihren Teilbereichen zeichnen sich schon seit einiger Zeit neue Perspektiven ab. Sprache und Literatur werden nicht mehr nur durch den Menschen, sondern auch mithilfe der Maschine rezipiert und produziert – sowohl auf der Ebene der Untersuchungsgegenstände als auch in Forschungsprozessen. Im Zuge der Entwicklung digital gestützter Forschung sind einige erkenntnistheoretische und methodenreflektierende Aspekte aufgegriffen worden, die eine Vorgeschichte in der Wissenschaftsphilosophie und der empirischen Sozialforschung haben. Dazu gehört die schon oft besprochene Debatte über quantitative vs. qualitative Methoden bzw. theorie- vs. datengeleitete Forschungsverfahren in den germanistischen Teilfächern. In diesem Zusammenhang wird auch die Hermeneutik immer wieder thematisiert, meistens in Bezug auf Interpretation als qualitativen Gegenpol zu statistischen, evtl. auch algorithmischen, jedenfalls frequenz- und distributionsorientierten Messverfahren.

Die Hermeneutik kommt vor allem da ins Spiel, wo davon ausgegangen wird, dass die Erfassung durch und die Operationalisierung für maschinelle Verfahren nicht möglich ist. Oder die datengeleitete Perspektive wird stark gemacht, um das Hermeneutische zu überwinden, das als zu subjektiv, durch Vorwissen geprägt, unter Zirkularitätsverdacht stehend und nicht repräsentativ angesehen wird. Dabei steht oft die Reflexion der Chancen und Grenzen des Maschinellen im Mittelpunkt, weniger die tiefgreifendere Auseinandersetzung mit der interpretativen, hermeneutischen Seite. In diesem Themenheft soll diese Perspektive hingegen im Vordergrund stehen. Die Tradition der Hermeneutik spielt auch unabhängig von der Digitalisierung in allen Teildisziplinen der Germanistik eine Rolle. In einem Ende 2021 erschienenen LiLi-Themenheft (vgl. Bleumer/Habscheid/Spieß/Werber 2021) wurde das Thema – allerdings ohne Schwerpunkt auf dem Bezug zu digitalen Korpora – in jüngerer Zeit ausführlich behandelt. In der germanistischen Sprachwissenschaft wurde bereits über eine linguistische Hermeneutik bzw. hermeneutische Linguistik als Subdisziplin diskutiert (vgl. Hermanns/Holly 2007; Bär 2015), ebenfalls ohne Fokussierung auf Korpora und Digitalität. Doch Korpora haben im Zuge der Digitalisierung an Bedeutung gewonnen und stellen nicht nur in der Korpuslinguistik, sondern auch in der digitalen Literaturwissenschaft und Mediävistik eine wichtige Forschungsressource und somit eine relevante Reflexionsperspektive dar.

Das Themenheft greift das zuvor im spezifischeren Zusammenhang der lexikalischen Semantik eingeführte Konzept der Korpushermeneutik (vgl. Haß 2007, S. 241–261) auf, um es erweiternd und ausdifferenzierend auf verschiedene germanistische Forschungsansätze beziehen zu können. Es dient der Sensibilisierung für die enge Verschränkung von quantifizierenden, korpusstatistischen Analyseverfahren und den zentralen hermeneutischen Prozessen des Verstehens, Interpretierens und Erklärens (Bär 2016, S. 290 f.). Dies lässt sich als Gegenmodell zur Vorstellung von einer Gegensatz-Relation zwischen Hermeneutik und Korpusstatistik verstehen.

Die Heft-Beiträge zeigen aus ganz unterschiedlichen Perspektiven, dass Verstehen, Interpretieren und Erklären in alle Phasen germanistischer Forschungsprozesse involviert sind – von der Entdeckung eines überraschenden, forschungsrelevanten Phänomens, dem Anknüpfen an Vorwissen und der Entwicklung einer Fragestellung über die Recherche und Auswahl von Daten, die Erstellung und Erschließung von Korpora und Metadaten, bis hin zur Kategorienbildung, Annotation, Analyse, Auswertung und Ergebnisinterpretation. Korpusgestützte Forschungsprozesse sind als Ganzes Verstehensprozesse, ihre Verfahrensweisen sind durchsetzt mit Schnittstellen zur Hermeneutik, wobei das Verstehen nicht nur auf lokal lesende Zugriffsformen beschränkt, sondern auch auf globale, korpusweite bzw. -übergreifende Rezeption gerichtet ist. Statistische Messungen basieren auf durch hermeneutisches Deuten getroffenen Auswahlentscheidungen und ihre Ergebnisse werden erst durch das Interpretieren von Messdaten konstituiert. Maschinelle Verfahren können ›nur‹ auf die in der Linguistik so genannte sprachliche Oberfläche zugreifen, nicht direkt auf das Gemeinte und den kommunikativen Sinn von sprachlichen Äußerungen, also auf Implizites und Inferiertes, ob in Gebrauchstexten und Gesprächen oder in der Literatur. Selbst durch maschinelles Lernen können zwar z. B. Kategorisierungen trainiert und so menschliche Entscheidungen annähernd imitiert werden, wohlgemerkt auf der Basis von Kategorien, die – ob daten- oder theoriegeleitet – durch hermeneutische Verstehens- und Deutungsprozessen gebildet wurden. Letztlich ist aber etwa bei Analysen, die Mehrdeutigkeiten und Implizites einbeziehen müssen, eine vollständige Automatisierung nicht möglich.

Angewendet und reflektiert werden die beschriebenen Schnittstellen-Verfahren, wenn auch bisher meistens nicht unter dem Terminus Korpushermeneutik, in allen Fachbereichen der digitalen Germanistik. Im Austausch zwischen den germanistischen Teildisziplinen diskutiert wurde das Thema in einem Doppel-Panel beim Germanistentag 2022 in Paderborn unter dem Titel »Germanistische Korpus-hermeneutik – digitale Methodik und Mehrdeutigkeiten«, das ein Ausgangspunkt für dieses Heft war (vgl. Bender/Jacob 2022). In der digitalen germanistischen Linguistik spielen diese Aspekte im gesamten Spektrum der Korpuslinguistik, bzgl. impliziter Phänomene aber insbesondere in der Diskursanalyse und der Korpuspragmatik (vgl. Felder/Müller/Vogel 2012), eine wichtige Rolle. Ein Beispiel für solche korpuspragmatischen Studien sind Annotationsprojekte in Verbindung mit maschinellem Lernen, in denen die zentrale Herausforderung ist, auch die implizite Ebene in einem Kategoriensystem zu erfassen, zu operationalisieren und dadurch für maschinelle Analysen verarbeitbar zu machen (vgl. Bender 2023; Becker/Bender/Müller 2020).

Die digitale Literaturwissenschaft wendet ebenfalls verschiedene quantifizierende Verfahren an und reflektiert hermeneutische Aspekte (vgl. Weitin/Gilli/Kunkel 2016), aber auch interpretative Annotationsmethoden (Gius/Jacke 2017). Dieses Spektrum an Methoden wird auch in der digitalen Mediävistik genutzt. Sowohl textstatistische als auch Annotations-Verfahren werden angewendet (vgl. Dimpel 2019; Bauer/Viehhauser/Zirker 2023).

Im vorliegenden Heft werden Perspektiven der Korpushermeneutik aus den verschiedenen Fachbereichen der digitalen Germanistik zusammengeführt.

Der Beitrag von Marcus Müller bezieht die Begriffe Verstehen und Erklären aus der Perspektive der digitalen Linguistik aufeinander und zeigt, dass sie nicht isoliert zu betrachten, sondern eng miteinander verknüpft sind. Er beschreibt Verstehen in der Korpuslinguistik als Ko-Konstruktion von Sinn, als regelgeleiteten Nachvollzug von Kontextualisierungsprozessen sowie damit verbundenen Regularitäten und als Voraussetzung für das Erklären sprachlicher Phänomene. Dabei wird insbesondere herausgearbeitet, dass Verstehen nicht auf die qualitative Analyse quantifizierbarer Muster reduziert werden kann, sondern »als Nebenbei-Praxis eine allumfassende und ganz entscheidende Rolle in allen Schritten des korpuslinguistischen Verfahrens« spielt.

Darauf folgt der Beitrag von Nadine Proske, in dem die Verbindung von interpretativen und quantifizierenden Verfahren in der Interaktionalen Linguistik beleuchtet wird. Obwohl der Begriff der Hermeneutik in der Konversationsanalyse (CA)/Interaktionalen Linguistik (IL) unüblich ist, spielt Verstehen, Deuten und Interpretieren eine zentrale Rolle, vor allem beim Zuweisen von Kategorien (beispielsweise syntaktische, prosodische oder handlungsbezogene) und Auswerten dieser Auszeichnungen. Diese Aspekte werden im Beitrag als Anknüpfungspunkte für Reflexionen zur Hermeneutik aufgegriffen. Bisher in der CA/IL noch nicht etablierte hermeneutische Aspekte werden so als neue Beschreibungsperspektive eingeführt.

Michael Bender beschreibt hermeneutische Aspekte in den verschiedenen Phasen eines korpusgestützten Theoriebildungsprozesses. Als Beispiel dient die Entwicklung einer Theorie des Kommentierens. Deren Kategoriensystem wird in einem iterativ-inkrementellen Prozess der Überprüfung von Hypothesen, die im Zuge empirischer Analysen gebildet werden, aufgebaut und abduktiv ausdifferenziert. Methodisch umgesetzt wird dies durch Annotationsstudien. Sie werden flankiert von korpusstatistischen Methoden, die im Rahmen des theoretischen Samplings auf spezifisch selektierte bzw. gebildete Korpora bzw. Subkorpora angewendet werden. Als Aspekte der Hermeneutik diskutiert werden insbesondere der Umgang mit Vorwissen und bestehenden Theorien, mit der hermeneutischen Zirkularitätsmetapher und mit Objektivierungsstrategien im interpretativen Forschungssetting.

Im Beitrag von Ulrike Haß wird das Wissen im Umgang mit linguistischen Korpussystemen in den Blick genommen. Ziel des Beitrags ist es, anhand von zwei Beispielen und zwei Korpussystemen aufzuzeigen, dass es nicht nur vonnöten ist, die Beschaffenheit eines Korpus zu kennen, um Rechercheergebnisse angemessen einordnen zu können, sondern dass die digitalen Verbindungen von Korpora und Wörterbuch den Komplexitätsgrad möglicher Reflexionen in problematischer Weise erhöhen.

Katharina Jacob reflektiert die Relevanz der Korpushermeneutik in der frühen und mittleren Phase linguistischer Studien am Beispiel eines Forschungsvorhabens zur Zeit(lichkeit) in Text- und Redesammlungen verschiedener Fach- und Wissensdomänen. In dem Beitrag wird zunächst die Abweichungsirritation, mit der Linguist:innen konfrontiert sein können, vor dem Hintergrund des eigenen Sprachgebrauchsmusterwissens reflektiert, dem dann Fragen der Korpuserstellung und -aufbereitung sowie der Methoden- und Toolauswahl folgen.

In dem Beitrag von Noah Bubenhofer wird mit dem Konzept der Data Philology die These vertreten, dass Daten ebenso gelesen und verstanden werden müssen wie Texte. Er spricht sich dafür aus, einen naiven Datenpositivismus zu umgehen und statistische Verfahren für interpretative zugänglich zu machen. Dabei wird gezeigt, dass sich Prinzipien der Korpuspragmatik mit denen der Korpushermeneutik überlappen und sich die beiden Paradigmen gegenseitig ergänzen.

Aus der Perspektive der digitalen Literaturwissenschaft argumentiert Thomas Weitin dafür, aus den Gegenstandsfeldern der klassischen, hermeneutischen Literaturwissenschaft neben Produktion und Text vor allem der Rezeptionsseite mehr wissenschaftliche Beachtung zu schenken. Daten, die in diesem Bereich durch Experimente gewonnen wurden, zeigen, dass »Lesen immer auch der Eigengesetzlichkeit der dabei beteiligten kognitiven Prozesse unterliegt« (S. 1) und »die rezeptionsästhetische Vorstellung vom ›impliziten Leser‹, der auf Textstrukturen nur reagiert, zu kurz« (S. 1) greift. Mit dem expliziten Leser führt Weitin ein Konzept ein, mit dem zentrale Fragen wie nach der Funktionsweise von Aufmerksamkeit oder der Wirkung von Narrativen empirisch gestützt neu analytisch erfasst werden können.

Philipp Hegels Beitrag diskutiert zunächst die mögliche Verbindung zweier Konzepte der hermeneutischen Tradition, der Parallelstellenmethode und dem von Dilthey so genannten »Lebenshorizont« im Rahmen des philologischen Arbeitens. Neben Problematisierungen der Parallelstellenmethode im Zusammenhang mit literarischen Texten wird gezeigt, wie sie für die Hypothesenerzeugung und -prüfung über Textstellen, aber auch über die Verbreitung von Themenfeldern innerhalb eines Korpus genutzt werden kann und somit auch als Mittel für die Rekonstruktion von Lebenshorizonten. Dieses Verfahren wird anschließend im Rahmen einer rhetorischen Analyse einiger Stellen aus zwei Konvoluten des Koblenzer Liebesbriefarchivs angewendet.

Gabriel Viehhauser fokussiert in seinem Beitrag aus mediävistischer Perspektive Vagheit und Mehrdeutigkeit von Bedeutungsbildungsprozessen in Texten, denen nicht nur durch Einbezug von Ko- und Kontexten, sondern vor allem auch mit einem Wechsel zwischen quantitativen und qualitativen Methoden begegnet werden soll. Er reflektiert dies an einem Beispiel aus der mittelalterlichen deutschen Literatur, der lyrischen Untergattung des Tagelieds.

Friedrich Michael Dimpel skizziert zunächst Probleme und Lösungsansätze einer mediävistischen Korpusforschung, wie z. B. die unzureichende Verfügbarkeit von digitalen Texten und leistungsfähigen Tools für das Mittelhochdeutsche. Mit der Sentiment-Forschung wird anschließend ein solches Desiderat im Beitrag aufgegriffen. Dimpel stellt vor diesem Hintergrund das erste mittelhochdeutsche Sentiment-Wörterbuch »SentiMhd« vor, das mit automatischen Verfahren zur Sentimentanalyse ermöglicht, große Korpora oder auch Textabschnitte hinsichtlich positiver oder negativer Stimmungen zu untersuchen. Problematisiert wird der Umgang mit mehrdeutigen, kontextabhängigen oder in Negation stehenden Lemmata. Als Beispiel werden Analysen zu annotierten Figurenreferenzen in Hartmanns ›Iwein‹ vorgestellt.