Skip to main content

Vergleichende Korpusanalyse als Erkenntnisinstrument der Literaturgeschichte

  • 234 Accesses

Part of the Digitale Literaturwissenschaft book series (DL)

Zusammenfassung

Wir haben bislang ein Korpus analysiert, das uns als historische Sammlung in genau der Auswahl vorlag, die die Herausgeber einst verantworteten. Dabei handelte es sich also nicht um eine repräsentative Stichprobe aus der riesigen Novellenpopulation des 19. Jahrhunderts, sondern um Texte, die nach dem Dafürhalten zweier Schriftsteller der Literaturgeschichte als Muster dieser Gattung überliefert werden sollten.

This is a preview of subscription content, access via your institution.

Buying options

eBook
USD   24.99
Price excludes VAT (USA)
  • ISBN: 978-3-662-63663-3
  • Instant PDF download
  • Readable on all devices
  • Own it forever
  • Exclusive offer for individuals only
  • Tax calculation will be finalised during checkout
Softcover Book
USD   34.99
Price excludes VAT (USA)
Abb. 3.1
Abb. 3.2

Notes

  1. 1.

    Im Darmstädter LitLab arbeiten wir mit automatischer Schrifterkennung (OCR = optical character recognition) und händischer Nachkorrektur im Rahmen der Software ABBYY -FineReader, die auch Fraktur erkennen kann. Die Alternative ist das so genannte double keying, bei dem zwei Nicht-Muttersprachler die Korpustexte unabhängig voneinander eingeben und der Computer dann beide Versionen abgleicht. Voraussichtlich wird sich dieser qualitativ hochwertigere, aber auch viel teurere Ansatz langfristig nur für die Erstellung digitaler Werkausgaben halten lassen. Bei entsprechender Handhabung und Nachkorrektur ist die automatische Schrifterkennung für den Zweck wissenschaftlicher Korpusanalyse ausreichend.

  2. 2.

    Bereits 2013 widmete der Economist der Replikationskrise in den experimentellen Wissenschaften eine ausführliche Analyse und einen Leitartikel (The Economist 2013). 2015 sorgte ein Artikel der „Open Science Collaboration“ in Science für Aufregung, dem zu Folge mehr als die Hälfte von 100 überprüften Psychologiestudien nicht reproduziert werden konnte (2015). Allerdings konnten diesem Artikel selbst statistische Fehler nachgewiesen werden (Gilbert et al. 2016). 2016 nahm der Economist das Thema erneut auf und berichtete u. a., wie ein Bug in einer populären Software für die Visualisierung von Hirnaktivität eine Vielzahl neurowissenschaftlicher Studien in den gleichen unbemerkten Fehler getrieben hatte (The Economist 2016).

  3. 3.

    Wie viele Netzwerkanalysetools verfügt „Visone“ über eine Best Layout-Funktion, die in Kombination mit ganz unterschiedlichen Algorithmen immer dafür sorgt, dass das Modell optimal, d. h. mit so viel wie möglich ersichtlicher Information dargestellt wird. Da wir für das Modell kein Centrality-Layout verwendet haben, sind nicht notwendigerweise die Texte in der Mitte auch am zentralsten. Im Sinne eines optimalen Layouts ist es aber natürlich sinnvoll, Texte mit sehr vielen eingehenden Verbindungen in der Modellmitte zu platzieren.

  4. 4.

    Komponenten sind in unseren Modellen Gruppen, deren Verbindungen zum Hauptnetzwerk durch den Simmelian Backbone-Algorithmus herausgefiltert worden sind. Um sie gut gemeinsam darstellen zu können, werden sie nah am Hauptnetzwerk gezeigt, der Abstand trägt aber keine Information.

  5. 5.

    Allerdings fälschlich auf Charlotte von Kalb (Krug 2004, S. 125).

  6. 6.

    Die Alternative wäre eine komplette automatische Normalisierung gewesen, etwa mit dem CAB-Service des Deutschen Textarchivs (CAB = Cascaded Analysis Broker). Allerdings greift dieses Tool bei der Normalisierung stark in die Stilebene ein, ersetzt „andern“ durch „anderen“ oder „ich’s“ durch „ich es“, was für stilometrische Analyse zum Problem werden kann. Da Christian Thomas vom Deutschen Textarchiv uns freundlicherweise beide Untersuchungskorpora komplett mit CAB bearbeitet hat, konnten wir die Folgen im Kontext unseres Forschungsinteresses direkt beobachten. Zur Funktionsweise des CAB-Algorithmus gehört es, dass er durch die in seinen Trainingsdaten häufigere Form ersetzt, was auch zu inhaltlichen Änderungen führen kann. So wurde bei unseren Korpora aus der weiblichen Form „Gesandtin“ der Plural „Gesandten“. Für unseren Zweck erschien uns daher eine hermeneutisch sensible Normalisierung ratsamer. Wir haben indes unsere auf dieser Basis berechneten Netzwerkmodelle mit Varianten verglichen, die wir auf der Basis der CAB-normalisierten Korpora erstellt haben, und konnten keine wesentlichen Unterschiede feststellen.

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Thomas Weitin .

Rights and permissions

Reprints and Permissions

Copyright information

© 2021 Der/die Autor(en), exklusiv lizenziert durch Springer-Verlag GmbH, DE, ein Teil von Springer Nature

About this chapter

Verify currency and authenticity via CrossMark

Cite this chapter

Weitin, T. (2021). Vergleichende Korpusanalyse als Erkenntnisinstrument der Literaturgeschichte. In: Digitale Literaturgeschichte. Digitale Literaturwissenschaft. J.B. Metzler, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-63663-3_3

Download citation

  • DOI: https://doi.org/10.1007/978-3-662-63663-3_3

  • Published:

  • Publisher Name: J.B. Metzler, Berlin, Heidelberg

  • Print ISBN: 978-3-662-63662-6

  • Online ISBN: 978-3-662-63663-3

  • eBook Packages: J.B. Metzler Humanities (German Language)