Springer Nature is making SARS-CoV-2 and COVID-19 research free. View research | View latest news | Sign up for updates

Differenzanalyse komplexer Textvarianten

Diskussion und Werkzeuge

Zusammenfassung

Eine der zentralen Aufgaben bei editionsphilologischen Vorhaben ist die Feststellung der Abhängigkeiten von zu unterschiedlichen Zeitpunkten entstandenen Textzeugnissen. Für die Edition handschriftlicher Textzeugnisse beispielsweise bezieht sich dies auf die editionsphilologisch zentrale Frage des Zusammenhangs unterschiedlicher Handschriften und ihrer Filiation untereinander und bei Texten, die starke Überarbeitungsprozesse erfahren haben, auf die Frage der Textgenese. Mit leistungsstarken Werkzeugen zum Textvergleich kann sich der Editor viel monotone Arbeit ersparen und auf die wirklich interessanten Inhalte konzentrieren. Die Vergleichswerkzeuge müssen in der Lage sein, über die verschiedenen Textvarianten hinweg ähnliche Textpassagen zu identifizieren, diese zu alignieren und die Abweichungen, soweit sie für die angedachte Edition von Interesse sind, präzise aufzulisten. Sie müssen mit großen Textmengen umgehen können und trotz dieser Datenmengen kurze Reaktionszeiten haben, um ein flüssiges Arbeiten zu erlauben. Der Beitrag diskutiert das Problem des Textvergleiches an zwei Fallbeispielen, der ‚Wundarznei‛ des Heinrich von Pfalzpaint, ein frühneuhochdeutscher Text aus dem 15. Jahrhundert mit Überlieferungen aus dem 15. und 16. Jahrhundert [8], und der ‚Histoire philosophique et politique des établissements et du commerce des Européens dans les deux Indes‛ von Guillaume Thomas François Raynal, ein französischer Text aus dem 18. Jahrhundert, der mehrere starke Überarbeitungen erfuhr.

This is a preview of subscription content, log in to check access.

Fig. 1
Fig. 2
Fig. 3
Fig. 4
Fig. 5
Fig. 6

Notes

  1. 1.

    Dies könnte prinzipiell mit TUSTEP [12] erfolgen, was sich aber aufgrund der Dateibasiertheit von TUSTEP als sehr schwerfällig erweisen würde. Ein flüssiges Arbeiten durch den Wissenschaftler wäre nicht möglich.

  2. 2.

    Siehe http://www.handschriftencensus.de/4867.

References

  1. 1

    Bartz H.-W, Burch T, Christmann R, Gärtner K, Hildenbrandt V, Schares T, Wegge K (2004) Der Digitale Grimm. Deutsches Wörterbuch von Jakob und Wilhelm Grimm. Zweitausendeins,

  2. 2

    CollateX Computer program for collating textual sources. http://collatex.net/. Zugegriffen: 14. Aug. 2014].

  3. 3

    Demske U, Dipper S, Solms H-J, Wegera K-P (2011) Erstellung eines digital verfügbaren strukturierten, transkribierten, lemmatisierten und grammatisch annotierten Referenzkorpus ‚Frühneuhochdeutsch‛ (1350-1650). Projekt der Deutschen Forschungsgemeinschaft, http://gepris.dfg.de/gepris/projekt/200609649. Zugegriffen: 18. Sept. 2014

  4. 4

    Diel M, Fisseni B, Lenders W, Schmitz H-C (2002) XML-Kodierung des Bonner Frühneuhochdeutschkorpus. Technical Report IPK-Arbeitsbericht NF 02, Universität Bonn, Arbeitsbereich Sprache und Kommunikation. http://www.korpora.org/Fnhd. Zugegriffen: 15. Aug. 2014

  5. 5

    Dipper S, Donhauser K, Klein T, Linde S, Müller S, Wegera K-P (2013) HiTS: Ein Tagset für historische Sprachstufen des Deutschen. J Lang Technol and Comput Linguist 28(1):85–137

  6. 6

    Gießler A, Ritter J, Molitor P, Andert M, Kösser S, Leipold A (2014) User-friendly lemmatization and morphological annotation of Early New High German manuscripts. In Conference Abstracts of Digital Humanities

  7. 7

    Jaccard P (1902) Lois de distribution florale dans la zone alpine. Bulletin de la Société vaudoise des sciences naturelle 38:69–130

  8. 8

    Leipold A, Ritter J, Solms H-J (2014) Neue Wege zu Textzeugenvergleich und Edition am Beispiel der Wundarznei des Heinrich von Pfalzpaint. Jahrbuch für Germanistische Sprachgeschichte.

  9. 9

    Pöckelmann M, Ritter J, Gießler A (2014) On automatically disambiguating end-of-line hyphenated words in French texts. In Conference Abstracts of Digital Humanities

  10. 10

    Schmid H (1994) Probabilistic part-of-speech tagging using decision trees. In Proceedings of International Conference on New Methods in Language Processing

  11. 11

    Schmid H (1995) Improvements in part-of-speech tagging with an application to German. In Proceedings of the ACL SIGDAT-Workshop

  12. 12

    TUSTEP Tübinger System von Textverarbeitungs-Programmen. http://www.tustep.uni-tuebingen.de/. Zugegriffen: 14. Aug. 2014

  13. 13

    WinMerge http://winmerge.org/. Zugegriffen: 14. Aug. 2014

Download references

Danksagung

Wir bedanken uns bei Sylwia Kösser, Dr. Aletta Leipold, Julia Ritter und Susanne Schütz für die vielen intensiven Diskussionen.

Author information

Correspondence to Paul Molitor.

Additional information

Die Arbeiten wurden im Rahmen des Programms eHumanities des Bundesministeriums für Bildung und Forschung, Projekt SaDA: Semiautomatische Differenzanalyse von komplexen Textvarianten (BMBF-Projektkürzel: 01UG1247) gefördert.

Rights and permissions

Reprints and Permissions

About this article

Verify currency and authenticity via CrossMark

Cite this article

né Gießler Medek, A., Pöckelmann, M., Bremer, T. et al. Differenzanalyse komplexer Textvarianten. Datenbank Spektrum 15, 25–31 (2015). https://doi.org/10.1007/s13222-014-0173-y

Download citation

Schlüsselwörter

  • Differenzanalyse
  • Alignierung
  • Datenbankbasierte Lemmatisierung
  • Textkritischer Apparat