Datenbank-Spektrum

, Volume 15, Issue 1, pp 25–31 | Cite as

Differenzanalyse komplexer Textvarianten

Diskussion und Werkzeuge
  • André né Gießler Medek
  • Marcus Pöckelmann
  • Thomas Bremer
  • Hans-Joachim Solms
  • Paul Molitor
  • Jörg Ritter
SCHWERPUNKTBEITRAG

Zusammenfassung

Eine der zentralen Aufgaben bei editionsphilologischen Vorhaben ist die Feststellung der Abhängigkeiten von zu unterschiedlichen Zeitpunkten entstandenen Textzeugnissen. Für die Edition handschriftlicher Textzeugnisse beispielsweise bezieht sich dies auf die editionsphilologisch zentrale Frage des Zusammenhangs unterschiedlicher Handschriften und ihrer Filiation untereinander und bei Texten, die starke Überarbeitungsprozesse erfahren haben, auf die Frage der Textgenese. Mit leistungsstarken Werkzeugen zum Textvergleich kann sich der Editor viel monotone Arbeit ersparen und auf die wirklich interessanten Inhalte konzentrieren. Die Vergleichswerkzeuge müssen in der Lage sein, über die verschiedenen Textvarianten hinweg ähnliche Textpassagen zu identifizieren, diese zu alignieren und die Abweichungen, soweit sie für die angedachte Edition von Interesse sind, präzise aufzulisten. Sie müssen mit großen Textmengen umgehen können und trotz dieser Datenmengen kurze Reaktionszeiten haben, um ein flüssiges Arbeiten zu erlauben. Der Beitrag diskutiert das Problem des Textvergleiches an zwei Fallbeispielen, der ‚Wundarznei‛ des Heinrich von Pfalzpaint, ein frühneuhochdeutscher Text aus dem 15. Jahrhundert mit Überlieferungen aus dem 15. und 16. Jahrhundert [8], und der ‚Histoire philosophique et politique des établissements et du commerce des Européens dans les deux Indes‛ von Guillaume Thomas François Raynal, ein französischer Text aus dem 18. Jahrhundert, der mehrere starke Überarbeitungen erfuhr.

Schlüsselwörter

Differenzanalyse Alignierung Datenbankbasierte Lemmatisierung Textkritischer Apparat 

References

  1. 1.
    Bartz H.-W, Burch T, Christmann R, Gärtner K, Hildenbrandt V, Schares T, Wegge K (2004) Der Digitale Grimm. Deutsches Wörterbuch von Jakob und Wilhelm Grimm. Zweitausendeins,Google Scholar
  2. 2.
    CollateX Computer program for collating textual sources. http://collatex.net/. Zugegriffen: 14. Aug. 2014].
  3. 3.
    Demske U, Dipper S, Solms H-J, Wegera K-P (2011) Erstellung eines digital verfügbaren strukturierten, transkribierten, lemmatisierten und grammatisch annotierten Referenzkorpus ‚Frühneuhochdeutsch‛ (1350-1650). Projekt der Deutschen Forschungsgemeinschaft, http://gepris.dfg.de/gepris/projekt/200609649. Zugegriffen: 18. Sept. 2014
  4. 4.
    Diel M, Fisseni B, Lenders W, Schmitz H-C (2002) XML-Kodierung des Bonner Frühneuhochdeutschkorpus. Technical Report IPK-Arbeitsbericht NF 02, Universität Bonn, Arbeitsbereich Sprache und Kommunikation. http://www.korpora.org/Fnhd. Zugegriffen: 15. Aug. 2014
  5. 5.
    Dipper S, Donhauser K, Klein T, Linde S, Müller S, Wegera K-P (2013) HiTS: Ein Tagset für historische Sprachstufen des Deutschen. J Lang Technol and Comput Linguist 28(1):85–137Google Scholar
  6. 6.
    Gießler A, Ritter J, Molitor P, Andert M, Kösser S, Leipold A (2014) User-friendly lemmatization and morphological annotation of Early New High German manuscripts. In Conference Abstracts of Digital HumanitiesGoogle Scholar
  7. 7.
    Jaccard P (1902) Lois de distribution florale dans la zone alpine. Bulletin de la Société vaudoise des sciences naturelle 38:69–130Google Scholar
  8. 8.
    Leipold A, Ritter J, Solms H-J (2014) Neue Wege zu Textzeugenvergleich und Edition am Beispiel der Wundarznei des Heinrich von Pfalzpaint. Jahrbuch für Germanistische Sprachgeschichte.Google Scholar
  9. 9.
    Pöckelmann M, Ritter J, Gießler A (2014) On automatically disambiguating end-of-line hyphenated words in French texts. In Conference Abstracts of Digital HumanitiesGoogle Scholar
  10. 10.
    Schmid H (1994) Probabilistic part-of-speech tagging using decision trees. In Proceedings of International Conference on New Methods in Language ProcessingGoogle Scholar
  11. 11.
    Schmid H (1995) Improvements in part-of-speech tagging with an application to German. In Proceedings of the ACL SIGDAT-WorkshopGoogle Scholar
  12. 12.
    TUSTEP Tübinger System von Textverarbeitungs-Programmen. http://www.tustep.uni-tuebingen.de/. Zugegriffen: 14. Aug. 2014
  13. 13.
    WinMerge http://winmerge.org/. Zugegriffen: 14. Aug. 2014

Copyright information

© Springer-Verlag Berlin Heidelberg 2014

Authors and Affiliations

  • André né Gießler Medek
    • 1
  • Marcus Pöckelmann
    • 1
  • Thomas Bremer
    • 2
  • Hans-Joachim Solms
    • 3
  • Paul Molitor
    • 1
  • Jörg Ritter
    • 1
  1. 1.Institut für InformatikUniversität Halle-WittenbergHalleDeutschland
  2. 2.Institut für RomanistikUniversität Halle-WittenbergHalleDeutschland
  3. 3.Germanistisches InstitutUniversität Halle-WittenbergHalleDeutschland

Personalised recommendations