Verzeichnis der Fragen

1. Was sind Normdaten? – 2. Was ist der Unterschied zwischen Metadaten und Normdaten? – 3. Welche Normdateien gibt es? – 4. Welchen Nutzen bieten Normdaten? – 5. Warum gibt es Bezeichnungsvarianten und welche Ansetzung ist richtig? – 6. Was ist die Gemeinsame Normdatei (GND)? – 7. Wie ist ein Datensatz der GND aufgebaut? – 8. Wie finde ich etwas in der GND? – 9. Wie ändere ich Daten in der GND? – 10. Was bedeutet die Geschichte der GND für ihre Nutzung? – 11. Wie vertrauenswürdig sind Normdaten? – 12. Worauf beruhen die GND-Daten? – 13. Inwiefern sind Normdaten für die Drittmittelförderung wichtig? – 14. Was sind beispielhafte Anwendungsszenarien für die Nutzung von Normdaten? – 15. Wo kann ich weiterlesen? – 16. Abkürzungen und Begriffe

1 Was sind Normdaten?

Normdaten sind Metadaten, die verbindliche und persistente Identifikatoren (IDs) für Personen, Orte, Werke und vieles mehr bereitstellen. Ursprünglich wurden Normdaten von Bibliotheken als Instrument zur Verbesserung der Katalogisierung von Büchern entwickelt. Ein einfaches Beispiel für das Problem, dem Normdaten begegnen wollen, sind AutorInnennamen, die sich in verschiedenen Büchern desselben Schriftstellers in unterschiedlichen Varianten zeigen können. Der Dichter Heinrich Heine wurde als Harry Heine geboren und veröffentlichte seine ersten Texte unter dem Pseudonym Sy Freudhold Riesenharf; hinter diesen drei Namen steht dieselbe Person. Für die Erschließung bibliothekarischer Quellen wurde es als nützlich erachtet, alle bekannten Pseudonyme, Beinamen, Geburts- oder Ehenamen unter einer Hauptansetzung zu vereinen, wodurch nicht nur die einzelnen Varianten leichter zusammengeführt werden, sondern auch die Suche nach allen Veröffentlichungen einer Person unabhängig von den Angaben auf der Titelseite erleichtert wird. Normdaten reagieren auch auf das Problem der Unterscheidung von Personen gleichen Namens. Unter dem Namen Heinrich Heine ist nicht nur ein Schriftsteller bekannt, sondern auch ein Heimatforscher, ein Maler, ein Bierbrauer und gar ein Ausflugsschiff, die mittels eindeutiger Kennzeichnung voneinander unterschieden werden können. Heute sind Normdaten über den Bibliothekskontext hinaus für Erschließungsdaten aus Kulturerbe-Einrichtungen und für Forschungsdaten aus Drittmittelprojekten von Relevanz. Denn, was für Personennamen funktioniert, lässt sich auch z. B. auf Orte (Praha/Prag), Titel (Die Leiden des jungen Werther/s) oder Appellativa allgemein (Kartoffel/Erdapfel) übertragen. Normdaten dienen der eindeutigen Identifizierung von Objekten aller Art, auch und gerade dann, wenn sie mit Synonymen bezeichnet werden.

2 Was ist der Unterschied zwischen Metadaten und Normdaten?

Metadaten sind beschreibende Kurzinformationen über andere Daten. Sie informieren beispielsweise darüber, wer ein Buch geschrieben hat, in welcher Sprache ein Programmcode verfasst ist, wer auf eine Datei zugreifen darf oder in welchem Museum eine Skulptur steht. In diesem Sinne sind Normdaten Metadaten von Metadaten; allerdings sind nicht alle Metadaten regelhaft strukturiert, wie es für Normdaten erforderlich ist.

3 Welche Normdateien gibt es?

Normdaten (englisch: authority control) werden in einer Normdatei (englisch: authority file) gesammelt. Die im deutschsprachigen Raum von Kulturerbe-Einrichtungen und Geisteswissenschaften aktuell meistgenutzte Normdatei ist die Gemeinsame Normdatei (GND), die von der Deutschen Nationalbibliothek (DNB) organisiert wird. Analog zur GND haben (National‑)Bibliotheken weltweit ähnliche Normdateien erstellt, die in ihrem Bereich wirkmächtig sind, etwa die Autorités des französischen Verbundkatalogs Système Universitaire de Documentation (SUDOC) oder der Nuovo soggettario der Biblioteca Nazionale Centrale di Firenze (BNCF). International am bekanntesten sind die Authority Records und deren Control Numbers der Library of Congress (LCCN). Seit einigen Jahren gibt es den Versuch, mehrere Normdateien in einem Virtual International Authority File (VIAF) zusammenzuführen. Über die Bibliotheken hinaus werden Normdateien auch in anderen Institutionen und für Entitäten jenseits des Buches angelegt und verwendet, beispielsweise in Museen (z. B. Getty Union List of Artist Names), als geographisches Informationssystem (GeoNames) oder für wiederkehrende Terminologie in den EU Vocabularies des Amts für Veröffentlichungen der Europäischen Union. Erwähnenswert ist auch Wikidata, eine frei bearbeitbare Wissensdatenbank, die aufbauend auf Wikipedia entwickelt wurde, aber in weiten Teilen ähnlich wie eine Normdatei funktioniert. Ursprünglich hatte Wikidata den Zweck, die gemeinsamen Wissensbestände aller Artikel auszulagern, damit z. B. die Einwohnerzahl eines Ortes in allen Sprachen gleichzeitig aktuell gehalten werden kann. Die gemeinsamen Informationen werden in Form von Normdaten organisiert. Das Prinzip ist inzwischen ausgeweitet worden und Wikidata ist insbesondere wegen seiner unkomplizierten Bearbeitbarkeit attraktiv. Ein internationales Verzeichnis kontrollierter Vokabulare, Normdateien, Thesauri, Ontologien, Taxonomien und Klassifikationssystemen entsteht mit dem Basic Register of Thesauri, Ontologies & Classifications (http://bartoc.org/). Eine DAtendrehscheibe für Normdaten und TErminologien, kurz DANTE, bietet der Bibliotheksverbund GBV (https://dante.gbv.de/).

4 Welchen Nutzen bieten Normdaten?

Die eingangs vorgestellte Unterscheidung von Bezeichnungsvarianten ist nur ein Beispiel für den Mehrwert, der sich für einzelne Forschungsprojekte oder Kulturerbe-Einrichtungen ergeben kann. Der Mehrwert resultiert aus den Beschreibungsinformationen, die in den Normdaten enthalten sind. Diese Informationen unterscheiden sich je nach vorgesehenem Zweck der Normdatei und ihres Regelwerks. Der Nutzen einer Verwertung der Informationen ist zunächst dadurch bedingt, ob sie gewinnbringend für eigene Zwecke übernommen werden können. Doch streng genommen sind die Beschreibungsinformationen von untergeordneter Bedeutung. Normdatensätze dienen im Kern der Identifikation von Entitäten. Basal enthalten sie deshalb nur so viele Informationen, wie zur Identifikation notwendig sind. Eine Doppelung von Informationen, die in anderen Portalen oder Nachschlagewerken zu finden sind, ist dafür nicht erforderlich, auch wenn es in der Praxis vorkommt. Ein Normdatensatz beispielsweise einer Person enthält neben einer ID-Nummer den Namen, die Lebensdaten und falls erforderlich weitere Angaben, damit diese Person exakt identifiziert werden kann. Die wichtigste Funktion von Normdaten ist, dass anhand einer ID eine Referenz für den automatisierten Austausch von Daten unterschiedlicher Herkunft und unterschiedlicher Erfassungsweisen geschaffen wird; es sind dann nicht mehr nur die Beschreibungsinformationen von Interesse, die direkt in den Normdaten gespeichert sind, sondern all jene Daten werden miteinander verknüpfbar, die sich in unabhängigen Projekten auf dieselbe Entität beziehen. Entitäten werden durch Normdaten identifizierbar. Normdaten sind deshalb besonders nützlich in einem Semantic Web, wie es der Erfinder des WWW, Tim Berners-Lee, vorgeschlagen hat: Im Semantic Web sind Daten nicht bloß für den Download verfügbar, sondern werden um Metadaten erweitert, die von Computern verarbeitet werden können. Hat man zuvor verschiedene Daten von einem Server geladen und musste sie manuell auf ihre Nützlichkeit prüfen, ist im Semantic Web gemeinsam mit den Daten bereits der passende Kontext angegeben, damit die Prüfung maschinell erfolgen kann. Diese austauschbaren Daten sind vorzugsweise frei zugänglich (Linked Open Data = LOD) und nach einem festen Schema strukturiert (z. B. RDF). Durch die Integration von Normdaten wird außerdem die Reichweite und Sichtbarkeit von Datenbeständen und Portalen im Internet erhöht, da Suchmaschinen Webseiten bevorzugen, die Normdaten enthalten.

5 Warum gibt es Bezeichnungsvarianten und welche Ansetzung ist richtig?

Bezeichnungen ändern sich gelegentlich und oftmals sind mehrere Varianten zeitgleich im Umlauf. Ursache dafür sind etwa Gebrauchswandel (die norwegische Hauptstadt Oslo trug 1624–1924 den Namen Christiania) oder auch Sprachunterschiede (Beispiel: Roma, Rome, Rom, Rim, an Róimh). Der deutsche Name ›Losannen‹ für die Hauptstadt des Kantons Waadt, Lausanne, ist heute weitgehend unbekannt. Bei Beispielen dieser Art handelt es sich immer um dieselbe Stadt. Wenn jemand den Ort oder den Zusammenhang der Namensvarianten nicht kennt, braucht er für den angemessenen Umgang mit ihnen zusätzliche Informationen. Nicht alle Varianten sind gleichermaßen bekannt oder eingeführt, dennoch werden sie in ihrem gewöhnlichen Gebrauchskontext als ›richtig‹ aufgefasst. Im Deutschen ist die Verwendung von ›Rom‹ üblich, im Italienischen dagegen sagt man ›Roma‹. Zuweilen gibt es sogar Varianten, die in einer Sprache gleichbedeutend nebeneinanderstehen (z. B. Den Haag und ’s-Gravenhage). Ein Regelwerk kann eine Sortierung dieser Varianten vorsehen, indem eine Variante als Hauptansetzung privilegiert wird. Die Exponierung einer Variante setzt in der Regel keine ausführliche Bewertung voraus, wie es z. B. bei einer Analyse der Verwendungshäufigkeit oder Aushandlung durch eine Expertencommunity der Fall wäre. Die Hauptansetzung steht nicht für eine vermeintlich ›richtige‹ Variante, sondern gilt als pragmatische Ansetzung.

6 Was ist die Gemeinsame Normdatei (GND)?

Die GND ist eine Sammlung von Normdaten über Personen, Körperschaften, Konferenzen, Geografika, Sachschlagwörtern und Werken, die nach dem Regelwerk Resource Description and Access (RDA) erfasst werden und die auf dem Datenmodell der Functional Requirements for Bibliographic Records (FRBR) basieren.Footnote 1 Sie umfasst ca. 9 Mio. Datensätze. Für die Geisteswissenschaften ist die GND besonders attraktiv, da sie bereits zahlreiche Personen seit der Antike wie auch Werke der Musik, der Literatur und der Kunst erfasst hat. Es gibt diverse Portale, mit denen man online in den Datensätzen recherchieren kann, sowie Schnittstellen für die Weiterverarbeitung in anderen Programmen und Datenbanken. Die GND steht unter der Lizenz CC0 frei zur Verfügung und kann über den Metadatendienst der DNB kostenlos bezogen werden.Footnote 2 Es ist also ein vollständiger Download möglich. Die Gemeinsame Normdatei (GND) wird von der Deutschen Nationalbibliothek, den Bibliotheksverbünden in Deutschland, Österreich und der Schweiz sowie weiteren Partnern kooperativ betrieben; das Netzwerk besteht aus mehr als 1.000 Einrichtungen. Steuerungsgremium ist der Standardisierungsausschuss, der vom GND-Ausschuss unterstützt wird; der Standardisierungsausschuss wiederum bildet Arbeitsgemeinschaften mit Expertengruppen zu Spezialthemen wie die angemessene Erfassung von Handschriften, Frühdrucken oder Bildern.

7 Wie ist ein Datensatz der GND aufgebaut?

Der Aufbau eines GND-Eintrags wird in der Regel nach dem sog. MARC21-Beschreibungsformat angegeben. Zentral ist eine eindeutig vergebene ID, die auch als Permalink den Zugang zum Datensatz sichert (z. B. https://d-nb.info/gnd/1218053429). Zu einem Eintrag gehört zunächst die Angabe des Entitätentyps (u. a. Sachbegriff, Werk, Person), sodann werden verschiedene Benennungen (darunter eine Hauptansetzung) festgehalten, es werden weitere Attribute genannt, die zur Abgrenzung von anderen Einträgen nötig sind, und schließlich Beziehungen zu anderen Entitäten hergestellt (z. B. »Autor von« oder »Teil eines Werks«). Zur Angabe der Qualität des Datensatzes können GND-Normdaten intern mit bestimmten ›Levels‹ gekennzeichnet werden. Die Levels reichen von 1 bis 6, wobei die höchste Datenqualität mit Level 1 bewertet wird. Der jeweilige Level beruht auf der Erfahrung und Expertise der erstellenden Institution wie auch auf der Anzahl der eingetragenen Informationen im Normdatensatz.

8 Wie finde ich etwas in der GND?

Auf die GND kann über verschiedene Portale zugegriffen werden. Sämtliche Daten sind im Katalog der Deutschen Nationalbibliothek zu finden.Footnote 3 Erschwert wird die Verwendung dadurch, dass die Normdaten gleichrangig mit dem Bestand der DNB angezeigt werden. Für wenig erfahrene BenutzerInnen ist es kaum ersichtlich, ob sich der angezeigte Datensatz auf das konkrete Exemplar eines Buches in Frankfurt bzw. Leipzig oder auf einen Normdatensatz bezieht. Die Ergebnisse lassen sich immerhin filtern, damit ausschließlich die Normdaten angezeigt werden. Es gibt aber auch einfachere Oberflächen: Lobid (»linking open bibliographic data«) des Hochschulbibliothekszentrums NRW ist eine Sammlung von Rechercheoberflächen und offenen Programmierschnittstellen, die auf Linked Open Data basieren und mitunter eine grafische Rechercheoberfläche anbieten.Footnote 4 Das Bibliotheksservice-Zentrum BW orientiert sich mit Online-GND (OGND) hingegen stärker am Benutzerverhalten und den Ansprüchen von Studierenden und Forschenden.Footnote 5WebGND ist ein unkomplizierter Zugang der Firma Eurospider.Footnote 6 Neuerdings steht mit dem GND-Explorer auch ein Zugang der DNB zur Verfügung, der die Verwendung externer Ressourcen vereinfachen und die Vernetzung von Datensätzen visualisieren wird.Footnote 7

9 Wie ändere ich Daten in der GND?

Die GND ist kein offenes Projekt, man kann die darin befindlichen Daten nur nach Anmeldung bei der DNB und mit institutioneller Anbindung bearbeiten. Ergänzungen oder Korrekturen können nicht direkt von allen BenutzerInnen vorgenommen werden, sondern diese müssen sich an eine Institution wenden, die über Schreibrechte verfügt, mit denen sie Änderungen vornehmen oder über eine Mailbox anstoßen kann. Die GND wurde ursprünglich von zahlreichen deutschsprachigen Bibliotheken gemeinschaftlich geführt. Mittlerweile öffnet sie sich auch für andere Akteure, etwa Archive, Museen, Sammlungen oder Forschungsprojekte, die auch selbst neue Datensätze in die GND einbringen. Obschon es relativ einfach ist, Schreibrechte zu erhalten, stellt der Zugang dennoch eine Hürde dar, denn die Erfassung ist wenig intuitiv und das Regelwerk setzt eine gewisse Einarbeitung voraus, wodurch aber ein hohes Maß an Formalisierung garantiert ist.

Beispielhaft sei die Arbeit des Akademievorhabens Handschriftencensus (HSC) genannt, das Normdaten für mittelalterliche Werke in der GND erstellt.Footnote 8 Der HSC erfasst systematisch das deutschsprachige Handschriftenerbe und sämtliche deutschsprachigen Werke des Mittelalters. Er ist die standardgebende Instanz für die Hauptansetzung des Titels eines deutschsprachigen Werks des Mittelalters. Für die Arbeit in der GND hat sich der HSC mit der Universitätsbibliothek Marburg zusammengeschlossen. Die Verantwortung für die redaktionellen Aufgaben rund um die neueingebrachten Normdatensätze wie die Korrektur und Ergänzung von bereits zuvor eingetragenen Datensätzen oder auch die Beantwortung von Rückfragen über das angeschlossene Mailboxsystem wird gemeinsam getragen. Durch die enge und auf Dauer angelegte Kooperation werden bibliothekarische GND-Expertise und Wissenschaft so verbunden, dass qualitätsgeprüfte Daten bereitgestellt und redaktionell betreut werden. Das Beispiel zeigt, wie aufwendig die organisatorische Struktur hinter der Erstellung von Normdatensätzen ist, die auf eine dauerhafte Pflege einmal angelegter Datensätze ausgelegt sein muss. Es wird sich in den kommenden Jahren zeigen, ob die GND mit offenen Normdateien, die direkt von allen BenutzerInnen bearbeitet werden können, konkurrieren kann oder ob just die durch die starke Bindung an ein Regelwerk und an Institutionen garantierte Zuverlässigkeit wichtiger erscheint. Bei dem Thema Normdaten zeigt sich auch deutlich die veränderte Rolle der Bibliotheken im Wissenschaftsbetrieb. Es kommt zu engeren Kooperationen und die Bibliotheken sind für die Arbeit mit und an Normdaten ein zentraler Anlaufpunkt geworden.

10 Was bedeutet die Geschichte der GND für ihre Nutzung?

Die GND erwuchs 2012 aus der Zusammenführung bestehender Normdateien: Dies sind primär die Gemeinsame Körperschaftsdatei (GKD), die Personennamendatei (PND) und die Schlagwort-Normdatei (SWD). Auch diese Normdateien haben ihre Geschichte; beispielsweise entstand die PND Ende der 1980er Jahre aus konvertierten Titeldaten großer Bibliotheken. Für die Geisteswissenschaften ist von besonderem Interesse, dass dezidiert auch historische Namen erfasst wurden. Die Personennamen der Antike bzw. des Mittelalters wurden gemeinsam mit FachvertreterInnen erarbeitet und als eigenständige Monographie veröffentlicht. Die GKD war zum Zeitpunkt der Überführung in die GND fast 40 Jahre alt. Mit Entstehen der GND konnte auf Datensätze zurückgegriffen werden, die bereits eine relativ hohe Qualität und vor allem einen großen Umfang aufwiesen. Seit der Gründung wurde die GND nicht nur vergrößert, sondern auch in internationaler Perspektive erweitert. Realisiert ist diese Perspektive u. a. durch die Integration in eine virtuelle Zusammenführung mehrerer nationaler Normdateien (VIAF, siehe oben 2). Der knappe Abriss zeigt, dass Normdaten zu einem bestimmten Zeitpunkt und von bestimmten AkteurInnen erstellt werden. Selbst wenn sie in ihrem Ergebnis wie ›neutrale‹ Daten aussehen, entstehen sie aus einem historisch bedingten, exklusiven Interesse. Deshalb ist es in einem wissenschaftlichen Zusammenhang ratsam, die Geschichte eines Normdatenbestandes zu beachten.

11 Wie vertrauenswürdig sind Normdaten?

Wenn man Forschungsdaten mit Normdaten in Verbindung bringt oder gar durch sie strukturiert, dann werden im eigenen Projekt Fremddaten genutzt. Es stellt sich die Frage nach der Vertrauenswürdigkeit dieser Daten. Bei Normdaten handelt es sich um Arbeitsinstrumente, die in der Art des Wissenszugangs ähnlich funktionieren wie Enzyklopädien, Wörterbücher oder Grammatiken. Sie reduzieren und hierarchisieren komplexe Sachverhalte für einen bestimmten Zweck, in diesem Fall zum Zweck der Identifikation. Benutzt werden Normdaten von einer wissenschaftlichen Community aber nur, wenn sie die Komplexitätsreduktion als nützlich und angemessen anerkennt. Vertrauenswürdig sind sie erst dann, wenn sie auf bestehenden Praktiken und anerkannten Wissensbeständen beruhen und von ExpertInnen erstellt werden. Wenn dieser Qualitätsanspruch nicht gegeben ist oder die verkürzte Darstellung der Gegenstände als unpassend empfunden wird, droht die Gefahr, dass die Normdaten ignoriert werden und für einen größeren Nutzerkreis unbrauchbar sind; im schlimmsten Fall verfälschen sie spätere Forschungsergebnisse, ohne dass man einen Einblick in den zugrundeliegenden Mechanismus hätte. Ein Problem erwächst beispielsweise daraus, wenn in einer Normdatei größere Gruppen von Entitäten oder auch Beschreibungsaspekte ignoriert werden, die womöglich für andere Fragestellungen relevant wären. Normdaten schaffen auch bestimmte Deutungen der Welt, indem sie Festlegungen treffen. Die damit verbundene ethische Dimension sollte immer berücksichtigt werden (in der GND wurde etwa die Verwendung eines Sachbegriffs ›Überfremdung‹ diskutiert). Angesichts dieser Probleme wird ersichtlich, dass der Umgang mit Normdaten ein gewisses Maß an Vertrauen in die Autorität derjenigen, die sie erstellt haben, erfordert. Vertrauenswürdigkeit entsteht also nicht bloß durch eine sachkundige Erstellung, sondern auch durch kompetente Benutzung. Ein weiteres Problem stellen teilweise die bereits existierenden Normdaten insofern dar, als sie anhand der Angaben aus veralteten Nachschlagewerken erfasst wurden, denn in der Zwischenzeit hat die Forschung neue Erkenntnisse, Identifikationen oder Zusammenhänge erbracht. Die Pflege und Fortschreibung der Normdaten ist nur durch aktive Verbindung mit der Forschung möglich und bleibt eine dauerhafte Herausforderung.

12 Worauf beruhen die GND-Daten?

Die Vertrauenswürdigkeit der GND basiert auf dem sogenannten Nachschlagewerk-Prinzip; sie gibt eine verbindliche »Liste der fachlichen Nachschlagewerke«Footnote 9 vor, die als Quellen für die Erstellung neuer Datensätze bevorzugt genutzt werden sollen. Nur wenn die Nutzung dort genannter Titel nicht möglich ist, darf auf alternative Quellen zurückgegriffen werden, die in den Datensätzen anzugeben sind. Verwendet werden in erster Linie etablierte Nachschlagewerke, also anerkannte und gesicherte Wissensbestände, und die verwendeten Quellen sind nachvollziehbar in den Datensätzen dokumentiert. Das Prinzip stammt jedoch noch aus einer Zeit, in der Nachschlagewerke für schnell zugängliches und gesichertes Faktenwissen standen. Dieser Status hat sich gewandelt, weil traditionelle Nachschlagewerke von Online-Portalen, allen voran der ›Wikipedia‹, abgelöst wurden. Die Vertrauenswürdigkeit von Normdaten auch heute noch auf ein Nachschlagewerk-Prinzip zu stützen, ist deshalb problematisch, weil manche der gedruckten Quellen nicht mehr nachgeführt werden und einen veralteten Wissensstand bieten. Das gilt für Inhalte von Standardwerken wie dem Brockhaus, dessen 21. Auflage lediglich bis 2010 aktualisiert wurde, aber auch für fachliche Nachschlagwerke, die oft nicht mehr in neuen Auflagen erscheinen. Dieser veränderte Stellenwert von Nachschlagewerken kann auf Dauer nicht ohne Folgen für das Nachschlagewerk-Prinzip der GND bleiben. Die Akzeptanz der GND-Daten in der wissenschaftlichen Community dürfte in nicht geringem Maß von der Verwendung der einschlägigen Fachterminologie und von der Aktualität der Normdaten abhängen. Beispielsweise wird das Faustbuch (GND-ID 4153795-6) mit dem veralteten Gattungsbegriff ›Volksbuch‹ spezifiziert, statt mit dem heute gängigen Zusatz ›Prosaroman‹. Der Erwartung von aktueller Fachterminologie wird zunehmend das RangfolgeprinzipFootnote 10 entgegenstehen, demgemäß allgemeine Nachschlagewerke zu konsultieren und gegenüber spezielleren Forschungspublikationen zu bevorzugen sind. Doch Wissensbestände und Terminologien veralten, sobald die Forschung sich weiterentwickelt. Eine dauerhafte Herausforderung wird es deshalb sein, die GND durch aktive Zusammenarbeit mit der Wissenschaft zu pflegen und zu erweitern. Es gilt, eine gemeinsame Sprache, eine gemeinsame Zielrichtung, eine gemeinsame Verantwortung für den Datenbestand und einen gemeinsamen Modus der Zusammenarbeit zu finden.

13 Inwiefern sind Normdaten für die Drittmittelförderung wichtig?

Die Berücksichtigung von Normdaten spielt eine wichtige Rolle bei der Entwicklung und Planung von geisteswissenschaftlichen Forschungsprojekten, in denen Daten entstehen oder ausgewertet werden. Alle großen Forschungsförderorganisationen erwarten inzwischen im Rahmen der Antragseinreichung ausgearbeitete Datenmanagementpläne – z. B. die Deutsche Forschungsgemeinschaft (DFG), der Schweizer Nationalfonds (SNF), der Fonds zur Förderung der wissenschaftlichen Forschung (FWF), das Bundesministerium für Bildung und Forschung (BMBF), die VolkswagenStiftung, aber auch das EU-Programm Horizon. Zahlreiche Universitäten haben inzwischen eigene Stabsstellen für Forschungsdaten eingerichtet. Mit der Nationalen Forschungsdateninfrastruktur (NFDI)Footnote 11 wird seit 2019 der Aufbau eines Forschungsdatenmanagements jährlich mit einem hohen zweistelligen Millionenbetrag gefördert. Besondere politische Dimension erlangte das Thema im Koalitionsvertrag von SPD, Grünen und FDP im Jahr 2021.Footnote 12 Die DFG hat darüber hinaus im Jahr 2019 in ihren Leitlinien zur Sicherung guter wissenschaftlicher PraxisFootnote 13 das Forschungsdatenmanagement und auch die Berücksichtigung der sog. FAIR-Prinzipien gestärkt, mit denen die Nachnutzung erstellter Forschungsdaten gewährleistet wird. Normdaten gehören zu den Instrumenten, mit denen geisteswissenschaftliche Forschungsdaten interoperabel gemacht werden können, die also für jene vielfach geforderte Anschlussfähigkeit sorgen. Daher sind Aussagen zum Einsatz von Normdaten heute ein wesentlicher Baustein in Datenmanagementplänen von Drittmittelanträgen geisteswissenschaftlicher Forschungsvorhaben.

14 Was sind beispielhafte Anwendungsszenarien für die Nutzung von Normdaten?

1. Vernetzung. Werden in Datenbanken historische Personen erfasst, ist man in der Regel mit dem Problem konfrontiert, dass Namen in verschiedenen Kontexten unterschiedlich geschrieben werden, weil einzelne Fachdisziplinen für dieselbe Person gelegentlich unterschiedliche Namen verwenden. Ein Beispiel: Projekt-Datenbank A benutzt die Namensvariante ›Agostino‹, Projekt-Datenbank B die Namensvariante ›Augustinus von Hippo‹ und Projekt-Datenbank C die Namensvariante ›Aurelius Augustinus‹. Normdaten können dieses Variantenproblem lösen und Eindeutigkeit herstellen. Die GND-ID für die genannte Person lautet stets 118505114. Durch diese ID lässt sich also klarstellen, auf welche Person sich ein Datensatz bezieht, die verschiedenen Projekt-Datenbanken dagegen können weiterhin die in der Disziplin oder der Region gebräuchliche Variante verwenden. Außerdem lassen sich über die ID jene Datensätze zusammenführen, die dieselbe Person betreffen. Die auf diese Weise vernetzten Daten lassen sich dann unabhängig vom ursprünglichen Projektzusammenhang unter einer neuen Fragestellung gemeinsam analysieren.

2. Digitale Editionen. Entitäten, die in einem Text erscheinen, lassen sich mit Normdaten auszeichnen. Ein Beispiel: Hans Sachs schreibt im Eingang seiner Comedia Die irrfart Ulissi:

[…]

Homerus der Griechisch Poet

Jn Odisea mich versteht

Darinn er anzeiget nach art

Vlissi deß Fürsten jrrfart

Als der für Troya zogen war

Kam erst haim im zwentzigsten jar

(Folio-Ausgabe, Bd. 3, Nürnberg 1561, Bl. 91b, Vv. 11–16, Graphien vereinfacht)

Sämtliche Eigennamen – der Dichter Homer, sein Epos Odyssee, die fiktive Figur Odysseus, der Ort Troja – finden sich auch in der GND. Damit im Editionstext Normdaten berücksichtigt werden können, benötigt man eine Auszeichnungssprache, die den eigentlichen Editionstext mit Zusatzinformationen versieht. Eine solche Auszeichnungssprache bietet das Dokumentformat TEI, das sich in den vergangenen Jahren als Standard der (digitalen) Editionspraxis durchgesetzt hat. TEI erlaubt die Codierung von Eigennamen als Typus – Person, Werk, Ort –, bei der man auch direkt auf die Normdaten verweisen kann:

<lb/><persName ref=″https://d-nb.info/gnd/11855333X″>Homerus</persName> der Griechisch Poet

<lb/>Jn <name type=″artificialWork″ ref=″https://d-nb.info/gnd/4193022-8″>Odisea</name> mich versteht

<lb/>Darinn er anzeiget nach art

<lb/><persName ref=″https://d-nb.info/gnd/118589385″>Vlissi</persName> deß Fürsten jrrfart

<lb/>Als der für <placeName ref=″http://d-nb.info/gnd/4060974-1″>Troya</placeName> zogen war

<lb/>Kam erst haim im zwentzigsten jar

Nützlich wird diese mühevolle Auszeichnung, wenn größere Korpora automatisiert durchsucht werden sollen. Fragestellungen könnten etwa sein: In welchen Texten des 16. Jahrhunderts wird die griechische Stadt Troja genannt (und nicht etwa ein gleichnamiger Ort in einem anderen Land)? In welchen Graphien erscheint der Dichter Homer in vergleichbaren Nürnberger Texten? Wie oft nennt Hans Sachs die Werke anderer Autoren in den ersten 20 Zeilen seiner Werke? Die Auszeichnung mit eindeutigen Beziehungen hilft dabei, Editionsprojekte miteinander zu vernetzen, und wird künftig einen Datenpool bieten, der neuartige Fragestellungen erst ermöglicht und auch die Arbeit mit den einzelnen Editionen erleichtert.

3. Visualisierungen. Eine in den Digital Humanities beliebte Form der Analyse größerer Datenbestände ist die Visualisierung. Beispielsweise lassen sich Briefsammlungen so aufbereiten, dass sie in Form eines Graphen dargestellt werden können. Mit der Anzeige in einem Netzwerk ist leicht zu erkennen, wer wie oft mit wem korrespondierte.Footnote 14 In Datenbanken, die Kulturobjekte verzeichnen, bietet es sich wiederum an, deren Aufbewahrungsorte auf einer Karte anzuzeigen. Das ist insbesondere dann von Interesse, wenn es um die Geschichte von Beständen geht. Wenn man beispielsweise erforscht, wohin mittelalterliche Handschriften im und nach dem Zweiten Weltkrieg bewegt wurden, ist eine Karte zur Darstellung von buchgeschichtlichen Vorgängen des 20. Jahrhunderts hilfreich.

15 Wo kann ich weiterlesen?

Aus praktischer Sicht beschrieben wird das Konzept von Normdaten etwa von Maxwell (2002), Patton (2009/2010), der IFLA Working Group on GARE Revision (2013) oder Wiechmann (2014). Die ethischen Aspekte und die Kritik am Konzept der Normdaten werden von Sandberg (2019) und Rösch (2021), S. 309–332, diskutiert. Die Anfänge der GND erläutern Behrens-Neumann (2012) und Pfeifer (2013), zur Entstehung der VIAF vgl. Tillett (2012). Die genannten gedruckten Verzeichnisse sind Personennamen der Antike (1993) und Personennamen des Mittelalters (1989). Einführend zu RDA kann man Wiesenmüller/Horny (2017) konsultieren. Zum Stellenwert von Normdaten in der NFDI Text+ am Beispiel von digitalen Editionen vgl. Kett u. a. (2022). Über Normdaten aus editionswissenschaftlicher Sicht hat bereits Stadler (2012) grundlegend geschrieben. Ein aktueller Sammelband, der Linked Open Data aus Sicht der Editionskunde thematisiert, ist Spadini et al. (2021). Werknormdatensätze zu über 4.500 Werken aus dem Kanon der deutschsprachigen Literatur seit 1700 werden im Rahmen des DFG-Projekts Werktitel als Wissensraum angelegt bzw. aufbereitet, vgl. Barnert u. a. (2021). Die Schwierigkeiten und Lösungen im Zusammenhang mit (mittelalterlichen) Werknormdatensätzen führen wir weiter aus in Busch/Müller (2022). Einführend zu Visualisierungen vgl. Rehbein (2017); zum Thema der Briefwechselvisualisierungen Baillot (2018); wie sich die Werkdaten des Handschriftencensus vorläufig visualisieren lassen, zeigt Riva (2019). Zu Vernetzungen: Zum Konzept der Linked Open Data vgl. Smiraglia/Scharnhorst (2021) und Antopolsky (2022). Das Sonderheft »Digitale Mediävistik« der Zeitschrift Das Mittelalter (Bleier u. a. 2019) hält den aktuellen Stand der Forschung fest, darin auch mehrere Beiträge, die das Thema LOD aufgreifen. Burrows (2010) stellt erste Überlegungen an, wie Handschriftenstudien im Semantic Web betrieben werden können.

16 Abkürzungen und Begriffe

  • Autorität: ›Autorisierte‹ Hauptansetzung, die in zahlreichen Sprachen das Konzept der ›Normdaten‹ ersetzt; der Begriff stellt nicht die normierten Daten heraus, sondern zielt auf die Praxis der Ansetzung (authority control, autorité, controllo di autorità).

  • BARTOC: Basic Register of Thesauri, Ontologies & Classifications, ein internationales Verzeichnis kontrollierter Vokabulare, Normdateien, Thesauri, Ontologien, Taxonomien und Klassifikationssysteme.

  • CC0: Begriff aus dem Urheberrecht, der eine Creative-Commons-Lizenz bezeichnet, bei der in diesem Fall das Werk ohne jede Einschränkung verwendet werden darf.

  • DANTE: DAtendrehscheibe für Normdaten und TErminologien, ein online-Verzeichnis.

  • DNB: Deutsche Nationalbibliothek in Frankfurt und Leipzig.

  • Entität: Eindeutig bestimmbares Objekt von Normdaten, z. B. einzelne Urkunden, Menschen, Orte, aber auch Ereignisse, Lemmata oder fiktive Figuren. Entscheidende Voraussetzung für die Anlage von Normdaten ist, dass Entitäten unterscheidbar sein müssen von anderen Entitäten.

  • FAIR: Prinzipien im Forschungsdatenmanagement (findable, accessible, interoperable, reusable = auffindbar, zugänglich, nachnutzbar, wiederverwendbar).

  • FRBR: Functional Requirements for Bibliographic Records, Datenmodell für bibliographische Metadaten und theoretische Grundlage für bibliothekarische Regelwerke. Unterschieden werden vier Begriffe: ›Werk‹ (idealisiert gedachte geistige Schöpfung), ›Expression‹ (Ausdrucksform des Werks, z. B. durch eine Übersetzung), ›Ausgabe‹ (bestimmte Auflage), ›Exemplar‹ (einzelnes Objekt, z. B. bestimmtes Buch in einer Bibliothek).

  • GND: Gemeinsame Normdatei, wird von der Deutschen Nationalbibliothek (DNB), allen Bibliotheksverbünden des deutschsprachigen Raums, der Zeitschriftendatenbank (ZDB) und zahlreichen weiteren Institutionen kooperativ betrieben.

  • Hauptansetzung: Eine privilegierte Form innerhalb von synonymen Formen, die für die Anzeige genutzt wird. Zum Beispiel wird in Bibliothekskatalogen als Schlagwort lediglich ›Rom‹ angezeigt, im Hintergrund dagegen ist das Datenfeld mit einer ganzen Liste an Synonymen (Roma, Rome, Rom, Rim, an Róimh) verknüpft.

  • ID: Identifikatoren, die eine eindeutige Bezeichnung ermöglichen.

  • Klassifikationssystem: Ordnungssystem verschiedener Typen.

  • LCCN: Library of Congress Control Number.

  • LOD: Linked Open Data, Konzept des Semantic Web, bei dem zusätzlich zu den eigentlichen Daten angegeben wird, wofür diese verwendet werden können. Ferner müssen sie untereinander verknüpft (›linked‹) sein und in einer freien Lizenz (›open‹) zur Verfügung stehen.

  • NFDI: Nationale Forschungsdateninfrastruktur, Initiative zur Schaffung eines dauerhaften digitalen Wissensspeichers.

  • Normdatei: Identifikatoren-System, eine Sammlung von Normdaten, die nach denselben Regeln erstellt wurden.

  • Normdaten: Datensätze, die Synonyme unter einer ID-Nummer bündeln und Entitäten eindeutig benennbar machen.

  • Ontologie: Allgemeines Konzept, mit dem Wissensbestände eines bestimmten Bereichs repräsentiert und formalisiert werden, damit sie zwischen verschiedenen Programmen ausgetauscht werden können. Ontologien bestehen aus einer Menge an Begriffen und aus den Beziehungen zwischen diesen Begriffen.

  • RDA: Resource Description and Access, umfangreiches Regelwerk für die Erschließung in Bibliotheken, Archiven und Museen, das internationale Gültigkeit beansprucht und nicht mehr nur Bücher, sondern auch Gemälde, Filme, Ereignisse u. v. a. m. im Blick hat. Es steht online zur Verfügung (http://www.rdatoolkit.org), ist aber nicht frei zugänglich.

  • RDF: Resource Description Framework, Datenstrukturierung für LOD: Aussagen enthalten drei Aspekte (›Tripel‹): Ein Subjekt, ein Objekt und eine Aussage über den Zusammenhang beider (›Prädikat‹). Beispielsweise besteht zwischen dem Subjekt ›Karl der Große‹ und der Zeitstrecke ›ca. 747–814‹ der Zusammenhang ›Lebensdaten‹.

  • Taxonomie: Klassifikationsschema.

  • TEI: Text Encoding Initiative, ein Konsortium, das Richtlinien für die Auszeichnung von Texten im Dateiformat XML vorschlägt, z. B. Richtlinien für die Auszeichnung von digitalen Editionen.

  • Thesaurus: Sammlung kontrollierter Vokabulare.

  • VIAF: Virtual International Authority File, eine virtuelle Zusammenführung bestehender Normdateien, ursprünglich auf Personen beschränkt.

  • Vokabular (kontrolliertes): Standardisierende Wortlisten ohne Synonyme und Homonyme.

  • Wikidata: Zentrale Wissensdatenbank für alle Wikimedia-Projekte mit z. B. Daten zu Personen oder Orten, wie Lebensdaten oder Einwohnerzahlen u. ä., die der automatischen Aktualisierung von Wikipedia-Artikeln sämtlicher Sprachen dient.