1 Literaturwissenschaft und Bibliothek

Literaturwissenschaft und Bibliothek scheinen schon immer eng verbunden gewesen zu sein. Die Gründe dafür liegen auf der Hand. Die Literaturwissenschaft ist in besonderer Weise auf Literatur angewiesen. Die Bibliothek wiederum ist der Aufbewahrungsort für Literatur. Ohne Bibliothek also keine Literaturwissenschaft? Natürlich ist es nicht so einfach. Denn weder ist klar, von welcher ‚Bibliothek‘ die Rede ist, noch auch, von welcher ‚Literaturwissenschaft‘. Sieht man einmal von dieser Unschärfe ab, ist aber auch die Beziehung der Bibliothek zur Literaturwissenschaft nicht so eindeutig und eng, wie es den Anschein haben mag.Footnote 1 Zwar braucht die Literaturwissenschaft Literatur, aber braucht sie auch die Bibliothek? Man hat versucht, in Analogie zu den Naturwissenschaften die Bibliothek als Laboratorium zu verstehen,Footnote 2 in dem die Literaturwissenschaft gleichsam ihre Experimente durchführt. Allerdings deutet schon die Rede von ‚Experiment‘ die Sperrigkeit des Begriffs ‚Laboratorium‘ für einen Gebrauch innerhalb der Literaturwissenschaft an, denn die in den Literaturwissenschaften gängige hermeneutische MethodeFootnote 3 bedient sich in der Regel nicht Experimenten zum Erkenntnisgewinn.

Eine andere Richtung der Funktionsbestimmung der Bibliothek für die Literaturwissenschaft ist ihre Rolle als Gedächtniseinrichtung bzw. als kulturelles Gedächtnis.Footnote 4 Die Bibliothek ist ein Archiv und Ort der Erinnerung, der Vergegenwärtigung der Literatur, deren Verständnis man sich im hermeneutischen Prozess aneignet. Als Archiv und Gedächtnis inhäriert ihr aber auch eine gleichsam mnemotechnische Ordnung, die das Suchen und Finden in ihren Beständen strukturiert. Diese bibliothekarische Ordnung versucht zwar einerseits, alle Fachspezifika abzubilden, andererseits aber auch temporäre Trends zugunsten einer stabilen Systematik zu glätten. Der Feind der Bibliothek ist die Zeit, die immer neue Ordnungssysteme generiert und die alten obsolet macht. Die Ordnung der Bibliothek ist nicht die Ordnung der Wissenschaft, auch wenn sie sich an ihr orientiert.Footnote 5

Wegmann, der neben Werle zu den wenigen Literaturwissenschaftlern gehört, die sich des Konzeptes ‚Bibliothek‘ nicht als literarisches Motiv, sondern als Grundbegriff der LiteraturwissenschaftFootnote 6 angenommen haben, deutet auf dieses Missverhältnis, wenn er den Zugang der Literaturwissenschaft zur Bibliothek quer zur Bibliothek sucht und Konzepte wie Serendipity aktiviert, um das Unvordenkliche und gleichsam Dekonstruktivistische des Zugangs zur Bibliotheksliteratur zu charakterisieren. Die Heuristik der Serendipity lehrt, so Wegmann, dass es „keinen richtigen Weg“ gibt.Footnote 7 Nicht die Ordnung gewährt den Zugang zur Literatur, sondern eine gegen sie widerständige und überbietende Praxis der, wie Wegmann es nennt: „Überinterpretation“.Footnote 8

Der einflussreiche Wolfenbütteler Literaturwissenschaftler und Bibliothekar Paul Raabe wiederum sah in der Bibliothek eine humane Anstalt,Footnote 9 die Bildungsaufgaben übernehme und Ort der intensiven Lektüre und schöpferischen geistigen Arbeit sei.Footnote 10 Prägend war auch der von ihm wiederholt ins Feld geführte Begriff des Schatzhauses.Footnote 11 Der hohe Ton trug nicht wenig zur Bewunderung bei, die diese Vorstellungen in breiten Bildungskreisen und auch in der Literaturwissenschaft weckten und ließen die Bibliothek nicht nur als einen Ort der wertvollen und klassischen Literatur, sondern auch materialiter der seltenen und kostbaren Bücher aufscheinen, der gleichsam als Gralsort des Geistes und, gebunden an die Materialität des schönen und wertvollen Buches, als kultureller Identitätsstifter verehrt wird. Diese mit den Vorstellungen der Bibliothek als Gedächtnisort verwandte Idee, sie als Hüter der kulturellen Identität zu begreifen, hat durchaus ihre Realität. Im negativen Sinne zeigt sie sich in kriegerischen Auseinandersetzungen, in denen militärisch eigentlich unsinnige Niederbrennungen oder Zerstörungen von Bibliotheken zu beobachten sind. Sie geschehen offenbar in der Absicht, feindliche Kulturen in ihrem Kern, ihrer kulturellen Identität, auszulöschen. Der antike Gemeinplatz dafür ist die Verbrennung der Bibliothek von Alexandria durch den Kalifen Omar, der neben dem Koran keine andere Literatur duldete und daher alles andere für überflüssig bzw. schädlich hielt.Footnote 12 In der Gegenwart kann man die Zerstörung der Bibliothek von Sarajewo durch serbische Truppen oder die von Timbuktu durch islamistische Milizionäre als traurige Beispiele dieser Logik nennen.

Auf der anderen Seite hat die Literaturwissenschaft auch immer wieder mit dem Kanon der schönen und wertvollen Bücher gekämpft und ihn bekämpft.Footnote 13 Die Diskussion über kanonische Autorität, über Dichtung und Gebrauchstexte, über hohe und kanonische Literatur gegenüber der Alltagsliteratur reißt bis heute nicht ab. Die Bibliothek als Ort der schönen Literatur, die sich in ihrem Sammeln beschränkt, ist für diese Literaturwissenschaft zugleich ein Ort der kulturellen Vernachlässigung der Alltagsliteratur und des, mit Wegmann gesprochen, „Mülls“.Footnote 14

Ein weiteres Motiv, das die Bibliothek mit Blick auf die Literaturwissenschaft kennzeichnet und das schon zur digitalen Bibliothek überleitet, ist die Sammlung als Netzwerk,Footnote 15verwandt mit literaturwissenschaftlichen Konzepten zur IntertextualitätFootnote 16 oder zum HypertextFootnote 17. Intertextualität oder Hypertext war schon unter anderen Vorzeichen und Begriffen in der Frühen Neuzeit ein Bestandteil der Gelehrtenkultur in der Gewissheit, dass liber librum aperit. Zahlreiche der damaligen der historia litteraria verpflichteten Gelehrten durchkämmten die Bibliothek in der Absicht, die Werke der jeweiligen Sammlungen zu ermitteln und miteinander in Beziehung zu setzen. Literaturwissenschaft, die es damals als solche freilich noch nicht gab (hilfsweise könnte man die Literärgeschichte der res publica litteraria dafür in Anspruch nehmen), tritt uns vor allem als propädeutische Wissenschaft der Ordnung des Wissens entgegen. Die Bibliothek ist demgegenüber die Büchermasse, die sich der Gelehrte einverleibt – allerdings weniger, um die Bibliothek im Sinne einer Bibliothekslehre „in Ordnung“ zu bringen, als um sich selbst zu einer „wandelnden Bibliothek“ zu einem Polyhistor umzuschaffen.Footnote 18 Zugang zu den diversen Materien schafft denn auch weniger der Katalog oder die Struktur der Sammlung als der gelehrte polyhistorische Bibliothekar.Footnote 19 Literaturwissenschaft und Bibliothek sind sich wohl nie wieder so nahe gewesen wie in der Person des frühneuzeitlichen Gelehrten.

Die überwiegende Wahrnehmung der Bibliothek seitens der Literaturwissenschaft ist heute allerdings diejenige einer Gebrauchsbibliothek, die nach ihrem jeweiligen Charakter (Nationalbibliothek, Universitätsbibliothek, Landesbibliothek, Forschungsbibliothek, Stadtbibliothek, Spezialbibliothek usw.) Dienstleistungen erbringt. Bibliothek ist die Institution, die weitgehend unbemerkt und geräuschlos Literatur und Quellen bereitstellt und einen Service am ‚Kunden‘ erbringt, dem man ‚Produkte‘ (vor allem Informationen) anbietet. Im innerbibliothekarischen Diskurs ist der Charakter der Bibliothek als reiner Dienstleister durchaus umstritten und wurde in der Debatte zur Dichotomie des philologisch-historischen und sozialwissenschaftlich-technologischen Paradigmas erbittert geführt.Footnote 20 Mit dem Abschneiden alter Zöpfe wurden in der Übernahme des sozialwissenschaftlich-technologischen Paradigmas zwar Wege freigeräumt für die Bewältigung der Informationsbedürfnisse der modernen Massenuniversität, doch verkümmerte, so die Gegner, zugleich die wissenschaftliche Seite der Bibliothekswissenschaft, der es zudem in Deutschland anders als in anderen Ländern nicht gelang, sich über den einen Standort an der Humboldt-Universität zu Berlin hinaus universitär zu etablieren. Dadurch gingen die althergebrachten inneren Verbindungen zur Literaturwissenschaft verloren oder konzentrierten sich auf wenige spezialisierte Bibliotheken. Die Literaturwissenschaft steht ihrerseits einer solchen Dienstleistungsbibliothek gleichgültig gegenüber. Ob die benötigte Literatur aus der Bibliothek, dem Buchladen, Antiquariat oder aus dem Netz kommt, wird zu einer Frage der Effizienz und Ökonomie, nicht der inneren Verbundenheit zur bereitstellenden Einrichtung. Die durchökonomisierte Bibliothek ist nur eines von vielen möglichen Verteilrelais und der Bibliothekar allenfalls ein literarischer Mechanicus. Die angeblich ‚geistlose‘ ökonomische oder nach einem ManagementmodellFootnote 21 geführte Dienstleistungsbibliothek ist oft mit der digitalen in einen Topf geworfen worden und rief in diesem Grundverständnis heftige ideologische Gegenreaktionen hervor.Footnote 22 Doch hat, genau besehen, das eine mit dem anderen wenig zu tun. Das Digitale ist ebenso wenig der Untergang der Bibliothek wie der Literaturwissenschaft, noch auch zerstört es das „Gedächtnis“,Footnote 23 welcher Vorwurf geradezu eine kulturelle Konstante zu sein scheint, wenn man an die im Platonischen Dialog Phaidros überlieferte Kritik des König Thamus an Theuths Erfindung der Schrift denkt, die das Gedächtnis und damit die Fähigkeit zum Lernen und zur Weisheit schwächen soll. Der in der Bibliothekstheorie zentrale Begriff der memoria wird zwar mit der Digitalisierung zu einem externen Wissensspeicher, der technisch geordnet und abgerufen werden kann, doch unterscheidet sich dieser zumindest in diesem Punkt nicht von der traditionellen Bibliothek. Auch diese hat mechanische Hilfsmittel entwickelt (z. B. den Karteikasten oder eine systematische Buchaufstellung), um das Gedächtnis zu entlasten. Der Kern des bibliothekarischen Dienstleistungsparadigmas, demzufolge Wissen zur Ware oder zum Bereitstellungsproblem wird und darin zum bloß fakultativen oder potenziellen Wissen oder, mit griechischen Begriffen, von der Praxis zur Technik absinkt,ist daher keineswegs mit der Digitalisierung oder Digitalität in eins zu setzen. Die menschliche memoria bleibt im Sinne des kantischen Diktums tantum scimus quantum memoria tenemus Grundlage allen Wissens – gleichviel, ob sie digital unterstützt wird oder nicht, auch wenn literarische Phantasien wie Ted Williams' Otherland oder Konzepte des digitalen Human Enhancements sowie der totalen ImmersionFootnote 24 solche Gewissheiten aufzuweichen scheinen. Umgekehrt zeigen letztlich die durch den Medienwandel evozierten neueren Ansätze ein produktives Aufnehmen des Dienstleistungsbegriffs, indem er sich von den konkreten Medien löst und auf den Wissenserwerb in den jeweiligen Zielgruppen abhebt: „The mission of librarians is to improve society through facilitating knowledge creation in their communities.“Footnote 25

Alle diese Seiten und Ausprägungen der Bibliothek als Laboratorium, Gedächtniseinrichtung, als Ort der kulturellen Identität, als humane Anstalt, Schatzhaus bzw. Ort der schönen Literatur, als Netzwerk oder Gebrauchsbibliothek bzw. Dienstleister treffen auf eine Literaturwissenschaft, die aus ihrer jeweiligen Konstitution heraus einen nicht minder vielfältigen praktischen oder theoretischen Gebrauch von der Bibliothek macht.

Neben Wegmann sieht vor allem Werle in der Bibliothek ein Forschungsfeld der Literaturwissenschaft und skizziert eine Literaturwissenschaft als Bibliothekswissenschaft.Footnote 26 Allerdings verleibt er der Literaturwissenschaft eine Speise ein, deren Zutaten nicht leicht verdaulich sind. Denn ‚die‘ Bibliothekswissenschaft, die sich in dem dreibändigen gleichnamigen Handbuch von Leyh u. a. ein Monument gesetzt hat,Footnote 27 ist längst in eine Vielzahl von sich teilweise überlappenden und miteinander konkurrierenden Disziplinen und Sparten zerfallen, die entweder eigene Fakultäten begründen konnten oder sich in anderen auflösten oder als propädeutische Wissenschaften reüssierten. Zu ihnen gehört die Buchwissenschaft, die Bibliotheksgeschichte, die Informationswissenschaft, die Bibliotheks- und Informationswissenschaft (Library and Information Science), die Bibliotheksverwaltung und -praxis, die Dokumentationswissenschaft, Hilfs- und Spezialwissenschaften wie Inkunabelkunde, Epigraphik, Paläographie, Kodikologie, Diplomatik bis hin zur Bibliographie und Editionswissenschaft. In den Komplex hineingezogen werden auch Felder wie Archivwissenschaft, Restaurierwissenschaften oder Museologie. Die Situation schildert Greetham mit Blick auf den Teilbereich der hier ebenfalls zuzurechnenden Textwissenschaften: „Textual studies is a discipline drowning in a see of terms“.Footnote 28 Die Verbindungen zur Literaturwissenschaft liegen zwar auf der Hand, es ist aber im Einzelnen schwer abzugrenzen, welche Felder die Literaturwissenschaft auch für sich reklamieren kann. Will man jedoch eine Gemeinsamkeit in allen Feldern der Bibliothekswissenschaft identifizieren, so ist es sicher das Buch oder zumindest das Dokument als Gegenstand der Sammlung, Erschließung und Benutzung bzw. mit Blick auf die ökonomische, rechtliche und soziale Verwertung: seines Gebrauchs. Die Bibliothek bildet dafür das Gehäuse und den Referenzrahmen. Doch mit der Forderung, die Literaturwissenschaft als Bibliothekswissenschaft zu denken, lockert sich dieser traditionelle, von der Materialität des Mediums her gedachte Zusammenhang und betont stattdessen die ‚Literarität‘ der Bibliothek. Solche Ideen erinnern an ältere Gedanken der bibliothekarischen Zunft,Footnote 29 und der Frühneuzeitler Werle knüpft hier vielleicht nicht von ungefähr auch an Ideen der Literärwissenschaft an, deren Bemühungen sich nicht so sehr auf die Verzeichnung und den Erwerb von Literatur, sondern zum Zwecke des Erwerbs von Gelehrsamkeit auf deren intellektuelle Aneignung richten, eben um eine „wandelnde Bibliothek“ (s. o.) zu werden, was hier mehr als nur eine Metapher ist.

Bibliothek und Literaturwissenschaft stehen, wie sich hier zumindest skizzenhaft zeigt, in einer sehr komplexen Beziehung zueinander, die man vergegenwärtigen muss, wenn es um die Beziehung der Literaturwissenschaft zur Bibliothek unter digitalen Bedingungen geht. Denn die digitale Literaturwissenschaft modifiziert zwar die Anliegen der Literaturwissenschaft an die Bibliothek, ändert sie aber nicht grundsätzlich. Umgekehrt verändert die Digitale Bibliothek die Literaturwissenschaft, ohne aber selbst Charakteristika preiszugeben, die sie als Bibliothek kennzeichnen. Digitalität muss daher auch mit Blick auf die Auswirkungen auf die Bibliothek als Laboratorium, als Gedächtniseinrichtung, als Ort der kulturellen Identität, als Schatzhaus, als Netzwerk und Dienstleister oder auch konzeptioneller Gegenstand der Literaturwissenschaft bedacht und hinterfragt werden.

2 Text und Daten

Mit dem Übergang zum Digitalen ändert sich die Form des Gegenstandes für die LiteraturwissenschaftFootnote 30 bzw. literaturwissenschaftlich geprägte Bibliothekswissenschaft. Man mag zunächst einwenden, dass sich mit dem Medienwechsel lediglich das Kommunikationsmittel ändere und dass der Inhalt der Literatur davon unberührt bliebe (ihr ‚Sinn‘ oder ihre ‚Bedeutung‘). Das trifft zwar einerseits zu, Goethes Faust ist immer noch Goethes Faust, ganz gleich, ob er auf Papier oder digital publiziert wird, doch wissen wir spätestens seit McLuhans UntersuchungenFootnote 31 um den Einfluss des Mediums auf die Fragestellungen und Gegenstände der jeweiligen Wissenschaft.Footnote 32

Im Digitalen tritt uns Literatur in zweierlei Form entgegen: als (retro-)digitalisierte oder als digitale Literatur.Footnote 33 Während erstere unter den Bedingungen des Gutenbergzeitalters (oder davor) verfasst wurde und ins digitale Medium überführt wird, steht letztere unter digitalen Bedingungen und wird unter bewusstem Einsatz digitaler Mittel erstellt, so genannte born-digitals. Literatur, die die traditionelle Form im Digitalen simuliert (die digitale Inkunabel, typischerweise ein PDF) ist als Übergangsphänomen zu betrachten.Footnote 34 Beide Verfahren zielen darauf, das im Digitalen liegende Potenzial für sich zu nutzen.Footnote 35 Die (Retro-)Digitalisierung verhält sich wie seinerzeit die Übertragung von Handschriften in Drucke in Zeiten des Humanismus bzw. am Anfang des Gutenbergzeitalters und kann insofern als RemediatisierungFootnote 36 oder auch RecodierungFootnote 37 verstanden werden. Die Änderungen sind weitreichend, auch wenn es auf den ersten Blick nicht so scheinen mag. Für die Bibliothek bedeutet die Wende zum Digitalen einen massiven Umbruch, den man durchaus als Paradigmenwechsel bezeichnen kann. Versuchsweise könnte man ihn dadurch charakterisieren, dass sich die Bibliothek der Bücher zu einer Bibliothek der Texte wandelt.Footnote 38 Der hier verwendete Begriff des ‚Textes‘ ist indes auslegungsbedürftig.Footnote 39 In der Literaturwissenschaft ist ‚Text‘ meist, aber nicht immer schriftgebunden. So versteht ihn auch die Textlinguistik, die sich über den Begriff definiert.Footnote 40 ‚Text‘ steht als umfassender Begriff in Konkurrenz und Beziehung zu anderen Begriffen, z. B. den des ‚Werkes‘ oder des ‚Dokuments‘, und wechselt wie diese je nach Anwendungsbereich, Fragestellung und Kontext seine Bedeutung.Footnote 41 Trotz dieser Unschärfen lassen sich im Digitalen Merkmale festhalten, die es erlauben, den Text vom Dokument oder Werk zu unterscheiden. So diskutiert PedauqueFootnote 42 den Begriff des ‚Dokuments‘ nach den Kriterien forme, signe und medium.Footnote 43 Ich möchte den Begriff des ‚Dokuments‘ jedoch primär unter dem Begriff forme betrachten, also primär vom Substrat bzw. von der Form her denken, sei es Papier oder eine Datei. Ohne den Gedanken eines Substrates gibt es kein Dokument. Text gehört eher der Dimension von signe und medium an. In diesem Sinne würde ich auch Barthes' bekanntes Dictum verstehen wollen, dass Text in der Sprache sei und das Werk in der Hand liege, wobei ich für ‚Werk‘ hier den Begriff des ‚Dokuments‘ bevorzugen würde. Man kann, wie Barthes ausführt, den Text daher nicht in die Regale von Bibliotheken stellen, wohl aber die papiersubstratgebundenen Dokumente (Bücher). Wichtig für den Begriff des ‚Textes‘ ist hier, dass er anders als das Dokument oder das Werk im Sinne Barthes'Footnote 44 schon im vordigitalen Zeitalter von seinen materiellen Grundlagen gelöst erscheint und einen sprachlichen bzw. schriftlichen Charakter trägt.Footnote 45

Gleichwohl, selbst wenn im vordigitalen Zeitalter Texte im Prinzip ‚transitorisch‘ waren, wird diese Eigenschaft erst im Digitalen virulent – nämlich darin, dass der Träger gegenüber dem Text weitgehend gleichgültig und für seine Gestaltung und Subsistenz unerheblich wird. Weder das Aussehen der Schrift noch auch deren Subsistenz haftet noch am Träger.Footnote 46

Die Loslösung vom Träger (Papier, Pergament etc.) vollzieht sich über die Binarisierung. Sie liegt allen elektrischen Ladezuständen oder auch Speicherkonzepten (magnetisch, optisch, elektronisch) zugrunde. ‚Binarisierung‘ als Synonym der ‚Digitalisierung‘ bedeutet, dass Gegenstände in einen binären Code von Nullen und Einsen übersetzt werden. Das Dokument nimmt diesen Code als Ladungszustand auf und wird zur Datei oder zu einem Zusammenhang von Dateien.Footnote 47 Der binarisierte Text wiederum besteht aus sogenannten Code Points (UnicodeFootnote 48), denen Schriftzeichen zugeordnet sind. Das System ist – wie schon die Typographie – gegenüber der handschriftlichen Form reduktionistisch. Viele Informationen der Handschrift oder der Darstellung lassen sich auf der Code-Ebene nicht oder nur unvollständig wiedergeben bzw. nicht der Menge der Textzeichen zuordnen. Sie sind dadurch entweder kein Text oder betreffen seine vom Code zu trennende Darstellung: das Layout (z. B. Unterstreichungen, figürliche Initialen etc.). Grundlage des digitalen Textes in diesem Sinne ist daher der Code, genauer gesagt: eine Menge von theoretisch 1.114.112 Code-Punkten (65.536 Zeichen * 17 mögliche Planes in Unicode), die – mit Glyphen verbunden – als Text repräsentiert werden.Footnote 49 Eine Bibliothek der digitalen Texte ist damit zunächst eine Bibliothek von maschinenlesbaren Code Points, die über einen Textrenderingprozess oder Text Processes, wie es im Unicode-Standard heißt, zu ‚Text‘ generiert werden. Der Text ist daher Resultat eines Algorithmus,Footnote 50 der Grunddaten (Codes) mit Darstellungsinformationen verbindet. ‚Text‘ in diesem Sinne ist aber nicht nur ein mit einem Font gerendertes lesbares Zeichen, sondern als Code ohne diesen Font maschinenlesbar, Voraussetzung für jede digitale Anwendung. Als solche nennt sie das W3C auch Character Data. Sie bilden die digitalen Bausteine für Wörter und Sätze, sind aber auch Grundlage für die Zuordnung von Eigenschaften, die für das Verständnis des Textes unverzichtbar sind.

Dem Text kommen indes spezifische Eigenschaften zu, die durch die Code Points allein nicht erfasst werden. In der Literaturwissenschaft spricht man von ‚Textstrukturen‘, die nach der in der Disziplin typischen Unterscheidung phonetisch, syntaktisch, semantisch oder pragmatisch analysiert werden können. Zu den Textstrukturen gehören auch visuelle Informationen, wie Absätze oder abgesetzte Fußnoten, Seitenzahlen u. ä. Die westliche Schrift- und Druckkultur hat Gewohnheiten des mise en page entwickelt, die Bedeutungen an ein bestimmtes Aussehen knüpfen, auch wenn sie innerhalb des europäischen Kulturkreises variieren (Endnoten oder Fußnoten, Literaturverzeichnisse und Inhaltsverzeichnisse vorn oder hinten).Footnote 51 All dies muss ebenfalls entweder aus einer analogen Grundform in eine digitale Form ‚übersetzt‘, re-codiert, oder aber im digitalen Text explizit gemacht werden. Dafür bieten sich verschiedene Verfahren an. Von den Elementen, den Character Data, her gedacht, ist ‚Text‘ in der Regel eine sequenzielle Abfolge von Einzelzeichen, diese bilden Wörter, diese wiederum Sätze, diese ggf. ein abgeschlossenes Werk, dieses ein Netzwerk. Die Abfolge der Zeichen, Worte und Sätze ist für das Verständnis essenziell. Allerdings kann die Richtung variieren (Leserichtung links-rechts, rechts-links, oben-unten, Bustrophedon). Was genau ein Wort oder Grundelement der Sprache ist, muss definiert werden (etwa durch Tokenisierung).Footnote 52 In der Regel dienen heute Leerzeichen bzw. Whitespaces oder Satzzeichen dazu, Wort- und Satzgrenzen zu bestimmen, doch ist das der Schrift nicht unbedingt immanent, wie z. B. frühe Unzialschriften lehren. Die Worttrennungen ergeben sich durch die laut lesende, die Worte artikulierende Stimme; Worte selbst können, wie im Deutschen typisch, in Teile zerfallen. Im Digitalen bräuchte man dafür einen eindeutigen Code, denn die dafür im Layout typischerweise verwendeten Zeichen wie das Leerzeichen oder der Punkt sind mehrdeutig. Um Texte dieserart aufzubereiten, ist es daher erforderlich, die grammatischen und satzstrukturellen Einheiten unzweifelhaft zu qualifizieren (z. B. durch POS Tagging oder strukturelle Auszeichnungsmerkmale bzw. Markup bzw., allgemeiner formuliert, Annotation).

Die Frage, die sich stellt, ist, was man als Textstandard im Digitalen zugrunde legt, denn offensichtlich sind Kodierungen dieser Art variabel, technikgebunden und disziplinenabhängig. Während sich bei den Character Data Unicode als Standard etabliert hat, folgt die Kodierung von Textstrukturen variablen Textmodellen und Kodierungsverfahren, deren Standardisierung allenfalls in Teilen (vgl. z. B. die Aktivitäten der TEIFootnote 53) erfolgt ist und noch der weiteren Konsolidierung bedarf. Man darf allerdings nicht vergessen, dass es auch im Gutenbergzeitalter Jahrzehnte gedauert hat, bis ein Konsens erreicht werden konnte, was z. B. Fettdruck ‚bedeutet‘, was Überschriften sind, wie man Fußnoten über ihre Positionierung versteht oder Texte gliedert. Bis heute gibt es Unklarheiten, manchmal auch bewusst als solche im Schreiben eingesetzt. Typisch ist die Kursive, die, wenn sie nicht für Zitate verwendet wird, vieles bedeuten kann: Emphase, ironische Bemerkung, fremdsprachlicher Ausdruck, Name etc. Layout hat daher eine bedeutungstragende Funktion, die bei der digitalen Übersetzung explizit gemacht werden muss, um den Bedeutungsumfang des Textes vollständig wiederzugeben. Das dafür verwendete MarkupFootnote 54 bildet die Grundlage, um scriptgesteuert eine am Bildschirm oder im Druck lesbare Form zu erzeugen. Wie die Code Points für den Plain Text, so werden die Strukturen für das mise en page genutzt. Mit der Einführung von SGML bzw. heute XML hat es dabei eine wichtige Entwicklung gegeben. Während frühere Systeme durch sogenanntes Procedural Markup das Layout bzw. die Seitendarstellung unmittelbar kodierten (sodass es nur von einer bestimmten Software dargestellt werden konnte), löst XML das Markup von seiner festen Verbindung mit einer Software und trennt so nicht nur Struktur und Inhalt, sondern ermöglicht auch durch eine neue Schicht des Semantic Markup die explizite Zuordnung von ‚Bedeutung‘ zu Textteilen und wiederum über Scripte der XML-Familie (XSLT, XQuery) ein flexibles Layouting, wobei ‚Layout‘ eine besondere Form der Transformation ist, denn semantische Elemente können nicht nur mit Layout versehen, sondern auch in neue Formen überführt werden (z. B. Umwandlung in HTML, EPUB oder SVG). Der darin liegende Textbegriff nach der XML-Spezifikation ist eine Kombination von Inhalt und Struktur.Footnote 55 In der W3C-Definition heißt es: „Text consists of intermingled character data and markup“, wobei für „character data“ gilt: „All text that is not markup constitutes the character data of the document“.Footnote 56 „Character data“ (Unicode-Text) und „markup“ bilden so zusammen den Text, der sich in einem „document“ bzw. Dateien materialisiert.

Natürlich muss der Computer wissen, was das jeweilige Markup bedeutet. Da XML keine Regeln über die Benennung der Tags mitbringt, muss das Markup durch sogenannte Schemadateien (DTD, W3C-Schema, Relax-NG) festgelegt werden, um nicht z. B. <quote> und <Zitat> im selben Text zu haben.

Komponenten des Textes sind nach diesem Verständnis die Code Points, die Strukturinformation, die Anzeigeinformation, die Regeln für das Markup, Metadaten und ein Parser, der nach dem EVA-PrinzipFootnote 57 den Text ‚errechnet‘ und zur Anzeige bringt bzw. zu einem Resultat verarbeitet. Wir haben also Daten, Datenformate, Anweisungen für Struktur und Layout (Programme, Skripte) sowie einen Prozessor, die insgesamt den Text konstituieren.Footnote 58 Diese kleinteilige Sicht ist nötig, um den spezifischen Textbegriff zu fixieren, der die Grundlage für eine digitale Text- und so auch Literaturwissenschaft bildet. ‚Text‘ in diesem Sinne ist nichts Statisches, Unidirektionales, das von einem Autor ins Werk gesetzt und von einem Leser gelesen wird, sondern prinzipiell etwas Multifunktionales und Prozedurales, das auch die Maschine als Leser kennt, dessen Autor durch die Anwendung von eigenen Skripten auch Leser istFootnote 59 oder das in kombinatorischem Sinne als Enhanced Publication mehrdimensionale Zugänge eröffnet.

Aus diesem Textmodell ergeben sich für Bibliotheken und die Literaturwissenschaft Konsequenzen. Zunächst ist festzuhalten, dass im Falle der (Retro-)Digitalisierung die Charakteristika des Druckzeitalters in digitalen Code überführt werden müssen. Diesen Prozess kann man je nach Tiefe und Ausrichtung Datafication oder auch digitales Edieren nennen – in der Schrittfolge Imagedigitalisierung, manuelle oder automatische Transkription, strukturelle und semantische Annotation sowie Interpretation bzw. Kommentierung. Im Falle einer born-digital-Publikation müsste ein Autor Anforderungen an ein digitales Dokument unter den gewandelten Bedingungen beachten, z. B. in der Frage, ob Strukturelemente eindeutig interpretierbar sind, ob Standards eingehalten werden oder ob Metadaten verfügbar sind. In einigen Bereichen haben sich bereits meist XML-basierte Formate als Standards durchgesetzt, die diese Anforderungen weitgehend erfüllen, wie JATS, jTEI oder DITA. XML ist zwar nur eine von mehreren möglichen Verfahren zur Textkodierung – z. B. spricht prinzipiell nichts dagegen, Text als Graph oder in JSON darzustellen –, doch scheint es trotz einiger MängelFootnote 60 so weit durchgesetzt, dass eine grundsätzliche Neuorientierung wenig sinnvoll erscheint und man eher darauf sehen sollte, inwieweit sich die verschiedenen Konzepte komplementieren, insbesondere mit Blick auf graphentheoretische Ansätze, zu denen auch RDFFootnote 61 gehört. Ohne auf diese Elemente des digitalen Textes umfassend eingehen zu können, ist doch die funktionale Unterscheidung von ‚Text als Sequenz von Character Data‘ und ‚Text als Kombination von Character Data und Markup‘ festzuhalten, die alle modernen Konzepte von digitaler bzw. digitalisierter Literatur durchzieht und die in ein Verhältnis von Funktion (Algorithmus) und Argument (Daten + Struktur) eingebettet ist. Aristotelisch kann man sie sich auch als dynamis und energeia vorstellen. Daten sind als Relationsbegriff in diesem Zusammenhang entweder Code Points als Gegenstand eines Textrenderingprozesses oder Character Data als Gegenstand eines Markierungsprozesses, der die Bedeutung des Textes maschinenlesbar macht.

Diese extrem funktional-technische und kleinteilige Interpretation von ‚Text‘ führt unmittelbar zu einem Gefühl des Ungenügens, vor allem mit Blick auf den sinnstiftenden Leseakt und die Bedeutung des Textes, doch ist sie nötig, um die für die digitale Sphäre relevanten Schichten unterscheiden und auch Bedeutung und Sinn kodieren zu können. Für diesen Schritt der Transformation hat sich insbesondere der Begriff ‚Modellierung‘ als nützlich erwiesen.Footnote 62 Pedauque hat, ohne im vollen Umfang die Konsequenzen daraus zu ziehen, darauf hingewiesen, dass das Verfassen von Texten einen Vertrag zwischen Autor und seinem Leser impliziert.Footnote 63 Das kann bei digitalen Dokumenten bedeuten, dass der Autor ein genaues Verständnis auch der technischen Dimension des digitalen Textes haben muss, um seinen maschinellen und natürlichen ‚Leser‘ zu erreichen – oder aber, dass die Autorintention hinter den eigentlichen Modellierungsprozess zurücktritt und dem Leser eine weit prominentere Rolle in der ‚Interpretation‘ und Auswertung des Textes zukommt.Footnote 64 Autor- und Leserfunktion ändern sich, denn wenn ein Text geschrieben oder umgewandelt wird, um maschinenlesbar zu sein, müssen Elemente in den Text eingebracht oder mit ihm verbunden werden, die nicht für einen menschlichen Leser, sondern vor allem für eine Maschine ‚lesbar‘ sind. ‚Lesbarkeit‘ bedeutet in diesem Sinne nicht nur die Fähigkeit, einen Text auf der Basis von Sprache und Schrift zu verstehen, sondern auch ‚technische Lesbarkeit‘ auf der Basis von Daten und Struktur – mit anderen Worten: Digitale Texte müssen Schnittstellenanforderungen erfüllen (s. u.). Auch wenn die mathematische und statische Textauswertung kein neues Phänomen in der Literaturwissenschaft ist,Footnote 65 ist es doch die direkte Umwandlung (Modellierung) der Dokumente in Texte, die zum Zwecke integraler oder externer neuer Funktionen angereichert (annotiert) werden. Mit dem semantischen Markup erhält die Literaturwissenschaft zudem ein editorisches bzw. philologisches Werkzeug an die Hand, das es ihr ermöglicht, im Zuge einer interpretierenden Modellierung des Textinhalts genauer und expliziter zu sein, als es im analogen Feld möglich war.Footnote 66

Aus der Darstellung sollte deutlich werden, dass die Textwissenschaft bzw. dass das Textual Scholarship zu einer digitalen Textwissenschaft erweitert werden muss, die sich u. a. als digitale Philologie oder Computerphilologie der textlichen Datenverarbeitung und -repräsentation sowie Inhaltsmodellierung annimmt. Vonseiten der Remediatisierung ist sie nichts anders als digitale Editorik, von Seiten der born-digitals digitales Publizieren bzw. maschinenkonformes Schreiben. Für die Bibliothek stellt sie eine neue Sicht auf Literatur dar, die bisher in der Bibliothekspraxis kaum Berücksichtigung gefunden hat, und bestimmt den Text als ein Kompositum von Code Points, Strukturinformation, Anzeigeinformation, Regeln für das Markup, Metadaten und einem Parser, der für das ‚Ins-Werk-Setzen‘ bzw. die Darstellung sorgt. Konkret handelt es sich um eine Reihe von Dateien, wie z. B. .xml, .xslt, .xsd, .css oder.html, die zusammen ein funktionales Ganzes ergeben und in diesem Ensemble nicht nur die Stelle des Dokumentes einnehmen, sondern auch die stabile Grundlage jeder Langzeitarchivierung bilden.

3 Die Bibliothek: Sammeln – Erschließen – Benutzen

Die Aufgaben der Bibliothek werden funktional von alters her durch die Trias ‚Sammeln, Erschließen und Benutzen/Vermitteln von Literatur‘Footnote 67 beschrieben. Diese hat bis heute Bestand und kann als Leitlinie dienen, um die sich wandelnde Beziehung von Bibliothek und Literaturwissenschaft zu beleuchten. Doch müssen diese Begriffe mit der digitalen Wende neu interpretiert, die Bibliothek an die Anforderungen, die sich aus dem neuen Textbegriff ergeben, angepasst werden.

3.1 Sammeln

Bis vor wenigen Jahren war unstrittig, dass Bibliotheken Literatur in Form von Büchern oder ‚Medieneinheiten‘ sammeln, um der Literaturwissenschaft das Reservoir zu schaffen, das sie für ihre Forschungen benötigt.Footnote 68 Mit der digitalen Wende stellen sich aber die Fragen nach der Art und Form der Sammlung und nach dem Sammlungsort neu. Denn einerseits haben sich mit den Möglichkeiten des Internets die klassischen Publikationswege geändert, andererseits liegt auf der Hand, dass physische und digitale Bibliothek nicht mehr zusammenfallen müssen, auch wenn es aus organisatorischen Gründen pragmatische Gründe dafür geben mag. Eine digitale Bibliothek ist ihrer Natur nach ortlos, was schon daran abzulesen ist, dass man ohne Weiteres alle relevanten literaturwissenschaftlichen Werke zumindest im Textformat auf eine Festplatte bringen könnte, gewissermaßen als library to go. Das heißt freilich nicht, dass sich die Bibliothek als solche erübrigte, nur braucht man zum Sammeln keine Magazine und damit keinen konkreten Ort im üblichen Sinne mehr.Footnote 69 Das hat im Umkehrschluss dazu beigetragen, dass Bibliotheken es trotz vereinzelter mahnender StimmenFootnote 70 versäumt haben, ihren Sammelauftrag auch auf nicht-trägerbasierte elektronische Medien auszudehnen und sie es bei der Schaffung von Zugang haben bewenden lassen. Die Gründe lagen vor allem in den fehlenden Geschäftsgängen, mangelndem technischem Know-how, in bequem zugänglichen Online-Angeboten von Verlagen, die eine Eigenarchivierung überflüssig erscheinen ließen, und letztlich auch den schwierigen rechtlichen Rahmenbedingungen, nach denen nicht-trägerbasierte Medien nicht mehr als Sache behandelt werden konnten und lizensiert werden mussten.Footnote 71 Insgesamt scheint eine Art Grundvertrauen zu herrschen, dass Nationalbibliotheken oder andere zentrale Einrichtungen diese Funktion übernehmen werden. Ob tatsächlich die gesamte Bandbreite der international erscheinenden e-only-Publikationen ‚irgendwo‘ gesammelt wurde und wird, ist aber trotz der Einrichtung von DFG-Sondersammelgebieten bzw. Fachinformationsdiensten zumindest offen. Dahinter steht auch die Frage, wer dieserart Archivaufgaben im digitalen Sektor überhaupt wahrnimmt und warum eine Bibliothek es tun sollte, zumal es nicht nur um die lizenzbewehrten, sondern auch freien Publikationen im Open Access geht, wo das Sammeln augenscheinlich nicht mehr dem unmittelbaren Zweck der Benutzung vor Ort dient. Nur lizensierte Literatur benötigt geschützte Räume und durch Schrankenbestimmungen des Gesetzgebers abgesicherte Vermittlungsinstanzen wie Bibliotheken. Literatur, die im Open Access zugänglich ist, kann, so hat es den Anschein, in Zeiten von Google und Co. leicht von Zuhause aus benutzt werden – und es bedarf keiner sammelnden Einrichtung mehr. So sehr diese Evidenz auch einleuchten mag, erweist sie sich bei genauerem Hinsehen als trügerisch. Denn die Beschaffung und Nutzung von Texten im Netz stellt in der Praxis den Forscher vor große, teils unüberwindliche Herausforderungen und ist wenig geeignet, wissenschaftsfreundliche digitale Nutzungsszenarien zu entwickeln. Texte im Netz sind oft von unbekannter Quelle, nicht zuverlässig erreich- und zitierbar und, da de-kontextualisiert, schwer einzuordnen. In vielen Fällen ist weder deutlich, auf welcher Textgrundlage sie beruhen, noch weiß man um ihre Qualität oder Vollständigkeit. Auch das Vorhandensein ausreichender Metadaten steht infrage – Mängel, die für eine digital arbeitende Literaturwissenschaft beträchtliche Hürden darstellen. Aus wissenschaftlicher Sicht ist es weniger wichtig, dass Texte irgendwo im Netz heruntergeladen werden können, als dass sie als differenziert beschriebene, integrale Teile einer wohldefinierten Sammlung verstehbar werden und eingeordnet werden können.

Unter diesem Gesichtspunkt gewinnt der Sammlungsakt sogar an Bedeutung, da größere Anstrengungen erforderlich sind, ein einheitliches und konsistentes Korpus bzw. eine digitale SammlungFootnote 72 herzustellen – eine Aufgabe, die neu für Bibliotheken ist, da nicht nur weitgehend einheitlich gestaltete Bücher zum Wiederfinden mit Signaturen versehen und magaziniert, sondern zunächst die ‚Bücher‘ (Dokumente qua Dateien) in eine sammlungsgeeignete, d. h. einheitliche Form, überführt werden müssen. Das Sammeln selbst verändert sich auf diese Weise in mehrfacher Hinsicht, zumal wenn es – wie perspektivisch zu erwarten – ausschließlich unter der Maßgabe von Open Access stattfindet. Digitale Sammlungsbildung kann z. B. bedeuten, dass eine Sammlung sich bei der anderen in einem freien Copy-&-Paste-Prozess ‚bedient‘, nicht unähnlich der ‚Kopiermaschine‘ Alexandrias.Footnote 73 Es kann bedeuten, dass die Kriterien, die bislang sammlungskonstitutiv waren, etwa die Figur der Sammlerpersönlichkeit, sich relativieren und Begriffe wie ‚seine Bibliothek‘ oder die ‚Sammlung der Bibliothek XY‘ eine andere oder gewandelte Bedeutung erhalten. Es kann auch bedeuten, dass Dokumente sammlungsbezogen modifiziert bzw. angereicht und nicht wie bisher as-is archiviert werden. An organisatorischen Änderungen tritt hinzu, dass die, was Texte (Character Data + Struktur) anlangt, schier unendlichen Speichermöglichkeiten eine Erwerbungsauswahl unter dem Gesichtspunkt des Magazinplatzes ebenso obsolet erscheinen lassen wie die Makulierung redundanter oder überflüssig scheinender Literatur, die Platz schafft für Neuerwerbungen. Auch die Erwerbungskosten konvergieren gegen Null. E-Books und E-Journals im Open Access kosten zunächst nichts, sie müssen nicht gekauft, sondern nur gefunden und heruntergeladen werden.

Doch täusche man sich nicht. Es entstehen für Bibliotheken, die sich dieser Aufgabe annehmen, beträchtliche neue Kosten im Verwaltungsprozess und auch in der Langzeitarchivierung und -verfügbarkeit,Footnote 74 die eine der wesentlichen Aufgaben bibliothekarischen Sammelns bleiben. Allerdings hat es Sinn, sie an zentralen regionalen oder nationalen Stellen zu konzentrieren und sie von der jeweiligen ‚Bibliothek‘ lediglich administrieren zu lassen. Erste Modelle sind in Entwicklung.Footnote 75 Sammeln unter digitalen Bedingungen reicht aber noch weiter. Wenn die Publikation im Internet im Open Access unmittelbar keine vermarktende Instanz mehr benötigt, weil theoretisch jeder Wissenschaftler selbst seine Beiträge publizieren kann, und wenn es umgekehrt Aufgabe der Bibliothek ist, wissenschaftliche Publikationen zu sammeln, anzubieten und zu vermitteln, dann liegt der Schluss nahe, dass Bibliothek und Wissenschaft in diesem Segment Hand in Hand arbeiten sollten, um das Publikationsinteresse der einen und das Sammlungs- und Vermittlungsinteresse der anderen Seite direkt miteinander zu verzahnen und aufeinander abzustimmen. Die Bibliothek weitet damit zugleich automatisch ihren Nutzerkreis aus, selbst wenn ihre Zielgruppe die eigene Klientel bleibt. Sammeln ist daher vonseiten der Bibliothek zugleich eine Unterstützungsleistung bei der Herstellung und Vermittlung wissenschaftlicher Publikationen unter nicht-kommerziellen Aspekten,Footnote 76 mit anderen Worten: Die Bibliothek wird zum wissenschaftlichen Publikationsdienstleister und Unterstützer eines rein an wissenschaftlichen Kriterien orientierten und nicht durch kommerzielle Interessen unterbrochenen oder gefährdeten Research Data Cycle bzw. Text Life Cycle.Footnote 77

Diese allgemeinen Charakteristika betreffen zwar nicht nur die Literaturwissenschaft, haben aber für sie beträchtliche Auswirkungen. Wenn ‚Sammeln‘ immer weniger nur eine Sache des ‚Ablegens‘ und Bereitstellens, sondern auch des ‚Herstellens‘ ist, übernimmt die Bibliothek für die digitale Literaturwissenschaft eine produktive Aufgabe nicht nur in der Bereitstellung von Texten und ihrem ‚Erwerb‘, sondern auch darin, dass sie den Rahmen bietet zu deren Herstellung – in dem oben genannten zweifachen Sinn als (1.) Datafication der Transformation analoger Literatur in digitale im Editionsprozess und (2.) der Erzeugung von born-digitals, also von Texten der literaturwissenschaftlichen Fachliteratur, die sich mit den Gegenständen dieser Literatur in der Bibliothek treffen. Bibliotheken sind daher als Orte ‚digitaler Sammlungen‘ auch virtuelle Forschungsräume, deren sich die Literaturwissenschaft bedienen kann, um ihre Ergebnisse zu publizieren. Die Bibliothek als wissenschaftsimmanente Forschungsinfrastruktur gedacht,Footnote 78 muss jedoch Sorge tragen, dass die wissenschaftsimmanenten Qualitätssicherungsverfahren der Literaturwissenschaft gewährleistet sind und Strukturen entstehen, durch die die Bibliothek als wissenschaftlicher Publikationsdienstleiter der Literaturwissenschaft attraktive Angebote machen kann, die auch Akzeptanz finden und wissenschaftliches Prestige genießen.Footnote 79 Sammlungsbildung bedarf in dieser Hinsicht auf mehreren Ebenen einer Neuausrichtung und einer strengeren Orientierung an qualitativen und auch differenzierenden Angeboten. Zugleich ist eine Neugestaltung des althergebrachten Fachreferats notwendig, dessen Aufgabe es sein muss, Sammelentscheidungen einerseits nach philologisch-bibliographischen Kriterien zu treffen und digitale Texte zu übernehmen oder herzustellen, die den fachlichen Anforderungen und digitalen Rahmenbedingungen entsprechen (qualitätsgesichert bzw. peer-reviewed, bibliographisch identifizierbar, unter offenen Lizenzen, mit Beigabe oder verlässlicher Verlinkung von Quellen bzw. Forschungsdaten etc.), andererseits nach technisch-formalen Kriterien, wo zu entscheiden ist, ob erworbene Ressourcen für digitale Anwendungen genügen oder aufbereitet werden müssen (Unicode, definierte Medientypen, bibliographische und strukturelle Metadaten inkl. Linkstrukturen etc.). Aufbereitete offene Sammlungen dieser Art, die eine signifikante Größenordnung erreicht haben, gibt es bis heute nur wenige,Footnote 80 und sie bilden im Bibliothekskontext immer noch die Ausnahme, wenngleich sie für die digitale Literaturwissenschaft wichtige Ressourcen wären.

3.2 Erschließen

Größere Korpora erlauben oft keine Differenzierung nach Textsorten und machen eine trennscharfe digitale Analyse schwierig. Zugleich ist es angesichts der mannigfachen Textvarianten und -formen im Netz eine besondere Herausforderung, daraus konsistente Sammlungen zu kreieren. Ein Beispiel dieser Probleme liefert TextGrid, das den lobenswerten Versuch unternommen hat, Texte aus heterogenen Quellen nach Gattungen zu klassifizieren, strukturell zu vereinheitlichen und zur Nachnutzung in Editionen oder zum Textmining zur Verfügung zu stellen. Die aus Zeno.org und anderen Quellen übernommenen Texte und Strukturdaten wurden zu diesem Zweck nach TEI-XML überführt und, so weit wie möglich, vereinheitlicht.Footnote 81 Allerdings waren die benötigten Ressourcen beträchtlich, sodass das Korpus bis heute nicht vollständig bereinigt ist. Der Fall zeigt, dass die Remediatisierung bzw. analog-digitale Konversion größerer Korpora die Leistungsfähigkeit einzelner Einrichtungen übersteigt und die meist projekthafte Organisation ungeeignet ist, zu einem wirklich flächendeckenden Angebot zu kommen. Eine nationale Erschließungsagenda, die das Ziel der einheitlichen Bereitstellung von Texten verfolgt, ist daher unverzichtbar. Erschließung bewegt sich hier nicht mehr nur in der traditionellen bibliothekarischen Unterscheidung von Formal- und Sacherschließung, sondern schließt die Aufbereitung der Quellen selbst in der Remediatisierung und die Beachtung von Standards in der Herstellung von Publikationen ein. Insofern werden die deskriptiven Prozesse von der Metadatenebene auf die Daten-/Dokumentebene bzw. Textebene erweitert. Analoge Materialien werden für eine digitale Nutzung dadurch ‚erschlossen‘, dass man einen Konversionsprozess implementiert, der von der Imagedigitalisierung über die Volltexterfassung und -konversionFootnote 82 bis zur Strukturdatenauszeichnung und Edition führt. Wichtige nationale Agenden in dieser Hinsicht sind die DFG-Projekte zur Digitalisierung der Verzeichnisse der im deutschen Sprachraum erschienen Drucke des 16., 17. und 18. Jahrhunderts (VD 16, VD 17 und VD 18)Footnote 83 und das unlängst begonnene Vorhaben zur OCR-D.Footnote 84 Darauf aufbauend, stehen Maßnahmen der systematischen Vereinheitlichung (Strukturdaten) der Texte, für literaturwissenschaftliche Quellen auf der Basis der TEI, zunächst im Sinne einer Rohkodierung, die bis zu historisch-kritischen Editionen ausgebaut und angereicht werden können.Footnote 85

Der digitalisierte oder digitale Text bildet den Unterbau für die klassische Formal- und Sacherschließung. An dieser ändert sich einerseits wenig – auch digitale Dokumente benötigen Metadaten zu Autor, Titel, Erscheinungsort und -jahr, und ihr Inhalt muss klassifiziert und beschrieben werden –, andererseits bringt die digitale Form Änderungen bei der Erschließung mit sich. Die Formal- und Sacherschließung dient nach dem aktuellen Katalogisierungsstandard RDA dem Finden („d. h. Ressourcen finden, die den vom Benutzer festgelegten Suchkriterien entsprechen“), dem Identifizieren („d. h. bestätigen, dass die beschriebene Ressource der gesuchten entspricht, oder zwischen mehreren Ressourcen mit ähnlichen Eigenschaften unterscheiden“), dem Auswählen („d. h. eine Ressource auswählen, die den Bedürfnissen des Anwenders entspricht“) und dem Zugang erhalten („d. h. die beschriebene Ressource erwerben oder Zugang zu ihr erhalten“).Footnote 86 Da die Bibliothek sich im Digitalen entgrenzt, besteht eine besondere Herausforderung darin, die bibliothekarische Erschließung literaturwissenschaftlicher Quellen und Forschungsliteratur in einem Webkontext zu denken, d. h. beispielsweise Eindeutigkeit möglichst auch auf einem internetweiten Level sicherzustellen und Zugänge unter Berücksichtigung multikultureller Aspekte und sprachlicher Vielfalt zu gestalten. Vor diesem Hintergrund ändert sich die Form dieser Erschließung und verlangt nach anderen webbasierten Techniken. Dazu gehört nicht nur die differenzierte Beigabe von und Anreicherung mit Metadaten, die sich in deskriptive, strukturelle, administrative und technische unterscheiden lassen, sondern auch semantische Beschreibungssprachen wie RDF, RDFS oder OWL, die Inhalte in maschinenlesbarer Form charakterisieren und Beziehungen der Texte und Dokumente untereinander mit Hilfe von Graphen explizit machen. Gerade die Perspektive eines Semantic Web könnte in einer Utopie aller semantisch verbundenen Ressourcen des Netzes dazu führen, dass strukturierte Texte und Daten, wie in der sogenannten Semantic Web Layer CakeFootnote 87 dargestellt, wirklich unabhängig von proprietären Anwendungen und technischen Besonderheiten für alle Arten von Nutzungen zur Verfügung stehen und intertextuelle Forschungen auf der Ebene des Internet vorangetrieben werden. Allerdings steckt die Anwendung von Semantic-Web-Techniken in den Literaturwissenschaften noch in den Kinderschuhen, und eine kooperative bibliothekarisch-literaturwissenschaftliche Modellierung von Textbeziehungen bzw. von deren semantischen Komponenten von Texten bedarf noch einer breiteren Erprobung.Footnote 88 All diese Arbeiten gehen über die traditionellen Katalogisierungsarbeiten hinaus, gehören aber in den Komplex der Erschließung digitaler literaturwissenschaftlicher Ressourcen.

Es ist deutlich, dass auch das Erschließen der Bibliothek einen neuen Charakter erhält. Es ist nicht mehr länger nur rezeptiv, nimmt fertige Bücher bzw. Dokumente entgegen und katalogisiert sie, sondern bereitet sie auch in vielfältiger Weise auf, reichert sie an und vernetzt sie. Das Ziel der Erschließung digitaler Medien liegt darin, eine möglichst homogene, konsistent strukturierte Text- und Datenmenge für die Recherche, Visualisierung und digitale Nachnutzung vor allem im Internet zur Verfügung zu stellen. Dies geschieht nicht mehr nur auf der deskriptiven Ebene der Sammlungen und Dokumente, sondern auch auf jener der Texte selbst (z. B. durch Auszeichnung nach TEI, POS Tagging, NEP etc.). Erschließung muss dabei nicht unbedingt bedeuten, dass diese manuell erfolgt, man kann auch an automatisierte Verfahren denken. Beispielsweise ließe sich Topic Modeling auch zur Klassifikation von Dokumenten einsetzen. Der Text selbst wird zu einer Art Werk- oder Rohstoff, den man je nach Nutzungsszenario auch mit dem Begriff ‚Forschungsdaten‘ belegen kann. Durch Normalisierung und Standardisierung von Texten, die zusätzlich zur Originalform – also gleichsam als Derivat – erzeugt werden, ist sichergestellt, dass die Sammlungsbildung als die Grundlage für alle literaturwissenschaftliche Forschungsfragen erfolgt und Daten über definierte Schnittstellen (s. u.) ausgeliefert werden können. Insofern wird es zu einer zentralen bibliothekarischen Erschließungsaufgabe, Texte und Daten, die bisher in proprietären Formaten und in abgeschlossenen, von außen unzugänglichen Datenbanken (Datensilos) vorliegen, zu öffnen, um sie so auch im Internet zugänglich zu machen.

3.3 Benutzen

Die reine Zurverfügungstellung von Texten ist angesichts der fortschreitenden Digitalisierung und freien Bereitstellung auch von Forschungsliteratur von abnehmender Relevanz. Während der Zugang zu Literatur im Mittelalter und noch in der Frühen Neuzeit auch unabhängig von der Lesefähigkeit ein Privileg Weniger war, die Zugang zu Büchern oder Sammlungen erhielten, ist die Verfügbarkeit heute zu fast allen literarischen Werken der Literatur kaum noch beschränkt und in vielen Fällen auch vom heimischen Schreibtisch aus möglich. Klassische Bibliotheksaufgaben der Benutzung wie Aus- und Fernleihe, Bereitstellung von Lesesaalflächen oder physische Buchaufstellung werden daher für die Forschungsliteratur im engeren Sinne an Bedeutung verlieren und allein für die Konsultation von gedruckten Originalen und Sondersammlungen relevant bleiben.Footnote 89

Eine wesentliche Funktion der Bibliothek liegt im Suchen und Finden, die Sammeln und Erschließen zu ihrer Voraussetzung haben. Zugänge zu Werken der Literatur haben sich diversifiziert und finden nicht mehr exklusiv über Bibliothekskataloge oder Fachbibliographien statt – auch wenn sie in den meisten Fällen die Datengrundlage dafür bieten –, sondern über zentrale, leicht bedienbare Suchmaschinen, insbesondere Google. Im Milieu des digitalen Überflusses, aber auch der Unübersichtlichkeit, wächst die Bedeutung differenzierter Zugangswege zu Texten und der Wunsch der Forschung nach qualitativ hochwertigen und konsistenten Sammlungen, die es in einem Webkontext erlauben, schnell zu ‚relevanten‘ Ressourcen zu kommen. Google und andere Suchmaschinen leisten zwar Beträchtliches, doch bleiben spezialisierte Zugänge auch weiterhin unverzichtbar, sowohl aus Gründen der bibliographischen Identifizierbarkeit und gezielten Auswahl als auch aus wissenschaftsmethodischen Gründen, denn die Funktion der Suchalgorithmen bleibt eine Unbekannte und damit eine Bewertung der Heuristik von Suchmaschinen weitgehend unmöglich. Im Zweifelsfall wirken Suchalgorithmen, die für eine wissenschaftliche Nutzung ungeeignet sind.Footnote 90 Vor diesem Hintergrund verschiebt sich auch die Funktion der Bibliothek vom Gatekeeper hin zum Filter – ein Konzept, dem auch moderne Modelle des Post-Publication Reviewing folgen.Footnote 91 Sie macht durch gezieltes Herausfiltern die ungeordnete Informationsmasse allererst zugänglich und ist Teil eines Rezeptionsprozesses, der eine Publikation als forschungsrelevant herausstellt. Wie früher nur die wichtigen Bücher ‚gekauft‘ wurden, werden jetzt nur die wichtigen Bücher aus einem ubiquitären freien Datenmeer ‚gefiltert‘.

Im digitalen Kontext erweitern sich zudem die Anforderungen an die Such- und Nutzungsmöglichkeiten, da es nicht nur darum geht, Titel zu finden, sondern auch Texte zu analysieren. Typische Textmining-Verfahren (Topic-Modelling, Stilometrie, Sentiment Analysis etc.) erfordern nicht nur die Identifikation von Ressourcen, sondern auch Text- und Datenhoheit sowie Transparenz bei den Daten- und Korpusstrukturen, sodass die Benutzung immer auch auf digitaler Sammlungsbildung und gegenstandsadäquater Erschließung aufbaut. Ohne speziell an die Fragestellung angepasste Werkzeuge sind zudem wissenschaftliche Aussagen in vielen Fällen kaum möglich oder in ihrer Validität zumindest fragwürdig. Hier ergeben sich für die bibliothekarische Benutzung wichtige Arbeitsfelder, indem sie die digitale Literaturwissenschaft in der Anwendung der jeweiligen Werkzeuge berät, Unterstützung bei der Text- und Datenerzeugung leistet oder den Forschungsdaten- bzw. Textmanagementprozess begleitet. In der bibliothekarischen Benutzung geht es daher auch um Vermittlung digitaler und informationswissenschaftlicher Kompetenz zum Finden, Bearbeiten und Analysieren von Texten sowie die Unterstützung bei der vorbereitenden Erschließung und Publikation von Texten und Daten im Sinne eines literaturwissenschaftlichen Forschungsdatenmanagements. Wie früher vermittelt die bibliothekarische Benutzung den Zugang zur Literatur, zugleich wird sie aber durch die Spezialisierung in der Nutzung von digitalen Methoden und Werkzeugen in weiterem Umfang als bisher zum Partner der Forschung und übernimmt als Makler des Zugangs zu und der Modellierung von Texten eine wichtige Rolle im Forschungsprozess.

4 Die Bibliothek als Schnittstelle

Wegmann hat als einer der ersten Literaturwissenschaftler die Bibliothek unter dem Gesichtspunkt ihrer Schnittstellenfunktion thematisiert.Footnote 92 Anders als die meisten älteren MedientheoretikerFootnote 93 nimmt er gegenüber einer ‚Schnittstelle‘ nicht eine hardwareorientierte Perspektive im Sinne eines Maschine-Maschine- oder Mensch-Maschine-Verhältnises ein, sondern für ihn bezeichnet eine Schnittstelle „als umfassende technische Metapher die strukturelle Koppelung von Sinn-Kommunikation und apparativen Strukturen“. Und weiter: „Entscheidend ist, daß das Konzept der Schnittstelle eine interaktive Beziehung benennt“.Footnote 94 Technik und Bewusstsein stehen in einem sich wechselseitig determinierenden Verhältnis und eröffnen so neue ‚Schemata‘ des Suchens und Findens in der Bibliothek. Auch die neuere Medientheorie fasst den Schnittstellenbegriff weiter. Hookway hält fest: „The interface delimits a specific cultural space, within which a specific set of relations occur […]. Its effects are registered not only in the opening up for access or experience of otherwise unavailable spatialities and temporalities, but also in how space and time are understood and treated within culture“.Footnote 95 Ähnlich wie Wegmann kommt er zu der Einsicht, dass das Interface den Nutzer nicht nur als Handelnden kennt, sondern diesen in seinen operativen Festlegungen immer auch beeinflusst und bestimmt. Die Schnittstelle ist für ihn nicht nur ein technisches Protokoll: „For while the interface might seem to be a form of technology, it is more properly a form of relating to technology“.Footnote 96 Die Schnittstelle tritt hier als medialer Übergangspunkt in Erscheinung, dem auch Eigenständigkeit und nicht nur transitorische Bedeutung als Vermittlungsprozess beigemessen wird. „The interface cannot be captured as a mere remediation of other media, but unfolds its own specific mediality“.Footnote 97 Auf dieser AbstraktionsstufeFootnote 98 werden Eigenschaften beschrieben, die man für die Rolle der Bibliothek operationalisieren kann, sodass sie nicht nur als eine Einrichtung bestimmbar ist, die im technischen Sinn Schnittstellen bereitstellt, sondern im Sinne dieser ‚Metapher‘ selbst als Schnittstelle zu den in ihr aufbewahrten (digitalen) Texten fungiert. Ihre Form und ihr Zuschnitt, ihre Struktur und Erschließung ist immer auf ihre Schnittstellenfunktion bezogen. Eine Bibliothek ist ein toter Bücherhaufen, wenn sie nicht mit ihren Benutzern kommuniziert und interagiert. So ist eine Schnittstelle zwar im technischen Sinne ein Protokoll zur Nachrichtenübermittlung – und die Bibliothek konkretisiert sich auch in diesen Protokollen –, aber sie bezeichnet zugleich auch eine allgemeine Übergangs- und Vermittlungsfunktion zwischen verschiedenen autonomen Seiten und Systemen. Und das nicht nur im Sinne von Nutzer und Bibliothek, sondern auch von Gestern und Heute, von Orient und Okzident,Footnote 99 von Geistes- und Naturwissenschaften usw. Die Schnittstellenfunktion ist als einer bestimmten Methodik folgender Prozess zu verstehen, den Wirth wie folgt beschreibt: „Building on the idea of the interface as a process, the term ‚interface‘ opens up the possibility to think the relation of human user and technology in its operability. The operability not only enables ‚interactivity‘ but first and foremost generates the possibility of it by providing a ‚ready-to-hand‘ space of possible activity“.Footnote 100 Dieser Raum ist letztlich als digitaler Raum zu verstehen und der Begriff der ‚Schnittstelle‘ ergibt nur in einem digitalen Kontext wirklich Sinn bzw. lässt sich nur dort angemessen umsetzen. Die gesammelten und erschlossenen digitalen Texte werden je nach Anforderung vielfältig modifiziert und in verschiedenen Formaten angeboten. Die diversen Extraktions-, Konversions-, Visualisierungs- oder auch sich in formalen – d. h. sich in maschinenlesbaren Sprachen ausdrückenden –literaturwissenschaftlichen Modellierungsprozesse, die Metadaten und Texte gleichermaßen umfassen, lassen sich über die Schnittstellenfunktion der Bibliothek interpretieren. Die Bibliothek ist die Infrastruktur für Texte und Forschungsdaten, die das schriftliche kulturelle Erbe in eine maschinenlesbare, algorithmisch prozessierbare Form bringt, nachhaltig sichert und der digitalen Literaturwissenschaft zur Verfügung stellt, die ihrerseits Daten und Texte digital bearbeitet, um sie dann, vermittelt über Schnittstellen, zurückzuspielen. Wesentliche Komponenten dieses Prozesses sind Nachhaltigkeitskonzepte, Standardbildung, freie Zugänglichkeit durch Open-Access-Lizenzen und eine kooperative Wissenschaftskultur, die an die Stelle des traditionellen geisteswissenschaftlichen Einzelforschers Teams setzt, die in Forschungsprojekten die Informatik, Informations- und Bibliothekswissenschaft bzw. Digital Humanities sowie Fachwissenschaft in sich vereinigen.

Zusammenfassend lässt sich festhalten: Die Bibliothek wird als digitale Bibliothek zu einem virtuellen Forschungsraum, der sich im Begriff der Schnittstelle konkretisiert. Sie ist eine konkrete Funktion der Sammlung, Erschließung und Benutzung von Texten und Daten, nicht mehr ein Ort der Bücher. Sie sprengt frühere am Dokument haftende und dort fixierte Textformationen auf. Sie ist nicht nur ein Arbeitsplatz, an dem Bücher bereitgestellt werden, sondern wird zu einem integralen Element einer digital arbeitenden Literaturwissenschaft. Durch nach Qualitätskriterien bestimmtes Sammeln, Transformieren und Produzieren digitaler Texte und Daten sowie deren Langzeitsicherung bietet sie der digitalen Literaturwissenschaft zugleich den Gegenstand ihrer Forschung und ist im Digitalen ihr Bewegungs- und Beziehungsraum, der sich nicht in der Unbestimmtheit des Internets verliert, sondern einen zwar offenen, aber definierten digitalen Raum der Intertextualität bzw. Interaktivität bildet. Mithilfe des Textes als Code und Struktur, die als solche algorithmisch zu übersetzen, über technische Schnittstellen zugänglich und mit digitalen Methoden bearbeitbar sind, werden Anzeige- oder Lesevarianten erzeugt, verlässliche Suchen ermöglicht und Wege in unvordenkliche hypertextuelle Netze gebahnt. So verändert sich im Digitalen die Beziehung von Bibliothek und Literaturwissenschaft durch die gleichsam symbiotische Vereinnahmung der Literaturwissenschaft durch die Bibliothek – und umgekehrt der Bibliothek durch die Literaturwissenschaft. Die Bibliothek ist einerseits eine digitale Ressource, steht aber andererseits als ihr Element auch in einem gleichsam kybernetischen bzw. interaktiven Verhältnis zur Literaturwissenschaft, die hermeneutisch-zirkulär, mit digitalen Methoden arbeitend, ihre Forschungsergebnisse in den virtuellen Raum der Bibliothek der Texte einschreibt, als Hypertext, als Annotation, als Transkription und Edition oder als semantisches Netz. Zurückgebunden an die eingangs genannten Aspekte der Bibliothek lässt sich so die Beziehung der Bibliothek zur digitalen Literaturwissenschaft als prozesshaft gedachte Schnittstelle näher und neu bestimmen – als Laboratorium, Gedächtniseinrichtung, Ort der kulturellen Identität, humane Anstalt, Schatzhaus, Netzwerk oder auch Dienstleister.