1 Zum Begriff ‚Textumfang‘

1.1 Einleitung

Ob bewusst oder unbewusst, bei jeder Beschäftigung mit literarischen Texten ist er stetig präsent: der Textumfang. Der vorliegende Aufsatz betrifft damit einen so allgegenwärtigen Gegenstand, dass es verwundern muss, darüber noch keine einzige dedizierte Studie vorzufinden. Immerhin erscheint das Thema allmählich auf der Agenda: So gab es vor Kurzem einen entsprechenden Aufruf zur Bewerbung für ein geplantes Panel mit dem Titel On Length, das auf der 2017er Jahreskonferenz der ACLA (American Comparative Literature Association) stattfinden und erörtern sollte, „how length – short or long or in between – matters to literary studies. What is the importance of length to literary works?“Footnote 1

Nun, das geplante Panel wurde leider für dieses Mal abgelehnt. Dabei wäre eine solche Veranstaltung höchst relevant, denn unsere Kenntnisse über die Semantik literarischer Textumfänge sind allenfalls marginal und kommen bisher höchstens noch als nicht allzu wichtig zu nehmende Größe bei der Unterscheidung verschiedener Genres ins Spiel, etwa in Aussagen wie dieser: „Nach ihrer Länge steht die Novelle zwischen Roman und Kurzgeschichte.“Footnote 2 Denn, genau, eine Kurzgeschichte ist eben: ‚kurz‘, Novellen meist irgendwie länger, aber selten so lang wie ein Roman, und als ‚Roman‘, als Novel, bezeichnet man dann „[a]ny fictitious prose work over 50,000 words“Footnote 3, um E. M. Forster zu zitieren. Nun hat Marcel Reich-Ranicki dieses launige Bonmot einmal auf seine Weise übersetzt, indem er Forster zu zitieren vorgibt, aber den Roman als „ein erzählendes Werk mit mehr als 200 Seiten“Footnote 4 charakterisiert. Damit sind wir mittendrin: Wir haben es plötzlich mit Zahlen in verschiedenen Einheiten zu tun, von denen eine unveränderlich ist (die Anzahl von Wörtern, aus denen ein veröffentlichter Text besteht), die andere jedoch nicht (je nach Ausgabe eines Werks können sich Seitenanzahlen natürlich voneinander unterscheiden). Diese variabel-invariable Doppelnatur des Textumfangs muss eine entsprechende Theorie fassbar machen.

Sowohl bei der Anzahl der Wörter als auch bei der Anzahl der Seiten handelt es sich im Prinzip um Metadaten, die aber nicht als neutral bibliographisch missverstanden werden dürfen. Der Umfang, egal wo dieser zwischen „short or long or in between“ angesiedelt ist, steht nicht außerhalb der Bedeutung eines literarischen Werks, sondern ist grundsätzlich mit interpretierbar. Wenn wir von literarischen Texten in Buchform reden, materialisieren sich die genannten Metadaten, der Textumfang wird an der Stärke des Buchrückens einschätzbar und ist als Gewicht des Buchblocks auch spürbar, was den Lektüreprozess bereits beeinflussen kann. Dass in der menschlichen Wahrnehmung Gewicht mit Bedeutung korreliert wird, legen entsprechende psychologische Untersuchungen nahe, die zeigen, „that the conceptualization of importance is grounded in bodily experiences of weight“: „People may thus associate the experience of weight with the increased expenditure of bodily or mental effort.“Footnote 5

Wenn man die Zeile als erste (lineare) und die Seite als zweite (flächige) Dimension eines Buches beschreibt, dann liegt es nahe, das Buch als Ganzes als dreidimensionales Objekt aufzufassen, wie dies jüngst Carlos Spoerhase in seiner Studie Linie, Fläche, Raum getan hat. Allerdings konstatiert Spoerhase ein „theoretische[s] Desinteresse an der Dreidimensionalität der buchförmigen Schriftlichkeit“,Footnote 6 das er schon bei der einflussreichen buchtheoretischen und bibliophilen Essayistik der 1920er Jahre (mit Valéry, Benjamin und Moholy-Nagy) ausmacht und das bis in die Gegenwart anhalte. Spoerhase geht es vor allem um die materialen Aspekte des Textumfangs, also die Implikationen, die das Buch als sich je spezifisch materialisiert habender Text mit sich bringt. Diese Aspekte spielen in die hier vorliegende Studie hinein, unsere Empirie bezieht sich allerdings auf digital erfasste Metadaten, Katalogdaten letztlich.

Das Interesse an bezifferbaren Textumfangsphänomenen zeigt sich innerhalb der Literaturwissenschaft bisher nur bezüglich kleinerer Einheiten, etwa der Länge von Buchtiteln oder Sätzen.Footnote 7 Aber auch vor der ausdrücklichen Beschäftigung mit dem Umfang literarischer Volltexte ist die Gesamtlänge eines untersuchten Textes eine wichtige implizite Größe in der quantifizierenden Literaturwissenschaft, man denke an simple Sachen wie die Berechnung des Vokabelreichtums eines Textes über die Bestimmung der Type-Token-Ratio. Allerdings ist unser Blick auf Textlängen nun ein expliziter.

Doch bevor wir mit der Erhebung und Auswertung empirischer Daten beginnen, die als Beitrag zu einer Theorie des literarischen Textumfangs gedacht sind, sollen einige Begrifflichkeiten geklärt und einige Aspekte des bisher nur verstreut geführten Diskurses zusammengeführt werden.

1.2 Textumfang als Teil des Paratextes

Wenn man die materialen Aspekte des Textumfangs einmal außen vor lässt, könnte man die ausdrückliche Angabe von Seitenanzahlen auch als Teil des Paratextes verstehen, also zum „Beiwerk des Buches“ zählen im Sinne Gérard Genettes,Footnote 8 entweder zum Peritext, wenn im Buch selbst, also verlagsseitig, eine Angabe wie z. B. „580 Seiten“ zu finden ist (was so explizit eher selten der Fall ist, denn ein rascher Blick auf die Randbereiche der letzten Buchseiten erfüllt bereits denselben Zweck), oder zum Epitext, wenn diese Angabe über Verlagsprospekte, Rezensionen usw. erfolgt.

Es ist in diesem Zusammenhang übrigens wichtig, zwischen ‚Seitenanzahl‘ und ‚Seitenzahl‘ zu differenzieren.Footnote 9 Erstere ist eine fixe Angabe pro Buch, letztere findet sich auf der Mehrzahl der Seiten eines Buches und etabliert ein numerisches Orientierungs- und Referenzraster. Seitenzahlen wären, obwohl hochkonventionalisiert, noch einmal ein eigenes Thema, denn sie können sich doch auch in die Semantik eines Textes einordnen, wie eine berüchtigte Stelle in Brentanos Roman Godwi (1801) zeigt: „Dies ist der Teich, in den ich Seite 266 im ersten Bande falle.“Footnote 10

Genette hat die Seitenzahlen wohl aufgrund ihrer hohen Konventionalisierung übersehen und die Seitenanzahl nicht als Paratext berücksichtigt, weil sie für ihn schlicht zu den rein bibliographischen Metadaten gehört. Und in der Tat oszilliert die Seitenanzahl eines Werkes auch zwischen ihren Funktionen als Teil des Paratextes und Teil der Metadaten. Diese Erkenntnis ist deshalb wichtig, weil sich daraus ergibt, dass der Buchumfang keine bloß bibliothekarische Metaangabe ist, die nicht weiter bedeutungstragend wäre, sondern dass im Kontext des Paratextes dessen Einfluss auf den Rezeptionsprozess diskutierbar wird. Er stellt eine Kommunikationsinstanz dar, der eine Mitteilung, ein Adressant und ein Adressat zugeordnet werden können.

Wie oben bereits gezeigt, handelt es sich beim ‚Textumfang‘ um ein Phänomen, das sich in verschiedenen Formen zeigen kann, sei es als Anzahl von Zeichen, von Wörtern, von Seiten oder als Gewicht des Buchblocks. All diese Größen hängen voneinander ab, in ihrem Verhältnis zueinander gibt es jedoch Spielraum. Um ein Beispiel zu nennen: Die Anzahl von Wörtern in Peter Handkes Mein Jahr in der NiemandsbuchtFootnote 11 wird sich zwischen der Erstausgabe von 1994 und der Taschenbuchausgabe von 2007 nicht oder nicht großartig geändert haben, allerdings hat erstere Ausgabe 1.067 Seiten, letztere nur 628.Footnote 12 Der wortbasierte Textumfang bleibt unbeeinflusst, der seitenbasierte jedoch nicht. Die Bedeutung dieser doch beträchtlichen materialen Veränderung soll an dieser Stelle noch nicht weiter diskutiert werden, es ging zunächst nur noch einmal um den Hinweis auf die unterschiedlichen Einheiten, in denen sich Textumfang konstituiert. Solcherlei Befunde gehören zur Ausgangslage einer Textumfangstheorie, die sich in diesen rein quantitativen Messungen aber natürlich nicht erschöpfen wird.

2 Diskurssplitter

2.1 Grenzen der Lektüre: Textumfang als Zeitproblem

Der Umfang literarischer Werke ist ein Teil der Form, der die Wirkung eines Textes maßgeblich mitbestimmen kann und verschiedene Rezeptionsaspekte beeinflusst. Zuallererst setzt er der kumulierenden Lektüre enge Grenzen, wie das einfache Rechenbeispiel zeigt, das Arno Schmidt Mitte der 1950er-Jahre durchgeführt hat:

Das Leben ist so kurz ! Selbst wenn Sie ein Bücherfresser sind, und nur fünf Tage brauchen, um ein Buch zweimal zu lesen, schaffen Sie im Jahre nur 70. Und für die fünfundvierzig Jahre, von Fünfzehn bis Sechzig, die man aufnahmefähig ist, ergibt das 3150 Bände : die wollen sorgfältigst ausgewählt sein !Footnote 13

Auf ein ähnliches Rechenergebnis kommt vier Jahrzehnte nach Schmidt auch Heinz Schlaffer: „Selbst ein habitueller Leser vermag bestenfalls ein Buch pro Woche zu lesen, im Jahr demnach fünfzig, im Laufe des Lebens vielleicht dreitausend Bücher.“Footnote 14 Wiederum knapp anderthalb Jahrzehnte später erhöht Fotis Jannidis gegenüber der Süddeutschen Zeitung diesen Wert leicht: „Wir können etwa 4000 Bücher in unserem Leben lesen – das bedeutet, dass jeder von uns eigentlich zu wenig Bücher kennt“.Footnote 15 Jannidis zieht diese anthropologisch bedingte Grenze als Grund für die notwendige Digitalisierung der Literaturwissenschaften heran, insofern sich diese jenseits des bekannten Kanons noch am Big Picture versuchen will. Und – so formulierte es ja bereits Moretti – „if you want to look beyond the canon […], close reading will not do it“.Footnote 16 Dieser Gedankengang motivierte dann das Distant Reading, für das sich mittlerweile auch eine lebendige digitale Praxis entwickelt hat.

Schmidt und Schlaffer geht es hingegen um Leseökonomie, um Lösungsansätze angesichts des von Schmidt skandalisierten Zeitproblems, um den eng begrenzten „Zeithaushalt des Menschen […], die verwundbarste Stelle seiner Existenz“, um es mit Hans Blumenberg noch etwas dramatischer auszudrücken.Footnote 17 Eine der Konsequenzen, die größere Textumfänge so mit sich bringen, hat dabei in jüngerer Zeit einige Beachtung erfahren, nämlich der Umstand, dass der Normalfall beim Lesen eines Werks nicht dessen Gesamt-, sondern dessen Teillektüre ist, die sich wiederum hochgradig abstufen lässt. Schlaffer unterscheidet im bereits zitierten Text allein 17 Arten der Lektüre, von denen nur die ‚vollständige Lektüre‘ (Typ 12) und die ‚wiederholte Lektüre‘ (Typ 17) implizieren, dass ein Werk ganz gelesen wurde.Footnote 18 Auch Pierre Bayard hat sich in seinem paradoxerweise viel gelesenen Bestseller Comment parler des livres que l’on n’a pas lus ?Footnote 19 (2007) diesem Aspekt gewidmet, er soll an dieser Stelle jedoch keine weitere Rolle spielen.

Rein rechnerisch ist an den oben mit Schmidts Zitat beginnenden Lesevermögensberechnungen übrigens auffallend, dass in ihnen stets ein wichtiger Faktor fehlt. Die vorgestellten Gleichungen sind nämlich längeninvariant, der Umfang der Bücher spielt keine Rolle. Man benötigt offenbar immer dieselbe Zeit, um ein Buch zu lesen, egal wie lang, egal wie schwierig es ist; Schmidt und Schlaffer gehen hier wohl von einem subjektiv empfundenen Mittelwert aus. Textumfang und Lektüredauer stehen natürlich keineswegs immer im gleichen Verhältnis, zumindest die Textschwierigkeit käme als intersubjektiv schwer zu bestimmender Koeffizient noch hinzu, und trotzdem ist es zunächst der Umfang, der die Lektüre steuert. Wir würden behaupten, dass kaum ein Lesevorgang beginnt ohne vorausgehende Orientierungsgeste zur Feststellung, wie lang der bevorstehende Absatz, ein zu lesendes Kapitel oder ein Gesamttext ungefähr ist (den Verzicht auf diese Geste könnte man die Kolumbus-Methode nennen: einfach mal loslesen und schauen, wohin man kommt). Als Beispiel für neuere Entwicklungen in Sachen Textorientierung seien die variable Größe der Browserleiste und die Prozentangaben bei E-Books genannt, und „[i]m Onlinejournalismus ist es inzwischen gang und gäbe, Beiträgen einen Hinweis auf die voraussichtliche Lektüredauer voranzustellen“.Footnote 20 Wobei dies, im Grunde genommen, gar nicht so neu ist, ein prominenter Vorläufer wäre etwa Klabunds Hundert-Seiten-Buch Deutsche Literaturgeschichte in einer Stunde (1920), dessen Titel trotz der ironischen Brechung durchaus ganz konkret gemeint ist.

2.2 Mittlere und vorgegebene Textumfänge

Eine Abkürzung anderer Art schwebte Hans Magnus Enzensberger vor. In dem Ideen-Magazin, das seine Anfang 2011 erschienene autobiographische Sammlung Meine Lieblings-Flops beschließt, stellt er Projekte vor, die „über das Stadium der Skizze nie hinausgekommen“ sind. Eines davon trug den Arbeitstitel Die hundert Seiten: Klassiker der Weltliteratur, die besonders umfangreich, besonders unzugänglich sind, sollten auf genau hundert Seiten komprimiert werden, als Nacherzählung eigenen Rechts. Denn „viele der berühmtesten Klassiker werden nicht gern gelesen“, da sie eine „Zumutung an das Zeitbudget“ seien.Footnote 21 Er siedelte sein Projekt selbst im literarischen Bereich an, die Zusammenfassungen sollten wiederum von Romanciers verfertigt werden, so entstandene Kurzversionen also literarisch eigenständig sein und sich darin von Zusammenfassungen etwa in Literaturlexika unterscheiden.

Das Lamento über zu lange Bücher kann auch bei den Autoren selbst zur Mäßigung führen. Zwei argentinische Autoren seien angeführt, die daraus gar eine Programmatik entwickelt haben. Jorge Luis Borges etwa meint im Prolog zu dem Band El jardín de senderos que se bifurcan (1941), dass es ein mühsamer und auslaugender Unsinn sei, dicke Bücher zu schreiben und auf mehr als 500 Seiten einen Gedanken auszubreiten, der mündlich in wenigen Minuten akkurat mitgeteilt sei.Footnote 22 Auch bei César Aira findet sich diese Präferenz für kurze Texte. In der Erzählung El Congreso de Literatura (1997) lässt Aira seinen Erzähler, der den gleichen Namen trägt wie der Autor, sagen: „me he impuesto una extensión fija para todo el texto […] por respeto al tiempo del lector“, dass er es sich also auferlegt hat, beim Gesamttext eine gewisse Seitenzahl nicht zu überschreiten, aus Respekt vor der (begrenzten) Zeit des Lesers.Footnote 23 Aira hat in mehreren Interviews unterstrichen, dass es ihm beim Verfassen seiner meist um die 100 Seiten langen Erzählungen bzw. Romane nur darauf ankommt, wenigstens Buchlänge zu erreichen.Footnote 24 Koketterie oder nicht, zeitökonomische Überlegungen können auch Teil poetologischer Konzepte sein.

Eine weitere Möglichkeit der kontrollierten Einhegung des Textumfangs ist dessen vonvornige Fixierung. Für die Einhaltung einer festen Länge gibt es auch in der fiktionalen Literatur Beispiele, wenn auch eher im U-Bereich und im Rahmen entsprechender Reihen, man denke etwa an den 64-seitigen Heftroman.

Doch wann ist ein Textumfang ‚perfekt‘? Das kann man fragen, wenn man „length“ auffasst als „an aspect of any book that has an enormous if somewhat mysterious influence on its quality“.Footnote 25 Schon in der aristotelischen Poetik finden sich Bemerkungen zur perfekten Länge (der „richtige[n] Begrenzung der Ausdehnung“) des Epos.Footnote 26 Dem zugrunde liegt die Annahme, dass es für die Ausgestaltung eines geeigneten Stoffes jeweils die perfekte Länge gibt – eine Annahme, die sich beim modernen Roman natürlich erübrigt hat. Und doch pegeln sich bestimmte Textumfänge ein und steuern die Erwartungshaltung. Ein Beispiel nennt der Verleger Michael Krüger: „Es gibt eine Euro-Novel: 320 Seiten, moderates Thema, das hat sich so eingespielt.“Footnote 27

Genau dieser Textumfang, die 320 Seiten, spielte vor zwei Jahrhunderten in einem ganz anderen Kontext schon einmal eine Rolle. Diese Anzahl von Seiten (die 20 Bogen entspricht) musste laut den Karlsbader Beschlüssen von 1819 überschritten werden, damit ein Buch nicht der obligatorischen Vorzensur unterlag (der Gedanke dahinter war, dass sich der Inhalt dicker Bücher schlechter verbreiten ließe). Nach dieser 20-Bogen-Klausel war es also möglich, kritische Schriften erst einmal in Umlauf zu bringen, insofern nur ein gewisser Umfang erreicht werden konnte.Footnote 28 So war etwa Heines Deutschland. Ein Wintermärchen (1844) in einem Sammelband erschienen, da es allein zu kurz gewesen wäre, um die 20 Bogen zu erreichen.

2.3 Extremtexte: „Der längste Roman der Welt“

Eine weitere Art, sich dem Thema ‚Textumfänge‘ zu nähern, ist die Fokussierung auf Texte, die sich in umfangstechnischen Extrembereichen bewegen. Dies kann zunächst auch das Niedrigstsegment sein, man denke an berüchtigte Kürzesttexte wie Apollinaires Einzeiler Chantre aus der 1913 erschienenen Sammlung Alcools („Et l’unique cordeau des trompettes marines“) und Ungarettis trotz Zweizeiligkeit noch kürzeres Gedicht Mattina („M’illumino/d’immenso“, 1917) oder auch Daniil Charms’ Zweisatzerzählung Vstreča (vor 1942), die allesamt dadurch frappieren, dass sie die genrebedingte Mindesterwartung an den Umfang eklatant unterlaufen.

Die „literarischen Formate des Kleinen“ haben jüngst dezidiert Beachtung gefunden, nicht zuletzt, da sie dem Zeitgeist entgegenzukommen scheinen, denn die Literatur reagiere im 20./21. Jahrhundert auf die „Begrenzung von Aufmerksamkeits- und Zeitressourcen mit dem ‚kommunikativen Imperativ‘ der Kürze“, um die Ankündigung für ein entsprechendes Symposium an der Universität Paderborn zu zitieren.Footnote 29 Seit dem Frühjahr 2017 widmet sich auch ein in Berlin beheimatetes DFG-Graduiertenkolleg dem Thema (Literatur- und Wissensgeschichte kleiner Formen).

Bei der Diskussion um Texte extrem großen Umfangs sieht es etwas anders aus. Wenn man von Ausnahmen wie Stefano Ercolinos 2014 erschienener Studie The Maximalist NovelFootnote 30 absieht (wobei „length“ bei ihm nur eine von zehn Eigenschaften des maximalistischen Romans ist), haben unseres Wissens bisher keine größeren Anstrengungen stattgefunden, um die Extreme literarischen Umfangs dezidiert zu untersuchen. Normalerweise, vor allem abseits des Wissenschaftsbetriebs, beschränkt sich das Interesse daran auf eine Superlativik, die letztlich nur auf sich selbst verweist. Das beginnt mit dem Guinness-Buch der Rekorde und dem Gewinner der Rubrik Longest novel.Footnote 31 Die Nase vorn, sozusagen, hat Prousts À la recherche du temps perdu – und zwar mit „an estimated 9,609,000 characters (each letter counts as one character. Spaces are also counted, as one character each).“Footnote 32

Diese Angabe ist aus mehreren Gründen problematisch. Erstens, weil nicht thematisiert wird, was als Novel zählt (die romans-fleuves und anderweitige Romanzyklen? und ab wann ist ein Roman kein Fortsetzungsroman mehr? usw.). Und zweitens, weil es natürlich sehr wohl längere Romane gibt.

Der beliebteste Treff für die Diskussion um die längsten Romane der Welt ist aber der Artikel List of longest novels in der englischen Wikipedia.Footnote 33 Er hält eine Liste mit Werken einer Länge von „over 500,000 words published through a mainstream publisher“ bereit und wird mit relativ hoher Frequenz editiert. Hier findet sich dann gleich im Artikelkopf auch die vermeintlich richtige Antwort auf die Frage nach dem längsten Roman. Anhand der kursierenden Seitenumfangszahl 13.095 wird dazu Madeleine de Scudérys Roman Artamène, ou le Grand Cyrus erklärt, erschienen in zehn Bänden zwischen 1649 und 1653 (wohlgemerkt, es handelt sich nicht um das längste ‚Buch‘).

Im präsentierten Ranking allerdings findet sich dann ein roman-fleuve an der Spitze, Les Hommes de bonne volonté von Jules Romains, erschienen in 27 Bänden zwischen 1932 und 1946. Die Community sieht ihn bezüglich der Zeichenanzahl vor Madeleine de Scudéry, und es ist so sinnlos wie eigentlich unmöglich, hier irgendwelche abschließenden Urteile zu fällen, was auch der Grund dafür ist, dass der Wikipedia-Artikel seit seiner Entstehung im Jahr 2004 mehrfach tiefgreifend umstrukturiert wurde. Als längster deutscher Roman wird übrigens Zettel’s Traum geführt, aber auch dies ist natürlich kontingent, und nennen müsste man hier wenigstens noch die Römische Octavia des Herzogs Anton Ulrich von Braunschweig-Wolfenbüttel, wobei das Zählen der Seiten bei diesem über mehrere Jahrzehnte erschienenen und mehrfach umgearbeiteten Barockroman eine besondere Schwierigkeit darstellt, doch sind es sicher mehr als 7.000.Footnote 34

Die Wikipedia-Diskussion um den längsten Roman der Welt wird jedenfalls durchaus ernsthaft geführt, dafür spricht die Vielzahl von Kriterien. So sind etwa „self-published, printed-on-demand, vanity works, […] and record-grabbing stunts“ von der Aufnahme in die Liste ausgeschlossen. Da aber die ausschlaggebenden Kriterien, wie oben angeführt, nicht zu eindeutigen Ergebnissen führen, bleibt die Liste vorläufig. Ihr größtes Problem ist natürlich, dass sie nur auf sich selbst verweist und sich völlig in ihrem Interesse am Superlativ und am Ranking erschöpft.

Der logische nächste Schritt wäre, einmal nach Funktionen des Umfangs dicker Bücher zu fragen. So ist die schiere Präsenz eines massiven Buchblocks zunächst mitunter respektgebietend, wie diese Bemerkung in den Blättern für literarische Unterhaltung von 1863 zeigt:

Dieser Respect vor recht dicken Büchern besteht im Grunde auch noch jetzt; man schreibe das geistreichste Buch über Shakspeare [sic], concentrire aber seine Ansichten in einem dünnen Bande, und die Schrift wird wahrscheinlich wenig Beachtung finden; man dehne es aber zu drei oder vier starken Bänden aus, und das gelehrte und halbgelehrte Publikum wird bewundernd davor stille stehen wie vor einer der ägyptischen Pyramiden, an denen man im Grunde vorzugsweise doch nur die Masse anstaunt.Footnote 35

Dickleibige Werke verursachen also Bewunderung und laden offenbar gleichzeitig zur Nichtlektüre ein. Fritz J. Raddatz spricht in so einem Fall dann von einem „Werk-Gerücht – Proust, Joyce, ungelesen, aber zum obligaten Kanon zählend“.Footnote 36 In beiden Zitaten wird suggeriert, dass es einen Zusammenhang geben könnte zwischen extremem Textumfang und Kanontauglichkeit. Ob man nachweisen kann, dass dickleibige Bücher in literarischen Kanons überrepräsentiert sind, soll exemplarisch in Abschn. 4.3. Textumfang und Kanonisierung untersucht werden.

Ein anderes Subphänomen im Zusammenhang mit literarischen Texten extremer Ausdehnung soll hier zumindest angeführt werden, auch wenn dessen Erörterung eher in eine rezeptionsästhetische Studie gehört. Man könnte, analog zum Titel von Peter Brooks’ Monographie Reading for the Plot (1984), von reading for the length sprechen, denn der „Respect vor recht dicken Büchern“ geht nicht zwangsweise mit deren Nicht- oder nur Teillektüre einher. In Uwe Tellkamps Roman Der Turm (2008), selbst ein Seitenanzahlenschwergewicht, finden sich die Sätze: „Mit 500 Seiten begannen die wirklichen Romane. Mit 500 Seiten begann der Ozean, drunter war Bachpaddeln.“Footnote 37 Ähnlich äußert sich der Feuilletonist Andreas Platthaus anlässlich seiner Rezension des ebenfalls sehr umfangreichen Romans Morbus Fonticuli (2001) von Frank Schulz:

Eines muß der Rezensent wohl vorausschicken: Er liebt lange Filme und dicke Bücher. Nicht daß kurzes Kino und schlanke Literatur keine Gnade vor seinen Augen fänden, aber alles, was hundertachtzig Minuten oder sechshundert Seiten überschreitet, hat es bei ihm leichter.Footnote 38

Umfang als Gütesiegel findet sich auch bei Christian Kracht, der mit seinen eigenen „dünnen Büchern“ hadert und einem Feuilletonisten der Welt erklärt, dass „dicke Bücher […] nun mal besser als dünne [sind]. ‚Die Enden der Parabel‘ ist besser als ‚Der Fänger im Roggen‘.“Footnote 39

Doch wie gesagt, diese Überlegungen gehören in einen anderen Subdiskurs und sollen hier nicht weiterverfolgt werden. Insgesamt sollte jedoch etabliert sein, dass die quantifizierbare Größenordnung eines literarischen Textes ein konstitutives formales Merkmal desselben darstellt und stets auch Einfluss auf die ästhetische Erfahrung ausüben kann, auf die ‚Stimmung‘ (im Sinne Hans Ulrich Gumbrechts). Denn „[a]usnahmslos alle Konstitutionsebenen von Texten können an der Produktion von Stimmungen beteiligt sein“,Footnote 40 schreibt Gumbrecht, und dies gilt eben auch für den implizit empfundenen oder explizit präsenten Textumfang.

2.4 ‚Seitenpolitik‘

Der Diskurs über den Textumfang hat nur Sinn, wenn man ‚Umfang‘ als Vergleichsgröße versteht, eine einzige derartige Angabe zu einem einzigen Werk ist nicht mehr als eine bedeutungslose Metainformation. Und Vergleichsaspekte gibt es einige. Man kann etwa dazu ansetzen, „das Werk eines Schriftstellers rein quantitativ zu fixieren und mit anderen vergleichbar zu machen“, wie Arno Schmidt dies vorhatte (dazu unten mehr). Man kann Textumfang genreintern thematisieren, man kann Originale mit Übersetzungen ins Verhältnis setzen und dergleichen mehr, und man kann Umfang auch als Teil von Verlagsstrategien erörtern, hier speziell als etwas, das man ‚Seitenpolitik‘ nennen könnte. Die Präsentationsmöglichkeiten eines Textes in einem Buch sind vielgestaltig, verschiedene Satzspiegel und Methoden der Textstauchung und -streckung kamen und kommen zur Anwendung, aus verschiedensten (ökonomischen, ästhetischen, produktionsbedingten usw.) Gründen.

Kommen wir auf ein oben bereits angeführtes Beispiel zurück: Peter Handkes Buch Mein Jahr in der Niemandsbucht, das bei seinem ersten Erscheinen 1994 vom Verlag mit einem sehr luftigen Satzspiegel versehen wurde, der nur 23 Zeilen pro Buchseite vorsieht.Footnote 41 Nur deshalb kann das Buch auf über 1.000 Seiten Länge anwachsen und ein Tausendseiter sein, und auch nur deshalb kann es vom Erzähler als „eins dieser unanständig dicken Bücher“ etikettiert werden.Footnote 42 Wenn am Umfang ersichtlich ist, dass dieses Werk sich selbst als ‚Großes Werk‘ versteht, als eine Maximalist Novel, muss man auch nicht mehr darauf pochen, dies in der Vorlagsvorschau oder dem Klappentext explizit anzukündigen, wie es Handkes Lektor Raimund Fellinger ursprünglich tun wollte: „In seinem großen, neuen, bisher umfangreichsten […] Werk erzählt Peter Handke [usw.]“ – Handke war entsetzt und beklagte sich sofort bei seinem Verleger Siegfried Unseld, und zwar wie folgt: „Alles, was ich unbedingt vermeiden wollte – daß gesagt würde: ‚groß’, ‚großes Werk’, ‚großes Epos’ –, steht nun großkotzig da.“Footnote 43 Und das braucht es tatsächlich nicht, denn die angepeilte ‚Größe’ dieses Romanwurfs wird ja schon durch seinen Status als Tausendseiter kommuniziert. In der späteren Taschenbuchausgabe, siehe oben, wurde der Text auf 628 Seiten zusammengezurrt, was man kaum noch als „unanständig dick“ bezeichnen kann.

Neben solchen Einzelfällen kann man sich auch ansehen, welche Extremtexte die Verlage in ihren Programmen platziert haben. Denn wie schon aus dem Wikipedia-Artikel zu den längsten Romanen deutlich wird, gibt es gar nicht so viele überlange Romane, die die nötigen 500.000 Wörter aufbringen würden.Footnote 44 Da ‚Buchumfang‘ auch eine ökonomische Komponente hat und lange Bücher das verlegerische Risiko steigern, kann es aussagekräftig sein, die umfangreichsten Texte verschiedener Verlage gegeneinander zu halten, was wir in 4.2. Die umfangreichsten Bücher pro Verlag demonstrieren werden.

Wir konnten hier nur einige mögliche Aspekte des beginnenden Diskurses um den Textumfang als literaturwissenschaftliche Kategorie benennen und diskutieren, und bei Weitem nicht alle verlangen nach einem empirisch-quantifizierenden Instrumentarium. Da wir nun aber bereits einige dahingehende Versprechungen gemacht, jedoch noch nicht über deren Operationalisierung gesprochen haben, widmen wir uns nun dieser.

3 Operationalisierung

3.1 Katalogbasierte Seitenanzahlen als Maßeinheit des Textumfangs

Angesichts der durchaus variablen Größe ‚Seitenanzahl‘ (siehe das Beispiel Handke), aber auch angesichts der schriftgrößenvariablen Textpräsentation, die sich beim Lesen von E-Books, im Browser usw. findet, wäre ein Messwert jenseits der Angabe von Seitenanzahlen nötig. Was wäre so ein Maß, das Vergleichbarkeit herstellte? In einer für die Publikation gestrichenen Passage aus Fouqué und einige seiner Zeitgenossen (1958/1960) stellt Arno Schmidt folgende Überlegungen an:

Wie irreführend ist es oft, zu sagen, ein Buch zähle 500 Seiten; nachher hat es auf jeder einzelnen davon nur 20 Zeilen und in jeder 40 Anschläge = 800 Buchstaben. Ein anderes, von „nur“ 200 Seiten, aber mit 40 Zeilen [à] 50 Anschläge, enthält genau so viel Text. Man führe endlich in Wissenschaft und Buchhandel den Begriff der „Normalseite“ (abgekürzt: SN) von 2000 Buchstaben pro Seite ein! Es bleibe natürlich auch in Zukunft jedem unbenommen, mit Format, Zeilenzahl oder Typen völlig souverän zu schalten, aber man füge der Anzeige auch des apartesten Sonderdruckes noch in Klammern hinzu: „SN 340“ – oder wieviel es nun gerade sind. Das würde, konsequent durchgeführt nicht nur in Katalogen aller Art, viel nützen, sondern endlich auch einmal ermöglichen, das Werk eines Schriftstellers rein quantitativ zu fixieren und mit anderen vergleichbar zu machen.Footnote 45

Zwar hat sich inzwischen in verschiedenen Kontexten der Begriff der ‚Normseite‘ etabliert, doch ist die dahinterstehende Zeichenzahl als Richtwert national und international schwankend. Nichtsdestotrotz ist Schmidts Idee, eine normierte Umfangsangabe für literarische Werke zu schaffen, tatsächlich geeignet, um ‚Umfang‘ als trägermedienunabhängige komparatistische Größe überhaupt nutzbar zu machen. Inwiefern Absätze, Zeilenumbrüche usw. in die Berechnung dieser ‚Normalseite‘ hineinspielen sollen, wäre noch festzulegen, und was eine ‚Normalseite‘ im Fall von Schmidts eigenem Romanungetüm Zettel’s Traum bedeutete, das ja in drei parallel nebeneinander platzierten Erzählsträngen gesetzt ist, müsste man dabei gleich mit klären.

Wenn wir also im Folgenden mit katalogbasierten Seitenanzahlen rechnen, nehmen wir die etwas problematische Buchseite als Maß der Dinge – eine Einschränkung, die buchhistorisch allerdings durchaus Sinn hat, wie wir gesehen haben, denn der Diskurs über die Länge literarischer Texte ist noch immer vor allem seitenorientiert.

3.2 „362.597 Seiten“ – Vorarbeit auf Kanon-Ebene

Zum eigentlichen Untersuchungsgegenstand für diese Studie haben wir den Katalog der Deutschen Nationalbibliothek erkoren. Da dieser mit seinen mehreren Millionen Medien und einer durchaus teils problematischen Metadatenqualität ein sehr komplexes Thema darstellt, sei hier eine kurze Vorarbeit an einem kleineren Korpus eingeschoben, um überhaupt einmal zu evaluieren, inwiefern Textumfangsdaten ausgewertet und visualisiert werden können.

Geschehen soll dies am Beispiel eines jüngeren (welt)literarischen Kanons, den 1001 Books You Must Read Before You Die, erschienen 2006, herausgegeben von Peter Boxall.Footnote 46 Die Version von 2008 wurde stark aktualisiert, die weiteren Ausgaben von 2010 und 2012 beinhalten nur marginale Revisionen; wir greifen hier auf die Erstausgabe von 2006 zurück. Es handelt sich wohlgemerkt um einen „populären Leseführer“,Footnote 47 nicht um einen literaturwissenschaftlichen Kanon.

Abb. 1
figure 1

Verteilung der Seitenanzahlen innerhalb des 1001-Books-Kanons

Unser Freund William McComish hat im Jahr 2012 jedem der 1.001 Bücher seine Seitenanzahl zugewiesen.Footnote 48 Obwohl er dabei nicht die jeweils benutzte Ausgabe spezifiziert hat, geben die Daten einen guten ersten Einblick in die statistische Verteilung der Buchumfänge (die zugrunde liegende TSV-Datei kann in unserem Repositorium eingesehen werden). Insgesamt haben wir es mit 362.597 Seiten zu tun, deren Verteilung auf die tausendundeins Bücher Abb. 1 zeigt.

Auf der x-Achse finden sich die Seitenanzahlen als Umfangskategorien in 16er-Schritten (warum es 16er-Schritte sind, dazu unten mehr), und jedes Buch wird nun in seine jeweilige Kategorie einsortiert, sodass die Säulen entlang der y-Achse entsprechend wachsen. Das Gros der Bücher ist zwischen 100 und 400 Seiten lang (682 Stück, somit mehr als zwei Drittel). 23 Werke sind länger als 1.000 Seiten, sie wurden in Abb. 1 gemeinsam aufsummiert, obwohl sie sich eigentlich viel weiter in die x-Achse hinein verteilen, bis zu einer Seitenanzahl von etwa 3.700, erzielt von dem südkoreanischen roman-fleuve The Taebaek Mountains des Autors Jo-Jung Rae. Das kürzeste Buch ist wiederum Gogols Erzählung Die Nase, das als alleiniger Gegenstand mit den 32 hier veranschlagten Seiten nicht einmal den Tatbestand ‚Buch‘ erfüllt, denn laut UNESCO ist ein Buch „a non-periodical printed publication of at least 49 pages“Footnote 49.

Was kann man nun aus dieser visualisierten Kanonliste ersehen? Zunächst kommt mit der längenbasierten Sortierung des vorgestellten Kanons ein neues Ordnungskriterium ins Spiel, Textumfang wird einmal jenseits der Genrediskussion fassbar und erzeugt etwa einen Subkanon hundertseitiger Bücher – eine Textlänge, für die sich nicht nur, wie oben beschrieben, Enzensberger und César Aira begeistern. Für dieses Subphänomen, das 100-Seiten-Buch, haben wir diese neue Ordnungsmöglichkeit sogar einmal durchgespielt.Footnote 50 Auch hier zeigte sich die Schwankungsbreite, die mit der ‚Seitenpolitik’ der Verlage einhergeht, denn 100-Seiten-Bücher oszillieren unserer Beobachtung nach in ihrem Umfang zwischen etwa 75.000 und 225.000 Zeichen.Footnote 51 Das 100-Seiten-Genre hat übrigens sogar zu entsprechenden verlegerischen Unternehmungen geführt: in Italien zu der von Italo Calvino herausgegebenen Reihe Centopagine, in Frankreich zur Éditions Cent Pages. Und auch der Reclam-Verlag hat jüngst eine eigene Reihe namens 100 Seiten eingeführt, kurze Monographien zu aktuellen Themen, Slogan: „100 Seiten für 100 min“.Footnote 52

Doch Textumfang als Ordnungsprinzip (das ja z. B. auch die Anordnung der Suren im Koran organisiert) hat, für sich besehen, noch keinen unmittelbaren Erkenntniswert. Interessanter wäre da die Frage, ob sich etwas über den Einfluss von Buchlängen auf die (Nicht-)Kanonisierbarkeit von Werken ableiten lässt. Dazu kommen wir auch gleich, wir benötigen nur zunächst eine Vergleichsgröße.

3.3 Der DNB-Katalog

Es gibt noch kaum literaturwissenschaftlich relevante Studien, die den Katalog der Deutschen Nationalbibliothek (DNB) als Grundlage für statistische Untersuchungen nutzen.Footnote 53 Mittlerweile ist die Arbeit mit diesem Katalog sehr komfortabel geworden, der Datendienst der DNB stellt vierteljährlich einen Komplettabzug der Katalogdaten im RDF-Format bereit, und zwar unter der freien Lizenz CC0 1.0.Footnote 54 Der von uns verwendete Abzug stammt vom 23. Juni 2017 und enthält 14.102.309 Datensätze. Nicht alle Datensätze repräsentieren Bücher, und nicht alle Bücher weisen extrahierbare Informationen zu ihrem Umfang auf (die meisten aber schon). Man muss außerdem hinzufügen, dass nicht bei allen Büchern mit Umfangsangaben diese auch korrekt sind.Footnote 55 Alle für uns relevanten Datenfelder (etwa Autor, Titel, Verlag, Publikationsjahr, Umfang) wurden extrahiert und ggf. normalisiert. Mit dem von uns gebauten Framework ist es so auch möglich, in Detailbereiche des Problems vorzudringen und auf Basis von Textumfangsdaten etwa die Verlagspolitik hinsichtlich des Publizierens seitenanzahltechnisch extremer Werke zu beschreiben.

Da wir unsere Untersuchung auf Romane beschränken wollten, war für uns außerdem das Datenfeld ‚rdau:P60493‘ wichtig, das für Titelzusätze vorgesehen ist.Footnote 56 Der DNB-Katalog verzeichnet in diesem Feld relativ systematisch die Untertitel von Werken bzw. Büchern.Footnote 57 Bei den folgenden Statistiken ist also zu beachten, dass wir dadurch zwar den Großteil, aber keineswegs alle Werke abdecken, die man als ‚Romane‘ bezeichnen könnte, sondern nur diejenigen, die gemäß der Katalogisierungspraxis der DNB einen entsprechenden Eintrag im richtigen Feld bekommen haben (etwa weil diese Information auf dem Titelblatt eines katalogisierten Buches enthalten war). Tab. 1 zeigt die häufigsten Bezeichnungen in diesem Feld, die auf den regulären Ausdruck /[rR]oman/ matchen.Footnote 58 Insgesamt betrifft dies ca. 353.498 Bücher im KatalogFootnote 59 (wohlgemerkt: Bücher, nicht Werke, denn darunter befinden sich gemäß dem Sammelauftrag der DNB auch Neuauflagen, Übersetzungen usw.).

Tab. 1 Die zehn häufigsten Werte des Datenfeldes rdau:P60493, die /[rR]oman/ enthalten

Angesichts der Tatsache, dass Self-Publishing-Verlage wie der GRIN Verlag (mit insg. 121.456 Titeln) und Books on Demand (97.716 Titel) schon jetzt, nur wenige Jahre nach ihrer Gründung, den DNB-Katalog überflutet haben, setzten wir zusätzlich auf ein Relevanzkriterium, um unseren Datensatz weiter zu qualifizieren. Dafür haben wir auf Wikidata als Wissensdatenbank zurückgegriffen. Als relevant für diese Studie haben wir Autoren erachtet, die in mindestens einer Wikipedia-Sprachversion mit einem Artikel vertreten sind, die also die dortigen Relevanzhürden genommen haben (die Relevanzkriterien der verschiedenen Wikipedias sind teilweise problematisch, aber es gibt sie).Footnote 60

Abb. 2 zeigt die zeitliche Verteilung einiger Subdatensätze des DNB-Katalogs. Von den 14.102.309 Items im originalen DNB-Datensatz weisen – von den seit eigentlichem Sammlungsbeginn im Jahr 1913 erschienenen Werken – insgesamt 8.346.148 extrahierbare Seitenanzahlen auf (das sind 59 %) – die Gesamtsumme aller so extrahierbaren Seitenanzahlen beläuft sich momentan auf 1.327.973.922.Footnote 61 Wenn wir die Gesamtmenge an Büchern auf ‚Romane’ beschränken, kommen wir auf die genannten 353.498, von denen 316.518 auch Umfangsangaben aufweisen und von denen wiederum 180.219 einen Verfasser haben, der mindestens einen Wikipedia-Eintrag hat. Diese letzte Zahl ist die Größe unseres Datensets, mit dem wir weiterarbeiten.

Abb. 2
figure 2

Fünf verschieden qualifizierte Subdatensätze des DNB-Katalogs in zeitlicher Verteilung

Der Code und die Dokumentation zum gesamten Operationalisierungsprozess liegt in unserem GitHub-Repositorium.Footnote 62 Die vorgestellte technische Lösung ist exemplarisch angelegt.Footnote 63 Unser Vorgehen sollte mit den Katalogdaten anderer Bibliotheken oder Institutionen sowie mit anderen Filtermechanismen reproduzierbar sein und eine mögliche empirische Grundlage für den gerade emergierenden Diskurs um eine allgemeine Textumfangstheorie schaffen.

4 Auswertung

4.1 Erster Blick in die DNB

Beginnen wir mit einer Übersicht, die uns etwas zur Repräsentativität der DNB sagt. Wer sind eigentlich die Autoren mit den meisten Büchern in der Nationalbibliothek (wie gesagt, inklusive Neuauflagen und Übersetzungen)? Eine Übersicht dazu gibt Tab. 2, hier noch bezogen auf alle Bücher, nicht eingeschränkt auf Romane. Goethe, Steiner, Hesse, Konsalik, Thomas Mann – so sieht die nach Bücheranzahl quantifizierbare Realität der DNB aus. Unter den 50 Schriftstellern mit den meisten Werken finden sich sechs Frauen. Die meistübersetzten fremdsprachigen Autoren in der DNB sind Shakespeare, Agatha Christie, Enyd Blython, Lenin, Dostojewski, Tolstoi, Balzac, Jack London und Edgar Wallace.

Tab. 2 Autoren geordnet nach Anzahl der Werke im DNB-Katalog

Wenn wir diese Übersicht auf die Autorschaft von Romanen einschränken, ergibt sich ein etwas anderes Bild (Tab. 3, wiederum inklusive Neuauflagen und Übersetzungen). Vor allem (aber natürlich nicht nur) die Autoren von Roman-Bestsellern im U-Bereich treten hier hervor.

Tab. 3 Romanautoren geordnet nach Anzahl der Romane im DNB-Katalog

Schauen wir uns nun die Verteilung der Seitenanzahlen für die knapp 180.000 als ‚Roman‘ rubrizierten Bücher an (s. Abb. 3). Die Mehrzahl der Romane hat einen Umfang zwischen ca. 160 und 480 Seiten. Danach fällt die Kurve flacher, aber stetig weiter ab, bis wir es ab einer Seitenanzahl von ca. 1.600 nur mehr mit Ausreißern zu tun haben.

Abb. 3
figure 3

Verteilung der Seitenanzahlen von 180.219 gefilterten Romanen aus dem DNB-Katalog

Beim Zoom auf einen Detailbereich des Diagramms, den Bereich von 200 bis 400 Seiten, fällt noch etwas anderes auf (s. Abb. 4). Und zwar gibt es einen regelmäßigen Peak der Seitenanzahlen aller 16 Seiten, was leicht zu erklären ist: 16 Seiten entsprechen genau einem Bogen, und es gibt nachvollziehbarerweise die Tendenz der Verleger und/oder Autoren, den Platz, den der letzte Bogen bietet, möglichst voll auszunutzen. Sowohl in Abb. 3 als auch in Abb. 4 zeigt sich übrigens, dass jeder zweite Peak höher als der jeweils vorhergehende ist, was auf den teilweisen Einsatz größerer Druckbogen hinweist. Diese hier unerwartet sichtbar werdenden buchhistorischen Fun-Facts sind immerhin dazu geeignet, genug Vertrauen in die Verlässlichkeit und Konsistenz der für uns wichtigen Metadaten zu etablieren, auf deren Basis die folgenden Auswertungen stattfinden.

Abb. 4
figure 4

Detailansicht des Bereichs 200–400 Seiten

4.2 Die umfangreichsten Bücher pro Verlag

In Abb. 5 wird die Anzahl von Romanen pro Verlag korreliert mit der mittleren Seitenanzahl pro Roman. Hier wird in der Tendenz deutlich, dass größere Verlage im Durchschnitt umfangreichere Bücher verlegen.

Abb. 5
figure 5

Anzahl der Romane pro Verlag, korreliert mit der mittleren Seitenanzahl pro Roman (jeder Punkt entspricht einem Verlag)

Um etwas genauer in die Verlagslandschaft zu schauen, haben wir in Tab. 4 aus den von uns gefilterten Katalogdaten die 20 Verlage mit den meisten Romanen bzw. Romanseiten in der DNB aufgelistet. Das gleichzeitige Vorkommen von „Rowohlt“ und „Rowohlt-Taschenbuch-Verl.“ sowie von abgekürzt „Fischer-Taschenbuch-Verl.“ und ausgeschrieben „Fischer-Taschenbuch-Verlag“ weist darauf hin, dass wir für diese Übersicht Verlagsnamen zunächst noch nicht normalisiert und zusammengeführt haben.

Tab. 4 Top-20-Verlage nach Gesamtseitenanzahl aller als Roman markierten Katalog-Items

Dies geschieht allerdings in Tab. 5, in der 25 ausgewählte Literaturverlage nach absteigender durchschnittlicher Seitenanzahl gerankt sind. Die verschiedenen Schreibungen von Verlagsnamen wurden hierfür zusammengeführt, was die Unterschiede zur vorherigen Tabelle erklärt.

Tab. 5 Daten zu 25 ausgewählten Literaturverlagen, sortiert nach mittlerer Seitenanzahl

Romane, die im Manesse Verlag erscheinen, der sich die „ambitionierte Klassikervermittlung“ auf die Fahnen geschrieben hat, sind im Mittel am umfangreichsten. Wie in Abb. 5 bereits beobachtet, scheinen größere Verlage nicht nur mehr, sondern auch längere Romane zu verlegen. Diese Zahlen sollten freilich nicht losgelöst von anderen Faktoren betrachtet werden.

Abb. 6
figure 6

Entwicklung der mittleren Seitenanzahl pro Jahr seit 1913

Sehen wir noch einmal von der Verlagskategorie ab und betrachten den gesamten Datensatz: Abb. 6 zeigt, wie sich der mittlere Buchumfang der Romane zwischen den Jahren 1913 und 2017 entwickelt hat. Dieses Bild könnte man nun z. B. mit einer Vermutung des Verlegers Helge Malchow konfrontieren: „Mit dem Einzug des Computers in den Schreibprozess sind die Romane nach meinem Eindruck im Durchschnitt um zehn Prozent länger geworden.“Footnote 64 Die Daten scheinen diese Verlegerempfindung zu bestätigen, zumindest für den Zeitraum zwischen Anfang der 1980er Jahre (mit den ersten Heimcomputern) und etwa 2010.

Da sich die Diskussion um Textumfänge gut anhand von Extremtexten führen lässt, interessierte uns als nächstes, welche Autoren und Romane die Verlage als ihre umfangreichsten platziert haben. Wie bereits bemerkt, steigert das Operieren im 1.000-Seiten-Buch-Segment das ökonomische Risiko, und nicht jeder Verlag kann sich dies leisten (von den oben ausgewählten Literaturverlagen haben kleinere wie etwa Blumenbar, Nagel & Kimche, Voland & Quist und Wiesenburg bisher keine Tausendseiter in ihrer Backlist).

Auch bei den größeren Verlagen haben wir es meist mit nur einer Handvoll Tausendseitern zu tun, an denen sich zumindest Teile der Verlagspolitik ablesen lassen:

Tab. 6 Umfangreichste Romane des Ammann Verlags

An der Liste zum Ammann Verlag (Tab. 6) fällt zuerst auf, dass zwei Bücher fehlen: Dostojewskis Die Brüder Karamasow (2003, 1.271 Seiten)Footnote 65 und Ein grüner Junge (2006, 829 Seiten)Footnote 66 – dies auch noch einmal als Hinweis darauf, dass wir bei der Analyse auf die Katalogdaten angewiesen sind und Wege finden müssen, diese zu verifizieren. Jedenfalls handelt es sich bei all diesen Dostojewski-Ausgaben um die Neuübersetzungen Swetlana Geiers, und es wird anhand dieses Rankings einmal konkret bezifferbar, warum Geier „Die Frau mit den 5 Elefanten“ genannt wurde (vgl. auch den gleichnamigen Dokumentarfilm über sie, Regie: Vadim Jendreyko, veröffentlicht 2009). Ihre Neuübersetzungen der fünf großen Dostojewski-Elefanten waren ein Insignium des mittlerweile aufgelösten Schweizer Verlags.

Tab. 7 Umfangreichste Romane des Manesse Verlags

Wie schon oben anhand der durchschnittlichen Seitenanzahlen deutlich wurde: Schwerpunkt von Manesse sind schwergewichtige Klassiker (Tab. 7).

Tab. 8 Umfangreichste Romane des Suhrkamp Verlags

Die nach der Seitenanzahl umfangreichsten im DNB-Katalog verzeichneten Items von Suhrkamp sind keine Einzelwerke, sondern die großformatigen, broschierten Bände der Suhrkamp Quarto-Reihe (etwa Amos Oz: Die Romane [2009], 2.569 Seiten)Footnote 67. Durch unsere Beschränkung auf Romane ergibt sich eine sinnvollere Übersicht über das Tausendseiter-Segment von Suhrkamp, meistenteils kanonisierte Romane (Tab. 8).

Tab. 9 Umfangreichste Romane des Rowohlt Verlags

Auch bei Rowohlt finden sich in diesem Segment neben Romanen unserer unmittelbaren Gegenwart viele seit langem kanonisierte Werke, etwa Musils Mann ohne Eigenschaften (Tab. 9).

Tab. 10 Umfangreichste Romane bei Kiepenheuer & Witsch

Der umfangreichste Roman von Kiepenheuer & Witsch (Tab. 10), die deutsche Übersetzung von David Foster Wallaces Unendlicher Spaß (erschienen 2009, 1.547 Seiten)Footnote 68 fehlt in der Übersicht, da er im entsprechenden Datenfeld nicht als ‚Roman‘ verschlagwortet ist (das Filtern der für den Roman vergebenen Sachgruppe „B Belletristik“ hätte hier Abhilfe schaffen können, allerdings ist die Aufnahme der Sachgruppen, wie oben berichtet, im Datenabzug der DNB momentan ausgesetzt).

Dabei lässt sich an diesem Beispiel zeigen, dass ein mehr als tausendseitiges Buch immer ein Ereignis ist: Das Buch war so dick, dass es bei der Herstellung nur gerade noch so durch die Bindestraße passte, was mitunter zu Herstellungsfehlern führte.Footnote 69 Eine sicher nicht neutrale, aber in ihrer Pointierung gut in unsere Argumentation passende Einschätzung der dedizierten Bewerbung dieses Buch-Events stammt von Rainald Goetz, geäußert bei seinem Auftritt in der Harald Schmidt Show am 8. April 2010: „Wir wollen Helge Malchow, den Chef des Kiepenheuer-Verlages, preisen, […], der hat die Leute so bequatscht, dass alle Angst hatten irgendwie, dieses sehr schlechte Buch schlecht zu finden.“Footnote 70 Das Buch wurde jedenfalls ein Bestseller, und die zur Schau gestellte Dickleibigkeit trug sicher dazu bei.

Der kleine Streifzug durch den Elefantenbestand einiger Literaturverlage hat gezeigt, dass man nur anhand der umfangreichsten Werke, die der Verlagskatalog zu bieten hat, Teile der Verlags-DNA ableiten kann.Footnote 71 Das Verlegen dicker Bücher ist immer auch eine Setzung. Ein hilfreicher nächster Schritt zur Theoriebildung wäre es, einige Vertreter aus der Liga der Tausendseitigkeit einer Fallstudie zu unterziehen, um den Zusammenhang zwischen Buchumfang und Rezeption einmal konkret anhand einiger Beispiele zu untersuchen und der quantitativen eine qualitative Perspektive zur Seite zu stellen.

4.3 Textumfang und Kanonisierung

Eine oben gestellte Frage war die nach dem Verhältnis zwischen Textumfang und Kanon. Abb. 7 visualisiert die kumulierte Verteilungsfunktion der Seitenanzahlen unseres DNB-Datensatzes sowie die des 1001-Books-Kanons. Die Vergleichbarkeit beider Datensätze sollte dadurch gegeben sein, dass in Boxalls Kanon „das Wort ‚Buch‘ kurzerhand mit ‚Roman‘ gleichgesetzt wird“,Footnote 72 wir also letztlich zwei Romankorpora vergleichen. Dass wir es bei den 1001 Books mit Umfangsangaben zu englischsprachigen Romanen (bzw. Übersetzungen) zu tun haben und im Fall unseres DNB-Datensatzes mit Umfangsinformationen zu deutschsprachigen Romanen (bzw. Übersetzungen), ist natürlich ein hier nicht eingerechneter Faktor. Wir betrachten Seitenanzahlen für diesen Vergleich also als trockenes, von anderen Faktoren unbeeinflusstes Faktum (was sie natürlich, siehe oben, nicht sind).

Abb. 7
figure 7

Vergleich der Verteilung der Seitenanzahlen zwischen dem DNB-Katalog und dem 1001-Books-Kanon

Wenn wir uns also ganz auf die Größe der Buchblöcke konzentrieren, dann sagt der Verlauf der beiden Kurven etwas über die Wahrscheinlichkeit aus, dass ein Buch des jeweiligen Datensatzes eine gegebene Anzahl von Seiten unterschreitet. Der spätere Anstieg der Kurve des 1001-Books-Kanons impliziert, dass in diesem Datensatz der Anteil der umfangreicheren Bücher größer ist als im DNB-Datensatz. Die Bücher in letzterem zeigen also eine deutliche Tendenz, umfangreicher zu sein.

Im Bereich 100–400 Seiten befinden sich 68,1 % des 1.001er-Kanons und 71,7 % der DNB-Romane: vergleichbare Zahlen. Wenn wir allerdings den Bereich ab 1.000 Seiten betrachten, ändert sich das Bild: Von den Büchern im Kanon überschreiten 2,3 % diese Seitengrenze, von den DNB-Romanen nur 0,6 %. Im 1001-Books-Kanon befinden sich also überdurchschnittlich viele umfangreiche Romane. An diesem Beispiel zeigt sich, dass Texte extremen Umfangs jenseits der 1.000 Seiten tatsächlich kanonfähiger sein können, ein erster datengestützter Hinweis auf den Zusammenhang zwischen Textumfang und Kanonisierung, den es freilich umfassender zu untersuchen gilt.

5 Ausblick

Die hier angestellten empirischen Versuche vermessen Texte in ihrer Buch gewordenen Gestalt. Unser empirischer Ansatz ist seitenbasiert, nicht wörter- oder zeichenbasiert. Die beiden letzteren Maße sollten aber langfristig ins Metadatenarsenal literarischer Werke aufgenommen werden. Inwiefern Prozentangaben (etwa für den Umfang von Textteilen oder für die Position einer Textstelle) erkenntnisfördernd sind, wäre noch zu eruieren. Um komparatistische Perspektiven zu entwickeln, muss jedenfalls das Instrumentarium feststehen: „The concept of length is […] fixed when the operations by which length is fixed are fixed“.Footnote 73

Langfristig wird es für eine Theorie des literarischen Textumfangs darauf ankommen, die eher materialen bzw. buchhistorischen und die eher digital-quantifizierenden Komponenten miteinander zu verbinden. Wir haben in diesem Aufsatz versucht, beide Diskurse anzustoßen, mit einem Bibliothekskatalog als einer möglichen Schnittstelle.