1 Einleitung

Mit der Verabschiedung des Wahlgesetzes zur Wahl des Deutschen Bundestags von 2020 war zugleich die Einsetzung einer Wahlrechtskommission vorgesehen worden, die ihre Arbeit im April 2022 aufgenommen und Ende April 2023 beendet hat. Eine der wesentlichen Aufgaben der Kommission bestand darin, „auf der Grundlage der Prinzipien der personalisierten Verhältniswahl“ Vorschläge zu erarbeiten, „die eine effektive Verkleinerung des Bundestages in Richtung der gesetzlichen Regelgröße bewirken und nachhaltig das Anwachsen des Bundestages verhindern“Footnote 1. Denn infolge des im Wahlgesetz von 2013 vorgesehenen Ausgleichs von Überhangmandaten war es 2017 und 2021 zu erheblichen Vergrößerungen des Bundestags von regulär 598 Sitzen auf 709 bzw. 736 Sitze gekommen.

Das von den drei Parteien der regierenden Ampelkoalition aus SPD, Grünen und FDP am 17. März 2023 im Bundestag verabschiedete Gesetz sieht nun vor, die Vergrößerung dadurch zu verhindern, dass keiner Partei mehr Wahlkreismandate zugewiesen werden sollten, als ihr aufgrund der Zweitstimmen zustehenFootnote 2. Der Gegenvorschlag, den die Unionsparteien im Bundestag zur Abstimmung stelltenFootnote 3, sah im Wesentlichen eine Reduktion der Anzahl der Wahlkreise auf 270 und eine Erhöhung unausgeglichener Überhangmandate vor. In beiden Fällen wird der Grundtypus des gegenwärtigen Wahlsystems als eine Ausprägung der personalisierten Verhältniswahl beibehalten. Während der Arbeit der Wahlrechtskommission hatten die drei von der Union benannten Sachverständigen Grzeszick, Mellinghoff und Schmahl (2022) allerdings noch einen anderen Vorschlag unterbreitet, bei dem es sich um ein klassisches Grabenwahlsystem handelte. In diesem Papier sowie in einem späteren des Sachverständigen Grzeszick (2022) wird dabei auf die Möglichkeit der Einführung von Stichwahlverfahren zur Bestimmung von Wahlkreismandatsträgern hingewiesen, „um einem Legitimitätsmangel bei der Verteilung der Direktmandate vorzubeugen“ (Grzeszick 2022, S. 1). Ein anderer Grund für die Rechtfertigung der absoluten Mehrheitsregel bzw. dass diese notwendig sei zur Rechtfertigung des Grabenwahlsystems wird von Grzeszick darin gesehen, dass damit der Vorwurf entkräftigt werden könnte, die Einführung eines Grabenwahlsystems bevorzuge voraussehbar die Unionsparteien und würde die Gefahr einer Mehrheitsumkehr nach sich ziehen. Insbesondere diese Gefahr aber sei nur bei der Kombination der Verhältniswahl mit der relativen Mehrheitsregel gegeben, nicht aber wenn die Mehrheitskomponente im Grabenwahlsystem durch eine absolute Mehrheitsregel mit Stichwahlverfahren realisiert würde (Grzeszick 2022, S. 1).

Beide Argumente für die Einführung eines Stichwahlelements bei der Grabenwahl sind offenkundig strategischer Art, um die Akzeptanz eines Grabenwahlsystems zu erhöhen. Die verfassungsrechtliche Relevanz einer solchen Regelung sei dahingestellt. Ob aber durch die Kombination der Grabenwahllogik mit der Stichwahl tatsächlich der Vorteil für die großen Parteien weniger deutlich ausfällt bzw. die Wahrscheinlichkeit einer Mehrheitsumkehr dadurch abnimmt, sind zuerst einmal empirische Fragen. Die Antworten auf diese Fragen hätten allerdings dann weitreichende politische Konsequenzen. Denn Akzeptanz im Sinne von Legitimation beruht auf der Möglichkeit, bestimmte Ergebnisse rechtfertigen zu können, wobei die Erfüllung von Standards prozeduraler Gerechtigkeit für diese Rechtfertigungen notwendige Voraussetzung ist (vgl. Tyler 1994, 2006; Jost 2020). Eine als unfair empfundene Sitzverteilung und mehr noch eine in diesem Sinne „falsche“ Mehrheit im Parlament würden gegen diese Standards womöglich verstoßen.

Vor der normativen Würdigung müssen daher grundsätzlich die Fakten geklärt werden, die die normative Würdigung voraussetzt. Der vorliegende Artikel befasst sich daher mit der Prüfung der Plausibilität der empirisch prüfbaren Behauptungen:

  • Führt ein Grabenwahlsystem mit absoluter Mehrheitsregel zu einem geringeren Vorteil der großen Parteien als eines mit relativer Mehrheitsregel?

  • Führt ein Grabenwahlsystem mit absoluter Mehrheitsregel zu einer geringeren Verzerrung der Proportionalität als eines mit relativer Mehrheitsregel?

  • Führt ein Grabenwahlsystem mit absoluter Mehrheitsregel weniger häufig zu einer Mehrheitsumkehr (im Vergleich zur Verhältniswahl) als eines mit relativer Mehrheitsregel?

Auch wenn der Anlass dieser Untersuchungen im Zusammenhang mit aktuell diskutierten Reformoptionen für das deutsche Wahlsystem steht und sich die empirischen Analysen auf die beiden letzten bundesdeutschen Wahlen beziehen, so besitzen die Ergebnisse durchaus breitere Relevanz, weil die beobachteten Effekte grundsätzlich bei jedem System, in dem Wahlkreissieger mit relativer oder absoluter Mehrheit bestimmt werden, auftreten könnten.

2 Theoretischer Hintergrund

In Deutschland hat der Wähler bei Wahlen zum Deutschen Bundestag zwei Stimmen. Mit der Erststimme wählt er einen Kandidaten in einem Wahlkreis. Gewählt ist dabei der Kandidat, der die höchste Zahl an Erststimmen erhält. Mit der Zweitstimme wählt er eine Partei. Maßgeblich für die Verteilung der Sitze ist die Zweitstimme. Denn die Sitze werden proportional zu den Zweitstimmen verteilt, die direkt gewonnen Wahlkreismandate werden den Parteien dabei auf die so erworbenen Sitzkontingente angerechnet. Das deutsche Wahlsystem entspricht somit dem Typus eines „mixed member proportional system“ (Shugart und Wattenberg 2001). In einem Grabenwahlsystem kommt es hingegen zu keiner Verrechnung zwischen den beiden Ebenen. Es wird daher als „mixed member majoritarian“ (Shugart und Wattenberg 2001, S. 13 ff.) bezeichnet oder als „independent combination“ (Massicotte und Blais 1999, S. 246) von Mehrheitswahlsystem und Verhältniswahlsystem. Obwohl der Fokus der deutschen Reformdebatte immer auf sogenannten „minimal invasiven“ Reformen lag, die die Grundzüge des Wahlsystems beibehalten sollten, wurden gelegentlich auch das Grabenwahlsystem als mögliche Reformoption diskutiert (Strohmeier 2007) und die möglichen Folgen seiner Einführung für die Sitzverteilung analysiert (Linhart 2009; Behnke 2019).

Grabenwahlsysteme werden in der Literatur wie alle „gemischten“ Wahlsysteme vor allem unter dem Trade-Off zwischen Repräsentation/Proportionalität und „Accountability“ oder – negativ gewendet – zwischen Disproportionalität und Fragmentierung des Parteiensystems (Raabe und Linhart 2018, S. 171) diskutiert. Ihre Bewertung fällt in der Literatur mehrheitlich negativ aus (vgl. Bowler et al. 2005). Mitunter werden sie unter den gemischten Wahlsystemen als „worst of both worlds“ (Doorenspleet 2005), ja sogar als „worst of all worlds“ (Jastramskis 2019) bezeichnet. Denn Grabenwahlsysteme zerstören typischerweise einerseits die hohe Repräsentanz von Proportionalwahlsystemen, können aber eher nicht die Vorteile des Mehrheitswahlsystems wie „Hohe Zurechenbarkeit“ (Accountability) und stabile Regierungen garantieren, weil sie nicht im gleichen Maß wie das reine Mehrheitswahlsystem die Entstehung einer Einparteienregierung der stärksten Partei begünstigen. Aber gerade in diesen „manufactured majorities“ (Lijphart 1994, S. 72 ff.) sehen Befürworter der Mehrheitswahl meist die stärkste normative Rechtfertigung von Mehrheitswahlsystemen. Grabenwahlsysteme besitzen also vor allem die jeweiligen negativen Effekte der beiden Teilsysteme, aber weniger deren positive Eigenschaften. Sie schneiden daher in der Realität bezüglich der Aspekte Repräsentanz und Zurechenbarkeit besonders selten zweimal gut ab und besonders häufig zweimal schlecht ab (Raabe und Linhart 2018, S. 178).

Grabenwahlsysteme führen aufgrund der in ihnen enthaltenen Mehrheitswahlkomponente zu einer stärkeren Konzentration des Parteiensystems und können so unter Umständen die Koalitionsbildung vereinfachen, weil wegen der Konzentration eine Mehrheitskoalition womöglich aus weniger Parteien gebildet werden kann, als es unter der Verhältniswahl der Fall wäre. Dieser Effekt kann aber offensichtlich nur dann auftreten, wenn es im Vergleich zur Verhältniswahl zu Veränderungen von Mehrheitsverhältnissen kommt, wenn also neue Mehrheiten entstehen, die unter der Verhältniswahl nicht vorhanden wären, was umgekehrt ja auch immer bedeutet, dass Mehrheiten zerstört werden, die vorher existierten. Zumindest für deutsche Verhältnisse wären solche durch das Wahlsystem geschaffenen Veränderungen der Mehrheitsverhältnisse sehr ungewohnt und würden entsprechende Fragen hinsichtlich ihrer Legitimation aufwerfen. Der bekannte Verfassungsrechtler Peter Badura sprach im Zusammenhang mit solchen Mehrheitsumkehrungen schon in den 60er-Jahren pointiert von einer „staatsstreichartige(n) politische(n) Entscheidung im Mantel des Wahlrechts“ (Badura 1967, S. 12).

Geht man davon aus, dass Mehrheitsumkehrungen also durchaus als problematisch beurteilt werden können, dann stellen sich im Zusammenhang mit dem Grabenwahlsystem also zwei Fragen: Erstens, inwieweit solche Mehrheitsumkehrungen aufgrund der Konzeption des Wahlsystems als Grabenwahlsystem stattfinden, und zweitens, inwieweit sie innerhalb dieser Konzeption eher begünstigt oder behindert werden, wenn die Wahlkreismandate aufgrund absoluter Mehrheiten gewonnen werden. Die Ausformung des Grabenwahlsystem mit absoluter Mehrheit bzw. Stichwahl im zweiten Wahlgang tauchte in der Demokratisierungswelle der 90er-Jahre vor allem in Osteuropa und Vorderasien auf (Massicotte und Blais 1999, S. 350). Es wird mitunter vermutet, dass die absolute Mehrheitsregel zu einer größeren Streuung der Mandatsverteilung unter den Parteien führt als die relative Mehrheitsregel, zumindest in einem reinen Mehrheitswahlsystem. So ging Duverger in seinem Klassiker „Political Parties“ bekanntlich davon aus, dass die relative Mehrheitswahl zu einem Zweiparteiensystem führen würde, während er bei der absoluten Mehrheitswahl in Verbindung mit Stichwahlen vermutete, dass sie ein ähnliches und stärker ausdifferenziertes Parteiensystem wie die Verhältniswahl hervorbringen würde (Duverger 1964, S. 239). Allerdings spricht die vorliegende Evidenz eher gegen diese Annahme, d. h. die Effekte der Systeme mit absoluter Mehrheit ähneln eher denen mit relativer Mehrheit (siehe u. a. Farrell 2001, S. 60 ff.; Nohlen 2009, S. 312 ff.). Beide tendieren also dazu, eine Konzentration des Parteiensystems zu erzeugen. Wenig verwunderlich wird daher in der Literatur auch eher kein Unterschied zwischen Mehrheitswahlsystemen mit relativer und absoluter Mehrheit in Hinsicht auf ihre Neigung, Parlamentsmehrheiten zu erzeugen, wahrgenommen (Cox 1997, S. 58), beide begünstigen also tendenziell eine Mehrheitsbildung zu Gunsten der großen Parteien.

Die folgenden Analysen auf der Datengrundlage der beiden letzten Bundestagswahlen sollen nun mit Hilfe von Simulationsrechnungen einen direkten Vergleich zwischen den Effekten der relativen Mehrheitswahl und denen der absoluten Mehrheitswahl als jeweilige Teilkomponente eines Grabenwahlsystems ermöglichen und somit beitragen, eine bestehende Lücke in der Forschung zumindest teilweise zu schließen. Insbesondere ermöglicht das innovative methodische Forschungsdesign mit Hilfe von Simulationen eine Art von „within“-Vergleich innerhalb eines politischen Systems, der in der Realität wegen mangelnder Fallzahlen – wie schon von Duverger (1964) beklagt – nicht untersucht werden kann.

3 Simulationen des Effekts eines Stichwahlverfahrens

Um abschätzen zu können, welchen Kandidaten welcher Partei ein Wähler in einer Stichwahl im zweiten Wahlgang wählen würde, wird eine Präferenzliste, d. h. eine Rangordnung benötigt. Streng genommen müsste es sich dabei um eine Rangordnung über die jeweiligen Kandidaten handeln. Da solche Daten unzureichend verfügbar sind, wird die Rangordnung über die Parteien als eine Proxy-Variabel für die Rangordnung über die entsprechenden Kandidaten der Parteien in den Wahlkreisen verwendet. In vielen Untersuchungen konnte gezeigt werden, dass es eine sehr starke Übereinstimmung von Erst- und Zweitstimmen in Deutschland gibt, d. h. dass die Erststimme meistens dem Kandidaten bzw. der Kandidatin derjenigen Partei gegeben wird, der auch die Zweitstimme gegeben wird. Soweit stärkere Abweichungen auftreten, sind sie vor allem bei den kleinen Parteien zu beobachten und lassen sich weitgehend mit strategischen Motiven erklären (Jesse 1988; Schoen 1999; Gschwend et al. 2003; Gschwend 2007; Behnke und Bader 2013). Die Anhänger kleiner Parteien wählen oft mit der Erststimme die Kandidaten einer großen Partei, um sogenannte „wasted votes“ zu verhindern (Fisher 1973). Da daher angenommen werden kann, dass die Wahl des Kandidaten im Wahlkreis stark von der Parteipräferenz geprägt ist bzw. mit dieser auf jeden Fall stark korreliert (Behnke 2015, S. 599), erscheint die „Reproduktion“ der Kandidatenrangliste durch die der entsprechenden Parteien weitgehend unproblematisch. Soweit größere Abweichungen zwischen Erst- und Zweitstimmen bzw. Präferenzen für Kandidaten und für Parteien auftreten, die tatsächlich auf Personeneigenschaften der Kandidaten zurückzuführen sind oder deren Prominentenstatus, so dürfte auch dies unproblematisch sein, da diese Effekte nicht systematisch mit den Parteien korrelieren dürften und daher lediglich als Zufallsrauschen in die Modellierung eingehen.

Mit den GLES-Studien (German Longitudinal Election Study) verfügen wir über einen Datensatz, mit dem sich solche Präferenzordnungen sehr gut konstruieren lassen. Dort werden unter anderem Parteiskalometer abgefragt, d. h. die Befragten geben auf einer Skala von −5 bis +5 an, wie sympathisch sie eine bestimmte Partei finden. Für die Untersuchung bezüglich der Ergebnisse der Bundestagswahl 2021 greife ich dabei auf die Vorwahlstudie der GLES zurückFootnote 4. Der Datensatz umfasst 5220 Befragte. Für die Konstruktion der Präferenzordnungen werden nur die Fälle berücksichtigt, die für alle sechs ParteienFootnote 5 einen Sympathieskalometerwert angegeben sowie die Absicht bekundet haben, mit ihrer Erststimme für eine dieser sechs Parteien wählen zu wollen. Mit dieser Restriktion bleiben 2803 bezüglich dieser Variablen vollständige Fälle übrig, die für die folgenden Analysen herangezogen werden. Die Präferenzordnung wird nun so konstruiert, dass die Partei mit dem höchsten Sympathiewert den ersten Platz erhält, die mit den zweithöchsten Sympathiewert den zweiten Platz usw. Erhalten zwei oder mehr als zwei Parteien dieselben Sympathiewerte, dann wird die Reihenfolge in der Präferenzordnung mit Hilfe eines Zufallsgenerators bestimmt.

In Tab. 1 sind als Beispiel auszugsweise 20 Fälle des Datensatzes aufgeführt. In der ersten Spalte ist neben den Skalenwerten und der Präferenzordnung noch die Erststimme aufgeführt. Der Fall in der ersten Zeile findet z. B. die Grünen mit 5 Sympathiepunkten am sympathischsten, dann kommt die CDU/CSU, die 4 Sympathiepunkte erhält, die SPD mit 3 und die FDP mit einem Punkt. Am unteren Ende der Skala befinden sich die Linke und die AfD, die eine Bewertung auf der Sympathieskala von −4 bzw. −5 erhalten.

Tab. 1 Ausgewählte Erststimmen, Sympathiewerte und Präferenzordnungen, bezogen auf Umfragedaten (GLES) zur Bundestagswahl 2021

Wie man schon mit bloßem Auge sieht, stimmen Erststimme und Erstpräferenz meistens überein. Tab. 2 gibt die bedingten Verteilungen der Erststimmen in Abhängigkeit von der Erstpräferenz in der Rangordnung wieder. Während bei SPD, CDU/CSU und AfD jeweils ca. 80 % derjenigen, die eine Partei an erster Stelle ihrer Präferenzordnung haben, ihr auch ihre Erststimme geben, sind dies bei der FDP, Grüne und Linke nur ca. 60 % oder etwas mehr. Dies entspricht auch weitgehend den bekannten Splittingmustern.

Tab. 2 Verteilung der Erststimmen in Abhängigkeit von der Erstpräferenz, bezogen auf Umfragedaten (GLES) zur Bundestagswahl 2021 (Spaltenprozent)

Zu Abweichungen kommt es bei den ausgewählten Fällen in Tab. 1 zum Beispiel in den Zeilen 13 und 19. Dabei entspricht Fall 19 dem typischen Splittingmuster, dass Personen, die die FDP am besten bewerten, ihre Erststimme dennoch aus strategischen Gründen oft der CDU/CSU geben. weil die FDP üblicherweise keine realistischen Chancen auf den Gewinn eines Direktmandats hat (vgl. auch Schoen 1999).

Damit sind die notwendigen Informationen vorhanden, um abschätzen zu können, wie sich die Befragten in einer Stichwahl verhalten würden. Dabei gehe ich von dem z. B. bei süddeutschen Bürgermeisterwahlen oder bei der Wahl des französischen Präsidenten üblichen Verfahren aus, nach dem es einen zweiten Wahlgang gibt, wenn kein Kandidat im ersten Wahlgang eine absolute Mehrheit erzielt hat. Im zweiten Wahlgang können dann nur noch die zwei Kandidaten bzw. Kandidatinnen gewählt werden, die die beiden besten Ergebnisse im ersten Wahlgang erzielt habenFootnote 6. Nehmen wir daher an, die 20 Fälle in Tab. 1 entstammten alle einem Wahlkreis, bei dem im ersten Wahlgang die CDU und die SPD die zwei höchsten Ergebnisse erzielt haben. Denjenigen, die mit ihrer Erstpräferenz einen der ausgeschiedenen Kandidaten gewählt haben, wird nun für den zweiten Wahlgang die Kandidatin bzw. der Kandidat der Partei zugeordnet, die in der Rangordnung am weitesten vorne stehen. Der Grünenwähler Nr. 1 wählt daher im zweiten Wahlgang bei der Stichwahl die CDU, der Grünenwähler Nr. 4 wählt hingegen SPD, die beiden FDP-Wähler des ersten Wahlgangs Nr. 6 und 7 wählen in der Stichwahl jeweils CDU usw.Footnote 7

Für die Simulation des Wahlverhaltens in einem bestimmten Wahlkreis ziehen wir nun zuerst die tatsächlichen Erststimmenergebnisse in diesem Wahlkreis heran. In Tab. 3 ist dies beispielsweise für den Wahlkreis Nr. 1 Flensburg-Schleswig aufgezeigt.

Tab. 3 Erststimmen und Zusammensetzung der Stichprobe für den Wahlkreis Flensburg-Schleswig, bezogen auf die Bundestagswahl 2021

Um aus der bundesweiten Originalstichprobe mit 2803 Fällen eine wahlkreisspezifische „Stichprobe“ für Flensburg-Schleswig desselben Umfangs zu generieren, wählen wir aus der Originalstichprobe des GLES-Datensatzes zufällig 2803 Fälle aus, bei der die Verteilung der Erststimmen zwischen den sechs Parteien genau der Verteilung der Erststimmen im Wahlkreis entspricht. Da die Grünen bzw. ihr Kandidat Robert Habeck z. B. 50.231 Erststimmen erhielten, was einem Anteil von 31,5 % der Erststimmen, die auf diese sechs Parteien entfallen sind, entspricht, werden 883 Fälle (31,5 % von 2803) aus dem Subdatensatz des GLES-Datensatzes zufällig gezogen, der aus den Fällen besteht, bei denen die Erststimme für die Grünen abgegeben wurde. Diese Fälle werden mit Zurücklegen gezogen, d. h. es kann derselbe Fall auch mehrmals gezogen werden. So entstehen insgesamt 2803 Präferenzordnungen der Art, wie sie in Tab. 1 dargestellt sind. Dabei handelt es sich um eine durch die Erststimmenverteilung bedingte Verteilung von Präferenzordnungen. Bei der Generierung dieser wahlkreisspezifischen „Stichprobe“ mische ich gewissermaßen zwei Methoden. Indem ich aus der Originalstichprobe selbst eine neue „Stichprobe“ schaffe, greife ich im Wesentlichen auf die Logik des sogenannten Bootstrapping-Verfahrens (Duval und Mooney 1993) zurück. Die Grundidee dabei ist, dass man die der Stichprobe inhärente Unsicherheit bestimmter Kennwerte der Stichprobe, die sich in der Verteilung dieser Kennwerte ausdrückt, die man erhalten würde, wenn sehr viele solcher Stichproben ziehen würde, dadurch schätzt, dass man durch Simulation aus der Originalstichprobe selbst, die ja dummerweise die einzige ist, die man überhaupt hat, mit Hilfe des Ziehens mit Zurücklegen eine ebensolche Verteilung von Stichproben künstlich schafftFootnote 8. Dieses Verfahren bietet sich dann als Lösung an, wenn die Unsicherheit der Kennwerte mit Hilfe von statistischen Verfahren nicht einfach berechnet werden kann. Da es bei dem vorliegenden Problem nicht einfach um Anteilswerte geht, sondern um Anteilswerte, die aufgrund von bedingten Präferenzen auf relativ komplexe Weise gebildet werden, scheint die Anwendung des Verfahrens sinnvoll und hilfreich, da ansonsten sehr komplexe Entscheidungsbäume mit sehr vielen Zweigen und vor allem mit mehreren Gabelungen berechnet werden müssten. Um die Unsicherheit der Kennwerte in der Originalstichprobe möglichst genau durch die Verteilung der Kennwerte in den simulierten Stichproben abzubilden, haben die simulierten Stichproben denselben Umfang wie die Originalstichprobe.

Die zweite Methode, die ich bei der Schaffung der wahlkreisspezifischen Stichprobe anwende, besteht darin, dass die Stichprobe im Rahmen des Bootstrapping-Verfahrens als eine geschichtete Stichprobe gebildet wird, bei der die Schichtungsvariable der Erststimme entspricht.

Es werden nun jeweils aus der Originalstichprobe 100 solcher geschichteter Stichproben mit der Logik des Bootstrapping-Verfahrens gebildet, von denen angenommen wird, dass sie ziemlich genau in demselben Maße Variationen der kritischen Kennwerte erzeugen, wie es bei 100 „echten“ Stichproben aus der Grundgesamtheit gewesen wäre, wobei die Grundgesamtheit jeweils aus den Wählern eines spezifischen Wahlkreises bestehen würde.

Im Beispiel des Wahlkreises Flensburg-Schleswig ist der Erstplatzierte im Wahlkreis der Kandidat der Grünen, der Zweitplatzierte der der CDU. Diese beiden erhalten nun ihre Erststimmen unmittelbar zugewiesen, also 883 für die Grünen und 733 für die CDU. Den restlichen „Wählern“ in einer einzelnen Stichprobe wird nun die Kandidatin oder der Kandidat der Partei zugewiesen, die bzw. der am weitesten vorne in ihrer Präferenzordnung steht. Wiederholt man diesen Vorgang 100 mal, dann erhält man eine Verteilung des Stimmenanteils für Robert Habeck, wie sie in Abb. 1 dargestellt ist.

Abb. 1
figure 1

Stimmanteile von Robert Habeck in 100 Simulationen von Stichwahlen im Wahlkreis Flensburg-Schleswig, bezogen auf die Bundestagswahl 2021

In 96 der 100 Simulationen gewinnt Robert Habeck die Stichwahl, allerdings immer sehr knapp, im Mittel erhält er 51 % der Stimmen. Man kann also sagen, dass Robert Habeck den Wahlkreis nicht nur mit der relativen Mehrheitsregel tatsächlich gewonnen hat, sondern dass er ihn mit nahezu 100 %iger Wahrscheinlichkeit auch mit der absoluten Mehrheitsregel mit Stichwahlverfahren gewonnen hätte.

3.1 Methodische Hintergrundannahmen

Wie immer sind die Interpretationen statistischer Ergebnisse abhängig von methodischen Annahmen. Hier sind es vor allem zwei Annahmen, die eine Rolle spielen:

Erste Annahme

Es wird davon ausgegangen, dass die bedingten Präferenzordnungen bundesweit homogen sind.

In Tab. 4 sind die bezüglich der Erststimme bedingten Verteilungen der Zweitpräferenzen in der GLES-Stichprobe dargestellt.

Tab. 4 Verteilung der Zweitpräferenzen in Abhängigkeit von den Erststimmen, bezogen auf die Bundestagswahl 2021 (Spaltenprozent)

Insgesamt haben z. B. in der Stichprobe 287 Wähler eine Erststimme für die FDP abgegeben. Etwas mehr als 40 % von diesen haben abgesehen von der FDP die stärkste Präferenz für die CDU/CSU, etwa 20 % für die SPD usw. Diese Verteilungen für die einzelnen Bundesländer (oder gar für die einzelnen Wahlkreise) zu bestimmen und dann zur Bildung einer geschichteten Strichprobe heranzuziehen, scheint nicht sinnvoll, da die Fallzahlen in den einzelnen Bundesländern teilweise sehr gering ausfallen, so dass nicht davon ausgegangen werden kann, dass diese Verteilungen eine gute Repräsentation der bundeslandspezifischen Verteilungen sind und diese eine bessere Approximation an die wahlkreisspezifische Verteilung darstellt als die bundesweite.

Es wird daher davon ausgegangen, dass die bundesweite Verteilung der bedingten Präferenzordnungen eine relativ gute Approximation auch für die einzelnen Wahlkreise darstellt. Diese Annahme erscheint auch durchaus nicht unplausibel. Denn die wesentlichen Unterschiede zwischen den Wahlkreisen bestehen hinsichtlich ihrer Verteilung der Erststimmen. Natürlich ist ein Wahlkreis, in dem die FDP 20 % der Erststimmen erhält, strukturell verschieden von einem, in dem sie 6 % erhält. Diese Unterschiede aber werden ja durch die Kalibrierung der wahlkreisspezifischen Stichprobe an der Erststimmenverteilung im Wahlkreis berücksichtigt. Aber auch wenn sich die Wahlkreise hinsichtlich ihrer Randverteilungen unterscheiden, es also deutlich mehr FDP-Anhänger im ersten Wahlkreis gibt als im zweiten, so ist nicht unbedingt anzunehmen, dass sich die Binnenverteilungen unterschieden, dass also diejenigen, die FDP mit der Erststimme wählen, sich hinsichtlich ihrer Präferenzen zwischen den beiden Wahlkreisen grundlegend unterscheiden. Es gibt weniger FDP-Erststimmenwähler im zweiten Wahlkreis, diese Wenigen sind aber hinsichtlich ihrer politischen Präferenzen den deutlich stärker vertretenen FDP-Erststimmenwählern im ersten Wahlkreis mit hoher Wahrscheinlichkeit immer noch viel ähnlicher als z. B. einem Grünen-Erststimmenwähler im selben Wahlkreis. Diese Homogenitätsannahme hinsichtlich der bedingten Präferenzverteilungen dürfte also nicht allzu gewagt sein, d. h. zu keiner schwerwiegenden Verzerrung der Ergebnisse führenFootnote 9.

Zweite Annahme

Die Ergebnisse sind nicht dadurch strukturell bedeutend verzerrt, weil nur die Stimmenergebnisse hinsichtlich der sechs im Bundestag vertretenen Parteien betrachtet werden.

Sollte sich also das Wahlverhalten derjenigen, die mit der Erststimme eine andere Partei wählen als eine der sechs betrachteten Parteien, in der Verteilung ihrer Zweitpräferenzen sehr stark unterscheiden von der Verteilung der Zweitpräferenzen all der anderen Wähler, deren Zweitpräferenzen zum Zug kommen, weil sie mit der Erststimme keinen der beiden Kandidaten gewählt haben, die in die Stichwahl gelangen, dann könnte es theoretisch zu einer gewissen Verzerrung der Ergebnisse kommen. In Schleswig-Holstein z. B. dürften die SSW-Erststimmen-Wähler im zweiten Wahlgang vermutlich eher den Stichwahlkandidaten der Grünen oder der SPD wählen als den der CDU, in Bayern die Freie Wähler-Erststimmenwähler eher den der CSU als den der SPD oder Grünen. Für die einzelnen Bundesländer sind die Fallzahlen der Erststimmenwähler dieser Parteien aber zu gering, um daraus verlässliche bedingte Verteilungen der Zweitpräferenzen abzuleiten. Sie alle zu einer Kategorie „Andere Partei“ bundesweit zusammenzufassen wäre aber ebenfalls keine Lösung, da sie sich vermutlich zwischen den Bundesländern zu sehr substanziell voneinander unterscheiden (siehe SSW und Freie Wähler). Die durch die Nichtberücksichtigung der Wähler dieser Drittparteien bewirkten Verzerrungen dürften aber insgesamt nicht allzu bedeutend ins Gewicht fallen, da es sich ja überwiegend um Splitterparteien handelt, deren Effekte sich daher auch weitgehend gegeneinander ausbalancieren dürften (SSW und FW sind wohl die einzigen substanziellen Ausnahmen davon, weil sie in den erwähnten Bundesländern deutlich größer sind als bundesweit, wobei sich die relative Stärke des SSW wiederum auf nur wenige Wahlkreise beschränkt.).

Eine dritte Annahme bezieht sich auf Verhaltensannahmen, konkret auf die Bereitschaft, sich an der Wahl zu beteiligen.

Dritte Annahme

Es gibt keinen systematischen Ausfall der Wähler in Bezug auf die Stichwahl.

Es wird in der Simulation davon ausgegangen, dass alle Wähler, die eine Erststimme in der Umfrage angegeben haben, die ja für das geltende System der relativen Mehrheit gilt, auch an einer Stichwahl teilnehmen würden und dort entsprechend ihrer Präferenzen wählen würden. Theoretisch ließe sich durchaus vorstellen, dass Wähler bestimmter Parteien stärker dazu neigen, sich aus Indifferenz oder Entfremdung (Brody und Page 1973) zu enthalten, wenn ihr Lieblingskandidat nicht mehr zur Verfügung steht. Wie jedes Modell aber muss auch dieses Modell vereinfachende Annahmen treffen (King et al. 1994), daher soll davon ausgegangen werden, dass die „fehlenden Fälle“ bei der Stichwahl zufällig verteilt sind, sich also nicht systematisch zwischen den Parteien bzw. den verschiedenen Erststimmenwählergruppen unterscheiden. Für eine Schätzung eines parteispezifischen Ausfalleffekts liegend zudem keine belastbaren Daten vor.

Wichtig aber ist in jedem Fall, dass – selbst wenn die Annahmen zu idealisierend ausfallen mögen – die Richtung der Unterschiede zwischen der Wirkung der relativen Mehrheitswahl und der absoluten Mehrheitswahl in Stichwahlverfahren mit hoher Wahrscheinlichkeit korrekt abgebildet wird. Der Effekt eines Wechsels von der relativen Mehrheitswahl zu einem Stichwahlverfahren mag dann wegen der idealisierenden Annahmen womöglich zwar leicht unter- oder überschätzt werden, das Vorzeichen des Effekts aber, also für welche Partei Verluste und für welche Partei Gewinne entstehen, ist mit allerhöchster Wahrscheinlichkeit sehr zuverlässig und auch die Größenordnung der Veränderungen dürfte durchaus gut getroffen werden.

In einem einzelnen beispielhaften Simulationsdurchgang für alle 299 Wahlkreise ergaben sich die Resultate in Tab. 5. Die Anzahl der Direktmandate der SPD steigt von 121 deutlich auf 172 an. Die CDU verliert hingegen 24 ihrer 98 Direktmandate, die sie unter der relativen Mehrheitswahl gewonnen hat. Ebenfalls zu den Verlierern zählen Grüne, Linke und die AfD. Die AfD verliert alle 16 Direktmandate, die Linke verliert alle ihre 3 Direktmandate und die Grünen erhalten nur noch 7 statt der 16 Direktmandate, die sie nach der aktuellen Regel der relativen Mehrheitswahl erhalten haben. Die CSU behält hingegen alle ihre Direktmandate und kann sogar das letzte hinzugewinnen, das 2021 nach der relativen Mehrheitsregel noch an die Grünen gefallen ist.

Tab. 5 Verteilung der Direktmandate in einem einzelnen Simulationsdurchgang, bezogen auf die Bundestagswahl 2021

Insgesamt versändert sich der Sieger in 67 Wahlkreisen. Die detaillierten Ergebnisse sind in Tab. 6 zu sehen.

Tab. 6 Ergebnisse für einen Simulationsdurchgang, bezogen auf Bundestagswahl 2021

Besonders aufschlussreich in der Detailanalyse sind die Ergebnisse hinsichtlich der AfD. Während diese ihre Direktmandate nach relativer Mehrheit meistens mit Erststimmenanteilen zwischen 25 und 35 % gewinnt, gewinnt sie bei der Stichwahl typischerweise weniger als 10 Prozentpunkte weitere Stimmen hinzu, während der bisherige Zweite in der Regel mehr als 30 Prozentpunkte oder sogar mehr als 40 Prozentpunkte hinzugewinnt. Während die AfD-Direktmandate in Thüringen in der Stichwahl fast durchgehend an die SPD gehen, gehen sie in Sachsen-Anhalt und Sachsen an die CDU. Die zwei Direktmandate der Linken in Berlin gehen an die SPD und das in Leipzig an die Grünen. Die grünen Direktmandate in den Metropolen Berlin und Hamburg gehen an die SPD, das grüne Direktmandat in Bayern in München-Süd geht hingegen an die CSU.

Der letzte Fall zeigt auf, dass man bei der Interpretation der Ergebnisse der absoluten Mehrheitswahl mitunter vorsichtig sein muss. Denn es heißt z. B. keineswegs, dass die CSU, weil sie nun bei der absoluten Mehrheitswahl in der Stichwahl gewinnt, tatsächlich der beste Kandidat im Wahlkreis gewesen ist. In der Stichwahl unterliegt die grüne Kandidatin mit knapp 48 % der Stimmen dem der CSU. Allerdings zeigt eine Einzelanalyse, dass der Kandidat der SPD gegenüber dem der CSU die Wahl im Stichwahlverfahren sogar mit 55 % der Stimmen gewonnen hätte. Da der SPD-Kandidat auch gegen die Grünen-Kandidatin in einer Stichwahl gewonnen hätte, ist er also aller Voraussicht nach ein sogenannter Condorcet-Sieger gewesen, er ist aber in der ersten Runde unglücklicherweise ausgeschieden. Unter einem Condorcet-Sieger wird ein Kandidat verstanden, der jeden anderen Kandidaten in einem Paarvergleich schlägt (Dummett 1997). Ein Condorcet-Sieger würde also aus jeder vorstellbaren Stichwahl als Sieger hervorgehen, vorausgesetzt, er nimmt an dieser Stichwahl eben auch teil. Tatsächlich zeigt sich, dass die SPD-Kandidaten in allen vier Münchner Wahlkreisen Condorcet-Sieger gewesen wären und daher die CSU jeweils in der Stichwahl besiegt hätten (Das Ergebnis für München-Ost besteht allerdings in einem nur hauchdünnen Vorsprung der SPD vor der CSU.). Die SPD-Kandidatinnen und -Kandidaten kommen aber erst gar nicht in die Stichwahl, die CSU tritt in dieser gegen die „schwächere“ Kandidatin bzw. den „schwächeren“ Kandidaten der Grünen an und kann dann die Stichwahl in allen vier Wahlkreisen für sich entscheiden.

Die Durchführung von 100 Simulationsdurchgängen, in denen jeweils für alle 299 Wahlkreisen die Ergebnisse aufgrund wahlkreisspezifischer konstruierter Stichproben ermittelt werden, ergibt die in Tab. 7 aufgeführten Mittelwerte für die Direktmandatszahlen der Parteien.

Tab. 7 Mittelwert der Direktmandate für die Parteien in 100 Simulationsdurchgängen über alle 299 Wahlkreise, bezogen auf die Bundestagswahl 2021

Die Streuungen zwischen den einzelnen Simulationsdurchgängen für die SPD und die CDU/CSU sind in Abb. 2 aufgezeigt.

Abb. 2
figure 2

Verteilung der Direktmandate für SPD und CDU/CSU bei Stichwahlverfahren für 100 Simulationsdurchgänge mit allen 299 Wahlkreisen, bezogen auf die Bundestagswahl 2021

Die Simulation der Streuung kann man dazu verwenden, um quasi-signifikanzstatistische Tests durchzuführen. In allen 100 generierten Stichproben liegt die Anzahl der Direktmandate der SPD über den 121 Direktmandaten, die aufgrund der relativen Mehrheit für sie anfallen, ja sogar mit weitem Abstand, da das Minimum der Direktmandate der SPD mit dem Stichwahlverfahren bei 168 liegt. Man kann daraus den Schlussziehen, dass, solange die für die Simulationen gemachten Annahmen halbwegs zutreffen, die Einführung der Stichwahlregelung praktisch mit Sicherheit die Anzahl der Direktmandate der SPD bei einem Ergebnis wie dem von 2021 um mehr als 40 erhöht hätte. Ebenfalls mit annähernder Sicherheit erhielte die CDU/CSU mehr als 20 Direktmandate weniger, wenn die Wahlkreisgewinner nicht mit relativer, sondern mit absoluter Mehrheit ermittelt würden.

Durch die Einführung der absoluten Mehrheitsregel mit Stichwahl der beiden stärksten Kandidaten des ersten Wahlgangs kommt es insgesamt zu einem Trend zur Mitte, d. h. es konkurrieren im Wesentlichen die CDU/CSU und die SPD um die Direktmandate, da diese in ihrem jeweiligen Lager meistens die dominante Partei darstellen. Es kommt also keineswegs unter dem Stichwahlverfahren zu einer größeren Streuung der Direktmandate unter den Parteien, ganz im Gegenteil kommt es zu einer noch stärkeren Konzentration auf die zwei stärksten Parteien. Dies kann man auch am Wert des sogenannten Least-Square-Index von Gallagher (1991) sehen, der ein Maß für Disproportionalität ist und in der letzten Spalte von Tab. 7 aufgeführt ist. Das Disproportionalitätsmaß berechnet sich grob gesagt aus der Summe der quadratischen Abweichungen der Sitzanteile der Parteien von ihren StimmenanteilenFootnote 10. Dabei gehen in die Berechnung nur die Werte der sechs betrachteten Parteien ein. Wie man sieht, kommt es bei der Sitzverteilung nach der Proporzformel nur zu einer minimalen Disproportionalität, die auf Rundungseffekte zurückzuführen istFootnote 11. Dagegen ist die Disproportionalität bezüglich der Verteilung der 299 Direktmandate von 2021 im Vergleich zu den Sitzzahlen, die den Parteien im Verhältnis zu ihren Zweitstimmen zustehen würden, mit einem Wert von 21,7 schon sehr hoch. Sie wird aber noch einmal klar übertroffen durch den Wert von 27,8 bezüglich der Mehrheitswahl mit Stichwahl im zweiten Wahlgang.

Natürlich wären theoretisch Wahlabsprachen möglich, die in bestimmten Lagern die Direktmandate stärker unter den Parteien eines Lagers aufteilen, aber diese Absprachen wären auch unter dem aktuellen System schon möglich und z. B. auch sinnvoll gewesen, haben aber dennoch nicht stattgefunden. Es ist auch kein unmittelbarer Anreiz für die Parteien zu erkennen, solche Wahlabsprachen zu treffen. Dies ergibt vor allem Sinn in Systemen, in denen der zweite Wahlgang nicht automatisch auf die zwei Spitzenreiter des ersten beschränkt ist. Hier könnte es dann durch den uneinsichtigen Nichtrückzug eines Kandidaten dazu kommen, dass er zum „Spoiler“ (Poundstone 2008, S. 59 ff.) wird und dem Kandidaten aus dem eigenen Lager den Sieg stiehlt, den dieser bei einem reinen Duell zwischen den beiden Spitzenreitern hätte erringen können. Da dieser Anreiz zu Wahlabsprachen im hier beschriebenen Stichwahlverfahren weitgehend fehlt, spricht einiges dafür, dass die Ergebnisse sehr realistisch sind, d. h. sehr gut das schätzen, was sich unter einem Stichprobenwahlverfahren in dieser Form einstellen würde.

Der verstärkte Konzentrationseffekt auf die beiden stärksten Parteien bei der absoluten Mehrheitswahl lässt sich in Bezug auf die Bundestagswahl 2017 allerdings nicht bestätigenFootnote 12. Denn bei der Bundestagswahl 2017 kam es auch schon bei der relativen Mehrheitsregel zu einer extremen Konzentration der Wahlkreise auf die Unionsparteien. Hier konnte die Einführung eines Stichwahlverfahrens daher so gut wie gar keinen Effekt mehr entfalten. Die Anzahl der Direktmandate der CDU/CSU ist in den 100 Stichproben annähernd symmetrisch um das Ergebnis bezüglich der relativen Mehrheitswahl verteilt. „Signifikant“ auf dem 1‑Prozent-Niveau wäre allerdings die Veränderung bei der SPD. In 99 der 100 Stichproben erhält die SPD mit dem Stichwahlverfahren mehr als die 59 Direktmandate, die sie bei der relativen Mehrheitswahl erhält. Allerdings fällt der Zuwachs von durchschnittlich etwas mehr als vier Direktmandaten überschaubar aus (Tab. 8).

Tab. 8 Mittelwert der Direktmandate für die Parteien in 100 Simulationsdurchgängen über alle 299 Wahlkreise, bezogen auf die Bundestagswahl 2017

Die Unterschiede zwischen 2021 und 2017 lassen sich besonders gut an Gallaghers Least-Sqare-Index erkennen. Es gibt hier praktisch keinerlei Unterschied zwischen dem Wert bezüglich der relativen Mehrheitswahl und dem bezüglich der absoluten Mehrheitswahl mit Stichwahl. Beide liegen aber mit einem Wert von über 33 noch einmal deutlich höher als der höhere Wert von 2017, der sich dort bei der Stichwahlregel ergeben hat.

4 Vorteil der großen Parteien, Konzentration und Mehrheitsumkehr bei einem Grabenwahlsystem mit relativer Mehrheitswahl und mit absoluter Mehrheitswahl mit Stichwahlverfahren

Wie wirken sich diese Zahlen für Direktmandate in einem Grabenwahlsystem mit relativer Mehrheitsregel und einem mit absoluter Mehrheitsregel mit Stichwahlverfahren nun auf die Bildung von parlamentarischen Mehrheiten aus, was ja die wesentliche Ausgangsfrage war? In Tab. 9 sind die Gesamtzahlen für die Parteien für ein Grabenwahlsystem angezeigt, bei dem von einer hälftigen Teilung der 598 Sitze in je 299 Sitze, die in den Wahlkreisen gewonnen werden, und solchen, die nach dem Verfahren der Verhältniswahl verteilt werden, ausgegangen wirdFootnote 13.

Tab. 9 Sitzverteilung nach Proporz und Grabenwahlsystem, bezogen auf Ergebnisse der Bundestagswahl 2021

Die SPD hätte z. B. 2021 – ausgehend von der Regelgröße – aufgrund ihres Zweitstimmenanteils einen proportionalen Sitzanspruch auf 168 Sitze gehabt, unter einem Grabenwahlsystem mit relativer Mehrheitsregel hätte sie auf 205 Sitze zugelegt, unter einem Grabenwahlsystem mit Stichwahlverfahren hätte sie sogar 257 Sitze erhalten. Dem entgegen stehen Mandatsverluste bei der Umstellung von der Verhältniswahl auf das Grabenwahlsystem für FDP, Linke, AfD und Grüne, die unter dem Stichwahlverfahren noch stärker ausfallen als unter der relativen Mehrheitsregel. Die FDP erhält schon bei der relativen Mehrheitsregel nur die Hälfte der Sitze, die ihr nach Proporz zustehen würden, dies trifft für sie bei der Stichwahl natürlich genauso zu. Nun aber kommen bei der absoluten Mehrheitsregel mit Stichwahl noch Linke und AfD zu der Gruppe derjenigen dazu, deren Mandatsanspruch im Vergleich zur Verhältniswahl strikt halbiert wird, bei denen der Verlust bei der relativen Mehrheitswahl durch einige Direktmandate noch leicht gedämpft worden war. Auch die Grünen würden bei dem Grabenwahlsystem mit Stichwahl mehr verlieren als bei dem Grabenwahlsystem mit relativer Mehrheitsregel, auch wenn sie noch einige Direktmandate behalten würden.

Wegen der Einheitlichkeit der Darstellung wurden in Tab. 9 CDU und CSU zusammengefasst. Tatsächlich werden daher einige Effekte und Unterschiede sogar unterschätzt. Die CSU erhält z. B. schon unter der relativen Mehrheitsregel 45 der 46 Direktmandate, obwohl sie nur einen Sitzanspruch auf 34 Mandate hätte. Unter dem Grabenwahlsystem mit relativer Mehrheitsregel würde sie insgesamt sogar 62 Mandate erhalten, da sie ja zu ihren Direktmandaten im durch die Mehrheitsregel bestimmten Bereich noch die 17 Proporzmandate aus der anderen Hälfte bekäme. Sie wäre also im Verhältnis 62/34 bzw. um mehr als 80 % überrepräsentiert. Die FDP hingegen erhielte nur 38 der ihr nach Zweitstimmen eigentlich zustehenden 75 Sitze, sie ist also im Verhältnis 38/75 bzw. um fast 50 % unterrepräsentiert. Bildet man nun das Verhältnis zwischen diesen beiden Faktoren, also (62/34)/(38/75), erhält man den Wert 3,6. Dies entspricht gewissermaßen dem Verhältnis der Erfolgswerte der beiden Parteien, wobei der Erfolgswert die Anzahl der Sitze pro Wähler angibt. Anders ausgedrückt: Im Grabenwahlsystem erhielte die CSU für dieselbe Anzahl von Wählern 3,6 mal so viele Sitze wie die FDP. Bei der Stichwahlregel vergrößert sich dieses Verhältnis gegenüber der FDP, Linke und AfD sogar noch einmal leicht auf den Faktor 3,7.

Entgegen der üblichen Annahmen nehmen also insgesamt die Vorteile der großen Parteien bei der Stichwahlregel noch einmal zu, wobei es hier auch innerhalb der Gruppe zu einer größeren Konzentration kommt, so dass vor allem die CSU in Bayern und die SPD im übrigen Bundesgebiet und damit auch im gesamten Bundesgebiet deutlich zulegen. Am Disproportionalitätsindex von Gallagher lässt sich ebenfalls wieder ablesen, dass die Verzerrung der Sitzverteilung im Grabenwahlsystem gegenüber der Proporzverteilung bei der Stichwahlregelung stärker ausfällt als bei einem Grabenwahlsystem, bei dem die Wahlkreismandate mit relativer Mehrheit gewonnen werden.

Tab. 10 zeigt nun die Auswirkungen auf die Bildung von parlamentarischen Mehrheiten. Dafür werden systematisch alle möglichen Koalitionen aus den 6 Parteien gebildet. Da für jede Partei bezüglich jeder spezifischen Koalition gilt, dass sie in ihr enthalten oder nicht enthalten sein kann, gibt es also insgesamt 26 = 64 Teilmengen, die aus den 6 Elementen gebildet werden können. Da eine Koalition ohne Parteien (das Äquivalent zur leeren Menge) jedoch schwer vorstellbar ist, gibt es 63 mögliche Koalitionen.

Tab. 10 Mehrheitskoalitionen unter verschiedenen Systemen, bezogen auf Ergebnisse der Bundestagswahl 2021

Da für jede mögliche Koalition immer eine komplementäre Koalition mit all den Parteien, die in der ersten nicht enthalten sind, existiert und eine der beiden Koalitionen eine Mehrheit haben muss (außer in dem eher unwahrscheinlichen Fall eines Patts), gibt es in der Regel 32 mögliche Mehrheitskoalitionen. In Tab. 10 sind daher die 32 Koalitionen abgebildet, die nach dem System der Verhältniswahl eine Mehrheit bilden würden, wobei für eine Mehrheit mindestens 300 Sitze erforderlich sind. Die ersten sechs Spalten der Tabelle geben für eine bestimmte Koalition an, welche Partei in ihr enthalten ist und welche nicht. Ist eine Partei enthalten, erhält sie den Wert „1“, ist sie nicht enthalten, erhält sie den Wert „0“. Die Koalition in der ersten Zeile z. B. besteht daher aus CDU/CSU, FDP und AfD und hat insgesamt eine sehr knappe Mehrheit von 158 + 75 + 68 = 301 Mandaten usw. Allerdings sind unter diesen 32 Koalitionen viele, die in der Praxis unwahrscheinlich sind. Dabei geht es weniger um die politische Wahrscheinlichkeit, denn da die rechnerischen Möglichkeiten unabhängig von den Parteilabeln sein sollten, sollte man dies ignorieren, wenn es nur um die Abschätzung der Veränderung der möglichen Mehrheiten geht. Ungewöhnlich und im deutschen System inzwischen wohl kaum noch vorstellbar sind „übergroße“ Koalitionen, also Koalitionen, die mehr Partner an Bord haben als zur Bildung einer Mehrheit notwendig sindFootnote 14. Dies entspricht auch der spieltheoretischen Argumentation von John von Neumann und Oskar Morgenstern, nach der rationale Parteien die Pfründe der Macht mit so wenig Partnern wie möglich teilen wollen und daher sogenannte „minimal winning coalitions“ (Von Neumann und Morgenstern 1953) bilden. In Tab. 10 sind daher die „übergroßen“ Koalitionen kursiv dargestellt.

Für eine sinnvolle Analyse fokussieren wir uns also daher zuerst auf die „minimal winning coalitions“. Von diesen gibt es insgesamt sieben. Sie sind diejenigen in den Zeilen 1,3,5,9,11,13, und 17. Die letzte davon (Zeile 17) entspräche der Großen Koalition, alle anderen enthalten eine der beiden großen Parteien und weitere kleine Parteien. Die aktuell regierende Ampelkoalition entspräche der vorletzten dieser Koalitionen in Zeile 13. Die letzten beiden Spalten geben nun an, welche Mehrheiten sich durch die Einführung des Grabenwahlsystems ergeben würden. Wie man sieht, ergäbe sich ein möglicher Mehrheitswechsel bei der Grabenwahl mit relativer Mehrheitsregel. Unter den sieben realistischen Optionen ist dies immerhin schon eine Quote von 14 %. Hätte nach Proporz die Koalition aus SPD, FDP und AfD noch eine Mehrheit von 168 + 75 + 68 = 311 Mandaten, verlöre sie diese unter dem Grabenwahlsystem mit relativer Mehrheitsregel, womit automatisch die Gegenkoalition, die die Parteien mit der „0“ enthält, also die Koalition aus CDU/CSU, Grüne und Linke nun eine Mehrheit hätte. Allerdings handelt es sich bei beiden Koalitionen um sehr unwahrscheinliche Koalitionen, da sie ideologisch eine extrem hohe Spannweite hätten.

Bei einem Grabenwahlsystem mit Stichwahl gäbe es sogar 4 Koalitionen, die ihre unter der Verhältniswahl noch vorhandene Mehrheit nun verlieren würden. So ergäbe sich nun eine neue Koalitionsmöglichkeit für Rot-Rot-Grün (Zeile 1) oder SPD, FDP und Linke (Zeile 3). Das Ergebnis in Zeile 5 sollte man hingegen eher nicht im Sinn der neu entstandenen Koalitionsmöglichkeit, sondern der nun verloren gegangenen interpretieren. Denn die im Verhältniswahlsystem rechnerisch mögliche Jamaika-Koalition würde unter einem Grabenwahlsystem mit Stichwahl ebenfalls ihre Mehrheit verlieren.

Auch wenn die Ausgangskoalition in Zeile 2 eine „übergroße“ Koalition war und daher selbst eine eher unwahrscheinlich auftretende, darf der Fall in der Analyse nicht übergangen werden, denn der Mehrheitswechsel generiert dennoch eine neue Option, die durchaus relevant und wahrscheinlich ist. Denn die aufgrund des Grabenwahlsystems mit Stichwahl neue mögliche Koalition wäre Rot-Grün, die nun eine durchaus komfortable Mehrheit von 313 Sitzen hätte, da die deutlichen Sitzverluste der Grünen beim Wechsel von der Proporzwahl zum Grabenwahlsystem mit absoluter Mehrheitsregel mit Stichwahlverfahren mehr als aufgewogen würden durch die Sitzgewinne der SPD.

Zusammenfassend lässt sich feststellen, dass ein Grabenwahlsystem mit Stichwahlverfahren bei vergleichbaren Ergebnissen wie denen der Bundestagswahl 2021 keineswegs seltener zu einer Mehrheitsumkehr im Parlament geführt hätte, sondern ganz im Gegenteil diese Wahrscheinlichkeit deutlich erhöht hätte.

2017 gibt es keinen wesentlichen Unterschied zwischen einem Grabenwahlsystem mit relativer Mehrheitsregel und einem mit absoluter Mehrheitsregel mit Stichwahlverfahren, weil die Union auch schon allein mit dem ersten eine klare absolute Mehrheit im Parlament errungen hätte (Tab. 11).

Tab. 11 Sitzverteilung nach Proporz und Grabenwahlsystem, bezogen auf Ergebnisse der Bundestagswahl 2017

Auch hier kommt es durch die Einführung des Grabenwahlsystems zu weitgehenden Veränderungen der potenziellen Mehrheitsbildungen, da nun ja alle bisher denkbaren Koalitionen unter Ausschluss der Union nicht mehr möglich sind. Die deutlichste Konsequenz zeigt sich bei der Großen Koalition, der letzten der ursprünglichen „minimal winning“-Koalitionen in Zeile 17 in Tab. 12. Zwar bleibt bei dieser logischerweise der Mehrheitsstatus erhalten, aber die Koalition wäre unter einem Grabenwahlsystem nun nicht mehr eine „minimal winning coalition“, sondern eine „übergroße“, würde also nicht mehr zustande kommen und einer Alleinregierung der Union Platz machen.

Tab. 12 Mehrheitskoalitionen unter verschiedenen Systemen, bezogen auf Ergebnisse der Bundestagswahl 2017

5 Fazit

Das Grabenwahlsystem führt zu einer Konzentration im Parteiensystem, indem es größere Parteien noch größer und kleinere Parteien noch kleiner macht. Dieser Konzentrationseffekt tritt sowohl bei der relativen Mehrheitsregel als auch bei der absoluten Mehrheitsregel auf. Die durchgeführten Simulationen legen nahe, dass die Umsetzung der absoluten Mehrheitsregel mit Stichwahl zu einer noch stärkeren Konzentration des Parteiensystems als die relative Mehrheitsregel führt, weil Parteien, die eher am Rand des politischen Spektrums liegen und unter der relativen Mehrheitsregel noch einzelne Wahlkreismandate gewinnen können, durch die Stichwahl an Chancen verlieren, Direktmandate zu gewinnen. Umgekehrt gilt, dass die Partei, die insgesamt die größte ist und deshalb meist auch schon nach der relativen Mehrheitsregel vorne liegt, bei der absoluten Mehrheitswahl noch besser abschneidet. Die SPD, die 2021 insgesamt vorne lag und auch nach der relativen Mehrheitswahl die meisten Direktmandate außerhalb Bayerns gewonnen hätte, hätte ihren Vorsprung daher mit der absoluten Mehrheitsregel mit Stichwahl noch einmal deutlich ausbauen können.

2017 gab es hingegen keinen wesentlichen Unterschied zwischen der Grabenwahl mit der relativen Mehrheitsregel und der mit Stichwahlverfahren, weil die Union so oder so die ganz überwiegende Anzahl der Direktmandate gewonnen hätte und nur in den Kernhochburgen der SPD erfolglos bleibt.

Das Grabenwahlsystem muss also nicht unbedingt nur die CDU bevorzugen, es könnte wie 2021 auch die SPD der Gewinner des Systems sein. 2021 gewinnt die SPD im Vergleich zu dem, was ihr nach der Verhältniswahl zustehen würde, 37 Mandate bei einem Grabenwahlsystem mit relativer Mehrheitswahl in den Wahlkreisen und 89 Mandate bei einem mit Stichwahlregelung. Die CDU/CSU gewinnt 2021 hingegen 64 Mandate bei einem Grabenwahlsystem mit relativer Mehrheit hinzu und „nur“ noch 39 bei einem mit Stichwahlregelung.

Die CSU profitiert derzeit immer von einem Grabenwahlsystem und dies wird auch weiterhin auf absehbare Zeit der Fall sein, selbst wenn ihr Abwärtstrend weiter geht, denn trotz ihrer Verluste liegt sie immer noch so weit vor den anderen Parteien, dass sie die meisten, wenn nicht sogar alle Direktmandate gewinnt. Natürlich könnte es langfristig auch in Bayern zu ähnlich fundamentalen Kräfteverschiebungen wie in Baden-Württemberg kommen, wo die CDU auch einmal unangefochten mit weitem Abstand an der Spitze stand. Aber relevant sind nur die in absehbarer Zeit unter realistischen Annahmen zu erwartenden Folgen. Es ergibt keinen Sinn, davon zu sprechen, dass, wenn alles anders wäre, wir auch andere Folgen zu erwarten hätten. Wenn wirklich alles anders wäre, wären wir womöglich an den Folgen gar nicht mehr interessiert.

Das Grabenwahlsystem mit absoluter Mehrheit und Stichwahl im zweiten Wahlgang führt wegen des Zuwachs der großen und vor allem der größten Partei im Vergleich zum Grabenwahlsystem mit relativer Mehrheit auch zu einer größeren Konzentration des Parteiensystems bzw. zu einer Zunahme der Disproportionalität. Ebenso führt es häufiger zu Mehrheitsumkehrungen. Diese Effekte treten aber nur 2021 auf, während 2017 zwar die entsprechenden Effekte für das Grabenwahlsystem an sich zu beobachten sind, aber keine Unterschiede zwischen einem Grabenwahlsystem mit relativer Mehrheit im Wahlkreis und einem mit Stichwahlregelung.

Die Resultate sind allerdings mit entsprechender Vorsicht zu interpretieren. Einerseits unterliegen sie den Restriktionen, die durch die methodischen Annahmen formuliert wurden. Vor allem aber dürften sie sehr von der konkreten Struktur des Parteiensystems abhängen und von den Präferenzprofilen innerhalb der Anhängerschaften der Parteien. Der Zuwachs der SPD und der Verlust an Direktmandaten der CDU 2021 liegt offensichtlich darin begründet, dass die SPD in den Wahlkreisen, in denen sie im direkten separaten Vergleich der CDU noch unterlegen war, in den Stichwahlen dann in vielen Wahlkreisen an der CDU vorbeiziehen konnte, weil sie mehr Stimmen von Wählern ihr relativ nahestehender Parteien erhielt als die CDU. Es ist also nicht davon auszugehen, dass es einen inhärenten systematischen Effekt gibt, dass die Konzentration im System mit absoluten Mehrheiten und Stichwahl stärker ausfallen muss als die in einem System mit relativen Mehrheiten. Umgekehrt aber kann man die These zurückweisen, dass ein System mit absoluten Mehrheiten in den Wahlkreisen systematisch weniger Verzerrung bewirken würde als ein System, in dem die Wahlkreise mit relativen Mehrheiten gewonnen werden. Sowohl Duvergers These, die mitunter auch als sein „drittes Gesetz“ bezeichnet wird, als auch die Behauptungen der Unionsexperten in der Wahlrechtskommission, ein Grabenwahlsystem mit Stichwahlregelung könne als eine Art von „Grabenwahlsystem light“ betrachtet werden, finden in der deutschen Realität zumindest bisher keinerlei Unterstützung.