1 Einleitung

Der Bundestag ist weit von einer paritätischen Zusammensetzung aus Männern und Frauen entfernt. Zwar ist der Frauenanteil vor allem zwischen 1983 und 1998 deutlich angestiegen (Fortin-Rittberger und Eder 2013; Bieber 2022), lag aber unmittelbar nach der Bundestagswahl 2021 mit ca. 34,8 % nach wie vor klar unter der 50 %-Marke (Bundeswahlleiter 2021, S. 401). Hierbei gibt es große Unterschiede zwischen den Fraktionen. Bei den im Parlament vertretenen Parteien aus dem linken Spektrum gelten parteiintern verbindliche Frauenquoten (IDEA 2021), und die 50 %-Marke wird sowohl von den Grünen (59 %) als auch den Linken (54 %) übertroffen und scheint für die SPD zumindest in Reichweite (42 %). Die Frauenanteile der Fraktionen von FDP (24 %), Union (23 %) und AfD (13 %) fallen im Vergleich stark ab.

Als mögliche Lösung für dieses Ungleichgewicht werden vor allem Quotenregeln für die Aufstellung von Kandidatinnen diskutiert. Diese sind jedoch umstritten (siehe etwa Krook 2006; Coffé und Reiser 2021) und im deutschen Mischwahlsystem schwierig zu implementieren.Footnote 1 Vor allem beeinträchtigen sie nach Entscheidungen von Landesverfassungsgerichten verschiedene Rechte wie die Wahlvorschlagsfreiheit der Parteien, die passive Wahlrechtsgleichheit und die Wahlfreiheit der Wähler*innen.Footnote 2 Die Option offener Wahllisten, die Bürger*innen eine Wahl spezifischer Kandidat*innen erlaubt,Footnote 3 findet hingegen kaum Aufmerksamkeit in der politischen Diskussion. In der Reformdebatte während der 19. Legislaturperiode des Bundestages sah nur die Gesetzesvorlage der AfD die Möglichkeit von bis zu drei Personenstimmen vor.Footnote 4 Die Fokussierung auf paritätisch besetzte Listen ist auch im Auftrag an die im November 2020 eingesetzte Reformkommission sichtbar, sie „wird darüber hinaus Maßnahmen empfehlen, um eine gleichberechtigte Repräsentanz von Frauen und Männern auf den Kandidatenlisten und im Deutschen Bundestag zu erreichen“ (§55 Bundeswahlgesetz).Footnote 5 Während bei Parteiakteuren die Skepsis gegenüber mehr Einfluss durch Wähler*innen nicht überraschen mag, zog auch die Stellungnahme des Deutschen Frauenrats (2020) zum Wahlrechtsänderungsvorschlag der Großen Koalition offene Listen überhaupt nicht in Erwägung. Und selbst in der Fachliteratur findet diese Option oft keine oder nur eingeschränkte Beachtung.Footnote 6

Dies ist zu bedauern, da offene Listen die verfassungsrechtlichen Probleme von Quotenregeln für Nominierungen vermeiden würden. Im bestehenden deutschen Bundestagswahlsystem basiert die Verteilung der Mandate innerhalb der Parteien allein auf den Entscheidungen der für die Nominierung zuständigen Parteiselektorate (Bieber 2022). Würde man Wähler*innen die Möglichkeit einräumen, Präferenzen für Kandidat*innen innerhalb einer Partei auszudrücken, könnte dies möglicherweise auch die Unterrepräsentation von Frauen adressieren. Ob dies in der Tat so ist, lässt sich kaum im Rahmen einer rein theoretischen Diskussion von Wahlsystemeigenschaften und -effekten klären.Footnote 7 Die Antwort hängt auch davon ab, inwiefern Unterstützer*innen von FDP, Union und AfD bei einem offenen Listensystem bereit wären, Frauen statt Männer zu wählen. Zudem ist auch denkbar, dass insbesondere in der SPD die Möglichkeit der expliziten Unterstützung männlicher Kandidaten Fortschritte in der Repräsentation von Frauen gefährdet. Zwar gibt es eine umfangreiche Literatur zur Frage ob, das Geschlecht von Kandidat*innen die Entscheidung von Wähler*innen beeinflusst (siehe Schwarz und Coppock 2022 für einen Überblick). Jedoch beschäftigt sich ein Großteil dieser Literatur mit Wahlverhalten in Mehrheitswahlsystemen bzw. in Experimentalstudien im US-amerikanischen Setting. Zudem weist die generell recht große Bandbreite an Ergebnissen darauf hin, dass die Effekte kontextabhängig sind. Deswegen führen wir eine experimentelle Untersuchung des Wahlverhaltens – unter Manipulation des Listentyps und des Frauenanteils – mit einer für Deutschland bevölkerungsrepräsentativen Stichprobe durch.

Die zentrale Frage der vorliegenden Studie lautet also: Wie viele Frauen und Männer entscheiden sich bei offenen Listen für eine Kandidatin, und wie variiert dies über die Parteien? Zur Beantwortung verwenden wir Daten aus einem Umfrageexperiment, das im Januar/Februar 2019 online mit einer quotenrepräsentativen Stichprobe der wahlberechtigten deutschen Bevölkerung durchgeführt wurde (\(N=2640\)). Dabei hatten Befragte die Wahl zwischen Listen der sechs im Bundestag vertretenen Parteien, mit jeweils vier fiktiven Kandidat*innen.Footnote 8 Die Zahl der Frauen auf jeder Liste wurde zufällig zwischen einer bis drei variiert. Für eine Gruppe der Befragten waren die Listen geschlossen, für die andere offen. Zudem stimmten alle Befragten in einer zweiten Runde nochmals mit dem jeweils anderen Listentyp ab.

Unsere Ergebnisse zeigen, dass es offene Listen Wähler*innen erlauben, ihre Präferenzen für geschlechtsspezifische Repräsentation auszudrücken: In einem offenen Listenwahlsystem zeigt sich, dass Wähler*innen, denen Gleichstellung von Frauen wichtig ist, mit höherer Wahrscheinlichkeit Frauen wählen. Ebenso stimmen Frauen – über alle Parteien (mit Ausnahme der AfD) hinweg – mit höherer Wahrscheinlichkeit für Kandidatinnen als Männer. Relevante Unterschiede ergeben sich innerhalb des Parteienspektrums: Wähler*innen (beider Geschlechter) linker Parteien präferieren in der Tendenz Kandidatinnen. Bei Parteien in und rechts der Mitte ist dies nur bei Wählerinnen (CDU) bzw. bei keinem der beiden Geschlechter (FDP und AfD) der Fall. Relevante Unterschiede ergeben sich zudem je nach Zusammensetzung der Liste (d. h. je nach Parteiselektoratsentscheidung): Wähler*innen zeigen – über alle Parteien hinweg – eine Neigung, nach Geschlecht ungleich zusammengesetzte Listen in Richtung Parität auszubalancieren. Diese Ergebnisse sind kausal interpretierbar, da das Kandidat*innengeschlecht experimentell zugeordnet wurde, und die Zusammensetzung von Listen nach Kandidat*innengeschlecht die Wahlwahrscheinlichkeiten der Parteien in geschlossenen Listen nicht substanziell zu beeinflussen scheint. Zusätzliche Analysen zeigen außerdem korrelationale Evidenz dafür, dass die Bevölkerung ein offenes Listenwahlsystem einem geschlossenen vorzieht. Während generell eine Mehrheit der Befragten ein solches System unterstützt, ist diese Unterstützung bei Befragten, welche die Gleichstellung von Frauen als wichtig erachten, substanziell noch höher.

Im deutschen Kontext würden offene Listenwahlsysteme es insbesondere Wähler*innen mit hoher Themensalienz und weiblichen Befragten erlauben, ihre Präferenz für Kandidatinnen auszudrücken. Zu beachten ist, dass der Effekt des Kandidat*innengeschlechts zumindest in unserem Umfragesetting nicht besonders stark ist und es auch Subgruppen gibt, die eher für Männer stimmen. Insgesamt käme es mit Hinsicht auf Verschiebungen im Frauenanteil zwischen nominierten und von Wähler*innen unterstützten Kandidat*innen aber auch auf die Balance der den Wähler*innen vorgelegten Listen an, denn Wähler*innen neigen dazu, ungleiche Listen auszubalancieren. Die Präferenzen der Wähler*innen dürften mit offenen Listen also die deskriptive Repräsentation von Frauen in Deutschland zumindest tendenziell erhöhen. Jedenfalls würden offene Listen nicht schaden. Insbesondere da sie Wähler*innen erlauben auch weitere Kandidat*inneneigenschaften zu berücksichtigen, sollte eine mögliche Einführung in der öffentlichen Debatte stärkere Beachtung finden.

2 Listentypen und die Repräsentation von Frauen

Die Frage, ob bei einem Verhältniswahlsystem geschlossene oder offene Listen eine bessere deskriptive Repräsentation von Frauen herbeiführen, wird uneinheitlich beantwortet. Ein Teil der Literatur spricht sich für geschlossene Listen aus. Diese können per Definition nicht durch die Wähler*innen verändert werden und erlauben es dem Selektorat zu steuern, wer ins Parlament einzieht. Eine Ausbalancierung der Listen nach Geschlecht (oder auch anderen Merkmalen) ist daher einfach möglich. Aus diesem Grund lassen sich geschlossene Listen auch effektiv mit Quoten kombinieren, insbesondere wenn die Quoten nicht nur den Gesamtanteil der Frauen, sondern auch deren Platzierung (etwa abwechselnd mit Männern, im „Reißverschlussprinzip“) vorschreiben (Caul 1999; Jones 2009; Schmidt 2009). Aus dieser Perspektive sind offene Listen suboptimal, da Wähler*innen Frauen gegenüber voreingenommen sein können (Valdini 2013). Außerdem besteht die Gefahr, dass die Selektorate bei offenen Listen – zu Recht oder zu Unrecht – annehmen, dass Frauen für die Wählerschaft weniger attraktiv seien. Dies könnte wiederum die Nominierenden dazu veranlassen, weniger Kandidatinnen aufzustellen oder diese auf weniger prominente Listenpositionen zu setzen (Thames und Williams 2010; Valdini 2012; Brooks 2013).

Ein anderer Teil der Literatur hingegen sieht die Personenwahl auf offenen Listen als vorteilhaft für die Repräsentation von Frauen an. Aus dieser Sichtweise liegen die Hindernisse für Frauen auf der Ebene der Nominierung. Selbst wenn Selektorate nur relativ wenige Frauen aufstellen oder diese nur schlechte Listenplätze erhalten, bieten offene Listen den Bürger*innen eine Korrekturmöglichkeit. Wenn Frauen bei der Nominierung benachteiligt werden, schlägt sich dies bei geschlossenen Listen (oder Einpersonenwahlkreisen mit ebenfalls vorgegebenem Kandidatenfeld) hingegen zwingend im Wahlergebnis nieder (siehe etwa Verge und Wiesehomeier 2019 für den spanischen Fall).

Die empirischen Ergebnisse sind ähnlich zweigeteilt. So berichten manche Studien, dass Wähler*innen auf offenen Listen eher für Kandidaten als für Kandidatinnen stimmen, etwa in Lettland (Matland und Lilliefeldt 2014) und Litauen (Ragauskas 2021). Andere Untersuchungen schließen, dass Wähler*innen Politikerinnen nicht konsistent benachteiligen, z. B. in Estland (Allik 2015), oder diese an der Wahlurne männlichen Politikern gegenüber bevorzugen, etwa in Polen (Kunovich 2012) oder der Tschechischen Republik (Stegmaier et al. 2014). Die Effekte können sich zudem auch innerhalb eines Landes über Parteien hinweg (Kjaer und Krook 2019), im Zeitverlauf (Dean 2021) oder je nach institutionellen Kontextfaktoren wie der Wahlkreisgröße (Giger et al. 2014) unterscheiden.

Diese Beispiele legen nahe, dass die Effekte von offenen vs. geschlossenen Listen kontextabhängig sind – eine Sicht, die sich in der jüngeren Literatur durchsetzt (Valdini 2013; Golder et al. 2017; Golder und Ferland 2018). Inwiefern der Listentyp einen Unterschied macht, kommt zunächst darauf an, ob sich die Präferenzen der Selektorate und der Wähler*innen unterscheiden. Falls ja, hängt die Richtung davon ab, welcher der zwei kollektiven Akteure Politikerinnen gegenüber positiver eingestellt ist. Wo das Selektorat Frauen eher unterstützt als das Elektorat, sind geschlossene Listen für die deskriptive Repräsentation von Frauen besser als offene Listen. Andererseits schlagen offene Listen in dieser Hinsicht geschlossene Listen, wenn Wähler*innen Frauen in der Politik gegenüber positiver eingestellt sind als die Nominierenden.

2.1 Kandidat*innengeschlecht und individuelles Abschneiden bei Wahlen in Deutschland

Empirische Ergebnisse aus dem deutschen Kontext lassen zunächst vermuten, dass das Kandidat*innengeschlecht für das persönliche Wahlergebnis keine Rolle spielt oder aber Frauen weniger populär sind.Footnote 9 Eine ältere Studie betrachtet bayerische Landtagswahlen sowie Kommunalwahlen in drei Bundesländern (mit je offenen Listen) und schließt, diese „haben bisher nicht oder nur partiell die Wählbarkeit von Frauen verbessern können“ (Heepe 1989, S. 112). Mit der Ausnahme von einigen Kleinparteien berichten Schoen und Faas (2005) Nulleffekte für das Kandidat*innengeschlecht aus Regressionsmodellen für Personenstimmen bei den bayerischen Landtagswahlen 2003. Ebenfalls keine systematischen Unterschiede zwischen Kandidatinnen und Kandidaten zeigen sich beim individuellen Abschneiden auf offenen Listen in den Hamburgischen Bürgerschaftswahlen 2011, 2015 und 2020 (Marcinkiewicz und Jankowski 2014; Jankowski und Frank 2022). Bei den Wahlen zur Bremischen Bürgerschaft 2011 und 2015 schnitten Frauen nach Präferenzstimmenrängen im Vergleich zu ihren Listenplätzen schwächer ab, der Frauenanteil unter den Gewählten war aber nur geringfügig kleiner als derjenige im Pool der Kandidat*innen (Probst 2012; Probst und Schröder 2015).Footnote 10

Bieber und Wingerter (2020) untersuchen Kommunalwahlergebnisse für eine Stichprobe von Landkreisen bzw. kreisfreien Städten aus neun Bundesländern. Ein Vergleich der Listenplätze mit der Rangfolge nach Personenstimmen für Kandidatinnen zeigt, dass Frauen bei den Wähler*innen unpopulärer sind als bei den Selektoraten. Der Unterschied zu Männern in der Wahrscheinlichkeit ein Mandat zu erhalten ist zudem in Bundesländern mit offenen Listen ausgeprägter; hier stellt sich jedoch die Frage nach möglichen Störfaktoren auf Landesebene. Außerdem ist insgesamt nicht klar, wie gut sich Resultate aus dem Kontext von Kommunalwahlen auf eine Bundestagswahl übertragen lassen.

2.2 Theoretische Erwartungen zum persönlichen Wahlergebnis von Kandidatinnen

Um die Auswirkungen von offenen Listen abzuschätzen, entwickeln wir nun theoretische Überlegungen zum individuellen Abschneiden von Kandidatinnen bei Wahlen. In der Literatur gibt es hierzu verschiedene Ansätze. Manche Studien betrachten Faktoren, die sowohl unter Wählerinnen als auch Wählern die Entscheidung für eine Kandidatin beeinflussen (z. B. Sanbonmatsu 2002). Theorien der Affinitätswahl hingegen beziehen sich explizit darauf, ob Frauen eher für Frauen und Männer eher für Männer stimmen (z. B. Holli und Wass 2010; Giger et al. 2014; van Erkel 2019) – wobei die Wahl für die Eigengruppe auch eine Entscheidung gegen die Fremdgruppe widerspiegeln kann (vgl. Portmann und Stojanović 2021). Des Weiteren gibt es eine große Bandbreite an Motivationsfaktoren für eine Wahl aufgrund des Kandidatengeschlechts. Mögliche Beweggründe umfassen sozialpsychologische Identifikation mit der Eigengruppe (Plutzer und Zipp 1996); Stereotypisierung als Zuschreibung von positiven oder negativen Charaktereigenschaften aufgrund des Geschlechts (z. B. Sanbonmatsu 2002; Bieber 2011; Dolan und Lynch 2014); die Verwendung einer Heuristik, dass Kandidat*innen des eigenen Geschlechts eher dieselben Einstellungen vertreten (z. B. Koch 2000);Footnote 11 ein Interesse an deskriptiver Repräsentation an sich (Westle und Schübel 2009; Campbell und Heath 2017); und die Förderung von substanzieller Repräsentation (Höhmann 2020).

Zunächst ist es plausibel anzunehmen, dass diese Motivationsfaktoren manche Frauen veranlassen, bevorzugt Frauen zu wählen. Männer haben weniger direkte Anreize, für eine Frau zu stimmen und könnten die Eigengruppe bevorzugen oder Kandidatinnen gegenüber voreingenommen sein. Jedoch sollte hier auch die Interaktion mit der Parteiwahlentscheidung berücksichtigt werden. Generell entkoppeln offene Listen die Kandidat*innen von der Parteientscheidung (Rudolph und Däubler 2016), da mehrere Kandidat*innen aus jeder Partei zur Wahl stehen. Soziokulturelle Einstellungen beeinflussen aber die Parteipräferenz (Bornschier 2010; Rosset und Kurella 2021). Da gesellschaftspolitisch progressive Parteien auch stärker für Frauenrechte eintreten (Caul 1999; Golder et al. 2017; Keith und Verge 2018; Giger et al. 2021), ist zu erwarten, dass Wähler*innen konservativer Parteien seltener für Frauen stimmen.

Diese theoretischen Überlegungen lassen sich gut mit Daten aus dem deutschen Kontext ergänzen. Die German Longitudinal Election Study (2021) enthält auch eine Frage zu „staatlichen Maßnahmen zur Gleichstellung der Frauen in der Gesellschaft“. Tab. 1 zeigt eine Auswertung der eigenen Einstellungen der Befragten.Footnote 12 Wir haben hier, nach Geschlecht und Parteiidentifikation, den Anteil an Personen berechnet, die staatliche Gleichstellungsmaßnahmen unterstützen und für die dieses Thema hinreichend wichtig ist. Die Surveyfrage bezieht sich freilich auf staatliche Maßnahmen zu ihrer Förderung und nicht auf Gleichstellung an sich; mit gewissen Einschränkungen bei der liberalen Anhängerschaft der FDP dürften sich daraus aber dennoch nützliche Schlussfolgerungen ableiten lassen. Die Befürwortung von Gleichstellungsmaßnahmen ist erwartungsgemäß bei Frauen stärker ausgeprägt (53 % vs. 37 % bei Männern) und nimmt von links nach rechts ab. Über die Geschlechter hinweg liegt der Anteil der Unterstützer*innen bei Linken, Grünen und SPD bei mehr als der Hälfte, bei Union (38 %), FDP (29 %) und AfD (19 %) deutlich darunter. Innerhalb der Parteianhängerschaften sind die Differenzen zwischen Frauen und Männern rechts der SPD deutlicher ausgeprägt, und unter Frauen liegt das Niveau der Unterstützung selbst in der AfD (mit dem niedrigsten Wert) immer noch bei 31 %.

Tab. 1 Anteil der Befürworter*innen von staatlichen Gleichstellungsmaßnahmen für Frauen mit gewisser Themenwichtigkeit, in %, nach Parteiidentifikation und Geschlecht

Aus der Kombination der theoretischen Überlegungen und der empirischen Voruntersuchung im deutschen Kontext auf Basis der German Longitudinal Election Study (2021) können wir daher folgende Hypothesen formulieren:

Hypothese 1

Die Wahrscheinlichkeit, dass Frauen für eine Kandidatin stimmen, ist höher als die Wahrscheinlichkeit, dass Männer für eine Kandidatin stimmen.

Hypothese 2

Die Wahrscheinlichkeit, für eine Kandidatin zu stimmen ist unter Wähler*innen gesellschaftspolitisch konservativerer Parteien geringer.

Hypothese 3

Die Wahrscheinlichkeit, dass Wähler*innen, denen die Gleichstellung von Frauen wichtig ist, für eine Kandidatin stimmen, ist höher als die Wahrscheinlichkeit, dass Wähler*innen, denen die Gleichstellung von Frauen nicht wichtig ist, für eine Kandidatin stimmen.

Kommen wir nun zur Leitfrage dieses Beitrags zurück. Wie in der Literaturübersicht besprochen, können offene Listen zur deskriptiven Repräsentation von Frauen beitragen, wenn die Wähler*innen einer Partei eher bereit sind, Kandidatinnen zu wählen, als dass das Selektorat diese auf hinreichend gute Listenplätze setzt. Ob dies dann im Aggregat und gegeben der derzeitigen Listenvorschläge der Parteien der Fall ist, ist prinzipiell nicht klar vorherzusagen. Die vorgeschlagenen Hypothesen beziehen sich auf relative Unterschiede, aber Aussagen zum absoluten Niveau der Kandidatinnenwahl sind allein aus den theoretischen Überlegungen und den GLES-Daten kaum ableitbar.

Wir formulieren allerdings die Erwartung, dass die Präferenz von Wähler*innen für stärkere Frauenrepräsentation von den Entscheidungen des Selektorats abhängen sollte. So sollten Anreize zur Wahl von Kandidatinnen besonders dann höher sein, wenn Selektorate eine männerdominierte Liste vorlegen.

Hypothese 4

Die Wahrscheinlichkeit, dass Wähler*innen für eine Kandidatin stimmen, ist höher, wenn Listen überwiegend aus Kandidaten bestehen, und geringer, wenn Listen überwiegend aus Kandidatinnen bestehen (im Vergleich zu paritätisch besetzten Listen).

Der postulierte Zusammenhang würde dazu führen, dass Wähler*innen nach Geschlecht ungleich besetzte Listen ausbalancieren. Wie erwähnt verzichten wir darüber hinaus auf spezifische Vorhersagen bezüglich des absoluten Niveaus der Unterstützung von Frauen durch Wähler*innen auf Parteiebene. Die grundlegende Schwierigkeit solcher Prädiktionen weist zudem darauf hin, dass eine möglichst realistische Simulation der Wahlsituation im Rahmen einer Umfrage in diesem Kontext ein vielversprechender methodischer Ansatz ist.

3 Forschungsdesign

Unserer empirischen Analyse liegt eine quotenrepräsentative Stichprobe der wahlberechtigten deutschen Bevölkerung zugrunde.Footnote 13 Die Umfrage wurde zwischen dem 11. Januar und dem 19. Februar 2019 durch das Unternehmen Kantar durchgeführt. 6600 Befragte wurden aus dem Online-Panel des Anbieters rekrutiert. Quoten haben wir für Alter, Geschlecht, Bildung und Region gesetzt, die Stichprobe ist also entlang dieser Quoten repräsentativ für die deutsche Wahlbevölkerung. Die durchschnittliche Befragungsdauer betrug 6,4 Minuten. Interviews von weniger als vier Minuten Dauer wurden vom Umfrageunternehmen ausgeschlossen. Wir konzentrieren uns auf die 2640 Befragten, die, randomisiert zugewiesen, eine Wahlentscheidung in offenen bzw. geschlossenen Listen getroffen haben, wobei die Listen lediglich die fundamentalen Stimmzettelinformationen zu Parteizugehörigkeit, Geschlecht der Kandidat*innen (impliziert durch Vornamen) und deren Listenplatzierung angezeigt haben.Footnote 14

Ein Vergleich mit anderen Umfragen, die auf einer Zufallsstichprobe im selben Zeitraum beruhen, ermöglichen uns eine Beurteilung der Qualität unserer Stichprobe über die herangezogenen Quoten hinaus. Hierfür vergleichen wir die von unseren Befragten geäußerten Parteipräferenzen mit Ergebnissen telefonstichprobenbasierter Meinungsumfragen von Infratest dimap. Bei einer Fehlermarge von ca. drei Prozentpunkten sind in unserer Umfrage nur CDU/CSU-Wähler*innen leicht unterrepräsentiert und Die Linke- und AfD-Wähler*innen leicht überrepräsentiert.Footnote 15 Insgesamt sind wir daher zuversichtlich, dass die Ergebnisse des Umfrageexperiments auf die deutsche Wahlbevölkerung verallgemeinert werden können.

3.1 Experimenteller Aufbau

Unser Forschungsdesign basiert somit auf einem bevölkerungsrepräsentativen Umfrageexperiment (Mutz 2011), in dem wir eine Wahlentscheidung in einem Verhältniswahlsystem mit geschlossener Liste gegenüber einem Verhältniswahlsystem mit offener Liste nachbilden. Befragte werden zufällig der Gruppe mit offener oder der Gruppe mit geschlossener Liste zugeteilt. So können wir ausschließen, dass Eigenschaften der Befragten die Partei- bzw. Kandidat*innenwahl zwischen den Gruppen mit unterschiedlichen Listentypen systematisch beeinflussen.

Im Experiment zeigen wir eine vertikal geordnete Liste von Parteien mit je vier Kandidat*innen an, wobei die Reihenfolge der Darstellung sowohl für Parteien als auch für Kandidat*innen randomisiert wird. Unter der experimentellen Bedingung einer geschlossenen Liste stimmen die Befragten für eine der Parteilisten. Unter der experimentellen Bedingung der offenen Liste wählen die Befragten eine*n Kandidat*in innerhalb einer Partei. Die Befragten wurden darüber informiert, dass bei einer geschlossenen Liste die Sitze innerhalb von Parteien auf Grundlage des Listenplatzes zugewiesen werden bzw. dass bei einer offenen Liste hierfür die Stimmenanteile der Kandidat*innen maßgebend sind. Um die Komplexität für die Befragten zu reduzieren, umfasst unser Entscheidungsszenario die sechs im Parlament vertretenen Parteien, d. h. nach damaliger Fraktionsgröße CDU (CSU für die bayerischen Befragten), SPD, AfD, Grüne, FDP und Die Linke. Um die Kontextvalidität zu erhöhen, wurde das Design des angezeigten Stimmzettels im Hinblick auf den Titel, den Einleitungssatz, die vertikale Anordnung sowie die Auflistung der Parteien und Kandidat*innen einem echten Wahlzettel nachempfunden.Footnote 16 Abschn. A.3 im Online-Anhang diskutiert den Vergleich zu einem echten Bundestagswahlzettel im Detail.

Entscheidend ist, dass die Listenzusammensetzung nach Geschlecht ebenfalls zufällig erfolgt: Für die Generierung der fiktiven Kandidat*innen haben wir 24 häufige deutsche Vor- und Nachnamen gewählt, diese zufällig kombiniert und dabei überprüft, dass es keine namentlichen Übereinstimmungen mit Personen des öffentlichen Interesses wie Politiker*innen oder Prominenten gibt. Jede Liste enthält je 12 typischerweise weibliche und männliche Vornamen. Dabei haben wir explizit Vor- und Nachnamen gewählt, die einen Migrationshintergrund unwahrscheinlich machen. So können wir den Effekt von Kandidat*innengeschlecht isolieren, ohne Faktoren wie Ethnizität kontrollieren zu müssen. Bei der zufälligen Zuteilung von Namen zu Parteilisten schränken wir die Auswahl so ein, dass keine Liste ausschließlich männliche oder weibliche Politiker*innen enthält. Somit beträgt der Frauenanteil auf den Parteilisten (sowohl in der offenen wie auch in der geschlossenen Variante) entweder 25, 50 oder 75 %. Abb. 1 zeigt exemplarische Wahlzettel, wie sie den Befragten vorgelegt wurden (links im Format geschlossener, rechts im Format offener Wahllisten), inklusive der von uns genutzten Vor- und Nachnamen.

Abb. 1
figure 1

Exemplarisches Design der geschlossenen (links) und offenen Liste (rechts)

Neben soziodemografischen Merkmalen (Alter, Geschlecht, Bildung etc.) und politischen Einstellungen (Parteiskalometer, Links-Rechts-Einstellung, wichtigstes politisches Thema etc.) wurden die Befragten zuletzt gebeten, eine Präferenz für eine der Wahlregeln (offene oder geschlossenen Listen) anzugeben.

3.2 Kausale Inferenz

Unsere zentrale Frage lautet, wie viele Frauen und Männer sich bei offenen Listen für eine Kandidatin entscheiden, und wie dies über die Parteien variiert. Um die Wahlentscheidungen nach Geschlecht derart kausal interpretieren zu können, ist jedoch zentral, dass die Listenzusammensetzung nach Geschlecht die Parteiwahlentscheidung nicht beeinflusst. Theoretisch erwarten wir, dass diese Annahme erfüllt istFootnote 17 – Abschn. A.1 im Online-Anhang zeigt empirische Evidenz hierfür. Weder im Aggregat noch für die Subgruppe der Wählerinnen bzw. die Subgruppe der Wähler*innen, denen das Thema Gleichstellung von Frauen besonders wichtig ist, steht der Frauenanteil einer Liste im Durchschnitt in einem relevanten statistischen Zusammenhang zur Parteiwahl. Da die Reihung der Kandidat*innen randomisiert erfolgt, wäre bei Nichtberücksichtigung des Geschlechts der Kandidat*innen eine Gleichverteilung gewählter Kandidat*innen nach Geschlecht zu erwarten.Footnote 18 Eine Abweichung gewählter Kandidat*innen von dieser Gleichverteilung ist somit kausal dem Kandidat*innengeschlecht zuzuschreiben. Hervorzuheben ist, dass das Geschlecht der Kandidat*innen nur implizit durch den Vornamen kommuniziert wird, und somit von uns nicht in besonderer Weise als Entscheidungsmerkmal hervorgehoben wird. Für die Frage, ob die Wahrscheinlichkeit, eine Kandidatin zu wählen sich zwischen frauen- bzw. männerdominierte Listen unterscheidet, nutzen wir die randomisierte Zuteilung von Listen mit 25, 50 oder 75 % Frauenanteil – entsprechend ist hier kausale Inferenz ebenso direkt möglich. Bezüglich als statistisch signifikant identifizierbarer Effektstärken zeigen wir in Abschn. A.5 im Online-Anhang Post-hoc-Power-Analysen für die Unterschiede zwischen dem erwarteten und beobachteten Frauenanteil unter den gewählten Kandidat*innen. Hier wird ersichtlich, dass wir mit einer Power von 0,7 einen Unterschied in der Wahl von Kandidaten und Kandidatinnen ab einer Effektgröße von ca. 4,5 Prozentpunkten als statistisch signifikant nachweisen können (Abb. A.6 im Online-Anhang). Die Power in Partei-Subgruppen (Abb. A.7) ist je nach Stimmenanteil der Parteien im Elektorat entsprechend geringer. Ob Wähler*innen bei ungleich besetzten Listen einen Ausgleich in Richtung Parität vornehmen, sollte sich, mit einer Power von 0,7, ab einer Effektstärke von 5 bis 6 Prozentpunkten als statistisch signifikanter Zusammenhang feststellen lassen (Abb. A.8).

3.3 Statistische Modellierung

Um unsere Hypothesen zur Kandidat*innenwahl zu testen, nutzen wir deskriptive Statistiken und, motiviert durch theoretische Modelle der Nutzenmaximierung unter Einbeziehung von Zufallsfaktoren, Conditional Logit-Modelle (McFadden 1973; Thurner 2000; Mauerer et al. 2015). Hierfür fokussieren wir auf die 1320 Befragten, denen wir (experimentell) eine offene Liste vorgelegt haben. Die auf dem Stimmzettel angezeigten Kandidat*innen stellen somit die Entscheidungsalternativen dar. Die Wahlentscheidung erklären wir durch Attribute dieser Alternativen und die Beziehung zwischen Befragten und diesen Alternativen, insbesondere dem Geschlecht der Befragten und der Salienz von Geschlechtergleichheit für die Befragten. Die Modelle implizieren Fixed Effects für Befragte. Da die Randomisierung des Geschlechterverhältnisses der Parteilisten und deren Anzeigereihenfolge auf Ebene der einzelnen Befragten erfolgt und wir nicht sicher davon ausgehen können, dass eine Annahme über homogene Treatment-Effekte durch die randomisierten Wahlzettel gerechtfertigt ist, clustern wir zudem Standardfehler auf Befragtenebene (siehe zu diesem Vorgehen auch Abadie et al. 2017).

In unseren Analysen stellt das Geschlecht der Wahlalternativen die primäre unabhängige Variable dar. Wir codieren binär, ob eine Wahlalternative weiblich (1) oder männlich (0) ist. Das Vorliegen einer weiblichen Wahlalternative interagieren wir zunächst nacheinander in vier Modellen mit dem Geschlecht der Befragten, der Parteizugehörigkeit der Wahlalternativen, ob die Befragten „Gleichstellung von Frauen“ als eines der drei wichtigsten innenpolitischen Themen angeben (sprich die Gleichstellungs-Salienz der Befragten)Footnote 19 und dem Frauenanteil der jeweiligen Parteilisten. Zuletzt betrachten wir im fünften Modell die Interaktion zwischen Geschlecht der Wahlalternative und Geschlecht der Befragten separat nach Partei. Die Angaben zum Geschlecht der Kandidat*innen werden somit so analysiert, dass wir unterscheiden können, ob die Wahlwahrscheinlichkeit für eine Kandidatin prinzipiell höher oder niedriger ist als für einen Kandidaten, und ob sich dies für männliche bzw. weibliche Befragte und je nach Partei unterscheidet. In alle Modelle fließen zudem die Position der Kandidat*innen auf dem Stimmzettel (um für Reihenfolgeeffekte zu kontrollieren (Schoen und Faas 2005; Däubler und Rudolph 2020)), die von den Befragten angegebenen parteispezifischen SkalometerFootnote 20, die auf den Stimmzetteln enthaltenen Informationen über die Parteiliste (sprich Parteidummys; beide letztgenannten Attributeigenschaften erfassen die grundlegende Parteipräferenz) sowie weiterhin die Zusammensetzung der Parteiliste nach Geschlecht der Kandidat*innen (25, 50 oder 75 weiblich) ein.

4 Ergebnisse

4.1 Deskriptive Evidenz für Wahlpräferenzen nach Kandidat*innengeschlecht

Abb. 2 zeigt zunächst, wie sich die Wahlentscheidung für eine Kandidatin nach Befragtengeschlecht in offenen Listen unterscheidet. Die oben erläuterten Randomisierungen innerhalb des Experimentaldesigns implizieren, dass bei geschlechtsunabhängigen Wahlentscheidungen eine Gleichverteilung des Kandidat*innengeschlechts sowohl insgesamt als auch innerhalb der Parteien zu erwarten ist. Abweichungen hiervon sprechen für einen kausalen Einfluss des Kandidat*innengeschlechts auf das Wahlverhalten. Es zeigt sich, dass Wählerinnen zu etwa 55 % Kandidatinnen wählen; Wähler zu etwa 48 %. In Übereinstimmung mit Hypothese 1 entscheiden sich Wählerinnen somit substanziell und (auf dem 5 %-Niveau) signifikant häufiger für eine Kandidatin als Wähler.Footnote 21 Zudem ist die Häufigkeit der Auswahl von Kandidatinnen unter Wählerinnen signifikant über der theoretisch zu erwartenden Baseline von 50 % (und für Wähler nicht signifikant unter derselben). Nur Wählerinnen zeigen somit im Aggregat eine klare Präferenz für deskriptive Repräsentation.

Abb. 2
figure 2

Frauenanteil unter gewählten Kandidat*innen in offener Listenwahl, nach Wähler*innengeschlecht, mit 90 %- und 95 %-Konfidenzintervall. \(N=1320\) (673 Frauen, 647 Männer)

In einem nächsten Schritt unterscheidet Abb. 3 zwischen Parteielektoraten (graue Säulen) sowie innerhalb dieser Elektorate nach männlichen (blaue Säulen) und weiblichen (rote Säulen) Befragten. Der Gesamtstimmenanteil für Kandidatinnen variiert zwischen 59 % (Grüne) und 45 % (AfD). Die Parteien sortieren sich hier relativ klar anhand des ideologischen Spektrums, wobei Anhänger*innen der Linken, Grünen und SPD in ihrer Gesamtheit (in unterschiedlichem Ausmaß) weibliche Kandidatinnen bevorzugen, die Unions-Anhänger*innen insgesamt mit 51 % nahezu paritätisch wählen würden, und FDP- und AfD-Wähler*innen männliche Kandidaten bevorzugen. Während der Gesamtstimmenanteil für Kandidatinnen auf der linken Seite des Spektrums (Linke und Grüne) signifikant über 50 % liegt (bei der Linken auf 90 %-Niveau), ist dieser am rechten Ende (AfD) auf 90 %-Niveau signifikant unter 50 %. Dies zeigt deutliche Evidenz in Kongruenz zu Hypothese 2.

Abb. 3
figure 3

Frauenanteil unter gewählten Kandidat*innen in offener Listenwahl, nach gewählter Partei und Wähler*innengeschlecht, mit 90 % und 95 %-Konfidenzintervall. \(N=1320\) (Linke: 102 Frauen (F), 93 Männer (M), 195 Gesamt (G); Grüne: 142 F, 84 M, 226 G; SPD: 136 F, 120 M, 256 G; Union: 118 F, 157 M, 275 G; FDP: 81 F, 49 M, 130 G; AfD: 94 F, 144 M, 238 G)

Beachtenswert ist das Abstimmungsverhalten nach dem Geschlecht der Befragten: Mit Ausnahme der AfD zeigt sich über alle Parteien hinweg eine stärkere Wahrscheinlichkeit für Frauen als Männer, eine Kandidatin zu wählen. Besonders stark ausgeprägt und statistisch signifikant ist dieser Unterschied (mit 13,3 Prozentpunkten) für Wähler*innen der Union. Doch auch Wähler*innen der Grünen (11 Prozentpunkte Differenz) und der FDP (8,6 Prozentpunkte) weisen stark unterschiedliche Geschlechts-Präferenzen auf. Wir sehen diese Evidenz weitgehend in Kongruenz zu Hypothese 1. Das der Hypothese entgegengesetzte Abstimmungsverhalten von AfD-Anhängerinnen deutet jedoch an, dass eine (durchschnittliche) Präferenz von Frauen für deskriptive Repräsentation durch das eigene Geschlecht nicht in allen gesellschaftlichen Milieus vorausgesetzt werden kann.

Der relative Unterschied zwischen den Geschlechtern ist besonders stark (CDU, FDP) – aber nicht ausschließlich (Grüne) – in den gesellschaftspolitisch eher konservativen Parteien des politischen Spektrums auszumachen. In den linken Parteien sind auch männliche Befragte bereit, eine Kandidatin zu unterstützen, während in den konservativen Parteien männliche Befragte eher einen Kandidaten unterstützen. Beachtenswert ist das nahezu diametrale Stimmverhalten von Unionsanhänger*innen, mit einer klaren Präferenz männlicher Befragter für Kandidaten, und weiblicher Befragter für Kandidatinnen.

Wie aus Abb. 4 ersichtlich, hängt die Wahlwahrscheinlichkeit für eine Kandidatin auch von der präsentierten Listenzusammensetzung ab. In männerdominierten Listen liegt der Anteil der Stimmen für Kandidatinnen bei nahezu 38 % – eine substanzielle und statistisch signifikante Aufwertung des Frauenanteils im Vergleich zum theoretisch erwartbaren Frauenanteil von 25 % bei geschlechtsunabhängiger Wahl. Während bei paritätisch besetzten Listen das Geschlecht der Kandidat*innen keine signifikante Rolle spielt, ist bei frauendominierten Listen wiederum ein Trend in Richtung einer Abwahl von Frauen zu beobachten: Der Frauenanteil liegt bei knapp 68 %, substanziell und signifikant unter den erwarteten 75 %. Diese Ergebnisse stehen im Einklang mit Hypothese 4 – Wähler*innen balancieren unausgeglichene Listen des Selektorats aus.

Abb. 4
figure 4

Abweichung des gewählten Kandidatinnenanteils vom Erwartungswert in offener Listenwahl, nach experimentell variierter Zusammensetzung der Listen, mit 90 %- und 95 %-Konfidenzintervall. Erwartung: 1/4 Frauenanteil (F) = 25 %-Pkt.; 2/4 F = 50 %-Pkt.; 3/4 F = 75 %-Pkt. \(N=1320\)

4.2 Modellierung der Wahlentscheidung in offenen Listen

Die oben besprochene deskriptive Evidenz ergänzend zeigt Tab. 2 Ergebnisse für Conditional Logit-Modelle der Wahlentscheidung, welche das Geschlecht der Kandidat*innen sowie weitere Attribute (Listenplatzierung der Kandidat*innen, Listenzusammensetzung, Parteidummys, Parteivalenz) berücksichtigen.Footnote 22

Modell 1 zeigt Logit-Koeffizienten für weibliches Kandidatinnengeschlecht und dessen Interaktion mit Wähler*innengeschlecht. In Übereinstimmung mit Hypothese 1 stimmen Wählerinnen signifikant wahrscheinlicher für Kandidatinnen als Wähler, während Wähler nur leicht (und statistisch nicht signifikant) Kandidaten präferieren. Der Unterschied, mit dem Frauen auf weibliche Kandidatinnen reagieren, ist auf der Logit-Skala in etwa genauso wichtig wie der Unterschied zwischen einer Platzierung auf Listenplatz vier und Listenplatz zwei – unserer Interpretation nach ein substanziell relevanter Effekt.

Zur empirischen Untersuchung von Hypothese 2 ist ein Vergleich der Effekte des Geschlechts der Wahlalternativen nach Parteizugehörigkeit notwendig (Modell 2). Zunächst sehen wir, dass das Geschlecht der Kandidat*innen in der Referenzpartei, der SPD, einen leicht pro-weiblichen, jedoch nicht signifikanten, Effekt auszuwirken scheint. Wie bereits in Abb. 3 angedeutet, spielt das Geschlecht bei den Linken und Grünen eine größere Rolle. Kandidatinnen auf einer Liste dieser beiden Parteien haben im Vergleich zu ihren jeweiligen männlichen Gegenparts bessere Chancen, gewählt zu werden. Dieser Bonus entspricht bei den Linken in etwa dem Sprung von Listenplatz vier auf zwei und ist auf dem 10 %-Niveau signifikant (\(p=0{,}051\)), während der Effekt bei den Grünen auf dem 5 %-Niveau signifikant und noch etwa um ein Drittel stärker (auf der Logit-Skala) ausfällt (s. Abb. A.5 im Online-Anhang). Bei einem Blick auf das konservativ-rechte Spektrum der Parteienlandschaft zeigt sich, dass innerhalb der Union die Wahlchancen für Kandidierende beider Geschlechter nahezu identisch sind. Die FDP und AfD sind die einzigen Parteien, in denen Kandidatinnen geringere Wahlwahrscheinlichkeiten aufweisen als Kandidaten. Abb. A.5 zeigt außerdem, dass der Nachteil von Kandidatinnen innerhalb der AfD auf dem 10 %-Niveau signifikant und im Vergleich etwas schwächer als deren Vorteil innerhalb der Linken ist. Innerhalb der FDP sind die relativen Wahlchancen für Kandidatinnen sogar noch geringer, allerdings ist der Effekt hier statistisch nicht signifikant (\(p=0{,}102\)). Die Existenz eines Kandidatinnenbonus im linken Spektrum (Grüne, Linke), einer Indifferenz in der Mitte (SPD, Union) und eines Kandidatinnenmalus auf der rechten Seite (FDP, AfD) unterstützt somit Hypothese 2.

Tab. 2 Erklärungsfaktoren der Kandidat*innenwahl bei offener Liste

Weitere Evidenz für Hypothese 3 ergibt sich aus Modell 3, in dem das Geschlecht der Kandidat*innen mit der Gleichstellungssalienz der Befragten interagiert wird. Für Befragte, die Gleichstellung als salient erachten, spielt das Kandidat*innengeschlecht (zugunsten von Kandidatinnen) eine deutlich und signifikant stärkere Rolle als bei solchen ohne Gleichstellungssalienz. Substanziell ist der Effekt beinahe so hoch wie der eines Sprungs von Listenplatz vier auf Platz eins bzw. wie der einer Verbesserung um einen Punkt auf dem Parteiskalometer. Für Befragte, die dem Thema keine besondere Salienz beimessen, zeigt sich kein entsprechender Unterschied.

Das vierte Modell interagiert das Geschlecht der Kandidat*innen mit der Listenzusammensetzung nach Geschlecht und zeigt in Übereinstimmung mit Abb. 4 deutliche Unterstützung für Hypothese 4. Während in paritätisch besetzten Listen (50 % Frauen) das Kandidat*innengeschlecht praktisch keinen Effekt hat, zeigen die Logit-Koeffizienten signifikante Unterschiede hierzu in ungleich besetzten Listen. Demnach verbessern sich die Wahlchancen einer Kandidatin, wenn sie die einzige Frau auf der Parteiliste (mit 4 Kandidat*innen) ist – und verschlechtern sich, wenn nur ein einziger Mann auf der Parteiliste steht. Der Vorteil für Kandidatinnen in männerdominierten Listen hat dabei in etwa den gleichen Effekt wie ein Anstieg um einen halben Punkt im Parteiskalometer, während der Nachteil von Kandidatinnen in frauendominierten Listen leicht schwächer ausfällt und somit ungefähr dem Abstieg von Listenplatz zwei auf vier entspricht.

Zusammengenommen lässt sich also sagen, dass die Modelle 1 bis 4 die Hypothesen 1 bis 4 weitestgehend unterstützen. Abschließend wird zur detaillierteren Analyse in Modell 5 eine Dreifachinteraktion aus Kandidat*innengeschlecht, Wähler*innengeschlecht und Parteiwahl berücksichtigt. Um die Interpretation der Logit-Koeffizienten der Dreifachinteraktion in Modell 5 zu erleichtern, berechnen und präsentieren wir deren Linearkombinationen in Abb. 5. Bei der Interpretation der statistischen Signifikanz dieser Linearkombinationen ist zu beachten, dass die Fallzahlen in den Untergruppen nach Partei und Geschlecht mit 50–160 Wähler*innen relativ klein ausfallen. Dennoch ergeben sich aus dem Modell für vier Subgruppen statistisch signifikante Koeffizienten. Für Wählerinnen der Linken und der Grünen hat das Kandidatinnen-Geschlecht (im Vergleich zu Kandidaten) einen positiven Effekt auf die Wahlchance. Einen negativen Effekt auf die Wahlchance finden wir für die Subgruppen der FDP-Wähler und (analog zur deskriptiven Evidenz in Abb. 3) der AfD-Wählerinnen. AfD-Wählerinnen geben also entgegen Hypothese 1 offenbar eher Kandidaten als Kandidatinnen ihre Stimme.

Abb. 5
figure 5

Logit-Koeffizient des Kandidat*innengeschlechts nach Partei und Wähler*innengeschlecht, mit 90 und 95 %-Konfidenzintervall. Linearkombinationen (aufaddierte Logit-Koeffizienten) aus Modell 5 in Tab. 2 für die Dreifachinteraktion aus Parteiwahl, Wähler*innen- und Kandidat*innengeschlecht (mit 95 %-Konfidenzintervallen; \(N=1320\)). Für die Subgruppe der Wählerinnen bzw. Wähler zeigen Konfidenzintervalle, welche die 0 nicht beinhalten, dass eine Kandidatin (relativ zu einem Kandidaten) innerhalb der jeweiligen Partei eine signifikant unterschiedliche Wahlchance hat. Für die Differenz zeigen Konfidenzintervalle, welche die 0 nicht beinhalten, dass ein signifikanter Unterschied zwischen den Linearkombinationen von Wählerinnen und Wählern innerhalb der jeweiligen Parteien besteht

Darüber hinaus lässt sich mithilfe der Linearkombinationen untersuchen, ob der zuvor aus Modell 1 berichtete signifikante Unterschied in den Koeffizienten des Kandidat*innengeschlechts zwischen Wählern und Wählerinnen sich auch in den Subgruppen der jeweiligen Parteielektorate finden lässt. Abb. 5 zeigt, dass die Differenz zwischen Wählerinnen und Wählern nur innerhalb der Grünen und der FDP signifikant ist. Dieser Unterschied stammt bei den Grünen von einem deutlich proweiblichen Abstimmungsverhalten der Wählerinnen, während bei der FDP Männer Kandidaten bevorzugen. Letzteres ist dabei ganz deutlich als Ausreißer aus einem sonst homogenen Bild zu sehen: Wähler aller anderen Parteien scheinen weder starke Präferenzen für männliche noch weibliche Kandidatinnen zu hegen. Bei einer genaueren Betrachtung lässt sich also feststellen, dass Hypothese 1 zwar wie zuvor diskutiert für die Gesamtwählerschaft, nicht aber uniform über alle Parteielektorate hinweg gilt.

Inwiefern sind unsere Ergebnisse auf eine realweltliche Bundestagswahl übertragbar? Zwar bewerten unsere Befragten fiktive Kandidat*innen auf kurzen Listen; gleichzeitig bildet unser Umfragedesign aber den Entscheidungskontext einer (fiktiven) Bundestagswahl gut ab (vgl. Abschn. A.3 im Online-Anhang).Footnote 23 Wir halten zwei Fragen hier für entscheidend: Erstens, ob zu erwarten wäre, dass Geschlechtsinformationen im Kontext einer realen Wahl insgesamt irrelevant werden? Wenn Geschlecht etwa nur einen Proxy für von Wähler*innen erwartete Policy-Positionen darstellte, könnte dies der Fall sein. Die Studie von Quoß et al. (2022) (im Kontext der Schweiz) liefert jedoch gegenteilige Evidenz. Zweitens, ob zu erwarten wäre, dass Geschlechtsinformationen bei längeren Listen oder weiteren bekannten Merkmalen, die direkt (etwa Bekanntheit von Politiker*innen und deren Policy-Positionen) oder indirekt über den Stimmzettel (etwa Migrationshintergrund, akademische Titel) kommuniziert werden, in den Hintergrund treten? Möglicherweise wäre dann das Geschlecht der Kandidat*innen und das Geschlechterverhältnis auf Listen für Wähler*Innen schwerer zu identifizieren und entsprechende Reaktionen könnten schwächer ausfallen. Allerdings wären bei einer echten Wahl die Implikationen der Wahlentscheidung auch relevanter, was diesem Aufmerksamkeitseffekt entgegenwirken würde. Unser Forschungsdesign zielt freilich auf den durchschnittlichen Effekt des Geschlechts der Kandidat*innen auf die Wahlentscheidung ab. Zukünftige Forschung sollte daher auch untersuchen, wie das Merkmal Geschlecht mit anderen Kandidat*inneneigenschaften interagieren könnte.Footnote 24

5 Diskussion

Das Hauptaugenmerk unserer empirischen Studie lag auf den Entscheidungen der Wähler*innen zwischen fiktiven Kandidat*innen auf offenen Wahllisten, deren Frauenanteil (neben der Reihenfolge der Bewerber*innen) experimentell variiert wurde. Als vermutlich wichtigste Erkenntnis finden wir wenig Anhaltspunkte dafür, dass Kandidatinnen generell allein des Geschlechts wegen von Wähler*innen in Deutschland benachteiligt werden. Lediglich Männer unter FDP-Wähler*innen und Frauen unter AfD-Wähler*innen bevorzugen Kandidaten gegenüber Kandidatinnen. Darüber hinaus zeigen unsere Ergebnisse, dass offene Listen es – wie erwartet – insbesondere Frauen, Wähler*innen gesellschaftspolitisch linker Parteien sowie an Gleichstellungsfragen interessierten Personen ermöglichen, ihrer Präferenz für eine Kandidatin Ausdruck zu verleihen. Wähler*innen gehen dabei nuanciert vor und balancieren (über Parteiwählerschaften hinweg) stark ungleich besetzte Listen (d. h. Geschlechterungleichheit bei der Listenaufstellung vonseiten des Selektorats) aus. Unsere Ergebnisse bekräftigen somit neuere Evidenz dafür, dass offene Listenwahlsysteme es Wähler*innen ermöglichen, ihre Präferenzstimme im Sinne von Geschlechterrepräsentation einzusetzen, und dass Wähler*innen diese Möglichkeit auch nutzen (Campbell und Heath 2017; Campbell et al. 2019; van Erkel 2019; Wauters et al. 2020). Zusätzliche Analysen zeigen, dass der (experimentell variierte) Frauenanteil bei geschlossenen Listen keinen substanziellen Einfluss auf die Parteiwahl zu haben scheint. Dies kann auch erklären, warum Parteiselektorate des rechten politischen Spektrums entgegen anderslautender Präferenzen ihres (weiblichen) Elektorats weiterhin männlich dominierte Listen aufstellen können (vgl. Bieber 2022).

Was bedeuten diese Ergebnisse für das Potenzial von offenen Listen, zu einem ausgeglicheneren Frauenanteil im Deutschen Bundestag beizutragen? Unserer Interpretation nach ergibt sich hier ein gemischtes Bild. Zunächst hängt für einen großen Teil der Wähler*innen die Stimmabgabe auch in offenen Listen nicht maßgeblich vom Kandidat*innengeschlecht ab. Das dürfte in der Praxis heißen, dass die von den Parteiselektoraten vorgelegten Listen weiterhin einen großen Einfluss auf das Geschlecht der Gewählten haben. Daher können offene Listen gerade in den Parteien mit derzeit niedrigem Frauenanteil (Union, FDP und AfD) vermutlich keine Wunder bewirken. Ihre Wählerschaften würden in der Gesamtheit kaum bevorzugt für Frauen stimmen,Footnote 25 und bei der FDP könnten sogar die Männer unter den Kandidat*innen von Personenstimmen profitieren. In diesen Parteien ist sowohl dem Selektorat als auch dem Elektorat im Schnitt die Frauenrepräsentation nicht besonders wichtig, oder sie wird sogar skeptisch gesehen. Bei der Union käme es bekannterweise (Debus und Stecker 2019) zusätzlich darauf an, in welchem weiteren institutionellen Kontext offene Listen eingeführt würden. Würden offene Listen für die Zweitstimme bei Beibehaltung des bestehenden Mischwahlsystems gelten, würde der Einfluss des Listentyps durch die (zumindest derzeit) hohe Zahl an Direktmandaten (2021: 73 % der Unionssitze) gedämpft werden.Footnote 26

Auf der anderen Seite zeigen unsere Ergebnisse auch klar, dass Wähler*innen nicht paritätisch besetzte Listen ausbalancieren. Gegeben der derzeitigen Listenzusammensetzung bei BundestagswahlenFootnote 27 wäre damit ein Bonus für Kandidatinnen zu erwarten. Zudem liefern unsere Ergebnisse keine Anzeichen dafür, dass die Präferenzen der deutschen Wähler*innen bei offenen Listen der deskriptiven Repräsentation von Frauen insgesamt schaden könnten. Möglichen Verlusten in Parteien wie der FDP stehen potenziell zusätzliche Sitze für Frauen etwa bei den Grünen gegenüber. Auf jeden Fall würden sich Verbesserungen durch offene Listen allein durch die Präferenzen von Wähler*innen ergeben, und weder das Parteiselektorat noch das -elektorat müsste in seiner Handlungs- und Wahlfreiheit eingeschränkt werden. Es böte sich somit ein verfassungskonformer Weg zu mehr Geschlechtergerechtigkeit in der Zusammensetzung des Bundestags. Zusätzlich ließen sich auch andere Argumente gegen Quotenregeln (Krook 2006) umgehen, etwa dass Quoten Gruppen gegenüber Einzelpersonen bevorzugen oder die Chancengleichheit untergraben.

Allerdings behalten auch in offenen Listenwahlsystemen Parteien Einfluss über die Anzahl und Platzierung von Frauen auf den Listen. Aspekte wie die Wahlkampffinanzierung oder Medienberichterstattung können Frauen in offenen Listensystemen ebenfalls substanziell benachteiligen (Wauters et al. 2010; Lühiste 2015; Bauer 2020; Rohrbach et al. 2020). Daher wird die Quotenfrage auch in solchen Systemen nicht obsolet (Jones und Navia 1999; Górecki und Kukołowicz 2014).Footnote 28 In jedem Fall haben offene Listen an sich auch eine weitere positive Eigenschaft. Sie könnten gleichzeitig und ohne Weiteres auch die Repräsentation von anderen unterrepräsentierten Gruppen, wie etwa jüngeren Leuten oder Personen mit Migrationshintergrund, fördern (van Erkel 2019; Bloom und Thames 2021). Auch aus Sicht der Bevölkerung stellen offene Listen eine relevante Option dar und werden zumindest nicht klar abgelehnt. Wie in Abschn. A.2 im Online-Anhang näher erläutert, sprechen sich unsere Befragten, nach dem präferierten Listentyp für die Zweitstimme bei Bundestagswahlen gefragt, mehrheitlich für offene Listen aus. Dies gilt insbesondere für diejenigen Wähler*innen der Union (neben denen der Linken), die Gleichstellung für ein wichtiges Thema halten. Gerade Bürger*innen mit Interesse für Genderfragen scheinen also die Vorteile offener Listen zur Verbesserung der deskriptiven Repräsentation im Bundestag zu sehen. Insgesamt plädieren wir somit dafür, dem Potenzial offener Listen in der Debatte zur Reform des Wahlrechts mehr Beachtung zu schenken.