Gesamteindruck
Wir konzentrieren uns zunächst auf die Auswertung des Gesamteindrucks der Stimmzettel. Die Marginal Means zusammen mit den 95 %-Konfidenzintervallen sind in Abb. 3 dargestellt. Die Effekte sind wie folgt zu interpretieren: Je größer der Wert einer bestimmten Faktorausprägung, desto wichtiger ist dieser Faktor für die Auswahl eines Stimmzettels und desto stärker wird diese Ausprägung durch die Befragten favorisiert und umgekehrt. So zeigt sich bei den Informationen zum Wahlsystem, dass die mittellange Erläuterung der Stimmabgabe deutlich positiver bewertet wird als die kurze oder die lange Erläuterung. Beispielsweise liegt die Auswahlwahrscheinlichkeit eines Stimmzettels mit einer mittellangen Erläuterung bei rund 0,55. Wenn also diese Ausprägung bei einem der zu vergleichenden Stimmzettel vorliegt, dann beträgt die vorhergesagte Wahrscheinlichkeit für die Auswahl dieses Stimmzettels bei etwa 55 %. Die Werte für die kurze und die lange Erläuterung liegen dagegen unterhalb der 50 %-Schwelle. Trotz der häufig festgestellten Wissenslücken von Wählerinnen über Wahlsysteme, scheinen die Wählerinnen selbst also kein übermäßiges Interesse an detailreichen Erläuterungen zu haben.
Bei den Kandidateninformationen lassen sich klare Unterschiede feststellen. So zeigt sich, dass die Nennung des Berufs eindeutig gewünscht wird. Der Anstieg in der Auswahlwahrscheinlichkeit ist vergleichbar mit dem Anstieg, der bei der mittellangen Erläuterung des Wahlsystems zu beobachten ist. Dieser starke Effekt deutet an, dass der Beruf als entscheidungsrelevantes Merkmal angesehen wird. Dies deckt sich mit den Befunden von McDermott (2005) und Mechtel (2014), die zeigen, dass der Beruf eine wichtige Entscheidungsheuristik darstellt. Unsere Ergebnisse ergänzen diese Forschung dahingehend, dass Informationen über den Beruf der Kandidierenden von den Wählerinnen nicht nur genutzt, sondern auch aktiv gewünscht werden. Auch die Angabe des Alters wird positiv bewertet, wenngleich nicht so stark wie die Berufsangabe.
Sichtlich anders liegen die Befunde für die Angabe der Kandidatenadressen. Hier zeigen sich keine signifikanten Unterschiede zwischen den Marginal Means. Die Punktschätzer deuten gar eine Präferenz gegen die Nennung der Adresse an. Diese Beobachtung überrascht vor dem Hintergrund einer umfangreichen Literatur, die dem Wohnort ebenfalls eine wichtige heuristische Funktion bei der Wahlentscheidung zuschreibt (Campbell und Cowley 2014; Campbell et al. 2019; Jankowski 2016; Tavits 2010).
Der Unterschied zwischen der bestehenden Forschung und den Ergebnissen des vorliegenden Experiments kann mehrere Gründe haben. Erstens wird die Nennung der Adresse von vielen Wählerinnen womöglich als zu sensible Information angesehen, obwohl diese Angabe auf Stimmzetteln durchaus üblich ist. Es mag daher einen Unterschied machen, ob die spezifische Adresse oder eine unspezifische Wohnortsangabe auf dem Stimmzettel abgedruckt wird. Eine Reihe von offenen Antworten in einem Kommentarfeld am Ende des Surveys deutet darauf hin, dass die konkrete Adresse von den Teilnehmerinnen tatsächlich als zu sensibel wahrgenommen wird.Footnote 9 Zweitens ist nicht auszuschließen, dass die Wählerinnen die Angabe von Adressen zwar prinzipiell als problematisch bewerten, von dieser Information aber dennoch Gebrauch machen. In diesem Falle stünden die Befunde der bisherigen Forschung und die hier vorgestellten Ergebnisse nicht im Widerspruch. Drittens muss bemerkt werden, dass die Befunde zur Adressnennung eventuell eine geringere externe Validität aufweisen als andere Experimentalfaktoren. Da für das Experimentaldesign hypothetische Adressen verwendet wurden, können die Befragten anders als bei den Angaben zu Beruf und Alter aus der Adresse keine Informationen über die Kandidierenden ableiten.
Abschließend widmen wir uns den Designelementen des Stimmzettels. Unsere Ergebnisse zeigen, dass weder die Darstellung der Listenstimme noch die Hinweispfeile einen Einfluss auf die Bewertung der Stimmzettel haben. Die abgesetzten Ankreuzhinweise zeigen einen positiven Effekt gegenüber der Variante, bei der die Ankreuzhinweise in die Erläuterung des Wahlsystems eingebettet sind. Die Effektstärke ist insgesamt aber eher gering, sodass dieser Faktor kein entscheidender Aspekt bei der Stimmzettelgestaltung ist.
Ein deutlicher Effekt zeigt sich dagegen bei der Positionierung der Stimmflächen. Die Anordnung mit der Ankreuzoptionen rechts von den Kandidatennamen wird von den Teilnehmerinnen klar bevorzugt. Dies kann einerseits auf die Leserichtung von links nach rechts zurückgeführt werden, weshalb es für die Teilnehmerinnen natürlicher wirken mag, zunächst die Kandidatennamen und dann die Stimmflächen zu betrachten. Eine weitere Möglichkeit ist, dass sich in diesem Effekt die Häufigkeit von Rechtshändigkeit ausdrückt, die Mandal und Dutta (2001) mit rund 90 % beziffern. Denkbar wäre, dass Rechtshänderinnen die rechtsseitige Positionierung der Stimmflächen bevorzugen, während Linkshänderinnen eher die gegenteilige Anordnung auswählen. So legen die Ergebnisse von Kim et al. (2015) beispielsweise nahe, dass die Anordnung der Ankreuzoption einen Effekt auf das Wahlverhalten von Linkshänderinnen und Rechtshänderinnen hat. Da wir die dominante Hand der Teilnehmenden nicht abgefragt haben, können wir zwischen diesen beiden Mechanismen nicht unterscheiden. Zumindest deuten vereinzelte Antworten im Kommentarfeld am Ende der Umfrage darauf hin, dass Befragte die linke Anordnung der Stimmflächen aufgrund der Leserichtung ablehnen.Footnote 10 In zukünftiger Forschung sollte diese Frage weiter verfolgt und zwischen den möglichen Erklärungen unterschieden werden, da sie mit unterschiedlichen Handlungsempfehlungen einhergehen. Falls sich der Befund durch die typische Leserichtung erklärt, dann würde dieses Ergebnis für die Gestaltung von Stimmzetteln sprechen, die den Lesegewohnheiten in unterschiedlichen Ländern sprechen. Im Falle von Effekten der dominanten Hand könnten gar Stimmzettel für Linkshänderinnen und Rechtshänderinnen angezeigt sein.
Zusammenfassend kann jedoch festgehalten werden, dass insbesondere die Informationen zur Stimmabgabe und zu den Kandidierenden bei der Bewertung der Stimmzettel eine wichtige Rolle spielen. Mit Blick auf die Gestaltung der Stimmzettel ist die Positionierung der Stimmflächen entscheidend. Basierend auf diesen Ergebnissen haben wir in Abb. 4 den am besten gelungenen Stimmzettel dargestellt – also den Stimmzettel, bei dem die Punktschätzer der Marginal Means am größten sind.
Informationsgehalt, Übersichtlichkeit und Verständlichkeit
Neben dem Gesamteindruck wurde auch die wahrgenommene Übersichtlichkeit, Verständlichkeit und der Informationsgehalt der Stimmzettel abgefragt. Die Ergebnisse dieser Bewertungskriterien sind in Abb. 5 dargestellt.
Zunächst kann beobachtet werden, dass die Befragten den unterschiedlichen Informationsgehalt der Stimmzettel korrekt wahrgenommen haben. Dies unterstreicht zum einen die interne Validität des Experimentes. Zum anderen ergeben sich aus dem Vergleich der Bewertungen des Informationsgehalts mit den anderen Bewertungsdimensionen bemerkenswerte Folgen. So zeigt sich insbesondere, dass die Befragten die lange Erläuterung der Stimmabgabe als am informativsten wahrnehmen. Offensichtlich legen die Befragten aber keinen Wert auf derart detailreiche Erläuterungen. Dies zeigt sich sowohl beim Gesamteindruck und noch deutlicher bei der Übersichtlichkeit und der Verständlichkeit der Stimmzettel. Bei den beiden letztgenannten Aspekten wird die lange Erklärung am schlechtesten bewertet. Offenbar sind zu ausführliche Erläuterungen also problematisch, da die Befragten sich nicht mehr kompetent genug fühlen, um die Informationen aufzunehmen. Dieser Befund ist im Kontext der Debatte um die Verständlichkeit von Wahlsystemen zu sehen (Jankowski et al. 2020; Schmitt-Beck 1993). So stehen komplexe Wahlsysteme im Verdacht, Wählerinnen von der Wahlteilnahme abzuschrecken und den Anteil ungültiger Stimmen zu erhöhen (Nyhuis 2014; Schäfer und Schoen 2013). Unsere Befunde weisen in die gleiche Richtung. Zu umfassende Erläuterungen sind sichtbar unerwünscht und führen zu Unverständnis bei den Wählerinnen und Wählern.
Auch bei der Adressangabe und dem wahrgenommenen Informationsgehalt lassen sich klare Unterschiede zu den anderen Bewertungsdimensionen feststellen. So wird die Adressangabe als informativ wahrgenommen, hat aber keinen Einfluss auf die Verständlichkeit und sogar einen leicht negativen Effekt auf die allgemeine Bewertung und die Übersichtlichkeit.
Auch die Ausrichtung der Stimmflächen wurde als unterschiedlich informativ wahrgenommen. Diese Beobachtung überrascht auf den ersten Blick, da es sich bei diesem Faktor lediglich um ein Layout-Element handelt, durch das sich der objektive Informationsgehalt des Stimmzettels nicht ändert. Eine mögliche Erklärung für diesen Effekt ist, dass Befragte sich bei objektiv gleichem Informationsgehalt für den übersichtlicheren Stimmzettel auf der Dimension Informationsgehalt entscheiden.Footnote 11 Diese Vermutung wird durch die Daten gestützt. Berechnet man die Effekte nur für Vergleiche zwischen Stimmzetteln mit objektiv gleichem Informationsgehalt, dann zeigt sich der Effekt der Stimmflächenposition auf den wahrgenommen Informationsgehalt. Betrachtet man hingegen nur Paarvergleiche mit objektiv unterschiedlichem Informationsgehalt, dann findet sich ein solcher Effekt nicht (ohne Abbildung). Ebenso zu berücksichtigen sind mögliche Ausstrahlungseffekte zwischen den Fragen. Da alle Bewertungsdimensionen gleichzeitig erhoben wurden, ist davon auszugehen, dass die Bewertungen der Einzeldimensionen sich gegenseitig beeinflussen. Auch so könnte sich erklären, weshalb die Position der Ankreuzflächen einen Effekt auf den Informationsgehalt hat.
Zusammenhang zwischen den Teildimensionen und dem Gesamteindruck
In diesem Abschnitt untersuchen wir, wie die drei abgefragten Teildimensionen Informationsgehalt, Verständlichkeit und Übersichtlichkeit mit dem Gesamteindruck des Stimmzettels zusammenhängen. Eine solche Analyse kann Aufschluss darüber geben, ob einer der drei Teilaspekte eine besondere Rolle für den Gesamteindruck spielt.
Zunächst kann festgestellt werden, dass die Mehrheit der Befragten den Stimmzettel mit dem besseren Gesamteindruck auch auf allen drei Teildimensionen besser bewertet hat. Dies gilt in 66,4 % der Fälle. In 25,3 % der Fälle gilt das für zwei der drei Teildimensionen. In immerhin 7,8 % der Fälle wurde nur eine der drei Teildimensionen am besten eingeschätzt und trotzdem der Gesamteindruck als besser angesehen. Fälle, in denen zwar der Gesamteindruck besser ist, aber keine der Teildimensionen besser bewertet wurden, treten mit 0,4 % praktisch nicht auf.
Um zu untersuchen, welche der Teildimensionen den stärksten Einfluss auf die Gesamtbewertung hat, prüfen wir zunächst, wie häufig ein Stimmzettel insgesamt als besser und zugleich als verständlicher, informativer oder übersichtlicher bewertet wurde. Diese Zusammenhänge sind in Tab. 3 dargestellt. Sie legen nahe, dass Verständlichkeit der wichtigste Faktor für die Gesamtbewertung ist. In über 90 % der Fälle werden Stimmzettel, die als verständlicher eingeschätzt werden, auch insgesamt als besser bewertet. Hingegen wird in nur knapp 81 % der Fälle der informativere Stimmzettel auch als der bessere eingeschätzt. Die Übersichtlichkeit liegt mit 86 % zwischen den beiden Teildimensionen.
Tab. 3 Zusammenhang zwischen Gesamtbewertung und den drei Teildimensionen Um diesen Zusammenhang systematischer zu betrachten, wurde der Einfluss der Teildimensionen auf die Gesamtbewertung geschätzt. Dabei berücksichtigt das Modell alle möglichen Interaktionseffekte, dass also die Teildimensionen einen gemeinsamen Einfluss auf die Gesamtbewertung ausüben. Auf diese Weise ergeben sich acht (\(=2^3\)) mögliche Kombinationen der drei Teildimensionen. Abb. 6 zeigt die Ergebnisse dieser Analyse. Auf der y‑Achse ist die Wahrscheinlichkeit angegeben, dass ein Stimmzettel insgesamt als besser bewertet wird. Auf der x‑Achse sind die acht möglichen Kombinationen dargestellt. Wenig überraschend zeigt sich zunächst, dass die positive/negative Bewertung aller Teildimensionen eindeutig mit einer positiven/negativen Gesamtbewertung einhergeht. Interessanter sind Fälle, bei denen eine oder zwei Teildimensionen als schlechter bewertet wurden. Insgesamt macht es zwar einen eher geringen Unterschied, welche Teildimension/en als schlechter bewertet wurden. Dennoch hat die Übersichtlichkeit einen etwas geringeren Einfluss auf die positive Gesamtbewertung. Folglich zeigen auch diese Ergebnisse, dass die Verständlichkeit den stärksten Einfluss auf die Gesamtbewertung der Stimmzettel hat.
Effektheterogenität
In den letzten drei Abschnitten wurden allgemeine Präferenzen der Teilnehmerinnen für bestimmte Stimmzettelmerkmale herausgearbeitet. In diesem letzten Abschnitt der Analyse wird nun die Frage gestellt, ob bestimmte gesellschaftliche Gruppen identifiziert werden können, die systematisch anders gelagerte Präferenzen im Hinblick auf die Gestaltung von Stimmzetteln haben. So ist beispielsweise denkbar, dass der Bildungsgrad der Teilnehmerinnen mit unterschiedlichen Erwartungen an die Gestaltung der Stimmzettel einhergeht. Die Auswertung hat einen explorativen Charakter, sodass eine Vielzahl von möglichen und üblichen Gruppierungsfaktoren als Moderatoren geprüft wird.
Effektheterogenität liegt dann vor, wenn sich die Marginal Means zwischen Gruppen mit verschiedenen Ausprägungen eines bestimmten Gruppierungsmerkmals unterscheiden. Zur Prüfung heterogener Effekte kann die Gruppierungsvariable bei der Berechnung der Marginal Means einbezogen werden. Dabei wird ein Modell geschätzt, welches die Experimentalfaktoren und die Gruppenzugehörigkeit interagiert. Mittels eines F‑Tests lässt sich prüfen, ob ein Modell mit der Gruppierungsvariable die Daten besser beschreibt als ein Modell ohne (Leeper et al. 2020).
Die Ergebnisse des F‑Tests sind in Tab. 4 für zwölf potenzielle Moderatoren wiedergegeben.Footnote 12 Für keine der betrachteten Gruppen lässt sich ein statistisch signifikanter Unterschied zwischen den Modellen feststellen. Immerhin liegt der p-Wert für den Vergleich von Anhängerinnen der Grünen mit den anderen Befragten relativ nahe am üblichen Signifikanzniveau von 0,05 (vgl. Abb. A11 im Online-Anhang). Unterschiede zeigen sich hier vor allem bei der Länge der Erläuterung der Stimmabgabe. Im Gegensatz zu den anderen Befragten bewerten die Anhängerinnen der Grünen eine lange Beschreibung der Stimmabgabe positiver, eine kurze Beschreibung dagegen negativer. Dieser Befund erscheint vor dem Hintergrund des sozioökonomischen Profils der grünen Wählerschaft plausibel (Dolezal 2010). Dennoch kann festgehalten werden, dass die mittellange Erläuterung auch unter den Anhängerinnen der Grünen die höchste Zustimmung erfährt.Footnote 13
Tab. 4 Test für Gruppenunterschiede Insgesamt legen die Befunde der Subgruppenanalysen somit nahe, dass es ein hohes Maß an Übereinstimmung in der Bevölkerung über einen gelungenen Stimmzettel gibt. Es ist folglich möglich, einen Stimmzettel zu gestalten, der allgemein als gut geeignet wahrgenommen wird.