1 Einleitung

Einschlägigen Studien zufolge sind rassistische und fremdenfeindliche Einstellungen in Deutschland in den letzten Jahren rückläufig (Zieck et al. 2019; Decker et al. 2020). Während laut „Mitte“-Studie der Friedrich-Ebert-Stiftung im Jahr 2002 12,2 % der Befragten rassistischen Aussagen und 34,5 % der Befragten fremdenfeindlichen Aussagen zugestimmt haben, sind es im Jahr 2019 nur noch \(7,2\%\) bzw. \(18,8\%\) (Zieck et al. 2019, S. 82). So erfreulich diese Entwicklung auf den ersten Blick erscheinen mag, so fraglich ist der Befund angesichts einer Vielzahl an schweren rechtsextremistisch motivierten Terror- und Gewalttaten wie etwa in Hanau oder Halle. Der Eindruck einer Zunahme von politisch motivierten Straf- und Gewalttaten mit rechtsextremistischem Hintergrund wird auch von Zahlen des Bundeskriminalamts bestätigt. Während es 2009, dem ersten Jahr der Erhebung, in Deutschland nach offizieller Zählung zu 18.750 derartiger Taten kam, weist die Statistik für 2019 die Zahl 21.290 aus (Statista 2020).

Nun ließe sich argumentieren, dass es durchaus möglich sei, dass eine Abnahme rechtsextremer Einstellungen in der Bevölkerung mit einer Zunahme rechtsextremer Straftaten einhergeht. Mit der Frustrations-Aggressions-Hypothese nach Homans (1974) könnte man etwa argumentieren, dass vereinzelte Rechtsextreme umso aggressiver agieren, je stärker ihre „Gesinnung“ an Rückhalt in der Bevölkerung verliert. Eine andere rezente Entwicklung in der Bundesrepublik lässt aber die These der Rückläufigkeit rassistischer und xenophober Einstellungen recht unglaubwürdig erscheinen: Der Aufstieg der AfD, die seit 2017 die (numerisch) stärkste Fraktion der Opposition im Bundestag stellt und in manchen Bundesländern um den Status der stärksten Partei überhaupt konkurriert; einer Partei, die in jedem Fall nach der sozialwissenschaftlichen Bedeutung des Begriffs rechtspopulistisch ist (Mudde 2007) und vielleicht schon bald vom Bundesamt für Verfassungsschutz als rechtsextremer Verdachtsfall eingestuft wird.

Wie geht es zusammen, dass einerseits in der Breite der Bevölkerung rassistische und fremdenfeindliche Einstellungen an Boden verlieren, während sich gleichzeitig eine rechtspopulistische Partei, die genau diese Einstellungen zu einer Art politischem Programm erhebt, im politischen System der Republik festsetzt? Der vorliegende Aufsatz möchte zur Klärung dieser Frage beitragen. Hierfür greifen wir auf die Dual-Process-Perspektive (Kahneman 2011; Evans 2010; Stanovich 2011; Esser und Kroneberg 2020) zurück, um zwischen zwei Arten von Einstellungen, nämlich impliziten und expliziten Einstellungen, zu unterscheiden (Wilson et al. 2000; Wilson 2002). So verwendet die eben zitierte „Mitte“-Studie ausschließlich explizite Maße zur Messung von rassistischen und xenophoben Einstellungen. Dabei drücken die Befragten ihre Zustimmung oder Ablehnung für eine Reihe von Aussagen, wie etwa „Die Weißen sind zu Recht führend in der Welt“, mittels einer mehrstufigen Likert-Skala aus (Zieck et al. 2019, S. 70 ff.). Aus einer handlungstheoretischen Perspektive stellen derartige explizite Einstellungen lediglich Artefakte dar, was bedeutet, dass sie zwar auf zugrundeliegenden impliziten Einstellungen basieren, jedoch zusätzlich von situationalen und motivationalen Erwägungen, wie etwa sozialer Erwünschtheit, beeinflusst werden. Dabei geht es nicht nur darum, dass Befragte aus strategischen Motiven ihre „wahren“ Einstellungen verfälschen und bewusst „falsche“ Angaben machen. Vielmehr sind implizite und explizite Einstellungen in unterschiedlichen Segmenten oder Sektoren des Wissensvorrats der Befragten verankert. Befragte müssen nicht unbedingt von ihren impliziten Einstellungen wissen und können sie deshalb gar nicht expressis verbis, sei es in standardisierten Surveys oder auch in qualitativen Tiefeninterviews, artikulieren (vgl. Vaisey 2014). Implizite Einstellungen beruhen auf assoziativen Verknüpfungen zwischen Einstellungsobjekten und einer positiven oder negativen Evaluation und können durch aus der Sozial- und Kognitionspsychologie entlehnte Techniken wie dem Implicit-Association-Test sichtbar gemacht werden (Fazio et al. 1995; Greenwald et al. 1998). Vor diesem Hintergrund argumentieren wir, dass die Dual-Process-Perspektive ein zentrales handlungstheoretisches Prinzip der Katalysation beinhaltet, welches besagt, dass implizite Einstellungen sich umso stärker auf die Artikulation expliziter Einstellungen und das overte Verhalten niederschlagen sollten, je eher die Befragten zu intuitionsgeleitetem Handeln tendieren.

Die Relevanz impliziter Einstellungen sowie das katalytische Prinzip werden anhand einer explorativen Studie mit 960 Befragten validiert.Footnote 1 Es zeigt sich, dass implizite Einstellungen zum Populismus und zum Rassismus nur in einem eher losen Zusammenhang mit den korrespondierenden expliziten Einstellungen stehen, wobei sich dieser Zusammenhang bei Befragten, die stärker zur Intuition neigen, verstärkt. Ferner beeinflussen beide in Betracht gezogenen impliziten Einstellungen auch die Affinität zur AfD (operationalisiert über die Wahlabsicht) – und zwar sowohl unter Kontrolle der Standardvariablen aus der einschlägigen Forschung als auch unter Kontrolle der beiden expliziten Einstellungen. Auch in diesem Zusammenhang bestätigt sich das Prinzip der Katalysation: Je stärker Befragte dazu tendieren, sich auf ihr intuitives Bauchgefühl zu verlassen, desto stärker schlagen sich der implizite Populismus und der implizite Rassismus in der Wahrscheinlichkeit nieder, die AfD zu wählen.

Aufgrund der Tatsache, dass wir nur über Querschnittsdaten verfügen, welche darüber hinaus mit einem Convenience Sample aus einem Access Panel erhoben wurden, können wir keine gesicherten Aussagen über die Prävalenz impliziter und expliziter Einstellungen in Deutschland über die Zeit hinweg treffen. Die vorliegende Studie macht aber deutlich, dass implizite und explizite Einstellungen nur in einem losen Zusammenhang stehen und implizite Einstellungen unter spezifizierbaren Bedingungen einen starken Effekt auf die Affinität zu rechtspopulistischen Parteien haben können. Vor dem Hintergrund dieser Befunde ist es durchaus möglich, dass sich in den letzten Jahrzehnten vielleicht der öffentliche Diskurs in Deutschland rassistischer und xenophober Einstellungen zunehmend entledigt hat, aber zugleich, sozusagen hinter oder unter dem Schleier des Bewusstseins, weiterhin tiefsitzende implizit rassistische Einstellungen verbreitet sind oder sogar zugenommen haben und die elektoralen Erfolge der AfD ermöglichen.

Der Aufsatz ist wie folgt gegliedert: In Abschn. 2 werden die theoretischen Grundlagen gelegt. Abschnitt 3 beschreibt unser methodisches Vorgehen, insbesondere das aus der Psychologie entlehnte Instrument zur Messung impliziter Einstellungen. In Abschn. 4 präsentieren wir unsere empirischen Befunde. Abschnitt 5 ordnet diese Befunde in den Stand der Forschung ein, diskutiert allfällige Limitationen der Studie und gibt Hinweise auf mögliche Anschlussprojekte.

2 Dual-Process-Perspektive und das Prinzip der Katalysation

Wir entfalten unsere etwas involvierte handlungstheoretische Argumentation in mehreren Schritten. Zunächst führen wir in die wichtigsten Grundideen der Dual-Process-Perspektive ein. Im Anschluss wird die konzeptionelle Unterscheidung zwischen impliziten und expliziten Einstellungen sowie das Prinzip der Katalysation erläutert. Schließlich legen wir dar, was sich im Sinne empirisch prüfbarer Hypothesen aus diesen Überlegungen im Kontext dieser Studie lernen lässt.

2.1 Dual-Process-Perspektive

Die Dual-Process-Perspektive (DPP) ergibt sich aus der inhaltlichen Konvergenz dreier Literaturen: den neueren soziologischen Handlungstheorien zum Framing und zur variablen Rationalität (Esser 1996; Kroneberg 2005; Esser und Kroneberg 2020; Lindenberg 2013), dem eigentlichen Dual-Process-Ansatz in der Kognitions- und Sozialpsychologie (Kahneman 2011; Evans 2010; Stanovich 2011) und den axiomatischen Theorien der begrenzten Rationalität (Rubinstein 1998, 2013; Tutić 72,73,a, b). Für die Zwecke dieses Beitrags reicht es, einige wesentliche Grundideen der DPP zu skizzieren.

Erstens wird das Verhalten eines AkteursFootnote 2 aus der Interaktion zweier „Selbste“ erklärt. Die einzelnen Autoren pflegen zum Teil unterschiedliche Terminologien, etwa Modi (Esser, Kroneberg, Fazio), Systeme (Kahneman), Typen von Prozessen (Evans und Stanovich) oder reflektiertes versus intuitives Entscheiden (Rubinstein). Weithin geteilt ist allerdings die Beschreibung der psychologischen Charakteristika dieser beiden Selbste.Footnote 3 Typ-1-Prozesse sind in der Regel automatisch, schnell, beruhen auf Assoziationen und finden außerhalb des Bewusstseins des Akteurs statt. Typ-2-Prozesse hingegen unterliegen der Kontrolle, sind langsam, orientieren sich an Kalkülen und werden innerhalb des Bewusstseins des Akteurs prozessiert. Empirische Evidenz für qualitative Unterschiede zwischen Typ-1- und Typ-2-Prozessen lassen sich durch Studiendesigns zutage fördern, die etwa Zeitdruck oder eine Überlastung des Arbeitsgedächtnisses beinhalten, um Typ-2-Prozesse zu erschweren oder sogar zu verunmöglichen (z. B. Rand et al. 2012; Rand und Kraft-Todd 2014). Darüber hinaus zeigen bildgebende Verfahren der Neurowissenschaften auf, dass Typ-1- und Typ-2-Prozesse mit charakteristischen Unterschieden in den neuronalen Aktivitäten diverser Areale des Gehirns einhergehen (z. B. McClure et al. 2004; Greene et al. 2001).

Zweitens hängt es maßgeblich von der Definition der Situation ab, ob es zu einem Handeln im Rahmen von Typ-1- oder aber Typ-2-Prozessen kommt. Das Modell der Frame-Selektion (MFS; Esser 1996; Kroneberg 2005) als spezielle Variante der DPP bringt diese zweite Grundidee besonders deutlich zum Ausdruck. Akteure verfügen demnach über mentale Schemata der Kategorisierung, sogenannte Frames, die objektive Situationen in subjektiv wahrgenommene Situationen transformieren. Frames unterscheiden sich darin, wie gut sie zu einer objektiven Situation passen, wobei es dabei nicht nur auf die objektiv gegebene Situation, etwa das Vorhandensein signifikanter Objekte, die auf die Adäquanz eines Frames hindeuten, ankommt, sondern auch auf das Innere des Akteurs, insbesondere auf die chronische oder momentane Zugänglichkeit des Frames. Ist die Passung eines Frames zu einer objektiven Situation, der sogenannte Match, ausreichend hoch, ergibt sich die Definition der Situation wie von selbst, d. h. ohne einen bewussten und reflektierten Prozess der Auslegung. Verfügt der Akteur zusätzlich über mentale Schemata routinemäßiger Handlungssequenzen, sogenannte Skripte, und ist die Passung eines Skripts (das sogenannte Aktivierungsgewicht) zu einem zuvor selektierten Frame ausreichend hoch, dann kommt es zu einer automatisch-spontanen Selektion dieses Skripts. Ist ferner eine Handlung verfügbar, die ausreichend passend zu dem zuvor selektierten Skript ist, dann wird auch die beobachtbare Handlung automatisch-spontan selektiert. Zentral dafür, ob es zur Selektion einer Handlung im Rahmen eines Typ-1- oder Typ-2-Prozesses kommt, ist mithin die Frage, wie gut die Passung des intuitiv zugänglichen Frames zur objektiven Situation ist.

Drittens geht die DPP davon aus, dass das Gros individueller Handlungen und sozialer Interaktionen im Rahmen von automatischen Typ-1-Prozessen stattfindet. Ein bewusstes und reflektiertes Ausdeuten von Situationen und ein deliberatives Abwägen von Handlungsalternativen anhand der erwarteten Konsequenzen und das Entwerfen von Handlungsplänen stellt einen Grenzfall dar, zu dem es nur dann kommt, wenn der Akteur in eine ausreichend ungewöhnliche Situation gerät und Gelegenheit sowie Motivation zur Reflexion bestehen. Damit teilt die DPP ein zentrales Moment der phänomenologischen Theorie Alfred Schütz’ und auch der Praxistheorie, etwa in der Fassung von Bourdieu (1990) und Giddens (1984), die die empirische Relevanz der Lebenswelt sowie der Doxa betonen und sich gegen die Intellektualisierung bei der Erklärung von Verhalten und Handeln richten (vgl. Reckwitz 2003).Footnote 4

Schließlich entfalten der DPP zufolge kulturelle Orientierungen, insbesondere Einstellungen, Werte und internalisierte Normen, ihre Wirkung auf Verhalten über zu unterscheidende kognitive Mechanismen. Mit dem MFS lässt sich etwa argumentieren, dass sie einerseits die Definition der Situation (Frame, Match, Zugänglichkeit) beeinflussen und auch in einer Wahlverwandtschaft mit Formen routinierter Handlungssequenzen (Skripte) stehen. Entscheidend für die motivationale Kraft und das sinnstiftende Potenzial kultureller Orientierungen ist, dass über die Selektion von Frames und Skripten kulturelle Orientierungen im Rahmen von Typ-1-Prozessen Handeln beeinflussen können. Darüber hinaus lässt es das MFS aber auch zu, dass kulturelle Orientierungen im Rahmen von Typ-2-Prozessen eine Wirkung auf Handeln ausüben. Akteure können etwa im Rahmen von reflektierten Auslegungsprozessen über die situationale Geltung und Adäquanz von kulturellen Orientierungen räsonieren (Kroneberg 2007). Die Konformität mit kulturellen Orientierungen kann ferner eine der Konsequenzen sein, die der Akteur bei einer reflektierten Entscheidung über konkrete Handlungen in Rechnung stellt. Die These, dass kulturelle Orientierungen sich über unterschiedliche kognitive Mechanismen in Verhalten niederschlagen, hat sich als überaus fruchtbar in der amerikanischen Kultursoziologie erwiesen (vgl. DiMaggio 1997; Martin 2010). Vaisey (2009) argumentiert etwa, dass sich zwei klassische Auffassungen zur Rolle kultureller Orientierungen mit der DPP in eine Art Synthese bringen lassen. Zum einen die ältere soziologische Position nach Weber (2002), Durkheim (1997) und Parsons (1937), wonach kulturelle Orientierungen einen unmittelbaren Einfluss als Motiv des Handelns haben. Und zum anderen die vor allem bei Swidler (1986) formulierte Vorstellung, dass kulturelle Orientierungen eher eine Art Werkzeugkasten darstellen, aus denen sich Akteure strategisch bedienen, auch um Handlungen, die im Zweifel völlig andersartig motiviert sein können, ex post im Diskurs zu rationalisieren und zu legitimieren. Mit der DPP lässt sich sagen: Kulturelle Orientierungen fungieren als unmittelbares Motiv des Handelns, wenn sie ihren Einfluss im Rahmen von Typ-1-Prozessen ausüben. Strategischer Umgang mit kulturellen Orientierungen und diskursive Rationalisierungen mithilfe kultureller Orientierungen verweisen eher auf Typ-2-Prozesse.

In unserer Studie arbeiten wir mit einem dispositiven Maß für die Tendenz der Befragten, sich auf intuitive Typ-1-Prozesse zu verlassen (s. Abschn. 3), welches wir auch Maß für intuitionsgeleitetes Handeln nennen. In theoretischen Termen lassen sich Befragte, die einen hohen Wert bei diesem Maß erzielen, als Akteure auffassen, die chronisch hohen Kosten der Reflexion ausgesetzt sind und daher eher zu intuitiven Handlungen neigen.

2.2 Implizite Einstellungen, explizite Einstellungen und das Prinzip der Katalysation

In diesem Beitrag werden wir uns ausführlicher mit einer speziellen Art kultureller Orientierungen beschäftigen, und zwar mit Einstellungen. Eine Einstellung gegenüber einem Einstellungsobjekt lässt sich als die psychologische Tendenz definieren, dieses Objekt positiv oder aber negativ zu bewerten (Eagly und Chaiken 1993; Fazio 1995). Einstellungen können über implizite oder über explizite Maße gemessen werden; man spricht auch von impliziten und expliziten Einstellungen (Wilson et al. 2000; Fazio und Olson 2003; Strack und Deutsch 2004; Rydell und McConnell 2006). Implizite Maße setzen darauf, mental verankerte assoziative Verknüpfungen, wie sie kennzeichnend für System 1 sind (Kahneman 2011), zwischen einem Einstellungsobjekt und einer Bewertung im Rahmen von Typ-1-Prozessen sichtbar zu machen. Der in dieser Studie zum Einsatz kommende Brief Implicit Association Test (Sriram und Greenwald 2009; Nosek et al. 2014) etwa stellt auf den Vergleich der Antwortlatenzen bei Zuordnungsaufgaben ab, bei denen Objekte mit positiven oder aber negativen Attributen gematched werden (vgl. Abschn. 3). Explizite Maße für Einstellungen operieren mit expliziten, (latent) evaluativen Äußerungen. Befragte bringen dabei ihre Zustimmung zu oder Ablehnung von evaluativen Aussagen im Rahmen eines standardisierten Surveys zum Ausdruck oder tätigen von sich aus evaluative Aussagen im Rahmen von qualitativen Interviews.

Während implizite Einstellungen qua Definition im Rahmen von Typ-1-Prozessen sichtbar werden, können explizite Einstellungen sowohl im Rahmen von Typ-1- oder Typ-2-Prozessen geäußert werden. Werden explizite Einstellungen im Rahmen eines Typ-2-Prozesses geäußert, können in diese Artikulation oder Explikation neben den zugrundeliegenden impliziten Einstellungen zusätzliche Erwägungen, etwa das Interesse sozial erwünschte Einstellungen zu artikulieren, einfließen (Fazio et al. 1995). Explizite Einstellungen sind also situativ und motivational verzerrte Abbilder impliziter Einstellungen. Implizite und explizite Einstellungen zum selben Einstellungsobjekt stehen deshalb auch im Allgemeinen nicht in einem besonders engen Zusammenhang (Wilson et al. 2000). Befragte können sich durchaus konsistent expressis verbis positiv (oder negativ) gegenüber einem Einstellungsobjekt äußern und zugleich eine negative (oder positive) implizite Einstellung gegenüber dem Einstellungsobjekt inkorporiert haben. Ein weiterer interessanter Aspekt an der Unterscheidung zwischen impliziten und expliziten Einstellungen ist, dass Akteuren im Allgemeinen in deutlich stärkerem Ausmaß bewusst ist, dass sie eine explizite Einstellung zum Ausdruck bringen, als dass ihnen bewusst ist, dass sie Träger einer impliziten Einstellung sind (Rydell und McConnell 2006).

Die DPP lässt in diesem Zusammenhang die Formulierung eines allgemeinen handlungstheoretischen Prinzips zu. Dem Prinzip der Katalysation zufolge spiegeln sich implizite Einstellungen stärker in expliziten Einstellungen sowie im beobachtbaren Verhalten wider, wenn diese Artikulation expliziter Einstellungen oder das Verhalten im Rahmen von Typ-1-Prozessen stattfindet. Denn implizite Einstellungen haben für diesen Fall das Potenzial, die Definition der Situation und die Selektionen von Skript und Handlung als Leitmotiv zu dominieren, während ihr Einfluss im Rahmen reflektierter Typ-2-Prozesse durch situationale Erwägungen verwässert wird. Die Konformität mit einer impliziten Einstellung ist im reflektiert-kalkulierenden Modus nur eine unter mehreren Konsequenzen des Handelns, die der Akteur in Erwägung zieht.Footnote 5

Der Einfluss expliziter Einstellungen auf Handeln ist deutlich schwieriger zu theoretisieren. Einerseits ist eine explizite Einstellung ein Proxy für eine zugrundeliegende implizite Einstellung und sollte deshalb einen stärkeren Einfluss auf Verhalten haben, wenn dieses Verhalten im Rahmen eines Typ-1-Prozesses zustande kommt. Andererseits können explizite Einstellungen auch von den zugrundeliegenden impliziten Einstellungen abweichen, insbesondere dann, wenn sich die Artikulation der expliziten Einstellungen im Rahmen eines Typ-2-Prozesses vollzieht. Bei starker Abweichung sollte sich ihr Einfluss auf Verhalten, welches automatisch-spontan stattfindet, also abschwächen. Explizite Einstellungen sind aus der Perspektive der DPP inhärent Artefakte, die Theoriebildung und empirische Forschung vor große Herausforderungen stellt. In diesem Beitrag fokussieren wir deshalb auf das explanative Potenzial impliziter Einstellungen.

2.3 Empirisch prüfbare Hypothesen

Wie schon in der Einleitung deutlich wurde, interessieren wir uns in diesem Beitrag dafür, wie sich implizite Einstellungen auf explizite Einstellungen und letztendlich auf die Wahlabsicht der AfD niederschlagen, wobei wir die kognitive Disposition der Akteure zur Intuitivität als zentrale Moderatorvariable betrachten. In Anlehnung an die bestehende Forschung zu rechtspopulistischen Neigungen (z. B. Kitschelt 1995; Ivarsflaten 2005; Werts et al. 2013) und die deutschsprachige Literatur zur AfD (Lengfeld 2017; Lux 2018; Tutić und Hermanni 2018; Rippl und Seipel 2018; Lengfeld und Dilger 2018) konzentrieren wir uns dabei auf Einstellungen zum Rassismus und Populismus.

Ausgehend vom Prinzip der Katalysation gelangt man zu empirisch prüfbaren Hypothesen, wenn man theoretische Ideen zu den Bedingungen für das Einsetzen von Typ-1- oder Typ-2-Prozessen hinzuzieht. Dabei dominiert in der Literatur die Vorstellung des sogenannten Default-Interventionism (vgl. Evans und Stanovich 2013). Demnach offeriert System 1 automatisch eine Definition der Situation und auch Handlungsimpulse, die im Regelfall (Default) von System 2 unhinterfragt akzeptiert werden. In Ausnahmefällen interveniert System 2 und, sofern die kognitiven Kapazitäten wie etwa ein leistungsfähiges Arbeitsgedächtnis verfügbar sind, überschreibt die von System 1 generierten Eindrücke und Impulse mit den Ergebnissen des eigenen Prozessierens (Override). Die Modus-Selektion im Rahmen des MFS bringt die Bedingungen für diese Intervention im Vergleich zu alternativen Konzeptionen sehr klar zum Ausdruck: Je größer der Match zwischen mentalem Modell und objektiver Situation, je geringer die Erfolgsaussichten und der potenzielle Ertrag der Reflexion, und je höher die Kosten der Reflexion, desto unwahrscheinlicher ist es, dass es zu einem Typ-2-Prozess kommt (Kroneberg 2005, 2011).

Konkret interessieren wir uns in dieser Studie für die folgende Hypothese:

Bei Befragten, die eher dazu tendieren, intuitionsgeleitet zu handeln, schlagen sich implizite Einstellungen zum Populismus und zum Rassismus stärker in expliziten Einstellungen zum Populismus und zum Rassismus sowie in der Affinität zur AfD nieder als bei Befragten, die eher zur Reflexion tendieren.

Wir weisen darauf hin, dass diese Hypothese zwei Ideen impliziert, die nicht unbedingt selbstverständliche Gewissheiten der empirischen Sozialforschung darstellen und deshalb an dieser Stelle betont werden sollen. Erstens: Implizite und explizite Einstellungen können unter gewissen Bedingungen durchaus stark divergieren, weshalb explizite Einstellungen nur eingeschränkt als gute Proxies für implizite Einstellungen taugen. Zweitens: Implizite Einstellungen stellen unter gewissen Bedingungen bedeutsame Prädiktoren für soziologisch relevante Phänomene dar. Beide Aussagen und darüber hinaus die angeführte Hypothese werden durch die nun zu beschreibende empirische Studie gestützt.

3 Daten, Instrumente und Variablen

Auf Grundlage eines Convenience Sample des Access-Panel-Betreibers respondi wurden 1.102 Personen im Juni 2020 befragt. Die Befragung erfolgte online und dauerte etwa 30 Minuten. Wir quotierten die Befragten bevölkerungsrepräsentativ nach Alter und Geschlecht, übersampelten jedoch die Bewohner aus Ostdeutschland mit etwa einem hälftigen Anteil deutlich. Dies erfolgte vor dem Hintergrund, dass dort die Wahlbasis für die AfD besonders stark ist und wir sicherstellen wollten, dass für eine spätere Analyse genügend AfD-Wähler zur Verfügung stehen.

Brief Implicit Association Test

Zunächst wollen wir das Herzstück unserer Studie, den sogenannten Brief Implicit Association Test (BIAT), etwas ausführlicher vorstellen. Der BIAT (Sriram und Greenwald 2009; Nosek et al. 2014) stellt eine komprimierte Version des klassischen Implicit Association Tests (Greenwald et al. 1998; Fazio et al. 1995) dar. Zu dessen Durchführung werden insgesamt vier Wortlisten benötigt. Zwei dieser Wortlisten bestehen ausschließlich aus positiv oder ausschließlich aus negativ konnotierten Worten und stehen für die Attribute „gut“ bzw. „schlecht“. Darüber hinaus werden jeweils zwei Listen benötigt, deren Worte mit den jeweiligen Einstellungsobjekten, welche miteinander verglichen werden sollen, assoziiert sind. In dieser Studie haben wir zwei BIATs durchgeführt, die sich in den verwendeten Einstellungsobjekten unterscheiden. Im BIAT zur Messung des impliziten Rassismus werden die Einstellungsobjekte „Geflüchtete“ und „Deutsche“ verwendet.Footnote 6 Der BIAT zur Messung des impliziten Populismus arbeitet mit den Einstellungsobjekten „Etablierte“ und „Alternative“.

Ein BIAT besteht nun aus zwei Blöcken, wobei sich die Blöcke darin unterscheiden, welches der beiden Einstellungsobjekte darin fokal ist; das Attribut „gut“ ist in beiden Blöcken fokal. In jedem Block werden den Befragten zunächst das fokale Attribut, das fokale Einstellungsobjekte sowie die jeweils damit assoziierten Wortlisten vorgelegt. Der eigentliche Test besteht darin, dass den Befragten jedes Wort der vier zugrundeliegenden Wortlisten einzeln und nacheinander in einer zufälligen Reihenfolge präsentiert wird, wobei sich Worte, die mit dem Attribut assoziiert sind, ständig mit Worten, die mit dem Einstellungsobjekt assoziiert sind, abwechseln. Bei jedem präsentierten Wort müssen die Befragten so schnell wie möglich bestimmen, ob es entweder mit dem fokalen Einstellungsobjekt oder aber dem fokalen Attribut assoziiert ist, oder eben nicht.Footnote 7 In Abb. 1 sieht man eine solche Zuordnungsaufgabe: Das fokale Einstellungsobjekt ist in diesem Fall „Deutsche“ und das fokale Attribut ist „gut“. Der Befragte muss hier entscheiden, ob das präsentierte Wort („Thomas“) mit „Deutsche“ oder „gut“ (durch Tastendruck „K“) oder mit keinem von beiden (durch Tastendruck „D“) assoziiert ist.

Abb. 1
figure 1

Beispiel einer Zuordnungsaufgabe des BIATs

Die Idee hinter dieser Vorgehensweise ist, dass Befragte, welche eine positive implizite Einstellung gegenüber dem fokalen Einstellungsobjekt haben, weniger Zeit bei der Zuordnung benötigen sollten als Befragte, welche eine negative implizite Einstellung gegenüber dem fokalen Einstellungsobjekt haben.Footnote 8 Dies deshalb, weil das Attribut „gut“ qua Design stets fokal ist. Durch die unterschiedlichen Reaktionszeiten, welche sich in den zwei Blöcken ergeben, lässt sich nach Greenwald et al. (2003) das sogenannte D-Maß berechnen, welches sich gegenüber alternativen Maßen bewährt hat (vgl. Sriram et al. 2006).Footnote 9 Das D-Maß ist die Differenz zwischen den mittleren Latenzen der beiden BIAT-Blöcke geteilt durch die Standardabweichung der Latenzen in den beiden Blöcken.Footnote 10 Typischerweise liegen diese Werte zwischen \(-2\) und \(+2\). In unserem Fall verweist ein positiver (negativer) Wert beim impliziten Rassismus darauf, dass der Befragte eine implizit negativere (positivere) Einstellung gegenüber „Geflüchteten“ als gegenüber „Deutschen“ hat. Analog verweist ein positiver (negativer) Wert beim impliziten Populismus darauf, dass der Befragte eine implizit positivere (negativere) Einstellung gegenüber „Alternativen“ als gegenüber „Etablierten“ hat. Der Wert 0 beim D-Maß verweist auf eine implizite Indifferenz.

Wie bereits erwähnt, werden in dieser Studie zwei BIATs verwendet. Sowohl die Reihenfolge der beiden BIATs als auch die Reihenfolge der einzelnen Blöcke innerhalb der beiden BIATs wurden dabei randomisiert. In Anlehnung an Sriram und Greenwald (2009) haben die Befragten zudem vor der Durchführung der beiden BIATs einen Übungsblock absolviert (Einstellungsobjekte „Säugetiere“ und „Vögel“), um sie mit dem technischen Ablauf vertraut zu machen. Die Wortlisten der beiden BIATs finden sich in Tabelle 1 im Anhang.

Variablen

Als abhängige Variable fungiert die Wahlabsicht für die AfD, die mit der Sonntagsfrage erhoben wurde. \(9,2\%\) der Befragten gaben an, die AfD zu wählen.

Die impliziten Einstellungen wurden wie oben erläutert erhoben. Während sich bei den Befragten eine schwache Neigung zu implizit rassistischen Einstellungen zeigt (\(M=0,525\), \(SD=0,655\)), finden wir den impliziten Populismus weniger stark vertreten (\(M=-0,634\), \(SD=0,737\)).

Neben den beiden impliziten Einstellungen stellen die expliziten Einstellungen zum Populismus und zum Rassismus und die Disposition zu Typ-1-Prozessen die zentralen unabhängigen Variablen bei der Erklärung der Affinität zur AfD dar. Alle drei Maße wurden mittels Itembatterien erhoben. Jede Batterie bestand aus mehreren Aussagen, wobei die Befragten ihre Zustimmung zu diesen Aussagen auf einer Likert-Skala von 1 („stimme überhaupt nicht zu“) bis 7 („stimme voll und ganz zu“) zum Ausdruck bringen konnten (siehe Tab. 2 im Anhang).

Die explizite Einstellung zum Populismus wurde mithilfe eines additiven Indexes über acht Items operationalisiert (Cronbachs \(\alpha =0,875\), \(M=4,505\), \(SD=1,203\)). Dabei hatten die Befragten die Möglichkeit, ihre Zustimmung zu Aussagen wie „Das Volk ist sich oft einig, aber die Politiker verfolgen ganz andere Ziele“ auszudrücken. Auf der Grundlage von 18 Aussagen zu Geflüchteten (Beispiel: „Sie nehmen den Deutschen die Arbeitsplätze weg“) ergibt sich die Variable expliziter Rassismus als additiver Index (Cronbachs \(\alpha =0,969\), \(M=3,696\), \(SD=1,534\)).

Als dispositives Maß für die Tendenz, sich auf intuitive Typ-1-Prozesse zu verlassen, fungiert ein additiver Index über drei Aussagen (Cronbachs \(\alpha =0,584\), \(M=4,947\), \(SD=0,975\)), die zusammengenommen die Kurzskala zur Messung von sozialer Erwünschtheit im Sinne von Selbsttäuschung darstellen (vgl. Winkler et al. 2006). In der Datenanalyse unterscheiden wir zwischen intuitiven und reflektierten Befragten. Intuitive Befragte sind Personen, welche hohe Werte bei diesem Maß erzielen, auf ihre erste intuitive Eingebung vertrauen und nicht dazu tendieren, diese durch einen bewussten Prozess der Reflexion in Zweifel zu ziehen. Reflektierte Befrage hingegen sind Personen, welche niedrige Werte bei diesem Maß erzielen und sich dadurch auszeichnen, dass sie ihre ersten Eingebungen bewusst hinterfragen.

In die multivariaten Analysen fließen eine Reihe von soziodemografischen Kontrollvariablen ein. Die Variablen Alter (\(M=47,286\), \(SD=15,501\)) und Mann (\(M=0,472\)) sind selbsterklärend.Footnote 11 Die Variable Migration ist ein Dummy, der den Wert 1 annimmt, wenn die Mutter oder der Vater der Befragten nicht in Deutschland geboren sind (\(M=0,109\)). Dabei werden die Werte für 12 Befragte, bei denen ansonsten ein Missing vorliegen würde, vermöge einer Regression aus soziodemografischen Variablen imputiert. Die Variable Stadt ist ein Dummy, der indiziert, ob ein Befragter in einer Großstadt oder am Rand einer Großstadt wohnt (\(M=0,457\)). Die Variable West ist ein Dummy, der angibt, ob ein Befragter im Augenblick in Westdeutschland lebt (\(M=0,583\)). Beim höchsten allgemeinbildenden Bildungsabschluss des Befragten unterscheiden wir mithilfe dreier Dummies zwischen Abitur (\(M=0,529\)), Realschule (\(M=0,403\)) und Hauptschule (\(M=0,068\)). Beim Erwerbsstatus unmittelbar vor der Coronakrise differenzieren wir vermöge Dummies zwischen Erwerbstätigen (\(M=0,624\)), Rentnern (\(M=0,183\)) und Auszubildenden/Studierenden (\(M=0,131\)). Aufgrund geringer Fallzahlen arbeiten wir hier mit einer heterogenen Referenzkategorie Sonstige (\(M=0,061\)), die u. a. Arbeitslose, Erwerbsunfähige und Hausarbeitende umfasst.

Das Haushaltsnettoeinkommen wurde offen abgefragt. Hieraus und aus Angaben zur Komposition des Haushalts lässt sich mithilfe der Skala der Organisation for Economic Co-operation and Development (OECD-Skala) das Haushaltsäquivalenzeinkommen bestimmen. Dabei werden die Werte für 16 Befragte, bei denen ansonsten ein Missing vorliegen würde, vermöge einer Regression aus soziodemografischen Variablen imputiert. Das Haushaltsäquivalenzeinkommen fließt nicht direkt, sondern über die sich daraus ableitenden Schichten in die Analysen mit ein. Befragte, deren Haushaltsäquivalenzeinkommen nicht mehr als 70 % des Medians des HaushaltsäquivalenzeinkommensFootnote 12 entspricht, ordnen wir der unteren Schicht zu (\(M=0,468\)). Befragte, deren Haushaltsäquivalenzeinkommen mehr als 70 % aber nicht mehr als 150 % des Medians des Haushaltsäquivalenzeinkommens entspricht, werden der Mittelschicht zugeordnet (\(M=0,469\)). Alle anderen Befragten, für die ein Haushaltsäquivalenzeinkommen vorliegt, ordnen wir der Oberschicht zu (\(M=0,064\)).

Der derzeitige oder zuletzt ausgeübte Beruf der Befragten wurde mithilfe eines Drop-down-Menüs erhoben, das automatisch die ausgewählten Berufe in die International Standard Classification of Occupations in der Fassung von 2008 (ISCO-08-Klassifikation) überführt. Hieraus lässt sich vermöge einer Transformationstabelle der International Labour Organization die ISCO-88-Klassifikation ableiten (ILO 1990). Damit konnten wir anhand eines von Ganzeboom und Treiman (1996; vgl. auch Ganzeboom und Treiman 2011) entwickelten und von Hendrickx (2004) modifizierten Verfahrens (Stata-ado „ISKO“) das SIOPS-Maß für Berufsprestige bestimmen (\(M=45,705\), \(SD=9,992\)). Die Verwendung des Drop-down-Menüs hat zu einer hohen Zahl an Missings geführt; 520 fehlende Werte haben wir mithilfe einer Regression aus soziodemografischen Variablen imputiert.

Schließlich kontrollieren wir noch auf zwei allgemeine Maße kultureller Orientierungen. Die Variable Religiosität gibt an, wie häufig die Befragten an religiösen Zeremonien, etwa Gottesdiensten, teilnehmen (\(M=0,732\), \(SD=1,064\)).Footnote 13 Die allgemeine politische Orientierung wird mithilfe der Links-Rechts-Selbsteinschätzung operationalisiert (\(M=3,581\), \(SD=1,080\)).Footnote 14

Alle metrischen Variablen gehen z‑standardisiert in die Analysen ein. Von 1.102 Fällen weisen (nach Imputation bei Migration, Haushaltsäquivalenzeinkommen und SIOPS) 960 Fälle keine Missings in einer der betrachteten Variablen auf; all unsere Analysen beziehen sich ausschließlich auf diese Fälle. Fast alle Missings sind bei der Erhebung der impliziten Einstellungen mit dem BIAT entstanden; aus nachvollziehbaren Gründen sehen wir davon ab, fehlende Werte bei diesen zentralen unabhängigen Variablen zu imputieren.

4 Empirische Befunde

Bivariate Zusammenhänge

Wie von der DPP nahegelegt, stehen explizite und implizite Einstellungen nur in einem schwachen Zusammenhang (vgl. Abb. 2). Beim Populismus ergibt sich lediglich ein Korrelationskoeffizient von \(r=0,089\) (\(p< 0,006\)); eine Variation des impliziten Populismus um vier Standardabweichungen geht mithin lediglich mit einer marginalen Änderung von weniger als einer halben Standardabweichung beim expliziten Populismus einher. Impliziter und expliziter Rassismus stehen in einem etwas stärkeren, aber nach konventionellen Maßstäben immer noch sehr schwachen Zusammenhang (\(r=0,204\), \(p< 0,000\)). Eine Zunahme des impliziten Rassismus um vier Standardabweichungen wird statistisch von einer Zunahme um weniger als eine Standardabweichung beim expliziten Rassismus begleitet.

Abb. 2
figure 2

Korrelation zwischen impliziten und expliziten Einstellungen

Vor diesem Hintergrund lassen sich implizite und explizite Einstellung als partiell unabhängige Prädiktoren für die Affinität zur AfD auffassen. Die Abbildungen 3 und 4 geben einen Überblick darüber, wie die vier Einstellungen bei Wählern und Nichtwählern der AfD verteilt sind. Der optische Eindruck bestätigt sich in inferenzstatistischen Mittelwertvergleichen (zweiseitige t‑Tests): Wähler und Nichtwähler der AfD unterscheiden sich bei allen vier Einstellungen signifikant voneinander. Der kleinste t‑Wert findet sich beim impliziten Rassismus mit \(t=-3,113\) bei einem empirischen Signifikanzniveau von \(p< 0,002\). Deutlich wird, dass sich AfD-Wähler stärker von AfD-Nichtwählern bei ihren expliziten als bei ihren impliziten Einstellungen unterscheiden.

Abb. 3
figure 3

Explizite Einstellungen bei Wählern und Nichtwählern der AfD

Abb. 4
figure 4

Implizite Einstellungen bei Wählern und Nichtwählern der AfD

Multivariate Analysen

Kommen wir nun zur Überprüfung unserer Hypothese im Kontext multivariater Modelle. Zunächst stellen wir uns die Frage, ob sich tatsächlich implizite Einstellungen stärker in expliziten Einstellungen niederschlagen, wenn sich die Artikulation der expliziten Einstellung im Rahmen eines Typ-1-Prozesses vollzieht. Zu diesem Zweck schätzen wir für beide expliziten Einstellungen je ein Regressionsmodell. Die drei zentralen unabhängigen Variablen sind dabei jeweils die dazugehörige implizite Einstellung, unser dispositives Maß für die Tendenz zu Typ-1-Prozessen und ein Interaktionsterm zwischen diesen beiden unabhängigen Variablen. Dabei kontrollieren wir auf die in Abschn. 3 aufgeführten soziodemografischen Variablen (Alter, Geschlecht, Migrationshintergrund, Stadt/Land, Ost/West, Bildung, Schicht, Erwerbsstatus, Berufsprestige), auf Links-Rechts-Selbsteinschätzung und auch auf Religiosität.

Abbildung 5 zeigt auf, dass sich beim Populismus ein deskriptiv positiver, aber nicht signifikanter Interaktionseffekt (\(p< 0,392\)) findet, während beim Rassismus ein positiver und signifikanter Interaktionseffekt (\(p< 0,006\)) besteht (vgl. auch Tab. 3 im Anhang). Abbildung 6 hilft dabei, die Stärke der Interaktionseffekte einzuschätzen. Die Geraden mit dem Label „Typ-1-Prozess“ geben die vorhergesagten Werte für stark intuitive Befragten wieder, die bei unserem dispositiven Maß gerade zwei Standardabweichungen über dem Mittelwert liegen. Analog weisen die Geraden mit dem Label „Typ-2-Prozess“ die vorhergesagten Werte für stark reflektierte Befragte aus, die bei diesem Maß gerade zwei Standardabweichungen unter dem Mittelwert liegen. Mit Blick auf den Populismus findet sich ein bezüglich der Effektstärke nicht besonders eindrucksvoller Interaktionseffekt; die Gerade mit dem Label „Typ-1-Prozess“ hat eine etwa doppelt so hohe Steigung wie die Gerade des „Typ-2-Prozess“. Aber das Doppelte von sehr wenig ist eben immer noch wenig. Beim Rassismus findet sich allerdings ein recht starker Interaktionseffekt: Tatsächlich zeigt sich bei eher reflektierten Befragten keinerlei Einfluss des impliziten Rassismus auf den expliziten Rassismus, während sich bei eher intuitiven Befragten ein durchaus wahrnehmbarer Zusammenhang findet. In der Gesamtschau über beide Einstellungen, d. h. über Populismus und Rassismus hinweg, interpretieren wir diese Befunde als klar positive Evidenz für das Prinzip der Katalysation.

Abb. 5
figure 5

Explizite Einstellungen als Funktion impliziter Einstellungen

Abb. 6
figure 6

Interaktion zwischen impliziten Einstellungen und Intuitivität

Kommen wir nun zur Betrachtung der Wahlabsicht für die AfD. Hier schätzen wir ein Modell, das alle vier Einstellungen simultan als unabhängige Variablen berücksichtigt und zusätzlich das Maß für Intuitivität sowie die zwei Interaktionseffekte zwischen diesem Maß und den beiden impliziten Einstellungen enthält. Darüber hinaus kommen wieder die bereits genannten Kontrollvariablen zum Einsatz. Da unser theoretisches Interesse sich auf Interaktionseffekte richtet und diese im Rahmen von Logit- oder Probit-Modellen schwer zu überprüfen sind (Ai und Norton 2003), folgen wir der in der Ökonometrie und zunehmend auch in der Soziologie gängigen und empfohlenen Praxis und greifen auf das lineare Wahrscheinlichkeitsmodell (Breen et al. 2018) zurück.

Wir finden sowohl mit Blick auf den impliziten Populismus als auch mit Blick auf den impliziten Rassismus positive und signifikante Interaktionseffekte (vgl. Abb. 7 und Tab. 4 im Anhang).Footnote 15 Abbildung 8 zeigt auf, dass bei stark reflektierten Befragten der implizite Populismus keinerlei Einfluss auf die Affinität zur AfD hat, während es bei stark intuitiven Befragten einen positiven Zusammenhang gibt. Auch beim impliziten Rassismus findet sich für stark intuitive Befragte ein signifikant positiver Einfluss auf die Affinität zur AfD (vgl. Abb. 8). Hierbei führt aber auch der kleine und nicht signifikante Haupteffekt des impliziten Rassismus dazu, dass es bei stark reflektierten Befragten der Tendenz nach sogar einen negativen Zusammenhang zwischen implizitem Rassismus und der Affinität zur AfD gibt. Eine mögliche Ursache für diesen auf den ersten Blick irritierenden Befund könnte Verdrängung im Sinne von Freud (1911) sein, welche sich im Rahmen der DPP als Konflikt zwischen impliziten und expliziten Orientierungen rekonstruieren lässt (vgl. Wilson et al. 2000). Dies bedeutet, dass stark reflektierte Befragte mit starken implizit rassistischen Einstellungen demnach gerade nicht die AfD wählen könnten, um zu verhindern, dass ihnen ihre implizite Einstellung bewusst wird. Dies ist selbstverständlich nur eine spekulative Post-hoc-Interpretation eines Befunds, den man zugleich nicht überbewerten muss. Eine zusätzliche Analyse, bei der nur Befragte mit überdurchschnittlicher Neigung zur Reflexion betrachtetet werden, zeigt nämlich auf, dass dieser negative Zusammenhang zwischen implizitem Rassismus und der Affinität zur AfD nicht signifikant ist (\(b=-0,011\), \(p< 0,300\)).

Abb. 7
figure 7

Affinität zur AfD als Funktion impliziter und expliziter Einstellungen

Abb. 8
figure 8

Interaktion zwischen impliziten Einstellungen und Intuitivität

Die Effektstärken der impliziten Einstellungen sind übrigens bemerkenswert. Das Modell, welches den Abbildungen 7 und 8 zugrunde liegt, weist für die Links-Rechts-Selbsteinschätzung einen Koeffizienten in Höhe von 0,048 aus (vgl. Tab. 4 im Anhang). Ceteris paribus führt also eine um eine Standardabweichung erhöhte Selbsteinschätzung als politisch rechts dazu, dass die Wahrscheinlichkeit, die AfD zu wählen, um \(4,8\%\) steigt. Ostdeutsche haben dem Modell zufolge eine um \(4,6\%\) erhöhte Wahrscheinlichkeit die AfD zu wählen. Beides, die Links-Rechts-Selbsteinschätzung und der Ost/West-Dummy, sind in der einschlägigen Forschung zur AfD als relativ starke Prädiktoren bekannt (vgl. Hambauer und Mays 2018; Lengfeld 2017). Aber schon bei Befragten mit einer Neigung zur Intuitivität, die um eine Standardabweichung über dem Durchschnitt liegt, hat der implizite Populismus einen stärkeren Effekt: Eine Erhöhung des impliziten Populismus um eine Standardabweichung führt zu einer Erhöhung der Wahrscheinlichkeit, die AfD zu wählen um \(5,8\%\). Tatsächlich hat der implizite Populismus einen stärkeren Einfluss als der explizite Populismus und lässt sich insgesamt nach dem expliziten Rassismus als zweitstärkster Prädiktor interpretieren. Wir interpretieren diese Befunde zum Einfluss der impliziten Einstellungen auf die Affinität zur AfD als klare Bestätigung des katalytischen Prinzips.

5 Diskussion

In diesem Beitrag wurde auf Grundlage der DPP die Unterscheidung zwischen impliziten und expliziten Einstellungen aufgegriffen und argumentiert, dass die DPP eine allgemeine Bedingung dafür formuliert, dass sich implizite Einstellungen zum einen stärker in expliziten Einstellungen, zum anderen aber auch im overten Verhalten niederschlagen. Dem Prinzip der Katalysation zufolge verstärkt sich der Einfluss impliziter Einstellungen, wenn die Explikation oder das Handeln im Rahmen von Typ-1-Prozessen zustande kommen. Diese handlungstheoretischen Ideen wurden im Zusammenhang mit der Erklärung der Affinität zur AfD angewendet. In einer explorativen Studie hat sich gezeigt, dass zum einen implizite Einstellungen zum Populismus und zum Rassismus nur in einem eher schwachen Zusammenhang mit korrespondierenden expliziten Einstellungen stehen. Ferner sind beide Arten von Einstellungen signifikante und auch starke Prädiktoren für die Wahlabsicht der AfD. Schließlich hat sich auch das katalytische Prinzip bewährt. In der Tat zeigt sich bei eher reflektierten Befragten ein schwächerer Zusammenhang zwischen impliziten Einstellungen und expliziten Einstellungen und auch zwischen impliziten Einstellungen und der Affinität zur AfD, als bei Befragten, die sich eher auf ihre Intuition verlassen.

Diese Befunde und die zugrundeliegende handlungstheoretische Argumentation können fruchtbare Impulse für die Wahlforschung und insbesondere für die empirische Forschung zu rechtspopulistischen oder -extremen Neigungen geben. Allgemein lässt sich sagen, dass die politikwissenschaftliche und auch die soziologische Literatur sowohl objektiv gegebene als auch subjektiv wahrgenommene sozioökonomische Statuslagen (Brug et al. 2000; Lubbers et al. 2002; Arzheimer und Carter 2006) und kulturelle Orientierungen, wie etwa Rassismus, Xenophobie, Autoritarismus und Euroskeptizismus (Kitschelt 1995; Ivarsflaten 2005; Werts et al. 2013), als Prädiktoren für rechtspopulistische Neigungen auffasst. Dabei werden kulturelle Orientierungen allerdings fast ausschließlich mithilfe expliziter Einstellungsmaße erfasst. Vor dem Hintergrund unserer Befunde, dass zum einen implizite und explizite Einstellungen nur unter gewissen Bedingungen in einem engen Zusammenhang stehen und zum anderen implizite Einstellungen auch unter Kontrolle von expliziten Einstellungen einen Einfluss auf die Wahlabsicht haben können, bleiben damit im Gros der Wahlforschung zentrale Determinanten individuellen Wahlverhaltens außen vor. Die These, dass implizite Einstellungen bei der Erklärung rechtspopulistischer Neigungen nicht zu vernachlässigen sind, ist auch für die soziologische Auseinandersetzung mit der AfD relevant. Hier setzt man sich durchaus kontrovers in Anschluss an Beiträge von Ronald Inglehart und Pippa Norris (Inglehart und Norris 2017, 2018) vor allem mit der Frage auseinander, ob eher sozioökonomische Faktoren (Economic Insecurity Hypothesis) oder aber kulturelle Orientierungen (Cultural Backlash Hypothesis) die Affinität zur AfD bedingen (Lengfeld 2017; Lux 2018; Tutić und von Hermanni 2018; Rippl und Seipel 2018; Lengfeld und Dilger 2018). Eine fundierte Auseinandersetzung mit dieser Frage setzt Mediationsanalysen voraus, denn neben den direkten Effekten der sozioökonomischen Lage, die auch unter Kontrolle der kulturellen Orientierungen auf die Affinität zur AfD wirken, sind zusätzlich die indirekten Effekte, die über Unterschiede in diesen kulturellen Orientierungen vermittelt werden, in Rechnung zu stellen (vgl. Lengfeld und Dilger 2018). Auch hier kranken aus einer handlungstheoretischen Perspektive die bisher vorgelegten Beiträge daran, dass kulturelle Orientierungen ausschließlich vermöge expliziter Maße berücksichtigt werden. Die in diesem Beitrag eröffnete handlungstheoretische Perspektive führt zu zusätzlichen Herausforderungen für die empirische Sozialforschung: Multiple Mediationsanalysen sind angezeigt, denn Statuslagen beeinflussen die Wahlabsicht zum einen direkt, aber auch indirekt über implizite und explizite Einstellungen, welche zusätzlich in einem durch die Disposition zu intuitivem oder aber reflektivem Handeln moderierten Binnenverhältnis stehen. Dabei ist davon auszugehen, dass sich der sozioökonomische Status nicht nur auf die impliziten und expliziten Einstellungen der Akteure auswirkt, sondern auch auf die Disposition zu eher intuitivem oder aber reflektiertem Verhalten (vgl. Brett und Miles 2021). Vor dem Hintergrund unserer Befunde zur Relevanz impliziter Einstellungen für die Wahlabsicht der AfD sind multiple Mediationsanalysen, die den angeführten Überlegungen Rechnung tragen, ein notwendiges und folgerichtiges Forschungsunterfangen, um die Auseinandersetzung um die relative empirische Validität der Economic Insecurity Hypothesis und der Cultural Backlash Hypothesis voranzutreiben. Unsere Daten eignen sich leider nur bedingt für derartige Analysen, vor allem weil mit den impliziten Maßen für Populismus und Rassismus nur ein sehr eingeschränktes Spektrum an impliziten kulturellen Orientierungen abgedeckt ist.

An dieser Stelle möchten wir einen weiteren Befund zu den Haupteffekten unseres Maßes für Intuitivität ansprechen und diskutieren, welches zwar nicht im Fokus dieses Beitrags steht, aber dennoch von Interesse sein dürfte. Wir finden das konsistente Muster, dass die Neigung zur Intuitivität damit einhergeht, explizit populistischen und rassistischen Äußerungen zuzustimmen und auch damit, mit höherer Wahrscheinlichkeit die AfD zu wählen (vgl. Abb. 5 und 7). Auf den ersten Blick widerspricht dieser Befund der gängigen Hypothese (Rand et al. 2012, 2014; Rand 2016), dass Intuition und Spontanität prosoziales Verhalten begünstigen. Hierzu möchten wir drei Aspekte ausführen. Zunächst erscheinen unsere Befunde nachvollziehbar, da unser Maß der Intuitivität auf die Neigung, sich auf erste Eindrücke und den „gesunden Menschenverstand“ zu verlassen, abstellt und diese Neigung von populistischen Parteien bedient wird (etwa die dezidierte Ablehnung von „elitistischen“ Experten). Darüber hinaus ist die These der intuitiven Prosozialität in der interdisziplinären Forschung auch nicht unumstritten (Bouwmeester et al. 2017; Verkoeijen und Bouwmeester 2014). Der DPP zufolge sollten implizite Einstellungen einen stärken Einfluss auf das Verhalten haben, wenn dieses Verhalten im Rahmen eines Typ-1-Prozesses zustande kommt. Ausgehend von diesem katalytischen Prinzip gelangt man nur dann zur These der intuitiven Prosozialität, wenn man eine generelle implizite Orientierung des Menschen unterstellt; und genau diese Annahme ist empirisch fragwürdig. Schließlich lassen sich unsere Befunde durchaus in den interdisziplinären Diskurs um die DPP einordnen. Empirische Belege zur intuitiven Prosozialität stammen ganz überwiegend aus Studien zu ökonomischen Spielen, die von ihrer Auszahlungsstruktur her so angelegt sind, dass individuelle Auszahlungen und soziale Wohlfahrt in einen Konflikt geraten (Logik: „Ich“ versus „Gruppe“). Das politische Narrativ rechtspopulistischer Parteien wie der AfD stellt aber nicht auf den Konflikt zwischen Individuum und Gesellschaft ab, sondern auf den Konflikt zwischen gesellschaftlichen Aggregaten oder Gruppen (Logik: „Wir“ versus „die Anderen“): zum einen auf den Konflikt zwischen „Volk“ und „Elite“ und zum anderen auf den Konflikt zwischen „Deutschen“ und „Ausländern“. Mit Greene (2013) lässt sich nun argumentieren, dass die Spezies Mensch als evolutionäre Anpassung die Tendenz entwickelt hat, in Situationen des Konflikts zwischen Eigen- und Gruppeninteresse intuitiv prosozial zu agieren, aber diese Prosozialität immer nur auf die wie auch immer definierte eigene Gruppe beschränkt ist. In Situationen, die nach der Logik „Wir“ versus „die Anderen“ strukturiert sind, führt die intuitive Prosozialität mit Blick auf die eigene Gruppe zu einer intuitiven Antisozialität gegenüber den Anderen.

Kommen wir nun zu den Limitationen des vorliegenden Beitrags. Wir haben in Abschn. 2 darauf hingewiesen, dass aus einer theoretischen Perspektive heraus, das Verhältnis zwischen expliziten Einstellungen und Verhalten schwierig zu fassen ist. Je nachdem, in welchem Modus die Artikulation der expliziten Einstellung und das Verhalten zustande kommen, lassen sich vier Fälle unterscheiden. Der Rückgriff auf ein dispositives Maß für Typ-1-/Typ-2-Prozesse führt dazu, dass wir nur Fälle, bei denen beides, Explikation und Wahlabsicht, im Rahmen eines Typ-1-Prozesses zustande gekommen ist, mit Fällen, bei denen weder die Explikation noch das Verhalten automatisch-spontan prozessiert wurden, vergleichen können. Aus diesem Grund ist die vorliegende Studie wenig instruktiv hinsichtlich des Einflusses expliziter Einstellungen. Die zukünftige Forschung sollte Techniken wie Zeitdruck oder kognitive Überlastung dazu einsetzen, auch die anderen beiden Fälle, bei denen entweder die explizite Einstellung oder aber das Handeln automatisch-spontan erfolgt, empirisch in den Blick zu nehmen. Darüber hinaus wäre es interessant, zu untersuchen, ob das von uns verwendeten Maß für Typ-1-/Typ-2-Prozesse sich auch in anderen Kontexten als valide erweist und in welcher Beziehung es zu alternativen Maßen, wie der Einstellungszugänglichkeit (Mayerl 2010) oder Einstellungsverankerung (Stocké 2004), steht.

Mit Blick auf das empirische Anwendungsbeispiel ist sicherlich die größte Limitation der vorliegenden Studie, dass wir in keinster Weise Anspruch auf Repräsentativität für die deutsche Bevölkerung erheben können und darüber hinaus auch nur mit einem Querschnitt arbeiten. Spannende Thesen zu der relativen Wichtigkeit sozioökonomischer Faktoren und kultureller Orientierungen oder auch zur Prävalenz impliziter und expliziter Einstellungen in der deutschen Bevölkerung über die Zeit hinweg lassen sich auf dieser Datengrundlage nicht überprüfen. Aus unserer Perspektive wäre es ein sehr lohnendes Unterfangen, ein repräsentatives Panel aufzusetzen, das neben den Standardvariablen im Zusammenhang mit der Forschung zu rechtspopulistischen Neigungen auch implizite kulturelle Orientierungen beinhaltet.