1 Einleitung, Forschungsfrage und Forschungsdesign

Politische Akteure verweisen regelmäßig auf die öffentliche Meinung oder auf öffentlichen Druck, wenn es gilt, Initiativen zum Um- oder Rückbau des Sozialstaats zu begründen. Öffentliche und veröffentlichte Meinung wirken als Taktgeber für neue Ideen zur Verteilungsgerechtigkeit, als Begründung für veränderte Budgetprioritäten oder für die Konditionalität sozialer Transfers. Diese Diskussionen unterstreichen die Bedeutung realer oder konstruierter Trends der öffentlichen Meinung für Reformen des Sozialstaats.

Einschlägige Beiträge haben herausgearbeitet, dass Haltungen zur Sozialpolitik durch persönliche und demografische Eigenschaften, utilitaristische Überlegungen zum materiellen Eigeninteresse, generelle politische Ideologien oder spezifische Präferenzen in der Sozialpolitik bestimmt werden. Weitere Argumente haben auch die Einbettung der Individuen in ihre jeweiligen institutionellen, ökonomischen, politischen und sozialen Kontexte, besonders auf der staatlichen Ebene, systematisch aufgegriffen und Interaktionen der Mikro- und Makroebene nachgezeichnet (vgl. Beramendi und Rehm 2016; Bobo 1991; Hasenfeld und Rafferty 1989; Blekesaune und Quadagno 2003; Esping-Andersen 1990; Groskind 1994; Hall und Soskice 2001; Margalit 2013; Rehm 2009, 2011, 2016; Rueda und Pontusson 2010).

Einstellungen zum Sozialstaat sind auf der einen Seite bestimmt durch die jeweiligen Interessen und Wertvorstellungen von Bürger:innen, die meist Steuern und Sozialabgaben zahlen und damit die materielle Grundlage für Sozialtransfers bereitstellen. Ihre politischen Präferenzen und persönliche Erfahrungen formen die Bereitschaft, generelle oder spezifische Sozialtransfers, wie etwa die Arbeitslosenversicherung, zu unterstützen oder auch abzulehnen.

Sozialwissenschaftliche Analysen ergänzen diese subjektorientierten Perspektiven, die auf die Einstellungen, Interessen und Werte der Bürger:innen abzielen, mit objektorientierten Ansätzen, die Eigenschaften von (vorgestellten) Leistungsempfänger:innen aufgreifen. Unter dem Etikett Deservingness wird zum Beispiel diskutiert, ob und wie Eigenschaften, Frames oder Stereotype, die bestimmten Gruppen von Leistungsempfänger:innen zugeschrieben werden, Einstellungen zum Sozialstaat beeinflussen. Besonders in Debatten zur Reform, zur Beschneidung oder zur Konditionalität sozialstaatlicher Transfers kommt dieser Dimension eine enorme Bedeutung zu: Während persönliche Werte, Erfahrungen und Präferenzen oft relativ starr und wenig beeinflussbar sind, ermöglicht die Generierung von Bildern potenzieller Leistungsempfänger:innen durch politische Kommunikation und Debatten in den Medien viel eher den Impuls zur Umgestaltung sozialstaatlicher Regelungen.

Seit dem grundlegenden Beitrag Wim van Oorschots (2000a) hat sich die Debatte zur Deservingness mit den Dimensionen dieses Konzepts beschäftigt und Kriterien zur Definition von Hilfsbedürftigkeit und -würdigkeit entwickelt. Das CARIN-Modell verweist auf die unterschiedlichen Dimensionen dieses Konzepts: Control bezieht sich auf die Handlungsmöglichkeiten, die „Kontrolle“ und die Verantwortlichkeit eine/s Einzelnen für die Entstehung und/oder die Bewältigung sozialer Notlagen. Attitude bezieht sich auf die Verhaltensdimension und greift Kriterien wie die Einstellung, die Regelbefolgung oder sogar die Dankbarkeit von Transferempfängern auf. Reciprocity beschreibt das „Geben“ und „Nehmen“ in einer Gesellschaft und stellt in der Vergangenheit erbrachte Beiträge dem gegenwärtigen Hilfeansuchen gegenüber. Identity meint die Fähigkeit, sich mit Leistungsempfänger:innen zu identifizieren, die meist als eine direkte Folge von wahrgenommener sozialer Nähe gefasst wird. Need beschreibt schließlich den Grad an sozialer Bedürftigkeit (zum CARIN-Modell vgl. grundlegend van Oorschot et al. 2017; für Erweiterungen und Modifikationen vgl. auch Knotz et al. 2022; Meuleman et al. 2020).

Einschlägige empirische Studien haben herausgearbeitet, dass sich Individuen eher mit denen solidarisch zeigen möchten, deren Schicksal sie als „unglücklich“ einschätzen, als mit denjenigen, die sie für „faul“ halten. Zum Beispiel etikettieren viele Menschen eine Mutter mittleren Alters, die ihre langjährige Beschäftigung durch den Bankrott ihres Arbeitgebers verliert, tendenziell für eher unterstützungswürdig als einen jungen Mann, der selbst seinen Job hinwirft, weil er ihn nicht mehr mag (vgl. Buss 2019; Gilens 2000; van Oorschot 2000a; Naumann et al. 2019; Petersen et al. 2011; Petersen 2012; Sniderman et al. 1991).

1.1 Deservingness als „Heuristik“ oder als „Automatismus“

Die sozialwissenschaftliche Literatur begreift Heuristiken als „judgmental shortcuts“ (Sniderman et al. 1991). Diese Mechanismen erlauben es Menschen, sinnvolle Präferenzen herauszubilden und auch ohne spezifische, substanzielle Informationen konsistent mit ihren Einstellungen und Interessen zu handeln. Das wohl prominenteste Beispiel ist die Parteiidentifikation, die einem Wähler auch ohne konkretes Wissen zu den Sachfragen einer Wahlkampagne eine Entscheidung ermöglichen soll, die mit seinen Interessen konsistent ist. Viele Beiträge zu sozialstaatlichen Präferenzen haben diese Logik übernommen und unterstellt, dass Überlegungen zur Deservingness ganz analog als eine Heuristik für diejenigen wirken, die nur unzureichend informiert sind oder nur wenig stabile und strukturierte Einstellungen und Präferenzen herausgebildet haben. Heuristiken ersetzen substanzielles politisches Wissen, und weniger informierte Akteure verwenden sie als „the next-best thing to fully rational decision-making“ (Druckman et al. 2009, S. 9). Sofern sich diese Überlegungen zur Deservingness als Heuristik theoretisch unterfüttern und empirisch belegen lassen, sollten deshalb die Reaktionen auf Deservingness-Signale empirisch eng mit utilitaristischen und wertbasierten Einstellungen und Präferenzen einzelner Proband:innen und mit ihrem sozioökonomischen Kontext korrespondieren (so besonders Gilens 2000; Larsen 2006; van Oorschot 2000b).

In einer Serie von Beiträgen haben Michael Bang Petersen und seine Koautor:innen dieses etablierte Verständnis von Deservingness als heuristisches und kognitives Hilfsmittel bestritten (Petersen et al. 2011; Petersen 2012; Jensen und Petersen 2017). Stattdessen, und aus der Perspektive der modernen politischen Psychologie, seien Reaktionen auf Deservingness-Signale individuelle, schnelle, letztlich „automatische“ Reflexe. Sie erfolgten ohne substanzielles politisches Wissen und völlig unverbunden mit individuellen, subjektspezifischen Erfahrungen, Präferenzen oder Werten (Petersen et al. 2011; Petersen 2012; und allgemeiner Gigerenzer und Todd 2000).

Inhaltlich entwirft Petersen (Petersen et al. 2011, S. 3) die Menschen als „social animals“. Die Bereitschaft, Hilfen für andere bereitzustellen, sei bereits „genetisch“ angelegt und dann sukzessive durch das Leben und die Sozialisation in Kleingruppen weiterentwickelt und weitergegeben worden. Der so konstruierte evolutionäre Prozess greift insbesondere die Reziprozitätsdimension auf und orientiert sich an einer schnell, quasi-automatisch vorgenommenen Charakterisierung von „Betrügern“ oder „Trittbrettfahrern“ auf der einen und an Leistung und Gegenleistung orientierten Partnern auf der anderen Seite. Die Position von Petersen et al. (2011, S. 4) geht auf Argumente der Neurowissenschaften und evolutionären Biologie zurück: „Moreover, according to this hypothesis, the cognitive categories of ‚cheater‘ and ‚reciprocator‘ are parts of our universal species-typical [sic!] psychology“.

Ein Aufschluss, ob Deservingness-Signale als Heuristik oder Automatismus sind, ergibt sich durch die Stabilität von Reaktionen über unterschiedliche Individuen hinweg. Wirken die zugeteilten Treatments zum Beispiel unterschiedlich bei politische informierten und weniger informierten Bürgern, ergibt sich ein deutlicher Hinweis auf ihre heuristische Funktion. Belege für die evolutionspsychologische Perspektive finden sich dagegen immer dann, wenn individuelle Reaktionen auf Deservingness-Signale allgemein und unabhängig sind von persönlichen Erfahrungen, von individuellen Einstellungen und Werten und von den ökonomischen, politischen und sozialen Kontexten verschiedener Nationalstaaten.

Die gerade vorgestellten Überlegungen sind eng verbunden mit der einschlägigen Literatur und begründen unmittelbar die beiden Leitthemen dieses Beitrags: Zunächst präsentieren wir, in einer ländervergleichenden Perspektive, umfangreiches empirisches Material, das den jeweiligen Beitrag subjekt- und objektorientierter Erklärungen für die Begründung von Einstellungen zum Sozialstaat aufzeigt. Zweitens schaffen diese Befunde schaffen eine Grundlage für die analytische und empirische Bewertung von Deservingness als Heuristik oder Automatismus. Eine Interaktion von zugeschriebener Deservingness mit sozialen Eigenschaften der Proband:innen verweist auf die heuristische Bedeutung von Überlegungen zur Deservingness; ihre Abwesenheit verweist dagegen auf einen automatischen Prozess, der über ganz unterschiedliche Individuen und heterogene soziale und ökonomische Kontexte hinweg stabil funktioniert.

2 Umfrageexperiment und Kontrollvariablen

In der achten Welle des European Social Survey von 2016 wurde zum zweiten Mal ein Wohlfahrtsstaatmodul integriert. (Antragsteller waren Wim van Oorschot, Christian Staerklé, Staffan Kumlin, Tim Reeskens und Bart Meuleman.) In diesem Beitrag legen wir eine Sekundäranalyse eines Umfrageexperiments zum Thema Deservingness vor, das in dieses Modul eingebettet war. Dabei werden den Proband:innen stilisierte Beschreibungen von Arbeitslosen vorgelegt, die Jobangebote, also wahrscheinliche Auswege aus der Arbeitslosigkeit, aus drei verschiedenen Motiven ablehnen. Sodann werden die Proband:innen befragt, wie scharf dieses Verhalten sanktioniert werden soll. Der Datensatz des ESS‑8 umfasst mehr als 44.000 Befragte aus den heterogenen institutionellen, ökonomischen, politischen und sozialen Kontexten von 23 europäischen Ländern. Im Folgenden fassen wir die Dimensionen des Umfrageexperiments systematisch zusammen. (Eine vollständige Dokumentation des Datensatzes und der Questionnaires kann auf der Homepage eingesehen werden: https://www.europeansocialsurvey.org; detaillierte Informationen, Daten und Scripts, die eine vollständige Replikation aller hier besprochenen Modelle ermöglichen, haben wir in einem Harvard Dataverse unter einer permanenten Adresse abgelegt: https://doi.org/10.7910/DVN/F2URMI).

2.1 Deservingness-Signale im Umfrageexperiment

Das Umfrageexperiment des ESS‑8 die weist die Proband:innen randomisiert einer von vier Untergruppen zu. Der Konstruktion des experimentellen Designs gemäß sind diese Samples vergleichbar ähnlich und unterscheiden sich nur mit Blick auf die ihnen vorgestellten Treatment-Vignetten. Sie bezeichnen jeweils unterschiedliche charakterisierte Leistungsempfänger:innen, die sich entlang einiger Dimensionen des CARIN-Modells unterscheiden und von den Proband:innen als unterschiedlich hilfsbedürftig und -würdig verstanden werden sollten. In diesem Text bezeichnen wir dieses multivariate Treatment durchgehend mit dem Vektor Tj; \(j\in \{1{,}..{,}4\}\) indiziert die vier verschiedenen Subgruppen/Vignetten:

T1::

Stellen Sie sich eine Person im Alter zwischen 20 und 25 Jahren vor, die arbeitslos ist und eine Stelle sucht. Diese Person war vorher berufstätig, hat ihre Stelle verloren und erhält jetzt Arbeitslosenunterstützung.

T2::

Stellen Sie sich eine Person vor, die arbeitslos ist und eine Stelle sucht. Diese Person war vorher berufstätig, hat ihre Stelle verloren und erhält jetzt Arbeitslosenunterstützung.

T3::

Stellen Sie sich eine Person im Alter zwischen 50 und 60 Jahren vor, die arbeitslos ist und eine Stelle sucht. Diese Person war vorher berufstätig, hat ihre Stelle verloren und erhält jetzt Arbeitslosenunterstützung.

T4::

Stellen Sie sich eine alleinerziehende Person mit einem 3‑jährigen Kind vor, die arbeitslos ist und eine Stelle sucht. Diese Person war vorher berufstätig, hat ihre Stelle verloren und erhält jetzt Arbeitslosenunterstützung.

Durch die vier verschiedenen Vignetten werden Leistungsempfänger:innen mit ganz unterschiedlichen Eigenschaften dargestellt. Diese Charakteristiken können auf die Dimensionen des CARIN-Modells bezogen werden. Sie variieren Angaben zum Alter der arbeitslosen Personen und greifen damit besonders die Dimensionen „Kontrolle“ und „Reziprozität“ heraus. In den meisten europäischen Vergleichsstaaten haben ältere Arbeitslose eine deutlich schlechtere Chance auf die Wiedereingliederung in den Arbeitsmarkt als jüngere („Kontrolle“). Zudem blicken ältere Arbeitslose meist auf eine sehr viel längere Erwerbsbiografie zurück und haben das System sozialer Sicherung, das sie nun in Anspruch nehmen möchten, meist jahrelang mitgetragen und mitfinanziert („Reziprozität“). Mit Blick auf die Dimensionen „Kontrolle“ und „Reziprozität“ erwarten wir im Durchschnitt für eine jüngere Person (T1) harschere und für eine ältere (T3) weniger starke präferierte Sanktionen. Die nur vage spezifizierte Vignette T2 („eine Person“) nimmt schließlich eine Mittelposition ein.

Die vierte Vignette (T4) führt eine neue Dimensionen ein und bezieht sich auf weitere Kriterien des CARIN-Modells: Die Charakteristik eines Elternteils, der allein ein dreijähriges Kind erzieht, verweist zunächst auf eine jüngere Person, und die meisten Befragten werden sich aber an einer alleinerziehenden Mutter orientieren. Weiter sollte eine Alleinerziehende weniger „Kontrolle“ über ihr Erwerbsleben und einen beruflichen Wiedereinstieg haben. Durch die Betreuung eines jungen Kindes spricht die alleinerziehende Person auch die Dimensionen „Reziprozität“ und „Identität“ an. Schließlich sollte eine Alleinerziehende, die auch den Unterhalt des Kindes decken muss, in höherem Maß als andere „bedürftig“ sein. Im Vergleich mit den eben skizzierten Vignetten T1, T2 und T3 spricht T4 so eine höhere Anzahl von Dimensionen des CARIN-Modells an, und sie tut das mit einer höheren Intensität. Deshalb erwarten wir, dass die Befragten in den unterschiedlichen Segmenten des ESS das Niveau an Deservingness etwa in der Reihenfolge der oben skizzierten Kategorien anordnen: \(T_{1}< T_{2}< T_{3}< T_{4}.\)

Im nächsten Schritt besprechen wir die drei unterschiedlichen Kontexte (S), die den Befragten vorgelegt werden. Während die Charakteristik der jeweiligen Personen, die Leistungsansprüche an den Sozialstaat stellen, Teil eines randomisierten Umfrageexperiments ist, wird jede/r Proband:in gebeten, nacheinander Sanktionen für die so charakterisierten Personen über drei verschiedene Situationen hinweg festzulegen. Diese drei Szenarios benennen wir mit Sk und dem Index k ∊ {1, 2, 3}:

S1::

(…) eine Stelle ablehnt, weil sie viel schlechter bezahlt ist als die vorherige?

S2::

(…) eine Stelle ablehnt, weil sie ein viel niedrigeres Bildungs- und Ausbildungsniveau erfordert, als die Person hat?

S3::

(…) sich weigert, als Gegenleistung für die Arbeitslosenunterstützung in ihrer Wohngegend regelmäßig unentgeltliche Arbeit zu leisten?

Anders als bei den vier Vignetten gibt es bei den Situationsbeschreibungen nur wenige theoretische Vorannahmen, und unsere deskriptiven Inferenzen sind hier eher explorativ als deduktiv. Wir können kaum ohne Weiteres postulieren, ob einzelne Proband:innen eher gewillt sind, diejenigen zu sanktionieren, die eine Stelle aufgrund zu geringer Bezahlung oder aufgrund eines zu geringen Anforderungs- und Qualifikationsniveaus ablehnen. Aber auch hier gibt es eine gewisse Heterogenität der beschriebenen Szenarios: S1 und S2 beziehen sich auf (freilich nicht wahrgenommene) Optionen, die Arbeitslosigkeit und die folgende Unterstützungsbedürftigkeit, wenn auch unter unbefriedigenden Bedingungen, zu beenden. Die im Kontext S3 aufgegriffene gemeinnützige Arbeit bietet diese Perspektive gar nicht, sondern bezieht sich eher auf die Dimensionen Reziprozität und Dankbarkeit bei einer fortbestehenden Arbeitslosigkeit.

Schließlich besprechen wir die Messung des Konzepts Deservingness, der abhängigen Variablen (O). Bisherige Umfragen und Umfrageexperimente benutzen eine Reihe von verbundenen, aber konzeptionell und theoretisch durchaus unterschiedlichen abhängigen Variablen: Die ursprüngliche Studie von van Oorschot (2000a) verwendet eine Generositätsskala von eins bis zehn. Die Studie von Buss (2019) bittet die Befragten, für jeden Fall eine „angemessene“ Transfersumme (in Euro) festzulegen. Beim Umfrageexperiment von Reeskens und van der Meer (2019) werden einige vorab definierte Kategorien mit unterschiedlichen Ersatzraten vorgelegt, und in einem weiteren Umfrageexperiment erheben Petersen et al. (2011) auf einer Fünf-Punkte-Skala, ob in vordefinierten Situationen die Konditionalität von Transfers der Arbeitslosenversicherung verschärft werden sollen.

Die im ESS‑8 gewählte Operationalisierung zielt ebenfalls auf den Konditionalitätsaspekt. Für jedes der oben beschriebenen Treatments (T) und für jede der skizzierten Situationen (S) wird eine Ordinalskala (O) vorgestellt, die abgestufte Niveaus an Sanktionen abbildet. Die Bandbreite reicht von der Streichung aller Transferleistungen (O1) über geringere, abgestufte Sanktionen (O2 und O3) bis hin zum Verzicht auf jede Sanktion (O4):

O1::

Diese Person [T1, …, T4] sollte in Situation [S1, S2, S3] weiterhin ihre gesamte Arbeitslosenunterstützung bekommen.

O2::

Diese Person [T1, …, T4] sollte in Situation [S1, S2, S3] einen kleinen Teil ihrer Arbeitslosenunterstützung verlieren.

O3::

Diese Person [T1, …, T4] sollte in Situation [S1, S2, S3] ungefähr die Hälfte ihrer Arbeitslosenunterstützung verlieren.

O4::

Diese Person [T1, …, T4] sollte in Situation [S1, S2, S3] ihre gesamte Arbeitslosenunterstützung verlieren.

Die abhängige Variable O kann durch ein ordinales logistisches Regressionsmodell geschätzt werden, und bei erfolgreicher Randomisierung ergibt sich der multivariate Treatment-Effekt als Regressionskoeffizient T. Für dieses kausale Modell steht ein umfangreicher Datensatz bereit, der gleichermaßen die interne wie die externe Validität des Forschungsdesigns absichert. Insgesamt liegen Beobachtungen für 44.387 Proband:innen vor; über die drei Szenarios hinweg ergibt das mehr als 120.000 einzelne Urteile zur Deservingness stilisierter Leistungsempfänger:innen. Die Proband:innen sind dabei (in Samples von etwa 1500 bis 2000) 23 übergreifenden nationalen Kontexten entnommen: Belgien, Deutschland, Estland, Finnland, Frankreich, Großbritannien, Irland, Island, Israel, Italien, Litauen, den Niederlanden, Norwegen, Österreich, Polen, Portugal, Russland, Slowenien, Spanien, Schweden, der Tschechischen Republik, der Schweiz und Ungarn.

Wir beschließen diese knappe Vorstellung des Umfrageexperiments mit dem deutlichen Hinweis auf zwei besondere Eigenschaften unserer Sekundäranalyse. Zunächst bilden die benutzten Vignetten das im CARIN-Modell abgesteckte Spektrum an Dimensionen nicht vollständig ab: Die vier zufällig zugewiesenen Treatments variieren allein das Alter und den Familienstand stilisierter Leistungsempfänger:innen. Damit greifen sie zum Beispiel die Kriterien Kontrolle, Reziprozität und Bedürftigkeit auf; die Dimensionen Haltung und Identität bleiben jedoch im Grunde ausgeblendet. Das zweite Merkmal betrifft die Konstruktion der abhängigen Variablen. Während die meisten einschlägigen Studien auf die allgemeine „Bedürftigkeit“ stilisierter Leistungsempfänger:innen eingehen, erheben die Questionnaires die spezifische Bereitschaft, die Ablehnung von Job-Angeboten auch mit tatsächlichen Leistungskürzungen, also Sanktionen, zu belegen. Weitere Hinweise zum Umfrageexperiment und Wohlfahrtsstaatsmodul des ESS‑8.

2.2 Subjektspezifische Kontrollvariablen des Umfrageexperiments

Im nächsten Schritt diskutieren wir subjektspezifische Moderator- oder Kontrollvariablen. Bei zufälliger Zuweisung der multivariaten Treatments (T1, …, T4) und erfolgreicher Randomisierung sind Kontrollvariablen per se für die Bestimmung unverzerrter Effektparameter nicht unbedingt erforderlich. Dennoch ermöglicht ihre Berücksichtigung, die jeweiligen Treatment-Effekte präziser und eingebettet in ihre jeweiligen sozioökonomischen Kontexte zu schätzen. Zudem ist die Bezugnahme auf diese Kontrollvariablen, die jeweils für einen theoretisch verankerten Erklärungsansatz stehen, nicht nur eine notwendige Voraussetzung für den Vergleich von subjekt- und objektspezifischen Erklärungsansätzen, sondern zentrale Kriterien für die analytische Unterscheidung und empirische Differenzierung heuristischer oder automatischer Effekte von Deservingness-Signalen.

2.2.1 Sozioökonomischer Hintergrund und individuelles Eigeninteresse

Unabhängige Variablen, die den jeweiligen sozioökonomischen Hintergrund einer/s Befragten erheben und eine Ableitung seines materiellen Eigeninteresses ermöglichen, gehören seit jeher zum etablierten Set von Erklärungsfaktoren für individuelle Einstellungen zum Sozialstaat (vgl. Blekesaune and Quadagno 2003; Bobo 1991; Groskind 1994; Hasenfeld and Rafferty 1989; Margalit 2013; Rehm 2009, 2011, 2016; Rueda und Pontusson 2010).

Einkommen

Einschlägige Studien haben herausgearbeitet, dass Personen mit hohem Einkommen regelmäßig gegenüber dem Sozialstaat tendenziell weniger positiv eigestellt sind. Besserverdiener:innen bringen meist einen hohen Anteil der Steuern und Sozialabgaben auf, sie nehmen aus utilitaristischer Perspektive oft an, niemals selbst bedürftig zu werden, und sie haben in der Regel wenig oder keine Interaktionen mit Menschen, die in Armut leben. Somit mindert ein hohes Einkommen sowohl das materielle Eigeninteresse am Sozialstaat wie auch die Fähigkeit und Bereitschaft, sich mit denjenigen, die auf Transfers angewiesen sind, zu befassen und zu identifizieren (Beramendi und Rehm 2016; Hasenfeld und Rafferty 1989; Svallfors 1997, 2004; Svallfors et al. 2012).

Risiko

Eine weitere, eng verbundene Dimension des materiellen Eigeninteresses bezieht sich auf das (wahrgenommene) Risiko am Arbeitsmarkt. Befragte, die in der Vergangenheit arbeitslos und auf soziale Transfers angewiesen waren, sollten umfassende und nicht an bestimmte Vorbedingungen gekoppelte Sozialleistungen nachhaltiger als andere unterstützen. Gleichermaßen sollten, in die Zukunft gewendet, Personen, die sich um den Verlust ihres Arbeitsplatzes sorgen und befürchten, soziale Unterstützung zu benötigen, ein hohes Maß an sozialem Schutz befürworten und (scharfe) Sanktionen ablehnen. Über ein eng gefasstes materielles Eigeninteresse hinaus sollten auf der gesellschaftlichen Ebene wahrgenommene Arbeitsmarktrisiken vielen ermöglichen, sich mit denjenigen zu identifizieren, die in der Folge auf Sozialleistungen angewiesen sind (van Oorschot und Meuleman 2012; Rehm 2009, 2011, 2016; Svallfors et al. 2012).

Der ESS‑8 greift diese Zusammenhänge durch zwei Dummy-Variablen auf, die abfragen, ob ein/e Proband:in in der Vergangenheit arbeitslos war oder gegenwärtig keine Beschäftigung hat. Darüber hinaus wird das subjektiv wahrgenommene Arbeitsmarktrisiko mit der Aussicht, selbst in Zukunft arbeitslos zu werden, auf einer Likert-Skala mit vier geordneten Kategorien erhoben (von „überhaupt nicht“ bis „sehr wahrscheinlich“).

2.2.2 Individuelle Einstellungen und Präferenzen

Die generelle ideologische Orientierung einer Person, ihre Prioritäten und Präferenzen in bestimmten Politikfeldern bestimmen Einstellungen zum Sozialstaat.

Allgemeine politische Orientierungen

Befragte, die sich auf der politischen Linken verorten, unterstützen meist die Regulierung von Arbeitsmärkten und die Absicherung von Arbeitsmarktrisiken durch umfassende und weitgehend voraussetzungsfrei Systeme sozialer Sicherung. Anders gewendet betrachten Akteure auf der ökonomischen Rechten vergleichsweise hohe und nahezu bedingungslos gewährte Unterstützungsleistungen oft als ein Hindernis für die Funktion des Arbeitsmarkts, und soziale Konservative sorgen sich um die inhaltliche Berechtigung von Ansprüchen auf soziale Transfers, die Inaktivierung von Unterstützungsempfänger:innen und sogar ihre moralische Versuchung oder Verwahrlosung („moral hazard“) durch bedingungslos gewährte Unterstützung (vgl. Andreß und Heien 2001; Bobo 1991; Blekesaune und Quadagno 2003; Feldman und Steenbergen 2001; Gërxhani und Koster 2012; Hasenfeld und Rafferty 1989).

Im ESS‑8 wird die allgemeine ideologische Orientierung auf einer eindimensionalen Skala von null („links“) bis zehn („rechts“) erhoben.

Spezifische Einstellungen zum Sozialstaat

Bewertungen, Einstellungen und Präferenzen zum Sozialstaat sind oft ein komplexer, vieldimensionaler Gegenstand. Ihre Erhebung in einfachen Befragungen wird zudem oft erschwert durch unklare kausale Beziehungen zwischen diesen Dimensionen und ihre endogene Einbettung in soziale Hintergründe und ihre Interaktionen mit dem materiellen Eigeninteresse der Befragten und generellen ideologischen Orientierungen. Einzelne Aspekte beziehen sich zum Beispiel auf die Kosten des Sozialstaats für einzelne Bürger:innen oder für Wirtschaftsbetriebe, die wahrgenommene Schwächung von Zusammenhalt oder Subsistenznetzwerken innerhalb der Gesellschaft oder sogar auf die Furcht vor dem Verlust von Arbeitsanreizen, der Inaktivierung arbeitsfähiger Menschen und sogar der Ausbreitung von „Anspruchsdenken“ und/oder „Faulheit“ (vgl. besonders Gilens 2000). Alternative Aussagen stellen dagegen besonders den Nutzen sozialer Sicherung für die Herstellung und Bewahrung gesellschaftlichen Zusammenlebens und Zusammenhalts, die Bewahrung einer mindestens tendenziell egalitären Gesellschaft heraus oder betonen ihre Rolle im Kampf gegen Armut und soziale Desintegration.

Das im ESS‑8 eingebettete Sozialstaatsmodul deckt eine ganze Bandbreite von Statements ab, die genau diese Dimensionen erfassen. Die Befragten werden gebeten, auf einer Skala von eins („stimme vollständig zu“) bis fünf („lehne vollständig ab“) ihre jeweiligen Präferenzen abzutragen. Die inhaltlichen Dimensionen beziehen sich darauf, (1) ob soziale Leistungen schlicht zu teuer sind, (2) ob sie zu einer egalitären Gesellschaft beitragen, (3) ob sie Menschen „faul“ machen, (4) ob sie die Bereitschaft der Menschen, sich subsidiär um andere zu kümmern, mindern, (5) ob sie einen sinnvollen Beitrag zur Armutsbekämpfung leisten oder (6) ob sie eine übergroße Belastung für die Wirtschaft bedeuten.

2.2.3 Demografische Hintergrundvariablen

Im Rahmen des ESS‑8 wird eine Reihe von demografischen Kontrollvariablen erhoben. Mit Blick auf die Rolle demografischer Eigenschaften bei der Herausbildung von Einstellungen und Präferenzen zum Sozialstaat hat sich die Forschung besonders auf das Alter und Geschlecht der Befragten konzentriert: Bisherige Studien haben gezeigt, dass Frauen konsistent ein höheres Niveau an sozialem Schutz befürworten und weniger bereit sind, wahrgenommenes „Fehlverhalten“ (scharf) zu sanktionieren. Das Geschlecht der Befragten wird im ESS‑8 durch eine binäre Dummy-Variable abgebildet. Die empirische Forschung hat auch die Altersdimension aufgegriffen und nachvollzogen, dass die Urteile älterer Befragter oft rigider sind, dass sie eher bereit sind, wahrgenommenes Fehlverhalten zu sanktionieren, dass sie andere Dimensionen herausheben als diejenigen, die noch im Erwerbsleben stehen, und dass sie die Reziprozitätsdimension, wie im ursprünglichen Konzept von van Oorschot (2000a) abgebildet, deutlich höher gewichten. In dieser Analyse verwenden wir einen Altersindikator mit vier Kategorien: von 15–29, von 30–44, von 45–65 und jenseits von 65 Jahren.

2.2.4 Kontext auf der Länderebene

Einstellungen zum Sozialstaat und Reaktionen auf die Ansprüche stilisierter Leistungsempfänger:innen sind in die jeweiligen Traditionen und in die historischen, politischen, kulturellen, ökonomischen und sozialen Kontexte der Vergleichsstaaten eingebettet. Wie sehr diese Prägung die Bereitschaft beeinflusst, bestimmte Transferempfänger:innen in bestimmten Situationen zu sanktionieren, hängt auch von der Wirksamkeit von Deservingness-Signalen als Heuristik oder als Automatismus ab. Einschlägige empirische Analysen haben zum Beispiel sehr robust gezeigt, dass Menschen, die in residualen Wohlfahrtsstaaten leben und sich dort der politischen Rechten zuordnen, sehr wahrscheinlich Empfänger:innen von Transferleistungen grosso modo als „faul“ etikettieren, mindestens die strikte Konditionalität von Transfers fordern und bereit sind, harsch zu sanktionieren (vgl. Gilens 2000; Larsen 2006; Petersen et al. 2011; Skitka und Tetlock 1993).

Übliche Prädiktoren auf der Makroebene der Vergleichsstaaten sind somit besonders die jeweilige sozioökonomische Lage, die soziale Polarisierung und Segmentierung der jeweiligen Gesellschaft, die Leistungsfähigkeit der Sozialsysteme, die Qualität und Quantität sozialer Probleme am Arbeitsmarkt und darüber hinaus die jeweilige Konstruktion, Zugänglichkeit und Generosität von Systemen sozialer Sicherheit.

Die Vergleichsstaaten des ESS‑8 sind in diesen Kontextvariablen jedoch recht ähnlich. Dies bedingen gleichermaßen der zunehmende Homogenitätsdruck der internationalen Ebene, der wirtschaftliche Wettbewerb und, in den meisten Fällen, die Mitgliedschaft in der Europäischen Union. Die Systeme sozialer Sicherung unterscheiden sich teils deutlich in ihrer Konstruktion, die gewährten Leistungen ähneln einander aber immer mehr, und keiner der Vergleichsstaaten hat einen im strikten Sinn nur noch residualen Sozialstaat implementiert (vgl. z. B. Böger und Öktem 2019).

2.3 Datenstrukturen und Datenanalyse

Die Komplexität der Datenstruktur leitet die empirische Datenanalyse an und begründet die Auswahl vergleichsweise komplexer Schätztechniken. Die Ergebnisvariable (O) beschreibt eine Reihe abgestufter Sanktionen. Sie wird auf einer Ordinalskala abgetragen und mit vier geordneten, kategorialen Ausprägungen von O1 bis O4 operationalisiert. Die multivariate Treatment-Variable bezeichnet eine Reihe von vier zufällig zugewiesenen Vignetten (T), die das Alter (T1 und T3) und den Familienstatus (T4) von Leistungsempfänger:innen variieren. Die nur vage spezifizierte Vignette (T2) dient dabei als Referenzkategorie. Vollständig spezifizierte Modelle schließen weiter eine Prädiktormatrix (X) mit individuellen Eigenschaften der Befragten und eine Batterie von Kontextvariablen (Z) auf der jeweils nationalen Ebene mit ein.

Die Komplexität und die hierarchischen Strukturen des Datenmaterials entstehen, weil jeder der 44.387 Befragten einer einzigen Vignette (T) zufällig zugeordnet wird, sie jedoch über drei verschiedene Situationen (S) und 23 nationalen Kontexten (C) hinweg evaluiert. Der Datensatz umfasst damit 133.161 einzelne Urteile zur Deservingness stilisierter Leistungsempfänger:innen. Jede/r einzelne Befragte ist in übergreifende staatliche Strukturen integriert und geprägt von ökonomischen, politischen, sozialen und kulturellen Kontexten (C); dies begründet ein hierarchisches Mehrebenenmodell mit individueller und nationaler Ebene. Freilich schlägt jede/r Befragte in jedem nationalen Segment des ESS‑8 für jedes der drei stilisierten Szenarien bestimmte Sanktionen vor (O); diese Ebenen sind deshalb nicht hierarchisch organisiert, sondern sie stehen in einem gekreuzten Verhältnis. In statistischen Mehrebenenmodellen wird die Kontextheterogenität durch die Modellierung von variablen Konstanten (Random Intercepts) auf der Individual- und Länderebene und durch variable Koeffizienten (Random Slopes) für die multivariaten Treatments (T1, T3 und T4) aufgegriffen.

Eine ordinalskalierte Variable kann durch „cumulative link models“ analysiert werden (Agresti 2019). Dieses Schätzverfahren konstruiert die vier abgestuften, wählbaren Sanktionsgrade O von O1 bis zu O4 als Funktionen einer unbeobachteten Variable \(\overline{\boldsymbol{O}}\), die substanziell die Wahrscheinlichkeit angibt, mit steigenden Werten von \(\overline{\boldsymbol{O}}\), stetig geringere Grade an Deservingness, schärfere Konditionalität oder schärfere Sanktionen O vorzuschlagen. Bei vier Kategorien einer Likert-Skala wird die Kategorisierung durch die Schwellenwerte τc dargestellt, und die Wahrscheinlichkeit, eine Kategorie c zu wählen, ergibt sich durch:

$$\Pr \left(O=c\right)=F\left(\tau _{c}\right)-F\left(\tau _{c-1}\right)$$

Sodann kann die latente Variable \(\overline{\boldsymbol{O}}\) durch einen linearen Prädiktor η abgeleitet werden, der die jeweils zugeordnete Vignette (T), variable Konstanten für Situations- (S) und Länderkontexte (C) und, bei vollständig spezifizierten Modellen, die beobachteten Kontrollvariablen X berücksichtigt. Zudem modellieren wir variable Regressionskoeffizienten für die drei Treatment-Variablen auf der Situations- und Länderebene:

$$\overline{\mathbf{O}}\left[\mathbf{S}\right]=\eta +\epsilon =\mathbf{\theta }\mathbf{T}+\mathbf{\alpha }\boldsymbol{S}+\mathbf{\beta }\boldsymbol{X}+\mathbf{\gamma }\boldsymbol{C}+\epsilon$$

Damit ergibt sich die Wahrscheinlichkeit, dass ein/e Proband:in eine der vier vorgegebenen Antworten wählt, durch:

$$\Pr \left(\mathbf{O}[\mathbf{S}]=c\right)=\Phi \left[\tau _{c}-\left(\mathbf{\theta }\boldsymbol{T}+\mathbf{\alpha }\boldsymbol{S}+\mathbf{\beta }\boldsymbol{X}\right)\right]-\Phi \left[\tau _{c-1}-\left(\mathbf{\alpha }\mathbf{S}+\mathbf{\theta }\boldsymbol{T}+\mathbf{\beta }\boldsymbol{X}+\mathbf{\gamma }\boldsymbol{C}\right)\right]$$

3 Die politischen Konsequenzen zugeschriebener Deservingness

Wir beginnen die Vorstellung des empirischen Materials mit einigen einfachen, deskriptiven Befunden. Konkret präsentieren wir die relativen Häufigkeiten vorgeschlagener Sanktionen über die einzelnen Treatment-Vignetten T, die Situationskontexte S und die heterogenen sozioökonomischen Umgebungen der Länder C. Über alle diese Kontexte hinweg meinen 27,4 % der Proband:innen, dass den Leistungsempfänger:innen alle Unterstützung entzogen werden sollte (O1), 31,7 % möchten die Hälfte der bislang gewährten Unterstützung streichen (O2). Die verbleibenden 19,7 bzw. 21,2 % finden, dass Leistungsempfänger:innen nur einen kleinen Teil (O3) oder gar keine Unterstützungsleistungen verlieren sollten (O4).

Abb. 1 greift die Effekte der zufällig zugewiesenen Vignetten (T) auf. Bei einer erfolgreichen Randomisierung zeigen diese Unterschiede direkt die (durchschnittlichen) Treatment-Effekte an, und sie können auch ohne die Berücksichtigung von Kontrollvariablen in einem randomisierten Zufallsexperiment interpretiert werden. Die Häufigkeitsverteilungen zeigen, dass mehr als 21 % der Proband:innen bereit sind, jungen Arbeitslosen (T1), die ein Stellenangebot als zu gering bezahlt (S1) ablehnen, sämtliche Transferleistungen zu streichen (O1). Bei einem alleinerziehenden Elternteil (T4) sind dagegen nur weniger als 14 % bereit, ähnlich harsch zu sanktionieren. Anders gewendet schlagen bei den jungen Leistungsempfänger:innen nur 23 % der Befragten vor, die Transfers in voller Höhe weiterzuzahlen; bei Alleinerziehenden sind immerhin 35 % der Proband:innen dazu bereit. Die nur vage spezifizierte Referenzperson (T2) und eine ältere, arbeitslose Person (T3) stehen jeweils zwischen diesen Extremen.

Abb. 1
figure 1

Beschreibung multivariater Treatments in drei Situationskontexten. Deskriptive Statistiken von Sanktionen (O), gegliedert nach Treatment-Vignetten (T) und Situationskontext (S). In dieser Abbildung werden die Länderkontexte ausgeblendet

Auf der nächsten Ebene des Datensatzes zeigt ein Vergleich der drei stilisierten Szenarios (S), dass diese Hierarchie bei der Sanktionierung von Leistungsempfänger:innen über diese verschiedenen Situationen hinweg jeweils robust erhalten bleibt: \(T_{1}> T_{2}> T_{3}> T_{4}\). Die Effektstärke aber unterscheidet sich. Im Durchschnitt sind die Proband:innen viel eher bereit, diejenigen (schärfer) zu sanktionieren, die ein Stellenangebot wegen geringerer Entlohnung ablehnen (S1), als diejenigen, die sich dabei auf ein wesentlich geringeres Anforderungs- und Qualifikationsprofil berufen (S2). Die Ablehnung von gemeinnütziger Arbeit nimmt dabei eine Mittelstellung ein (S3). Wenn wir (zunächst) die Länderdifferenzen ausblenden, sehen wir starke Zusammenhänge der über die einzelnen Situationskontexte hinweg gesetzten Sanktionen. Von den mehr als 40.000 Proband:innen schlagen etwa 34 % identische Reaktionen vor, egal ob jemand ein Stellenangebot aufgrund der Bezahlung oder aufgrund des Anforderungsprofils nicht wahrnimmt oder sich weigert, als Gegenleistung für Transfers gemeinnützig zu arbeiten. Über die Szenarios (S) hinweg schwankt die Spearman’s Rangkorrelation zwischen \(\rho \left(S_{1}{,}S_{3}\right)=0{,}46\) und \(\rho \left(S_{1}{,}S_{2}\right)=0{,}68\).

Abb. 2 arbeitet die substanziellen Differenzen über die heterogenen politischen, ökonomischen und sozialen Kontexte der 23 Vergleichsstaaten heraus (C). Bereits eine oberflächliche Inspektion der Häufigkeitsverteilungen zeigt, dass sich die Bereitschaft, Leistungsempfänger:innen in der Arbeitslosenversicherung zu sanktionieren, unter den Ländern des ESS‑8 stark unterscheidet. Vergleichsweise harsche Einschnitte für diejenigen, die Beschäftigungsangebote ablehnen, fordern im Durchschnitt Proband:innen aus Italien, Norwegen, Polen, Spanien oder Slowenien. Am anderen Ende des Spektrums stehen zum Beispiel Deutschland, Litauen und Russland mit im Durchschnitt vergleichsweise milderen Sanktionsforderungen der Befragten.

Abb. 2
figure 2

Beschreibung multivariater Treatments in 23 Länderkontexten. Deskriptive Statistiken von Sanktionen (O), gegliedert nach Treatment-Vignetten (T) und Länderkontext (C). In dieser Abbildung werden die Situationskontexte (S) ausgeblendet. Replikationsmaterialien sind im Dataverse dokumentiert: https://doi.org/10.7910/DVN/F2URMI

Die folgenden Analysen greifen die gesamte Komplexität des Datenmaterials auf und bestimmen die Effekte der vier verschiedenen Vignetten (T) mit Beschreibungen der Leistungsempfänger:innen, die Wirkungen der drei stilisierten Szenarios (S) und der 23 heterogenen Länderkontexte des ESS‑8 (C). Dazu verwenden wir die bereits eingeführten ordinalen Mehrebenenmodelle. Die Ergebnisvariable sind die für die jeweilige Situation vorgeschlagenen Sanktionen Os, und die einzige Prädiktorvariable ist der Vektor unterschiedlicher Treatment-Vignetten T4. (Hier und im Folgenden verwenden wir die vage spezifizierte Vignette T2 als Referenzkategorie.) Wir spezifizieren zudem Random Intercepts für die Konstante und Random Slopes für jeden der drei binären Treatment-Indikatoren T1, T3 und T4. Für die Parameterschätzung verwenden wir ein bayesianisches Mehrebenenmodell, wir setzen gering informative Prioriverteilungen, und wir spezifizieren vier parallele Ketten mit jeweils N = 5,000 Iterationen in Stan. Um einen zusätzlichen Test auf die Reliabilität und Robustheit der Befunde zu konstruieren, haben wir uns entschieden, für jedes der drei Kontextszenarien S1,S2 und S3 ein separates Mehrebenenmodell zu schätzen. Diese Modelle konvergieren problemlos und werden durch die etablierten Tests auf Autokorrelation („bulk“ und „effective samples sizes“ sind jeweils mindestens > 5,000), Nicht-Stationarität (Geweke- und Heidelberger-Welch-Tests) und Durchmischung der Ketten gestützt (\(\hat{R}\approx 1{,}00\)); die Teststatistiken, konventionelle, tabellarische Darstellungen der Ergebnisse und weitere Replikationsmaterialien sind online dokumentiert: https://doi.org/10.7910/DVN/F2URMI.

Abb. 3 stellt gleichzeitig die vier Vignetten (T), die drei Situationskoeffizienten (S) und die 23 Länderkontexte (C) des Umfrageexperiments dar; insgesamt geht es dabei um 276 Effekte von Deservingness-Signalen. Die Grafiken zeigen für jedes einzelne Land die in einem bayesianischen Mehrebenenmodell bestimmten Effektparameter für die binären Treatment-Variablen T1, T3 und T4; die vage spezifizierte Vignette T2 wird erneut als Referenzkategorie verwendet. Diese Modelle werden wie vorher separat für die drei Situationskontexte S geschätzt. Sie schließen variable Konstanten und variable Effektparameter für T1, T3 und T4 auf der Länderebene ein. Da die abhängige Variable O von keinen bis hin zu maximalen Sanktionen geordnet ist, zeigen, im Vergleich zur Referenzkategorie T2, negative Werte eine geringere und positive Werte eine höhere Sanktionsbereitschaft an.

Abb. 3
figure 3

Effekte multivariater Treatments in 3 Situations- und 23 Länderkontexten. Diese Abbildung berichtet die Regressionskoeffizienten für drei separat geschätzte lineare Mehrebenenmodelle der Situationskontexte S1, S2 und S3. Die abhängige Variable greift zunehmend scharfe Sanktionen von O1 bis hin zu O4 auf. Die linearen Koeffizienten kennzeichnen die binären Treatment-Effekte für die Vignetten T1, T3 und T4, und die unspezifizierte Vignette T2 wird erneut als Referenzkategorie benutzt. Die Punktmarkierungen tragen die ermittelten Regressionskoeffizienten θ ab, und die horizontalen Linien bezeichnen das bayesianische HPD-Intervall (95 %). Tabellarische Darstellungen der drei linearen Mehrebenenmodelle sind im Dataverse dokumentiert: https://doi.org/10.7910/DVN/F2URMI

Unsere Analyse bestätigt wesentliche Befunde vorhergehender theoretischer und empirischer Arbeiten zum Deservingness-Konzept (vgl. van Oorschot 2000a; Petersen 2012). Über alle Länder- und Situationskontexte hinaus wirken Vorstellungen zur Deservingness, abgebildet durch die zufällig zugewiesenen Vignetten, die jeweils Alter und Familienstatus variieren, auf die Bereitschaft, mehr oder weniger scharfe Sanktionen auszusprechen. Über beinahe alle stilisierten Situationen und Länder hinweg sind die Befragten eher bereit, jüngere Arbeitslose zu sanktionieren, ältere Arbeitslose und alleinerziehende Eltern werden dagegen tendenziell „geschont“. Die Schärfe der Sanktionen verläuft, entgegen der zugeschriebenen Deservingness, in der theoretisch begründeten Reihenfolge \(T_{1}> T_{2}> T_{3}> T_{4}\).

Erneut sind die statistischen Befunde zur Wirksamkeit der Treatment-Effekte über die Situations- und Länderkontexte, valide, stabil und sehr robust. Allein in Portugal oder Spanien, den beiden Vergleichsstaaten, die besonders deutlich und bereits seit einer besonders langen Zeit von hoher Jugendarbeitslosigkeit geprägt sind, wird die postulierte Reihenfolge durchbrochen. Bei diesen besonderen Kontexten überwiegt die Deservingness junger teils jene älterer Arbeitsloser. Mit Blick auf die von van Oorschot (2000a) skizzierten Dimensionen wirkt hier besonders die Dimension Kontrolle: Jugendliche in diesen beiden Ländern haben es nicht mehr selbst in der Hand, für ihren Erfolg auf dem Arbeitsmarkt zu sorgen.

4 Effektstärken, Heuristik oder Automatik?

Die bisher besprochenen statistischen Auswertungen haben allein bivariate Zusammenhänge von experimentellen Treatments T und Sanktionsbereitschaft O und die robuste Wirkung von Deservingness-Signalen herausgestellt. Das ordinale Skalenniveau der Ergebnisvariable verkompliziert jedoch eine genauere Abschätzung der Effektstärken und den systematischen Vergleich von Treatment-Variablen (T), Kontrollvariablen (X) und ihren Interaktionseffekten (TX). In diesem Abschnitt führen wir die Datenanalyse fort und konzentrieren uns auf drei Aspekte: Erstens transformieren wir die abhängige Variable und bestimmen die konkrete Effektstärke. Im zweiten Schritt nehmen wir die bereits diskutierten individualspezifischen Erklärungsfaktoren hinzu, und im dritten Schritt prüfen wir, ob die Effekte der Deservingness-Signale abhängig oder unabhängig von diesen alternativen Ansätzen funktionieren.

4.1 Die Stärke der Treatment-Effekte

Die Assoziation von multivariaten Treatments mit kategorialen abhängigen Variablen ist nicht immer einfach interpretierbar. Wie bereits dargestellt, können die Regressionskoeffizienten aus nicht-linearen Modellen nicht umstandslos als Effektstärken verstanden werden. Eine Konversion von Regressionskoeffizienten in vorhergesagte Wahrscheinlichkeiten für jede einzelne Kategorie der Ergebnisvariable O würde dagegen so viele Effektparameter erzeugen, dass diese Vielfalt an Befunden kaum noch anschaulich darstell- und interpretierbar wäre.

Wir greifen deshalb hier zu einer einfachen Transformation, um die ordinalskalierte Ergebnisvariable O in eine quasi-metrische Variable \(\boldsymbol{O'}\) zu verwandeln, die mit einfachen, leichter interpretierbaren linearen Modellen abgebildet werden kann. Die neue abhängige Variable \(\boldsymbol{O'}\) gibt dabei ansteigende Sanktionen, absteigende Zuschreibungen an Deservingness und den Prozentsatz der gestrichenen Transferleistungen an. Mit Blick auf die Extreme O1 („Erhalt aller Leistungen“) und O4 („Streichung aller Leistungen“) liegen diese Übersetzungen bei \(O'_{1}=0{\%}\) und \(O'_{4}=100{\%}\). Bei O3 („Verlust der Hälfte der Leistung“) beträgt per definitionem \(O'_{3}=50{\%}\). Allein bei der verbleibenden Kategorie O2 („Verlust eines kleinen Teils der Leistungen“) ist die Transformation etwas weniger genau spezifiziert, und wir definieren \(O'_{2}=25{\%}\). Diese Umformungen definieren die metrische und inhaltlich interpretierbare Ergebnisvariable, die freilich nur vier verschiedene Ausprägungen annehmen kann und auf das Intervall von null bis hundert Prozent begrenzt ist (\(\boldsymbol{O'}\in \{0{\%}{,}25{\%}{,}50{\%}{,}100{\%}\}\)).

Wenn wir die kategoriale abhängige Variable O durch ihr metrisches Äquivalent \(\boldsymbol{O'}\) ersetzen, vereinfachen sich sowohl die Schätzung als auch die Interpretation der Effektparameter. Die metrisch transformierte abhängige Variable \(\boldsymbol{O'}\) kann dann mit einen einfachen linearen Mehrebenenmodell geschätzt werden, und die linearen Regressionskoeffizienten θ der vier alternativen Treatments T sind sofort als Effektparameter interpretierbar. Sie geben an, um wie viele Prozentpunkte sich die durchschnittliche Sanktion verändert, wenn einer/m Proband:in die alternativ die experimentellen Treatments T1, T2, T3 oder T4 zugewiesen werden. Zudem enthalten die Modelle noch eine Matrix von beobachteten, individualspezifischen Prädiktoren X, und der Koeffizientenvektor β ist ganz analog als jeweilige Effektstärke interpretierbar:

$$O'=N\left(\boldsymbol{T}{,}\boldsymbol{X}| \upalpha {,}\mathbf{\theta }{,}\sigma ^{2}\right)=f_{N}\left(\upalpha +\mathbf{\theta }\boldsymbol{T}{,}\sigma ^{2}\right)=f_{N}(\alpha _{l\left[s\right]}+\boldsymbol{\theta }_{\boldsymbol{l}\left[\boldsymbol{s}\right]}\boldsymbol{T}{{,}\sigma }_{l\left[s\right]}^{2})$$
$$\alpha _{l[s]}\sim f_{N}\left(\varphi _{\alpha {,}0}+\varphi _{\alpha {,}1}\eta _{\alpha }{,}{\delta }_{\alpha }^{2}\right)$$
$$\boldsymbol{\theta }_{l[s]}\sim f_{N}\left(\boldsymbol{\varphi }_{\theta {,}0}+\boldsymbol{\varphi }_{\theta {,}1}\boldsymbol{\eta }_{\theta }{,}{\delta }_{\theta }^{2}\right)$$

Abb. 4 fasst die Befunde vollständig spezifizierter Modelle grafisch zusammen. Erneut haben wir für jedes Szenario S ein separates Mehrebenenmodell geschätzt. Positive Koeffizienten, jenseits der gepunkteten Linien, verweisen auf zunehmende Sanktionsbereitschaft, negative zeigen eine abnehmende Sanktionsbereitschaft an. Die in den drei Teilbildern abgetragenen Koeffizienten können, nach der Transformation zu einem linearen Modell, als direkte Effekte interpretiert werden. (Tabellarische Darstellungen der drei linearen Mehrebenenmodelle sind online im Dataverse dokumentiert.).

Abb. 4
figure 4

Effekte individualspezifischer Kontrollvariablen in 3 Situationskontexten. Diese Abbildung berichtet die Regressionskoeffizienten/Effekte objekt- und subjektorientierter Prädiktoren für drei separat geschätzte lineare Mehrebenenmodelle der Situationskontexte S1, S2 und S3. Die Punktmarkierungen tragen die ermittelten Regressionskoeffizienten θ ab, und die horizontalen Linien bezeichnen das bayesianische HPD-Intervall (95 %). Tabellarische Darstellungen der drei linearen Mehrebenenmodelle sind online im Dataverse dokumentiert: https://doi.org/10.7910/DVN/F2URMI

Die Hinzunahme von Kontrollvariablen verändert die Präsenz, die Muster und die Stärke der Treatment-Effekte nicht. Besonders, wenn Stellenangebote als „zu gering bezahlt“ abgelehnt werden (S1), sind die Unterschiede zwischen den vier Vignetten besonders ausgeprägt. Im Vergleich zur vage spezifizierten Basiskategorie (T2) wird bei jüngeren Leistungsempfänger:innen im Durchschnitt die Streichung weiterer 2,7 % an Sozialleistungen gewählt. Bei alleinerziehenden Eltern dagegen werden 7,4 % weniger an Leistungskürzungen gefordert. Die Spanne von der geringsten (T1) bis zur höchsten zugeschriebenen Deservingness (T4) beträgt somit mehr als zehn Prozentpunkte. Ein Blick auf die beiden anderen Szenarios (S1 und S2) zeigt jedoch, dass die Spannweite zwischen den einzelnen Vignetten hier um einiges geringer ist. Lehnt jemand eine angebotene Stelle aufgrund eines zu geringen Anforderungsniveaus ab, liegt sie bei nur noch knapp vier Prozentpunkten, und weigert sich jemand, gemeinnützige Arbeit als Gegenleistung für soziale Transfers zu leisten, beträgt die maximale Differenz etwa 5,7 Prozentpunkte.

Wir beginnen die Diskussion der individualspezifischen Prädiktoren mit demografischen Hintergrundvariablen. Über die Vergleichsstaaten hinweg hat das Alter der Befragten kaum einen Einfluss auf ihre Vorstellungen zur Deservingness. Die Bereitschaft, Sanktionen zu verhängen, ist nur in zwei der Szenarios (S1 und S2) marginal erhöht. Gleichermaßen, und etwas im Kontrast zu theoretischen Annahmen und dem etablierten Forschungsstand, sind Frauen über alle Szenarios hinweg eher bereit, (harschere) Sanktionen zu verhängen. Befragte mit höherem Einkommen bevorzugen schärfere, Menschen mit höherer Bildung schlagen dagegen mildere Sanktionen vor.

Die Befunde der drei linearen Mehrebenenmodelle betonen besonders die Konsequenzen des (materiellen) Eigeninteresses: Befragte, die gegenwärtig arbeitslos sind, früher arbeitslos waren oder sich um zukünftige Arbeitslosigkeit sorgen, wählen regelmäßig sehr viel mildere Sanktionen. Zum Beispiel geben die Befragten ihre subjektiv wahrgenommene Wahrscheinlichkeit, innerhalb der nächsten zwölf Monate arbeitslos zu werden, auf einer Vier-Punkte-Skala an. Der Unterschied zwischen der geringsten („überhaupt nicht wahrscheinlich“) und der höchsten Kategorie („sehr wahrscheinlich“) beträgt über alle Situations- und Länderkontexte hinweg etwa acht Prozentpunkte auf der transformierten abhängigen Variablen (\(\boldsymbol{O'}\)).

Im nächsten Schritt diskutieren wir die Auswirkungen allgemeiner Einstellungen, Präferenzen und Werte: Befragte, die sich links der Mitte einordnen, sind durchgehend eher bereit, den skizzierten Individuen soziale Transfers zu gewähren und auf (harte) Sanktionen zu verzichten. Bei anderen gesellschaftspolitischen Variablen, die etwa gesellschaftliche Kohäsion oder Sozialkapital messen, sind die Befunde jedoch weniger stark. Ob jemand seine Mitmenschen für fair oder hilfsbereit hält oder ob er ihnen Vertrauen entgegenbringt, hat keine oder mindestens keine substanziell relevanten Effekte auf die Ergebnisvariable \(\boldsymbol{O}\mathbf{'}\).

Wir schließen die Diskussion individualspezifischer Prädiktoren mit einer Batterie von einzelnen Fragen, die spezifisch auf Einstellungen zum Sozialstaat zielen. Die Einstellung eines Befragten zum Sozialstaat ist meist eng mit den Sanktionen verbunden, die beim (realen oder vermeintlichen) Verstoß gegen seine Grundsätze und Regeln gefordert werden. Prädiktoren aus diesem Bereich haben deshalb gleichermaßen die geringste substanzielle Erklärungskraft und sind zudem durch erhebliche Endogenitätsprobleme belastet. Die Bereitschaft (schroffe) Sanktionen zu verhängen ist besonders davon geprägt, ob die Befragten Arbeitslose generell für „faul“ halten oder ob sie sich um die Kosten für Betriebe und die Belastung der gesamten Wirtschaft sorgen.

4.2 Heuristik oder Automatismus

Eine weitere Leitfrage dieses Beitrags behandelt die Interaktionen von objekt- und subjektorientierten Ansätzen, von experimentellen Treatments und beobachteten individualspezifischen Variablen. Die Effekte von Deservingness-Signalen sind nach den bisherigen Befunden robust und wirksam, aber auch in ihrer Größe begrenzt. Eine mögliche Erklärung ist, dass einige Personen auf diese Heuristiken zurückgreifen, andere aber gar nicht darauf reagieren. Aus der ursprünglichen Perspektive Wim van Oorschots (2000a) funktioniert nämlich die Zuschreibung von Bedürftigkeit als Heuristik: Uninformierte Proband:innen greifen auf Charakteristiken von Leistungsempfänger:innen als „judgmental shortcuts“ zurück; besser informierte entscheiden rational und orientiert an ihren persönlichen Präferenzen und Werten.

Eine alternative Sichtweise haben Petersen und seine Koautor:innen eingebracht (Petersen et al. 2011; Petersen 2012; Jensen und Petersen 2017). Sie argumentieren, dass die Reaktionen auf stilisierte Leistungsempfänger:innen in der evolutionären Biologie und Psychologie verankert seien. Sie erfolgten automatisch, schnell und unverbunden mit den übrigen sozialen Eigenschaften, materiellen Interessen und Wertvorstellungen der Proband:innen. Den empirischen Beleg für diese These finden Petersen et al. (2011), wenn auch nach der Hinzunahme von subjektspezifischen Prädiktorvariablen (X in unserer Notation), darin, dass die Wirksamkeit der randomisiert zugewiesenen Vignetten (T) robust erhalten bleibt. Die Autor:innen können sogar zeigen, dass die Wirkungen persönlicher Eigenschaften, Interessen, Präferenzen und Werte zurückgehen, wenn klare Deservingness-Signale gesendet werden.

Wenn wir im Folgenden diese Thesen und Befunde mit noch reichhaltigerem empirischem Material und, vor allem, über heterogene Situationen und Länderkontexte analysieren, müssen wir die Interaktionseffekte experimenteller Treatments T und beobachteter individualspezifischer Merkmale der Proband:innen X genau überprüfen. Zeigt der Koeffizientenvektor γ statistisch relevante und substanziell bedeutsame Interaktionseffekte von Treatment und individuellen Eigenschaften der Befragten an, ergibt das Modell Indizien für eine heuristische Funktion von Deservingness-Signalen. Sind keine Interaktionen experimenteller Treatments und individueller Merkmale nachweisbar, deuten die empirischen Befunde, im Sinne von Petersen und seinen Koautor:innen, auf die automatische, unabhängige Funktionsweise von Deservingness:

$$\begin{array}{cc} O' & =f_{N}\left(\boldsymbol{T}{,}\boldsymbol{X}| \upalpha {,}\mathbf{\beta }{,}\mathbf{\gamma }{,}\mathbf{\theta }{,}\sigma ^{2}\right)\\ & =f_{N}\left(\upalpha +\mathbf{\theta }\boldsymbol{T}+\mathbf{\beta }\boldsymbol{X}+\mathbf{\gamma }\boldsymbol{TX}{,}\sigma ^{2}\right)\\ & =f_{N}\left(\alpha _{l\left[s\right]}+\boldsymbol{\theta }_{\boldsymbol{l}\left[\boldsymbol{s}\right]}\boldsymbol{T}+\boldsymbol{\beta }_{\boldsymbol{l}\left[\boldsymbol{s}\right]}\boldsymbol{X}+\boldsymbol{\gamma }_{\boldsymbol{l}\left[\boldsymbol{s}\right]}\boldsymbol{TX}{{,}\sigma }_{l\left[s\right]}^{2}\right) \end{array}$$
$$\alpha _{l[s]}\sim f_{N}\left(\varphi _{\alpha {,}0}+\varphi _{\alpha {,}1}\eta _{\alpha }{,}{\delta }_{\alpha }^{2}\right)$$
$$\boldsymbol{\theta }_{l[s]}\sim f_{N}\left(\boldsymbol{\varphi }_{\theta {,}0}+\boldsymbol{\varphi }_{\theta {,}1}\boldsymbol{\eta }_{\theta }{,}{\delta }_{\theta }^{2}\right)$$
$$\boldsymbol{\beta }_{l[s]}\sim f_{N}\left(\boldsymbol{\varphi }_{\beta {,}0}+\boldsymbol{\varphi }_{\beta {,}1}\boldsymbol{\eta }_{\beta }{,}{\delta }_{\beta }^{2}\right)$$
$$\boldsymbol{\gamma }_{l[s]}\sim f_{N}\left(\boldsymbol{\varphi }_{\gamma {,}0}+\boldsymbol{\varphi }_{\gamma {,}1}\boldsymbol{\eta }_{\gamma }{,}{\delta }_{\gamma }^{2}\right)$$

Für die Schätzung der Modelle haben wir erneut drei hierarchische, lineare Mehrebenenmodelle spezifiziert, um die Robustheit unserer Befunde über die drei Situationskontexte S abschätzen zu können. Über diese Kontexte hinweg trägt die Hinzunahme der Interaktionseffekte γTX jedoch keinen zusätzliche Erklärungsleistung bei, und die Interaktionseffekte der bayesianischen Modelle sind weder statistisch noch inhaltlich bedeutsam. Die durch die Vignetten transportierten Deservingness-Signale wirken damit gleichermaßen bei besser gebildeten und informierten wie bei weniger gebildeten und uniformierten Proband:innen. Auch das materielle Eigeninteresse, die generelle politische Orientierung auf der Links-Rechts-Dimension und die spezifischeren Einstellungen der Befragten zum Wohlfahrtsstaat verändern nicht den Effekt der Treatments T. Für die Zuschreibung von Deservingness ist es so nicht relevant, ob Proband:innen Erfahrungen mit Arbeitslosigkeit haben oder nicht, ob sie sich von Arbeitslosigkeit bedroht sehen oder nicht oder ob sie auf der ideologischen Dimension links oder rechts stehen.

Das bayesianische Mehrebenenmodell ermöglicht eine sehr hohe Flexibilität bei der Parameterschätzung und sieht auf der Länderebene (l) Random Intercepts α und Random Slopes für die Treatment-Variablen θl, die beobachteten Kontrollvariablen βl und ihre Interaktionsterme γl vor. Ein Vergleich der Random Slopes über die verschiedenen Länderkontexte hinweg verweist auf recht geringe Heterogenität und Fehlervarianzen. In keinem der Vergleichsstaaten liegen substanzielle Hinweise auf eine Interaktion von experimentellen Treatments und den Kontrollvariablen vor.

Über alle drei Modelle und Szenarios (S) hinweg trägt die Hinzunahme von Interaktionseffekten aller Treatment- und Kontrollvariablen γθX zu keinem höheren Erklärungswert bei, und die Effektparameter der Interaktionsterme sind statistisch und substanziell bedeutungslos. Diese Befunde unterstreichen das Postulat, allgemeiner, bedingungsloser Reaktionen auf die gesetzten Deservingness-Signale, und sie widersprechen der Funktionsweise als erlernte Heuristiken. Framing und Manipulation von Bildern, Images und Stereotypen unterschiedlicher Leistungsempfänger:innen bleiben deshalb eine erfolgversprechende politische Strategie, die tendenziell jede/n Bürger:in erreichen und beeinflussen kann. Diese automatischen Effekte spielen auf ein grundlegendes Verständnis von Angemessenheit und Reziprozität an und sie wirken ganz unabhängig von demografischen Merkmalen, materiellem Eigeninteresse, allgemeinen politischen und spezifischen sozialstaatlichen Einstellungen, Präferenzen und Überzeugungen. (Tabellarische Darstellungen der drei linearen Mehrebenenmodelle sind im Dataverse dokumentiert.).

5 Schlussfolgerung und Perspektiven

In der Diskussion über Möglichkeiten und Grenzen sozialer Sicherung hat die öffentliche Meinung stets eine besondere Rolle gespielt. Ihre Dynamik und auch ihre Manipulierbarkeit sind benutzt worden, um soziale Leistungen zu kürzen, ihren Umfang zurechtzustutzen und ihren Bezug an immer neue Bedingungen zu knüpfen. Während in polarisierten politischen Wettbewerbskontexten eine direkte Beeinflussung persönlicher Einstellungen und Präferenzen meist nicht (mehr) möglich ist, ermöglichen das Framing von Leistungsempfänger:innen und die Manipulation von Deservingness-Zuschreibungen eigeninteressierten politischen Akteuren und den Medien ein einfacheres und zuverlässigeres Instrument in Kampagnen.

Diese Analyse hat auf der Grundlage eines empirisch gesättigten, ländervergleichenden Umfrageexperiments zunächst die Stabilität und die Wirksamkeit von Deservingness-Signalen über heterogene Individual‑, Länder- und Situationskontexte eindrucksvoll aufzeigen können. Sie hat aber auch Grenzen in der Effektstärke demonstriert und nachgewiesen, dass klassische, individualspezifische Erklärungsmuster für Einstellungen zum Sozialstaat weiterhin wirksam und erklärungskräftig sind. Mit Blick auf die zweite Leitfrage dieses Beitrags haben wir schließlich gezeigt, dass die Zuschreibung von Deservingness unverbunden ist mit individuellen Erfahrungen und Präferenzen der Proband:innen. Sie scheint eher als ein Automatismus denn als eine Heuristik zu wirken.

Im konzeptionellen Bereich bleiben dennoch einige offene Fragen, die durch weitere Iterationen ähnlich angelegter, vergleichender Umfrageexperimente gelöst werden könnten. Insbesondere bildet das im ESS‑8 eingebettete Umfrageexperiment das Konzept von Deservingness nur teilweise und nur unzureichend ab. Die vier Vignetten variieren allein die Altersdimension und den Familienstand. Andere Aspekte, insbesondere die wahrgenommene kulturelle oder soziale Nähe oder Distanz zu Leistungsempfänger:innen, bleiben vollständig ausgeblendet. Gerade diese Defizite können durch die Konstruktion von Conjoint-Experimenten gemindert werden, die eine vieldimensionale und systematische empirische Prüfung des Konzepts Deservingness ermöglichen.

So hat Buss (2019) eine deutsche Fallstudie analysiert und in einem ähnlich konstruierten Umfrageexperiment Interaktionseffekte von durch Vignetten transportierten Eigenschaften der Leistungsempfänger:innen mit der ideologischen Orientierung der Befragten aufgezeigt: Deutsche Proband:innen, die sich auf der politischen Rechten verorten, neigen nämlich dazu, „Ali Öztürk“ viel schärfer zu sanktionieren als „Peter Müller“; Proband:innen auf der politischen Linken nehmen dagegen kaum eine substanzielle Unterscheidung vor. Das Umfrageexperiment des ESS‑8 enthält leider keine Treatments, die diese ethnische Identitätsdimension aufgreifen und variieren. Weitere Iterationen sollten unbedingt einen umfassenderen, systematischeren und theoretisch besser unterfütterten Kriterienkatalog in einem Conjoint-Experiment einbringen, um diese Befunde auch länderübergreifend prüfen zu können.

Schließlich müsste anschließende Forschung noch eine neue, vergleichende Perspektive auf die Wirkungen heterogener Länderkontexte begründen. Wie bereits diskutiert, haben sozioökonomische oder institutionelle Indikatoren, die vorhergehende Arbeiten erfolgreich zur Unterscheidung von residualen und stärker ausgebauten Sozialstaaten benutzt haben, beim noch immer vergleichsweise homogenen Sample des ESS‑8 zwar Variation auf der Länderebene aufgezeigt, aber kaum inhaltliche, substanzielle Begründungen dafür hervorgebracht.