Führen Online-Befragungen zu anderen Ergebnissen als persönliche Interviews? Eine Schätzung von Moduseffekten am Beispiel eines Mixed-Mode Surveys

Liedl, Bernd; Steiber, Nadia

doi:10.1007/s11614-023-00532-4

Führen Online-Befragungen zu anderen Ergebnissen als persönliche Interviews? Eine Schätzung von Moduseffekten am Beispiel eines Mixed-Mode Surveys

Do online interviews lead to different results compared to personal interviews? Estimates of mode effects using a mixed mode survey

Hauptbeiträge
Open access
Published: 05 June 2023

Volume 49, pages 1–22, (2024)
Cite this article

Download PDF

You have full access to this open access article

Österreichische Zeitschrift für Soziologie Aims and scope Submit manuscript

Führen Online-Befragungen zu anderen Ergebnissen als persönliche Interviews? Eine Schätzung von Moduseffekten am Beispiel eines Mixed-Mode Surveys

Download PDF

Bernd Liedl¹ &
Nadia Steiber¹

2179 Accesses
Explore all metrics

Zusammenfassung

Der zunehmende Einsatz von Online-Befragungen (CAWI) ist ein Trend, der sich im Zuge der COVID-19 Pandemie weiter verstärkte. Der Umstieg von persönlichen Interviews auf Online-Befragungen wirft die Frage nach Moduseffekten auf. Unterscheiden sich die Ergebnisse von Online-Befragungen von jenen auf Basis von Telefoninterviews? Die vorliegende Studie untersucht diese Frage unter Verwendung der Daten aus dem AKCOVID Panel Survey, der ein Mixed-Mode Design aufweist und im ersten Jahr der COVID-19 Pandemie durchgeführt wurde. Die Ergebnisse von Regressionsanalysen für 46 verschiedene Variablen, die für die Zusammensetzung der CAWI- und CATI-Stichproben kontrollieren, zeigen, dass Moduseffekte auf bestimmte Themenbereiche eingegrenzt werden können. Für manche Themen werden signifikante und substantiell bedeutsame Moduseffekte geschätzt (soziales Vertrauen, Zukunftssorgen, finanzielle Problemlagen und Gesundheit). Telefonisch Befragte antworten stärker sozial erwünscht, bringen Sorgen weniger stark zum Ausdruck, schätzen ihre finanzielle Lage, ihren sozialen Status und ihre Gesundheit besser ein, und sie geben an, anderen Menschen mehr zu vertrauen und prosozialer eingestellt zu sein als Online-Befragte. Kaum von Moduseffekten betroffen zeigen sich ‚faktische‘ Fragen nach krisenbedingten Veränderungen des Einkommens ohne Bezug zur finanziellen Lage, Fragen zu Arbeitsbedingungen, familiären Beziehungen oder vielen politischen Einstellungen. Der Beitrag schließt, dass Ergebnisse persönlicher Befragungen aus Zeiten vor der Pandemie oft nicht direkt mit aktuellen Ergebnissen auf Basis von Online-Erhebungen verglichen werden können und weist auf die Bedeutung heterogener Moduseffekte hin, deren systematische Untersuchung und Berücksichtigung als Forschungslücke identifiziert wird.

Abstract

The increasing use of online surveys (CAWI) is a trend that became more pronounced in the wake of the COVID-19 pandemic. The switch from face-to-face interviews to online surveys raises the question of mode effects. Do the results of online surveys differ from those based on telephone interviews? This study examines this question using data from the AKCOVID Panel Survey, which has a mixed-mode design and was conducted in the first year of the COVID-19 pandemic. The results of regression analyses for 46 different variables controlling for the sample characteristics of CAWI and CATI show that mode effects are topic-specific. For some topics, significant and substantial mode effects are estimated (social trust, worries about the future, financial problems and health). When people are interviewed by telephone, they answer more socially desirable, express worries less strongly, assess their financial situation, social status and health better, report more trust in other people, and present themselves as more prosocial than in CAWI interviews. Not or less affected by mode effects are ’factual’ questions about crisis-related changes in income without reference to one’s financial situation, questions about working conditions, family relations, or a range of political attitudes. The paper concludes that results of interviewer-led surveys from pre-pandemic times can often not be directly compared with current results based on online surveys and points to the importance of heterogeneous mode effects that are hitherto under-researched.

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

1 Einleitung

Die COVID-19 Pandemie hat den langjährigen Trend, sozialwissenschaftliche Befragungen zunehmend im Onlinemodus durchzuführen, noch weiter verstärkt. Einerseits wurden in der Pandemie Face-to-Face Befragungen im Sinne von Kontaktbeschränkungen vermieden, andererseits wurde versucht, durch Online-Befragungen zeitnah Erkenntnisse über Entwicklungen während der Pandemie zu erhalten. Der Onlinemodus wird nicht zuletzt aus Kostengründen immer häufiger eingesetzt und mit anderen Befragungsmodi kombiniert. Durch Mixed-Mode Designs wird versucht, Selektionseffekte unterschiedlicher Befragungsmodi auszugleichen. Im Onlinemodus fällt jedoch die direkte Interaktion zwischen Interviewer*innen und Befragten weg, womit sich die methodische Frage stellt, ob und wie sich der Befragungsmodus auf das Antwortverhalten auswirkt. Unterscheiden sich die Ergebnisse von Online-Befragungen von jenen, die von Interviewer*innen durchgeführt werden?

Die Abwesenheit eine*r Interviewer*in bei Online-Befragungen kann bei Fragen, die dazu verleiten sozial erwünschte Antworten zu geben, gewährleisten, dass Befragte ehrlicher antworten; umgekehrt kann das selbständige Ausfüllen von Online-Umfragen aber auch dazu führen, dass Fragen nicht richtig verstanden oder mit minimalem kognitiven Aufwand beantwortet werden (z. B. schnelles ‚Durchklicken‘, Antworttendenzen zur Mitte oder zu den Rändern von Antwortskalen, cf. Mühlböck et al. 2017). Moduseffekte dieser Art, welche über die unterschiedliche Zusammensetzung von Stichproben je nach Modus hinausgehen, sind Gegenstand der vorliegenden Untersuchung. Wir vergleichen die beiden Befragungsmodi des AKCOVID Panel Surveys (Steiber 2021): computerunterstützte Telefoninterviews (CATI) und computerunterstützte Webinterviews (CAWI).

Nachdem wir in den Abschn. 2 und 3 den Stand der Forschung und das Design der Studie erörtern, legen wir in den Abschn. 4.1–4.3 die Effekte der beiden Befragungsmodi auf das Antwortverhalten dar. In Abschn. 4.4 illustrieren wir anhand eines Beispiels, dass Befragungen auf Basis unterschiedlicher Modi nicht vergleichbar sind, und diskutieren die Bedeutung von heterogenen Moduseffekten in verschiedenen Bevölkerungsgruppen.

2 Stand der Forschung: Moduseffekte in der Umfrageforschung

Die Befundlage zu Moduseffekten ist durchwachsen. Manche Studien kommen zum Schluss, dass Befragungen auf Basis unterschiedlicher Befragungsmodi niemals zu vergleichbaren Ergebnissen führen, weil sich der Modus der Befragung signifikant auf das Antwortverhalten auswirkt – ganz unabhängig vom Thema der Untersuchung, der Art und der ‚normativen Aufladung‘ der Fragestellung (Klausch et al. 2013). Andere Studienautor*innen vertreten die Ansicht, dass CATI und CAWI meist doch sehr ähnliche Ergebnisse liefern und nur geringe Unterschiede im Antwortverhalten festgestellt werden können (Vannieuwenhuyze und Revilla 2013, S. 164; Ansolabehere und Schaffner 2014). Eine dritte Gruppe von Studien zeigt, dass Moduseffekte unter bestimmten Umständen und bei bestimmten Gruppen stärker zu Tage treten und zielt darauf ab, genuine Messeffekte von Selektionseffekten zu unterscheiden (Schouten et al. 2013; Vannieuwenhuyze und Loosveldt 2013).

2.1 Selektionseffekte

Vergleicht man die Ergebnisse von Online-Befragungen mit jenen von persönlichen Interviews, können etwaige Unterschiede im Antwortverhalten teils darauf zurückgeführt werden, dass sich die Stichproben der beiden Befragungsmodi voneinander unterscheiden können (Selektionseffekte). In vielen Mixed-Mode Designs wird eine Online-Stichprobe um eine Telefonstichprobe ergänzt, in der Hoffnung, die Repräsentativität der Gesamtstichprobe auf diesem Weg zu optimieren. Dabei werden meist spezifische Gruppen – wie etwa ältere Personen – bei den Telefoninterviews überrepräsentiert, weil man davon ausgeht, dass diese mittels Onlinebefragung weniger gut abgedeckt werden können. In manchen Studien gibt es gar eine strikte Trennung zwischen den Modi in Bezug auf die befragten Altersgruppen (z. B. der IHS COVID-19 Survey, cf. Grand 2021). Doch auch wenn unterschiedliche Zusammensetzungen der Telefon- und Online-Stichproben nicht intendiert sind, kann nicht ausgeschlossen werden, dass sich die beiden Gruppen anhand von Eigenschaften voneinander unterscheiden, die sich auf das Antwortverhalten auswirken (z. B. Lesekompetenz, digitale Kompetenz, politisches Interesse).

Erfolgt bei CATI oft eine einfache Zufallsauswahl der Befragten (z. B. RDD-Random Digit Dialing), kommen bei Online-Befragungen in der Praxis v. a. aus Kostengründen häufig große Online-Access Panels^{Footnote 1} zur Anwendung (z. B. Austrian Corona Panel Project (Kittel et al. 2021), Values in Crisis Austria (Aschauer et al. 2020) sowie auch der CAWI-Teil des AKCOVID Panel Surveys (Steiber 2021)). Für Befragungen auf Basis von Online-Access Panels werden Respondent*innen nicht auf Basis einer Zufallsauswahl rekrutiert, sondern sind bereits in einem Pool an Personen, die sich studienunabhängig bereiterklärt haben, an Online-Umfragen teilzunehmen. Aus diesem Pool werden Personen ohne Onlinezugang klarerweise ausgeschlossen, während webaffine Personen mit überdurchschnittlich hoher Lesekompetenz bzw. stärkerem politischen Interesse überrepräsentiert sind (Prandner 2022, S. 337). Es besteht das zentrale methodische Problem der Selbstselektion in den Pool der möglichen Befragten. Dies kann die Repräsentativität von Teilstichproben aus diesem Pool gefährden.

Über reine Selektionseffekte hinausgehend – bzw. unter Kontrolle der Zusammensetzung der Stichproben unterschiedlicher Befragungsmodi – können Unterschiede im Antwortverhalten je nach Befragungsmodus auch durch genuine Messeffekte bedingt sein. Diese Messeffekte stehen im Zentrum der gegenständlichen Analyse.

2.2 Effekte auf die Item-Non-Response

Messeffekte können durch verschiedene Muster der Antwortverweigerung (Non-Response) entstehen oder durch unterschiedliche Antwortmuster bedingt sein (De Leeuw und Hox 2015, S. 22–34). Befragte tendieren am Telefon beispielsweise eher dazu, die letzte Antwortoption zu wählen, während bei Webinterviews eher die erste gewählt wird, v. a. dann, wenn nur die Endpunkte einer Skala beschriftet sind. Weiters wird berichtet, dass die Option „weiß nicht“ bei CAWI signifikant häufiger gewählt wird als dies bei CATI der Fall ist (De Leeuw und Hox 2015; Bowyer und Rogowski 2017). Das kann bei einem Teil der Befragten ein Problem sein, wenn diese die Befragung mit einem minimalen zeitlichen und kognitiven Aufwand beenden wollen (Callegaro et al. 2015, S. 102). Zudem kann die soziale Situation einer persönlichen Befragung dazu verleiten, Antworten zu geben, auch wenn Befragte keine eindeutige Antwort auf die Frage haben (Atteslander 2008, S. 110–111; Peytchev und Hill 2010). Dieser Argumentation folgend sollten die Non-Response-Raten bei CAWI höher ausfallen als bei CATI (Hypothese 1a).

Umgekehrt wurde argumentiert, dass die Item-Non-Response bei persönlichen Interviews höher ausfallen könnte als bei Online-Befragungen und zwar bei sensitiven Fragestellungen. Manche Fragen werden als zu privat oder aufdringlich empfunden, wie etwa Fragen zu Einkommen oder Partnerschaft und werden deswegen weniger gerne beantwortet (Tourangeau und Yan 2007). Die Rate der Antwortverweigerung auf sensitive Fragen kann dabei bei persönlichen Interviews besonders hoch ausfallen, während die Abwesenheit von Interviewer*innen bei CAWI dazu führen kann, dass mehr Befragte sensitive Fragen beantworten und damit die Rate der Antwortverweigerung niedriger ausfällt (Joinson et al. 2007; Kreuter et al. 2008). Dieser Argumentation folgend sollten die Non-Response-Raten bei sensitiven Fragen generell höher ausfallen und man würde hier stärkere Moduseffekte zugunsten geringerer Non-Response bei CAWI als bei CATI erwarten (Hypothese 1b). Im AKCOVID Panel Survey können Fragen in den Frageblöcken Soziale Beziehungen und Finanzielle Lage als sensitive private Fragen identifiziert werden, bei denen wir im CAWI-Modus weniger Non-Response erwarten.

2.3 Soziale Erwünschtheit

Messeffekte können auch durch sozial erwünschtes Antwortverhalten bedingt sein. Befragte tendieren dazu, in ihren Antworten sozial normierten Erwartungen entsprechen zu wollen (Tourangeau und Smith 1996; Joinson et al. 2007; Kreuter et al. 2008; Malakhoff und Jans 2011). Sozial erwünschtes Antwortverhalten tritt dann verstärkt auf, wenn es um Einstellungen und Verhaltensweisen geht, die stärker durch soziale Normen geregelt werden. Ein gutes Beispiel für einen Themenbereich, in dem soziale Erwünschtheit das Antwortverhalten beeinflusst, sind Fragen zu kriminellem Verhalten. Diese werden häufig sozial erwünscht beantwortet, da hier explizit ein Normbruch thematisiert wird. Es gibt aber auch bei scheinbar weniger sensiblen Fragen die Tendenz, sich selbst positiv darzustellen. Beispielsweise werden Fragen zum persönlichen Wohlbefinden häufig den sozialen Erwartungen entsprechend beantwortet (Reinecke 1991, S. 105) – klassische Antwort: „Mir geht’s gut!“.

Während es bei zu aufdringlichen Fragen zu privaten Lebensbereichen wahrscheinlich eher als legitim empfunden wird, die Antwort zu verweigern (Non-Response, siehe Abschn. 2.2), kann die Verweigerung einer Antwort auch ein Gefühl der Selbstentlarvung hervorrufen. Beispielsweise könnten Befragte die Sorge haben, dass die Nichtbeantwortung von Fragen zum Thema Kriminalität implizit als Indikator für ein bestimmtes Verhalten gewertet werden könnte. Ein anderes Beispiel sind Fragen zum Gesundheitszustand. Die Antwort wird in manchen Fällen daher in Richtung sozialer Erwünschtheit modifiziert werden (Tourangeau und Yan 2007).

Kommt es dabei auf den Befragungsmodus an? Eine Reihe von Studien kommt zum Schluss, dass der Effekt der sozialen Erwünschtheit bei CATI stärker ausgeprägt ist als bei CAWI (Holbrook und Krosnick 2010; Engel et al. 2015; Bowyer und Rogowski 2017). Während durch die akustische Anwesenheit von Interviewer*innen bei telefonischen Befragungen die sozialen Normen in Erinnerung gerufen werden, wird in der völlig anonymen Situation der Web-Befragung eher ‚ehrlich‘ geantwortet. Damit wären bei sensitiven Fragen stärkere Messeffekte zu erwarten. Im AKCOVID Panel Survey können Fragen in den Frageblöcken Finanzielle Lage, Sorgen, Kinder, Gesundheit, Einstellungen und Soziale Beziehungen als jene mit Potenzial für sozial erwünschtes Antwortverhalten eingestuft werden. In diesen Themenblöcken erwarten wir mithin im CAWI-Modus weniger in Richtung sozialer Erwünschtheit verzerrte Antworten, während im CATI-Modus Antworten stärker in Richtung einer sozial erwünschten guten finanziellen Lage und Gesundheit, intakten sozialen Beziehungen und sozialeren Einstellungen erwartet werden (Hypothese 2).

3 Design der vorliegenden Studie: Vergleich CAWI mit CATI

Ziel der vorliegenden Untersuchung ist die Schätzung von Moduseffekten im AKCOVID Panel Survey (Steiber 2021) durch die Analyse unterschiedlichen Antwortverhaltens bei Telefonbefragungen (CATI) im Vergleich zu Online-Befragungen (CAWI). Dazu vergleichen wir die beiden Befragungsmodi des AKCOVID Panel Surveys. Im Rahmen der AKCOVID Studie wurden im Juni 2020 zwei Tausend in Österreich wohnhafte Personen im Alter zwischen 20 und 64 Jahren befragt: 80 % Online ohne Interviewer*in und 20 % mittels Interviewer*in per Telefon, beides computerunterstützt auf Basis eines identen Fragebogens. Die Anteile einzelner Bevölkerungsgruppen (definiert nach Alter, Bildung, Geschlecht und Bundesland) in der CATI Stichprobe wurden so gewählt, dass die Gesamtstichprobe der Befragung (CAWI plus CATI) der Struktur der Gesamtbevölkerung nach diesen Kriterien entsprach. Im Jänner 2021 wurden rund 70 % der in der Ersterhebung Teilnehmenden ein zweites Mal befragt.

Ziel dieser Studie ist, herauszufinden, ob für alle Items der Befragung ähnliche Moduseffekte gefunden werden können oder ob sich modusbedingte Verzerrungen auf bestimmte Item-Designs, Themen oder Bevölkerungsgruppen beschränken. Um diesen Fragen nachzugehen, vergleichen wir für 46 Variablen das Ausmaß der Non-Response („weiß nicht“ Antworten oder „keine Angabe“ bzw. „Kann ich nicht sagen“) und das Antwortverhalten (Mittel- und Anteilswerte) innerhalb der validen Angaben zwischen CATI und CAWI.

Zum Vergleich der Non-Response zwischen den Befragungsmodi werden die Anteile nicht-valider Antworten („weiß nicht“, „keine Angabe“) und deren Vertrauensintervalle berechnet (Prüfung Hypothesen 1a und 1b). Überlappen die Vertrauensintervalle nicht, liegt ein signifikanter Unterschied in der Non-Response zwischen CAWI und CATI vor. Messeffekte werden mittels Regressionsmodellen geschätzt (Prüfung Hypothese 2). Der Befragungsmodus fungiert dabei als zentrale erklärende Variable, wobei für die Stichprobenzusammensetzungen nach Geschlecht, Alter, Bildung, Bundesland, Urbanisierungsgrad des Wohnorts, Staatsbürgerschaft und Hauptaktivität (unterteilt in: Erwerbstätigkeit, Arbeitslosigkeit, Ausbildung, Hausarbeit, Pension) kontrolliert wird. Die Ergebnisse der Analyse sind in den Tab. 1, 2 und 3 im Überblick dargestellt. Die Gesamtmodelle inklusive der Kovariaten sind im Online Supplement verfügbar. Mit dem Ziel der Vergleichbarkeit von 46 Modellen im Sinne von Effektstärken, rechnen wir im Fall von Items mit quasi-metrischem Skalenniveau^{Footnote 2} lineare Modelle (OLS) und im Fall von binär kodierten Items lineare Wahrscheinlichkeitsmodelle. Items mit ordinalem Skalenniveau werden für die in Tab. 2 und 3 dargestellten Analysen dichotomisiert. Im Sinne einer Validierung der Ergebnisse, werden jedoch für alle binären und ordinalen Variablen zusätzlich binär logistische bzw. ordinale logistische Regressionen gerechnet. Diese Zusatzanalysen führten bei allen Variablen zu vergleichbaren Ergebnissen^{Footnote 3}. Für Details zur Kodierung der abhängigen Variablen siehe Anhang Tab. 4.

Tab. 1 Zusammensetzung der Stichprobe nach Modus. (Quelle: AKCOVID Panel Survey, gewichtet, eigene Berechnungen)

Full size table

Tab. 2 Signifikante Moduseffekte auf das Antwortverhalten nach Themenbereich

Full size table

Tab. 3 Geringe Moduseffekte auf das Antwortverhalten nach Themenbereich

Full size table

4 Ergebnisse

4.1 Selektionseffekt aufgrund unterschiedlicher Zusammensetzung der Stichproben

Mittelwertvergleiche geben erste Hinweise darauf, bei welchen Fragen die Befragungsmodi zu unterschiedlichen Ergebnissen führten. Beispielsweise können im Themenbereich Arbeitsbedingungen signifikante Unterschiede in den Mittelwerten zwischen den Modi festgestellt werden (nicht gezeigt). Diese verlieren nach Kontrolle soziodemographischer Merkmale in den Regressionsmodellen (Tab. 3) jedoch an Bedeutung – sie sind mithin lediglich auf die unterschiedliche Zusammensetzung der Stichproben (Tab. 1) der beiden Modi zurückzuführen (z. B. höheres mittleres Alter bei CATI) und können damit als reine Selektionseffekte identifiziert werden.

4.2 Wenig Unterschied zwischen CATI und CAWI in der Non-Response

Beim Vergleich der Non-Response zeigen sich nur bei wenigen Items Moduseffekte (im Einklang mit Befunden von Mühlböck et al. 2017). Über alle 46 Variablen hinweg kann in Bezug auf das Ausmaß der Non-Response kein Muster festgestellt werden (siehe Tab. 2 und 3). Bei fünf Items wurden bei CAWI häufiger die Optionen „weiß nicht“, „keine Angabe“ bzw. „Kann ich nicht sagen“ gewählt als bei CATI; bei zwei Items war es genau umgekehrt. Es können auch keine Themen oder Item-Designs ausgemacht werden, bei denen eher Moduseffekte auf die Rate der Non-Response auftreten. Dies gilt auch für die sensitiven Fragen zur finanziellen Situation und zum Privatleben. Die Hypothesen 1a und 1b können damit nicht bestätigt werden.

4.3 Antwortverhalten: Mehr soziale Erwünschtheit bei persönlichen Interviews (CATI)

Der bereinigte, für die Zusammensetzung der CATI- und CAWI-Stichproben kontrollierte, Moduseffekt wird mit Hilfe von Regressionsmodellen geschätzt. Der bereinigte Messeffekt ist stärker auf den Befragungsmodus per se zurückführbar, soweit für alle relevanten Unterschiede zwischen den beiden Stichproben kontrolliert werden konnte.^{Footnote 4} Die Ergebnisse werden in Tab. 2 präsentiert. Das genaue Wording der einzelnen Items findet sich im Anhang. Bei den Themenkreisen soziales Vertrauen, finanzielle Probleme, Sorge um Jobverlust, Gesundheit und Probleme im Zusammenhang mit den Schulschließungen werden signifikante Moduseffekte festgestellt:

Die Befragten gaben den CATI-Interviewer*innen gegenüber eher an, dass man anderen Menschen vertrauen kann, als online (im Schnitt um rund 1,4 Punkte mehr auf der 11-teiligen Vertrauensskala). In Zusammenhang mit einer geringeren Einschätzung des sozialen Vertrauens bei CAWI gab es bei diesem Befragungsmodus auch signifikant weniger Zustimmung zur Aussage, dass der Staat für einen angemessenen Lebensstandard der Arbeitslosen sorgen sollte (weniger stark ausgeprägte prosoziale Haltung). Sorgen, dass die Corona-Krise zu einer Verschlechterung der eigenen finanziellen Lage oder zu einem Jobverlust führen könnte, wurden den CATI-Interviewer*innen gegenüber signifikant seltener geäußert als in CAWI. Bei CAWI wurde weiters eher angegeben als bei CATI, dass sich die Sicherheit des Arbeitsplatzes seit Beginn der Pandemie verringert hat. Auch werden die finanzielle Lage des Haushalts und der eigene soziale Status bei CAWI im Mittel prekärer eingeschätzt als bei CATI. Diese Ergebnisse zeigen, dass die Einschätzung der Befragten bzgl. ihrer finanziellen Lage (z. B. subjektive Armutsgefährdung, finanzielle Engpässe, Rechnungsverzug) und ihres sozialen Status im Rahmen von Online-Befragungen im Vergleich zu persönlichen Befragungen tendenziell negativer ausfällt. Nicht oder weniger von Moduseffekten betroffen zeigen sich dagegen stärker „faktische“ Fragen nach den krisenbedingten Veränderungen des Einkommens/Umsatzes ohne Bezug auf deren Konsequenzen für die eigene finanzielle Lage.

Ein ähnliches Bild ergibt sich bei der Einschätzung der eigenen Gesundheit: Telefonisch Befragte schätzen sich im Schnitt gesünder ein – sowohl in Bezug auf ihren allgemeinen Gesundheitsstatus als auch im Hinblick auf ihr psychisches Wohlbefinden. Dies deckt sich mit Befunden aus der Literatur zu Indikatoren der mentalen und psychosozialen Gesundheit, die in selbstadministrierten Befragungen (CAWI oder auch Papierfragebögen) signifikant schlechter bewertet werden als bei Telefoninterviews (soziale Erwünschtheit in Präsenz von Interviewer*innen, siehe Hoebel et al. 2014; Epstein Faith et al. 2001). CAWI-Befragte äußerten auch signifikant häufiger Sorgen, dass sie aufgrund der Pandemie nicht die ärztliche Versorgung bekommen, die sie brauchen (Themenbereich Sorgen in Tab. 2). Ein weiteres in Tab. 2 gelistetes Thema mit signifikanten Moduseffekten sind Herausforderungen im Zusammenhang mit pandemiebedingtem Distance Learning. CAWI-Befragte gaben häufiger an, dass sie sich als Eltern überfordert fühlten und sich um den Lernfortschritt ihrer Kinder sorgten.

Die Items, bei denen signifikante Moduseffekte geschätzt werden, weisen sehr unterschiedliche Designs auf (z. B. 11-teilige Antwortskalen mit beschrifteten Rändern, fünf oder sechs vollständig beschriftete Antwortoptionen) – es kann kein Zusammenhang zwischen dem Design der Items und dem Auftreten von Moduseffekten auf das Antwortverhalten festgestellt werden.

Bei der Beantwortung der in Tab. 2 gelisteten Themen ist im Rahmen von CATI ein stärker sozial erwünschtes bzw. auch ein positiveres Antwortverhalten zu beobachten als bei CAWI (im Einklang mit Bowyer und Rogowski 2017). Die soziale Situation des Telefoninterviews scheint auch prosoziale Antworten zu fördern. In anderen Themenbereichen treten dagegen kaum Moduseffekte auf. Diese sind in Tab. 3 gelistet. Ein Beispiel sind politische Einstellungen zu den Themen Einkommensumverteilung und Armutsbekämpfung (im Einklang mit den Ergebnissen von Ansolabehere und Schaffner 2014). Auch der Themenbereich familiäre Beziehungen scheint kaum sozial erwünschtes Antwortverhalten zu triggern. Weder die Fragen nach Veränderungen in der Qualität der Paarbeziehung seit Ausbruch der Pandemie (Zufriedenheit, Konflikte) noch die Fragen zur Kinderbetreuung oder zur Vereinbarkeit von Beruf und Familie werden je nach Modus unterschiedlich beantwortet. Auch faktische Fragen zum Ausmaß der informellen Pflege (Stunden pro Woche) werden modus-unabhängig ähnlich beantwortet.

Kaum von Moduseffekten betroffen zeigt sich auch der Themenbereich Arbeitsbedingungen. Weder die faktischen Fragen zu den wöchentlichen Arbeitsstunden, der beruflichen Tätigkeit, dem Ausmaß der Arbeitsautonomie, der Nutzung von Home-Office und dem Vorhandensein eines Betriebsrats, noch die Fragen zu den Auswirkungen der Pandemie auf die Arbeitsbedingungen (Liste der Items in diesem Themenbereich in Tab. 4 im Anhang)^{Footnote 5} zeigen sich durch den Modus der Befragung beeinflusst. Einzige Ausnahme ist die Sicherheit des Arbeitsplatzes, welche im Rahmen von CAWI negativer eingeschätzt wird.

Zusammenfassend wurden mithin entsprechend Hypothese 2 in Themenfeldern, die normativ aufgeladenen sind und sozial erwünschtes Antwortverhalten hervorrufen können, stärkere Messeffekte geschätzt, während bei Fragen, die eher auf Fakten abzielten, kaum Effekte des Befragungsmodus festgestellt werden konnten.

4.4 Stärke der Moduseffekte und heterogene Moduseffekte

Bei signifikanten Moduseffekten gilt es zwischen vernachlässigbaren und substantiell bedeutsamen Effekten zu unterscheiden. Gängige Effektstärkemaße im Rahmen von Regressionsmodellen (z. B. Eta Quadrat) deuten durchwegs auf kleine Effekte hin (Tab. 2). Dies darf jedoch nicht darüber hinwegtäuschen, dass es sich substantiell teils um bedeutsame Effekte handelt. Beispielsweise geben CATI-Befragte im Schnitt 1,4 Punkte mehr auf der 11-teiligen Skala des sozialen Vertrauens an als CAWI-Befragte^{Footnote 6} (kontrolliert für die unterschiedliche Stichprobenzusammensetzung nach zentralen soziodemografischen Merkmalen). Auch die Einschätzung der finanziellen Lage des Haushalts zeigt sich stark vom Modus der Befragung beeinflusst: So geben bei den Telefoninterviews rund 40 % der Befragten an, mit dem Haushaltseinkommen bequem auszukommen, während sich dieser Anteil bei Online-Respondent*innen auf 29 % beläuft (ebenso im Rahmen der Regressionsanalyse kontrolliert für die Stichprobenzusammensetzung). Die Ergebnisse der Studie zu den teils doch maßgeblichen Effekten des Befragungsmodus legen nahe, dass es problematisch sein kann, Ergebnisse aus persönlichen Befragungen für die Zeit vor der Pandemie – beispielsweise aus dem European Social Survey (ESS) oder dem Sozialen Survey Österreich (SSÖ) – mit neueren Ergebnissen aus Online-Befragungen zu vergleichen, insbesondere wenn die CAWI-Befragten auf Basis eines Online Access Panels rekrutiert wurden.

Ein durch die Autor*innen dieses Beitrags durchgeführter Vergleich von Daten aus dem European Social Survey (ESS), die in zwei Wellen zwischen 2016 und 2019 mittels persönlicher Interviews erhoben wurden (ESS 2016, 2018), und dem im Jänner 2021 erhobenen AKCOVID Panel Survey, zum mittleren sozialen Vertrauen, würde beispielsweise suggerieren, dass es zwischen der Erhebung der ESS Daten vor der Pandemie und der AKCOVID Daten im ersten Jahr der Pandemie im Jänner 2021 zu einem massiven Einbruch im Ausmaß des sozialen Vertrauens kam (kontrolliert für die unterschiedliche Stichprobenzusammensetzung, siehe Abb. 1a). Dieser scheinbare Trend ist jedoch zu einem großen Teil auf den Wechsel des Befragungsmodus zurückzuführen und präsentiert sich im Vergleich der mittels persönlicher Interviews erhobenen ESS-Daten mit der Telefonstichprobe aus der AKCOVID Befragung so nicht. Nur in der CAWI-Teilstichprobe des AKCOVID ist das soziale Vertrauen signifikant niedriger als im ESS (siehe Abb. 1b).

Die Analysen zum sozialen Vertrauen zeigen weiters, dass dieser Moduseffekt altersabhängig ist. Während es für jüngere Befragte weniger darauf ankommt, ob sie im Rahmen der AKCOVID Panelbefragung persönlich oder via Onlinesurvey zu ihrem sozialen Vertrauen befragt wurden, ist dieser Moduseffekt bei den älteren Befragten stärker ausgeprägt (Abb. 2): Während es in der jüngeren Gruppe keinen signifikanten Unterschied der geschätzten Mittelwerte zwischen CATI- und CAWI-Befragten gibt (unter 40 Jahren), signalisieren in der älteren Gruppe (40–64 Jahre) telefonisch Befragte ein signifikant höheres soziales Vertrauen.

Heterogene Moduseffekte nach Alter können in der AKCOVID-Befragung auch für die Einschätzung der eigenen Gesundheit, die Sorgen um die gesundheitliche Versorgung in der Pandemie, die Einstellung zu Arbeitslosen (Tab. 2) und die Zufriedeneheit mit der Aufteilung der Hausarbeit (Tab. 3) festgestellt werden. Heterogene Moduseffekte nach dem höchsten Bildungsabschluss der Befragten zeigen sich bei den politischen Einstellungen (Tab. 2) und den Arbeitsstunden (Tab. 3), nach dem Geschlecht der Befragten bei den Arbeitsbedingungen (Tab. 3).

5 Resümee und Ausblick

Die vorliegenden Analysen des Antwortverhaltens in einem Mixed-Mode Survey legen nahe, dass Befragungen je nach Modus (CATI versus CAWI) in der Tat zu sehr unterschiedlichen Ergebnissen führen können. Zwar unterscheidet sich das Antwortverhalten kaum in Bezug auf die Non-Response-Rate, inhaltlich differieren die Antworten aber teils signifikant zwischen den Befragungsmodi (kontrolliert für die Stichprobenzusammensetzung nach Modus). Moduseffekte im AKCOVID Panel Survey können auf bestimmte Themenbereiche eingegrenzt werden: Vor allem bei Fragen zu finanziellen Problemlagen, der Einschätzung des eigenen sozialen Status und der eigenen Gesundheit, bei der Thematisierung von Sorgen um die Zukunft und zum eigenen sozialen Verhalten unterscheidet sich das Antwortverhalten signifikant nach Modus. Von Interviewer*innen per Telefon Befragte antworten stärker sozial erwünscht, beurteilen ihre finanzielle, soziale und gesundheitliche Lage positiver, bringen Sorgen weniger stark zum Ausdruck und geben an, anderen Menschen mehr zu vertrauen und prosozialer eingestellt zu sein als CAWI-Befragte.

Einschränkend muss angemerkt werden, dass zwei sehr unterschiedliche Befragungsmodi miteinander verglichen wurden. Die per Telefon Befragten wurden im Gegensatz zu den Online-Respondent*innen von Interviewer*innen befragt. Sie wurden darüberhinausgehend anders rekrutiert: Die CATI-Stichprobe wurde zufallsbasiert mittels Random Digit Dialing erstellt; die CAWI-Befragten dagegen aus einem bestehenden Online-Access Panel rekrutiert. Damit können wir strenggenommen den Effekt des persönlichen Interviews nicht von potenziellen Selektionseffekten isolieren. Die Regressionsanalysen kontrollieren für die unterschiedliche Stichprobenzusammensetzung der CAWI- und CATI-Befragten nach sozioökonomischen Merkmalen, ein verbleibender Selektionsbias auf Basis unbeobachteter Merkmale kann aber nicht ausgeschlossen werden.

Welche Schlüsse können auf Basis der Studienergebnisse für Online-Befragungen gezogen werden? Rein webbasierte Befragungen können den Vorteil bieten, dass sensitive Fragen eventuell ehrlicher beantwortet werden, da der Effekt der sozialen Erwünschtheit oft geringer sein wird. Bei stärker objektiven Fragen zur beruflichen oder familiären Situation der Befragten (‚Faktenfragen‘) sollte laut Studienergebnissen eine gute Vergleichbarkeit von CAWI mit persönlichen Interviews gegeben sein. Auch gibt es bei CAWI nicht unbedingt mehr Item-Non-Response („weiß nicht“ oder „keine Angabe“). CAWI kann jedoch zu einer höheren Rate an Survey-Non-Response führen, eine geringere Abdeckung der Zielpopulation (Internetzugang, digitale Affinität und Kompetenz) erreichen und damit einen größeren Stichprobenfehler bedingen (De Leeuw und Hox 2015). Zentral für die Einschätzung von Online-Befragungen ist die Art der Stichprobenziehung. CAWI auf Basis einer rein zufallsbasierten Auswahl von Befragten und einem adressbasierten push-to-web Design sollte einen deutlich kleineren Stichprobenfehler aufweisen als CAWI auf Basis von Online-Access Panels. Und hier gibt es in der Tat eine Reihe von methodischen Entwicklungen (Professionalisierung der push-to-web Designs, Befragungen über Mobiltelefone, Log-in für die Online-Befragung via QR Codes), die dazu führen, dass auch bei CAWI eine mit persönlichen Befragungen vergleichbare Survey Response Rate sowie eine hohe Repräsentativität der Stichprobe erreicht werden kann, wie beispielsweise bei der aktuellen Statistik-Austria Befragung „Wie geht’s uns heute“ (Mühlböck et al. 2022).

In diesem Zusammenhang ist zukünftige Forschung gefordert, ein stärkeres Augenmerk auf die Isolierung reiner Messeffekte (Effekte des Befragungsmodus per se), unter Kontrolle von Selektionseffekten, zu legen. Hier kann derzeit noch eine Forschungslücke ausgemacht werden. Selektionseffekte (unterschiedliche Zusammensetzung der Stichproben je nach Modus) können in der Tat größer ausfallen als die Messeffekte (Vannieuwenhuyze und Revilla 2013), die meist im Zentrum der Argumentation stehen. Zukünftige Forschung ist weiters gefordert, sich stärker mit heterogenen Moduseffekte zu beschäftigen, d. h. mit der Möglichkeit, dass sich der Modus der Befragung nicht auf alle Befragten gleich auswirkt. Heterogene Moduseffekte sind in der Literatur beschrieben, bleiben in der Praxis bis dato jedoch meist unbeachtet. Bei Erhebungen zur mentalen Gesundheit konnten beispielsweise unterschiedlich stark ausgeprägte Moduseffekte nach Bildung (Epstein Faith et al. 2001) und Alter (Wright et al. 1998) festgestellt werden. Auch bei politischen Einstellungen wurden unterschiedliche Moduseffekte nach Geschlecht, Alter und Bildung registriert (Sanders et al. 2007; Ansolabehere und Schaffner 2014). Obwohl es einige Evidenz dafür gibt, dass sich der Befragungsmodus nicht auf alle Bevölkerungsgruppen gleich auswirkt, blenden Theorien zum Antwortverhalten diese heterogenen Moduseffekte meist aus. Eine systematische Beschäftigung mit dem Thema ist noch ausständig (Pudney 2010; Heerwegh und Loosveldt 2011; Sánches Tome 2018, S. 153). Will man für Moduseffekte kontrollieren, um Trendanalyen auf Basis eines Vergleichs von persönlichen Interviews mit Online-Befragungen zu ermöglichen, ist es unabdingbar auf potenziell heterogene Moduseffekte zu achten. Die Kontrolle für homogene Moduseffekte kann – vor allem bei Gruppenvergleichen – womöglich zu stark verzerrten Resultaten führen (Jäckle et al. 2010; Backes und Cowan 2019).

Notes

In Österreich wird bei CAWI auf Basis eines Online-Access Panels meist das Marktforschungsinstitut Marketagent beauftragt. Dieses Online-Access Panel umfasst rund 130 Tausend Personen und erfüllt die Anforderung an Strukturgleichheit zur österreichischen Wohnbevölkerung ab einem Alter von 14 Jahren. Die Rekrutierung der Panelteilnehmenden erfolgt über verschiedene Kanäle (z. B. Fernsehwerbung, Werbeplakate, Inserate in Zeitschriften). Die Teilnehmenden erhalten Incentives für die Teilnahme an Befragungen (z. B. Gutscheinen oder auch Bezahlung für konkrete Befragungen).
Items werden als quasi-metrisch interpretiert, wenn diese mindestens fünf Ausprägungen aufweisen. Items mit fünf oder sechs Ausprägungen weisen eine vollständige symmetrische Beschriftung der Antwortoptionen auf; jene mit mehr Ausprägungen beschriftete Randkategorien mit numerischen Abstufungen. Es wird angenommen, dass die Variablen das Kriterium gleicher Abstände erfüllen (Baur 2008; Urban und Mayerl 2011; Völkl und Korb 2018). Aus den acht Items zur mentalen Gesundheit gemäß CES‑D Depressionsskala wurde ein Summenindex erstellt (Van de Velde et al. 2009).
Zusätzlich wurden bei den ordinalen Variablen die Schnittpunkte zur Dichotomisierung variiert. Einzig der Moduseffekt bei der Frage zu subjektiver Armutsgefährdung (Tab. 2 und 4) ist durch die Verwendung anderer Schnittpunkte für die Dichotomisierung nicht mehr signifikant (aufgrund der asymmetrischen Verteilung der binären Variablen). Allerdings weist eine ordinale logistische Regression einen signifikanten Moduseffekt aus, weshalb wir die Ergebnisse in Tab. 1 auch bei dieser Frage als belastbar ansehen und so der Trend im Fragenblock Finanzielle Lage bestätigt wird (siehe Abschn. 4.3).
Es kann nur für Unterschiede in der Stichprobenzusammensetzung von CATI und CAWI kontrolliert werden, insofern sich die Unterschiede auf in der Befragung gemessene Eigenschaften beziehen. Es kann nicht ausgeschlossen werden, dass sich die beiden Stichproben anhand weiterer Eigenschaften voneinander unterscheiden, die das Antwortverhalten beeinflussen (siehe Abschn. 2.1).
Arbeitszeit, Arbeitsdruck, betriebliche Mitbestimmung, Arbeitsautonomie, Arbeitsüberwachung, persönliche Kontakte zu Menschen, gefühlte gesellschaftliche Anerkennung für die berufliche Tätigkeit, sowie die Einschätzung des Risikos sich bei der Arbeit mit dem Coronavirus anzustecken.
Auf Basis eines Regressionsmodells analog zu jenem im Online-Supplement für dieses Item, jedoch anhand eines nicht standardisierten Regressionskoeffizienten.

Literatur

Ansolabehere, Stephen, und Brian F. Schaffner. 2014. Does survey mode still matter? Findings from a 2010 multi-mode comparison. Political Analysis 22:285–303. https://doi.org/10.1093/pan/mpt025.
Article Google Scholar
Aschauer, Wolfgang, Alexander Seymer, Dimitri Prandner, Benjamin Baisch, Markus Hadler, Franz Höllinger, und Johann Bacher. 2020. Values in crisis Austria (SUF edition). AUSSDA. https://doi.org/10.11587/H0UJNT.
Book Google Scholar
Atteslander, Peter. 2008. Methoden der empirischen Sozialforschung., 12. Berlin: Erich Schmidt.
Google Scholar
Backes, Ben, und James Cowan. 2019. Is the pen mightier than the keyboard? The effect of online testing on measured student achievement. Economics of Education Review 68:89–103. https://doi.org/10.1016/j.econedurev.2018.12.007.
Article Google Scholar
Baur, Nina. 2008. Das Ordinalskalenproblem. In Datenanalyse mit SPSS für Fortgeschrittene: ein Arbeitsbuch, 2. Aufl., Hrsg. Nina Baur, Sabine Fromm, 279–289. Wiesbaden: VS.
Chapter Google Scholar
Bowyer, Benjamin T., und Jon C. Rogowski. 2017. Mode matters: evaluating response comparability in a mixed-mode survey. Political Science Research and Methods 5:295–313. https://doi.org/10.1017/psrm.2015.28.
Article Google Scholar
Callegaro, Mario, Katja Lozar Manfreda, und Vasja Vehovar. 2015. Web survey methodology. SAGE.
Book Google Scholar
De Leeuw, Edith D., und Joop J. Hox. 2015. Survey mode and mode effects. In Improving survey methods: lessons from recent research, Hrsg. Uwe Engel, Ben Jann, Peter Lynn, Annette Scherpenzeel, Patrick Sturgis, und European Association of Methodology, 22–34. New York: Routledge, Taylor & Francis.
Google Scholar
Engel, Uwe, Ben Jann, Peter Lynn, Annette Scherpenzeel, und Patrick Sturgis (Hrsg.). 2015. Improving survey methods: lessons from recent research. European association of methodology. New York: Routledge, Taylor & Francis Group.
Google Scholar
Epstein Faith, Joan, Peggy Ripley Barker, und Larry A. Kroutil. 2001. Mode effects in self-reported mental health data. Public Opinion Quarterly 65:529–549. https://doi.org/10.1086/323577.
Article Google Scholar
ESS. 2016. European Social Survey Round 8 Data. Data file edition 2.2. NSD—Norwegian Centre for Research Data, Norway—Data Archive and distributor of ESS data for ESS ERIC. https://doi.org/10.21338/NSD-ESS8-2016.
Book Google Scholar
ESS. 2018. European Social Survey Round 9 Data. Data file edition 3.1. NSD—Norwegian Centre for Research Data, Norway—Data Archive and distributor of ESS data for ESS ERIC. https://doi.org/10.21338/NSD-ESS9-2018.
Book Google Scholar
Grand, Peter. 2021. IHS COVID-19 Survey 2021 (SUF edition). AUSSDA. https://doi.org/10.11587/VB8CMB.
Book Google Scholar
Heerwegh, Dirk, und Geert Loosveldt. 2011. Assessing mode effects in a national crime victimization survey using structural equation models: social desirability bias and acquiescence. Journal of Official Statistics 27:15.
Google Scholar
Hoebel, Jens, Elena von der Lippe, Cornelia Lange, und Thomas Ziese. 2014. Mode differences in a mixed-mode health interview survey among adults. Archives of Public Health 72:46. https://doi.org/10.1186/2049-3258-72-46.
Article PubMed PubMed Central Google Scholar
Holbrook, Allyson L., und Jon A. Krosnick. 2010. Social desirability bias in voter turnout reports: Tests using the item count technique. Public Opinion Quarterly 74:37–67.
Article Google Scholar
Jäckle, Annette, Caroline Roberts, und Peter Lynn. 2010. Assessing the effect of data collection mode on measurement. International Statistical Review 78:3–20. https://doi.org/10.1111/j.1751-5823.2010.00102.x.
Article Google Scholar
Joinson, Adam N., Alan Woodley, und Ulf-Dietrich Reips. 2007. Personalization, authentication and self-disclosure in self-administered Internet surveys. Computers in Human Behavior 23:275–285. https://doi.org/10.1016/j.chb.2004.10.012.
Article Google Scholar
Kittel, Bernhard, Sylvia Kritzinger, Hajo Boomgaarden, Barbara Prainsack, Jakob-Moritz Eberl, Fabian Kalleitner, Noëlle S. Lebernegg, et al. 2021. Austrian Corona Panel Project (SUF edition). AUSSDA. https://doi.org/10.11587/28KQNS.
Book Google Scholar
Klausch, Thomas, Joop J. Hox, und Barry Schouten. 2013. Measurement effects of survey mode on the equivalence of attitudinal rating scale questions. Sociological Methods & Research 42:227–263. https://doi.org/10.1177/0049124113500480.
Article MathSciNet Google Scholar
Kreuter, Frauke, Stanley Presser, und Roger Tourangeau. 2008. Social desirability bias in CATI, IVR, and web surveys: the effects of mode and question sensitivity. Public Opinion Quarterly 72:847–865. https://doi.org/10.1093/poq/nfn063.
Article Google Scholar
Malakhoff, Lawrence A., und Matt Jans. 2011. Towards usage of avatar interviewers in web surveys. Survey practice 4:1–14.
Article Google Scholar
Mühlböck, Monika, Nadia Steiber, und Bernhard Kittel. 2017. Less supervision, more Satisficing? Comparing completely self-administered web-surveys and interviews under controlled conditions. Statistics, Politics and Policy 8:13–28. https://doi.org/10.1515/spp-2017-0005.
Article Google Scholar
Mühlböck, Monika, Sarah Hartleib, Lisa Brüngger, und Matthias Till. 2022. So geht’s uns heute: die sozialen Folgen der Corona-Krise. Ergebnisse einer Statistik-Austria-Befragung im vierten Quartal 2021. Wien: Bundesministerium für Soziales, Gesundheit, Pflege und Konsumentenschutz (BMSGPK).
Google Scholar
Peytchev, Andy, und Craig A. Hill. 2010. Experiments in mobile web survey design: Similarities to other modes and unique considerations. Social Science Computer Review 28:319–335.
Article Google Scholar
Prandner, Dimitri. 2022. Zu Datengrundlage und Datenqualität: Methodische Reflexion zur quantitativen Erhebung während der Corona-Krise. In Die österreichische Gesellschaft während der Corona-Pandemie: Ergebnisse aus sozialwissenschaftlichen Umfragen, Hrsg. Wolfgang Aschauer, Christoph Glatz, und Dimitri Prandner, 325–347. Wiesbaden: Springer VS.
Chapter Google Scholar
Pudney, Steve. 2010. An experimental analysis of the impact of survey design on measures and models of subjective wellbeing. 2010–20. ISER Working Paper Series. Institute for Social and Economic Research (ISER), University of Essex.
Google Scholar
Reinecke, Jost. 1991. Interviewer- und Befragtenverhalten. Theoretische Ansätze und methodische Konzepte. Opladen: Westdeutscher Verlag.
Google Scholar
Sánches Tome, Rosa. 2018. The impact of mode of data collection on measures of subjective wellbeing. Lausanne: Université de Lausanne.
Google Scholar
Sanders, David, Harold D. Clarke, Marianne C. Stewart, und Paul Whiteley. 2007. Does mode matter for modeling political choice? Evidence from the 2005 British election study. Political Analysis 15:257–285. https://doi.org/10.1093/pan/mpl010.
Article Google Scholar
Schouten, Barry, Jan van den Brakel, Bart Buelens, Jan van der Laan, und Thomas Klausch. 2013. Disentangling mode-specific selection and measurement bias in social surveys. Social Science Research 42:1555–1570. https://doi.org/10.1016/j.ssresearch.2013.07.005.
Article PubMed Google Scholar
Steiber, Nadia. 2021. AKCOVID Panel Survey (SUF edition). AUSSDA. https://doi.org/10.11587/D9AYZ7.
Book Google Scholar
Tourangeau, Roger, und Tom W. Smith. 1996. Asking sensitive questions: the impact of data collection mode, question format, and question context. Public opinion quarterly 60:275–304.
Article Google Scholar
Tourangeau, Roger, und Ting Yan. 2007. Sensitive questions in surveys. Psychological bulletin 133., 859. American Psychological Association.
Google Scholar
Urban, Dieter, und Jochen Mayerl. 2011. Regressionsanalyse: Theorie, Technik und Anwendung, 4. Aufl., Wiesbaden: VS.
Book Google Scholar
Van de Velde, S., K. Levecque, und P. Bracke. 2009. Measurement equivalence of the CES‑D 8 in the general population in Belgium: a gender perspective. Archives of Public Health 67:15. https://doi.org/10.1186/0778-7367-67-1-15.
Article PubMed Central Google Scholar
Vannieuwenhuyze, Jorre T.A., und Geert Loosveldt. 2013. Evaluating relative mode effects in mixed-mode surveys:: three methods to disentangle selection and measurement effects. Sociological Methods & Research 42:82–104. https://doi.org/10.1177/0049124112464868.
Article MathSciNet Google Scholar
Vannieuwenhuyze, Jorre T.A., und Melanie Revilla. 2013. Evaluating relative mode effects on data quality in mixed-mode surveys. Survey Research Methods 7:157–168.
Google Scholar
Völkl, Kerstin, und Christoph Korb. 2018. Deskriptive Statistik. Eine Einführung für Politikwissenschaftlerinnen und Politikwissenschaftler. Wiesbaden: Springer VS. https://doi.org/10.1007/978-3-658-10675-1.
Book Google Scholar
Wright, Debra L., William S. Aquilino, und Andrew J. Supple. 1998. A comparison of computer-assisted and paper-and-pencil self-administered questionnaires in a survey on smoking, alcohol, and drug use. The Public Opinion Quarterly 62:331–353.
Article Google Scholar

Download references

Förderung

Die Befragung wurde von der Arbeiterkammer Wien, dem Europäischen Zentrum für Wohlfahrtspolitik und Sozialforschung und dem Institut für Höhere Studien (IHS) finanziert.

Funding

Open access funding provided by University of Vienna.

Author information

Authors and Affiliations

Institut für Soziologie, Universität Wien, Rooseveltplatz 2, 1090, Wien, Österreich
Bernd Liedl & Nadia Steiber

Authors

Bernd Liedl
View author publications
You can also search for this author in PubMed Google Scholar
Nadia Steiber
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding authors

Correspondence to Bernd Liedl or Nadia Steiber.

Ethics declarations

Interessenkonflikt

B. Liedl und N. Steiber geben an, dass kein Interessenkonflikt besteht.

Additional information

Availability of data and material

Steiber (2021) „AKCOVID Panel Survey (SUF edition)“, https://doi.org/10.11587/D9AYZ7, AUSSDA, V2.

Supplementary Information

Online-Supplement: Tabellenband

Anhang

Tab. 4 Formulierung der untersuchten Items

Full size table

Rights and permissions

Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.

Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.

Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/licenses/by/4.0/deed.de.

Reprints and permissions

About this article

Cite this article

Liedl, B., Steiber, N. Führen Online-Befragungen zu anderen Ergebnissen als persönliche Interviews? Eine Schätzung von Moduseffekten am Beispiel eines Mixed-Mode Surveys. Österreich Z Soziol 49, 1–22 (2024). https://doi.org/10.1007/s11614-023-00532-4

Download citation

Received: 07 June 2022
Accepted: 11 April 2023
Published: 05 June 2023
Issue Date: March 2024
DOI: https://doi.org/10.1007/s11614-023-00532-4

Schlüsselwörter

Keywords

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

Führen Online-Befragungen zu anderen Ergebnissen als persönliche Interviews? Eine Schätzung von Moduseffekten am Beispiel eines Mixed-Mode Surveys

Zusammenfassung

Abstract

1 Einleitung

2 Stand der Forschung: Moduseffekte in der Umfrageforschung

2.1 Selektionseffekte

2.2 Effekte auf die Item-Non-Response

2.3 Soziale Erwünschtheit

3 Design der vorliegenden Studie: Vergleich CAWI mit CATI

4 Ergebnisse

4.1 Selektionseffekt aufgrund unterschiedlicher Zusammensetzung der Stichproben

4.2 Wenig Unterschied zwischen CATI und CAWI in der Non-Response

4.3 Antwortverhalten: Mehr soziale Erwünschtheit bei persönlichen Interviews (CATI)

4.4 Stärke der Moduseffekte und heterogene Moduseffekte

5 Resümee und Ausblick

Notes

Literatur

Förderung

Funding

Author information

Authors and Affiliations

Corresponding authors

Ethics declarations

Interessenkonflikt

Additional information

Availability of data and material

Supplementary Information

Online-Supplement: Tabellenband

Anhang

Anhang

Rights and permissions

About this article

Cite this article

Share this article

Schlüsselwörter

Keywords

Search

Navigation