1 Einleitung

Die Debatte um Zuwanderung und Integration ist in Deutschland seit dem Sommer 2015 eines der zentralen Themen des öffentlichen medialen Diskurses. Ein Großteil davon findet im Internet statt (vgl. Vowe 2016). Bilder spielen in der Online-Kommunikation eine zentrale Rolle, da sie Inhalte auf einen Blick zusammenfassen, Emotionen wecken und die Aufmerksamkeit der Leser auf sich ziehen (vgl. de Haan et al. 2017). Visuelle Elemente können jedoch nur in ihrem Kontext verstanden werden (vgl. Wittgenstein 1977), weshalb das Zusammenspiel von Text und Bild entscheidend ist.

Wenn Text und Bild nicht dieselbe Sprache sprechen, kann derartige Kommunikation den Leser in die Irre führen (vgl. Leckner 2012, S. 169). Leser können sich getäuscht fühlen, was wiederum zu vermeintlicher postfaktischer Kommunikation von Organisationen beiträgt, welche die öffentliche Debatte einschränkt (vgl. Heidbrink und Lorch 2017). Im Gegensatz dazu bringen Rezipienten konsistenter Kommunikation mehr Vertrauen entgegen (vgl. Bentele und Nothaft 2011), weshalb sie eher geneigt sein könnten, am öffentlichen Diskurs teilzunehmen oder sich für ein Thema zu engagieren. Kongruenter Text-Bild-Kommunikation kommt also eine zentrale Bedeutung zu, wenn es um die Wahrnehmung von Glaubwürdigkeit der Kommunikation und Handlungsabsichten geht, besonders bei gesellschaftlichen Herausforderungen wie der Migration. Daher ist kongruente Text- und Bildsprache wichtig für eine voll funktionierende Gesellschaft (vgl. Heath 2013), in der die öffentliche Kommunikation von Organisationen verständnisorientiert abläuft (vgl. Burkart 2015).

Die Effekte kongruenter multimodaler Kommunikation wurden bisher vor allem in der Medienberichterstattung untersucht (vgl. z. B. Powell et al. 2015), jedoch nicht in Bezug auf Glaubwürdigkeit und weniger im Hinblick auf die Kommunikation von politischen und zivilgesellschaftlichen Organisationen. Diese sind aber ebenso zentral für die Migrationsdebatte in Deutschland wie die Medienberichterstattung, da Organisationen einerseits durch Agenda-Building versuchen, die Öffentlichkeit maßgeblich über die Medien im Sinne der „earned media“ zu beeinflussen (vgl. Macnamara et al. 2016). Andererseits geschieht dieser Agenda-Setting-Prozess aber auch direkt über die Online-Kommunikation von Organisationen, etwa via „owned“ oder „shared media“, also zum Beispiel Webseiten oder soziale Medien (vgl. Meriläinen und Vos 2011; Kiousis et al. 2007). Wird diese Kommunikation als glaubwürdig wahrgenommen – was auch vom Zusammenspiel von Texten und Bildern abhängen könnte – vermag sie bei Rezipienten in zivilgesellschaftlichem Engagement zu münden (vgl. Chung und Lee 2019). Daher ist die Wirkung der Kommunikation zu sozial zentralen Themen wie Zuwanderung und Integration (vgl. Vowe 2016) ein geeigneter und relevanter Untersuchungsgegenstand, um von Kommunikation über Glaubwürdigkeitseffekte auf Handlungsabsichten in einer demokratischen Zivilgesellschaft zu schließen.

Inwiefern führt also das Zusammenspiel von Text- und Bildsprache in der Online-Kommunikation von Organisationen dazu, dass Bürger geneigt sind, sich zivilgesellschaftlich zu engagieren, weil sie die Kommunikation als glaubwürdig, und nicht täuschend wahrnehmen? Um diese Forschungsfrage im Kontext der Zuwanderungs- und Integrationsdebatte zu beantworten, wurde ein 2 × 3-Between-Subjects-Online-Experiment mit dem SoSci-Panel (N = 406) durchgeführt. Da verschiedene Organisationstypen unterschiedlich strategisch kommunizieren (vgl. Holtzhausen und Zerfass 2014) wurde dieser Faktor ebenfalls experimentell manipuliert. Zwei Organisationstypen, die sich im Hinblick auf ihre gesellschaftliche Legitimierung unterscheiden, standen im Mittelpunkt: das Bundesinnenministerium (BMI) als zentraler politischer Akteur und die Bertelsmann Stiftung, die als zivilgesellschaftliche Organisation starken Einfluss auf die deutsche Medien-Agenda hat (vgl. Munzinger 2018). Letztere steht als gemeinnützige Organisation vor allem wegen ihrer wirtschaftlichen Interessen in der Kritik, ist jedoch unbestritten eine der einflussreichsten nichtstaatlichen Organisationen in Deutschland (vgl. Schuler 2010).

Die Internetseiten dieser Organisationen wurden als zentraler Kommunikationskanal und als digitale Visitenkarten (vgl. Kent und Saffer 2014, S. 575) experimentell manipuliert, so dass sich pro Organisationstyp je eine kongruente, inkongruente und textbasierte (Kontrollgruppe) Kondition ergab (insgesamt 12 Stimuli). Um dem spezifischen Kontext der Debatte zu entsprechen, wurde gemessen, inwieweit wahrgenommene Bedrohung durch Migration moderierend auf Glaubwürdigkeits‑/Täuschungswahrnehmungen wirkt („integrated threat theory“, vgl. Stephan et al. 1998) und welche Rolle die Art der Organisation spielt.

2 Theoretischer Hintergrund

Der folgende Literaturüberblick geht kurz auf die Rolle von Bildern in der Online-Kommunikation von Organisationen ein und beleuchtet die Medienreichhaltigkeitstheorie, die bei der Interpretation dieser Rolle Hilfestellung leistet. Es folgt ein Blick auf die aktuelle Forschung zu den Effekten multimodaler Kommunikation, wobei die zentral untersuchten Konzepte „Glaubwürdigkeit“ und „Täuschung“ eingeführt und die Hypothesen der Untersuchung abgeleitet werden.

2.1 Die Macht der Bilder in der Online-Kommunikation von Organisationen

Als integraler Bestandteil der Online-Kommunikation von Organisationen wurde die vermehrte Bildsprache im Internet mit dem Begriff des „Visual Turn“ umschrieben (Oeldorf-Hirsch und Sundar 2016, S. 625). Studien zur Medienberichterstattung belegen, dass Bilder die Aufmerksamkeit der Leser schneller auf sich ziehen als Text (vgl. Leckner 2012): Bei Tageszeitungstiteln gelten Bilder als erste Zugangspunkte für den Leser (vgl. Kress und van Leeuwen 2001), ein Befund, der sich auch auf das Internet anwenden lässt (vgl. de Haan et al. 2017). Zahlreiche Studien belegen (für einen Überblick siehe Smith-Rodden und Ash 2012), dass Texte in Kombination mit Bildern das Verständnis einer Nachricht, im Vergleich zu rein textbasierten Botschaften, verbessern (vgl. Moreno und Valdez 2005) und die Qualität der Kommunikation durch Medien insgesamt erhöhen (vgl. Brantner et al. 2011).

In Bezug auf die Organisationskommunikation vermag die Medienreichhaltigkeitstheorie (vgl. Daft und Lengel 1986) zu erklären, warum Organisationen online auf kombinierte Text- und Bildsprache setzen. Grundsätzlich ist zu vermuten, dass Organisationen durch Kommunikation Unsicherheiten und Unklarheiten reduzieren wollen und dass die Wahl des Mediums von der Ambiguität der Management-Aufgabe abhängt. Da mehrere Modalitäten eher dazu beitragen, Unsicherheit und Unklarheit zu reduzieren, ist multimodale Kommunikation in dieser Denkweise als reichhaltigere Kommunikation rein textbasierten Botschaften vorzuziehen (vgl. Cho et al. 2009), da sie mehr Informationen transportiert, die dem Rezipienten ein ganzheitliches Bild der Botschaft vermittelt. Dies schlägt sich folglich in einer höheren wahrgenommenen Glaubwürdigkeit nieder, die zu gegenseitigem Verständnis beiträgt (vgl. Burgoon et al. 2002).

Webseiten sind ein zentraler Kanal für die externe Kommunikation von Organisationen. Sie werden auch als digitale Visitenkarten bezeichnet (vgl. Kent und Saffer 2014), da sie unter anderem als Startpunkt für kommunikative Beziehungen und für einen Dialog zwischen Organisationen und (Teil‑)Öffentlichkeiten gelten (vgl. Kent und Taylor 1998). So hält man Internetseiten auch für ein reichhaltigeres Medium als beispielsweise Pressemitteilungen (Cho et al. 2009), was der Trend zu mehr Visuellem noch verstärkt (Chung und Lee 2019). Wahrnehmungen von Webseiteninhalten sind also positiver, wenn Internetseiten Text- und Bildsprache vereinen, da so Unklarheiten und Unsicherheiten in der Kommunikation reduziert werden. Außerdem stellten Fogg et al. (2003, S. 5) fest, dass der Hauptfaktor, nach dem Rezipienten eine Webseite als glaubwürdig einstufen, ihr „Design Look“ ist, was vor allem visuelle Aspekte einbezieht.

2.2 Text-Bild-Kongruenz und ihre Effekte

Allerdings ist zu vermuten, dass die oben beschriebenen positiven Wahrnehmungseffekte durch reichhaltige multimodale Kommunikation nur auftreten, wenn Texte und Bilder thematisch übereinstimmen. Wenn Bilder und Texte dagegen nicht übereinstimmen, kann diese Kommunikation potentiell irreführen (vgl. Leckner 2012, S. 169). Solch thematisch inkongruente Kommunikation führt zu erhöhter Unklarheit und Unsicherheit bei Rezipienten, da es für sie schwieriger ist, die Kommunikation plausibel zu interpretieren und zu erinnern (vgl. Geise und Baden 2014, S. 63).

Empirische Befunde über die Effekte multimodal kongruenter Kommunikation auf Wahrnehmungen sind, verglichen mit der Wirkung inkongruenter Kommunikation, nicht eindeutig. Kongruente Texte und Bilder können zwar analog interpretiert und daher schneller weiterverarbeitet werden (vgl. Rebich-Hesphana et al. 2015, S. 494) und geben tieferen Einblick in ein Thema (vgl. Leckner 2012, S. 173). Folglich behalten Leser weniger von thematisch inkongruenter Kommunikation im Gedächtnis (vgl. Holsanova 2014, S. 13). Weiterhin zeigen Experimente zu multimodalem Framing in der Medienberichterstattung, dass bei Kongruenz Wahrnehmungen und Handlungsabsichten gestärkt werden (vgl. Powell et al. 2019) und Rezipienten die Inhalte besser verstehen (vgl. de Haan et al. 2017, S. 4).

Andererseits gibt es auch empirische Befunde, die die darauf deuten, dass Verständnis durch kongruente Text-Bild-Sprache gerade nicht verbessert wird (vgl. Smith-Rodden und Ash 2012, S. 24). Außerdem erhöhen Bilder die Attraktivität von Medien, unabhängig davon, ob sie mit dem Text der Botschaft übereinstimmen (vgl. Hoslanova 2014, S. 2), wobei irrelevante Bilder Leser ablenken (vgl. Smith-Rodden und Ash 2012, S. 23) und die Inhalte dadurch schlechter erinnert werden (vgl. Leckner 2012, S. 174).

Bis dato wurden diese Effekte multimodaler Kommunikation vor allem ausgehend von der Medienberichterstattung untersucht, jedoch weniger von Seiten der Organisationskommunikation. Während einige Studien Handlungsabsichten in den Mittelpunkt rückten, konzentrierten sie sich darauf, wie Emotionen (vgl. Powell et al. 2015), Einstellungen gegenüber dem Nachrichtenthema (vgl. Powell et al. 2019) oder der Organisation (vgl. Chung und Lee 2019) diese Intentionen erklären. Sie stellten jedoch nicht die Frage, inwieweit Handlungsabsichten auf Wahrnehmungen der Glaubwürdigkeit der Botschaft beruhen. Dieser Faktor ist jedoch aus zivilgesellschaftlicher Perspektive von Belang.

2.2.1 Wahrnehmungseffekte: Glaubwürdigkeit und Täuschung

Vertrauen ist im demokratischen Diskurs zentral für eine voll funktionierende Gesellschaft („fully functioning society“, vgl. Heath 2013). Hierbei ist von Bedeutung, dass die Teilnehmer am öffentlichen Diskurs vertrauenswürdig sind, was durch glaubwürdige und verständnisorientierte Kommunikation erreicht werden kann (vgl. Burkart 2015). Täuschende Kommunikation hingegen unterminiert die Legitimität von Organisationen (vgl. Dulek und Campbell 2015, S. 132; Thummes 2018, S. 1), weil sie den Wahrhaftigkeitsanspruch von Kommunikation verletzt (vgl. Levine 2014). Öffentlicher Diskurs zwischen legitimen Akteuren führt zu einer besser funktionierenden Gesellschaft, in der Individuen und Organisationen kollektive Entscheidungen im Sinne von Partikular- und Gemeininteressen treffen (vgl. Heath et al. 2013, S. 273).

Organisationen im öffentlichen Leben werden als „Stewards“ der Demokratie angesehen, die dazu beitragen, kollektive Entscheidungen im Sinne eines deliberativen Demokratieansatzes (vgl. Habermas 1992) durch rationalen Diskurs herbeizuführen (vgl. Heath et al. 2013, S. 273). Dieser Kommunikationsprozess muss aber, laut Habermas’ Verständnis der deliberativen Demokratie (vgl. Chappell 2012), auf ethischem Diskurs basieren (vgl. Lock 2016, S. 423). Die Public Relations-Forschung nimmt daher an, dass konsistente und glaubwürdige Kommunikation in öffentlichem Vertrauen von Organisationen mündet (vgl. Bentele und Nothaft 2011). Dies trifft umso mehr auf Internetseiten zu (vgl. Kent und Saffer 2014, S. 575).

Glaubwürdigkeit wurde in der Kommunikationswissenschaft in unterschiedlichen Formen konzeptualisiert und operationalisiert (vgl. z. B. Jackob 2008). „[C]redibility is a salient judgment in all communicative transactions and one to which both participants orient.“ (Buller und Burgoon 1996, S. 208) Speziell für die Kommunikation von Organisationen wurde ein Glaubwürdigkeitsansatz im Sinne der Diskursethik von Habermas vorgeschlagen (vgl. Lock 2016). Dieser beruht auf den vier Geltungsansprüchen der idealen Sprechsituation (vgl. Habermas 1981) und stellt Organisationskommunikation als glaubwürdig dar, wenn sie wahr, wahrhaftig, normativ richtig und verständlich ist. Glaubwürdigkeitswahrnehmungen hängen jedoch neben dem Sender und Rezipienten auch von der Botschaft ab (vgl. Melican und Dixon 2008, S. 153) und von der Zusammenstellung der Botschaft, also der Kombination verschiedener Modalitäten. Allerdings wurde bis dato noch nicht untersucht, inwieweit kongruente und inkongruente Text- und Bildsprache auf den zentralen Effekt der Glaubwürdigkeit wirkt (vgl. Lock 2016).

Wie in der Medienwirkungsforschung festgestellt, verringern thematisch inkongruente Botschaften das Verständnis und den Einblick in Kommunikationsinhalte (vgl. de Haan et al. 2017, S. 4; Leckner 2012, S. 173). Übertragen auf Internetseiten bedeutet das, dass die Webseite schlechter verstanden wird. Wahrgenommene Verständlichkeit wiederum gilt als einer der vier Bestandteile von Glaubwürdigkeit in der Organisationskommunikation (vgl. Lock und Seele 2017). Ist die Verständlichkeit der Botschaft durch inkongruente Text- und Bildsprache eingeschränkt, sinkt wahrgenommene Glaubwürdigkeit und können Rezipienten sich getäuscht fühlen, weil sie Inhalte nicht mehr einfach verifizieren können. Glaubwürdigkeit und Täuschung sind also gemeinsam auftretende Effekte. Dies beschreibt auch die Internpersonal Deception Theory. Hier wird angenommen, dass der Sender umso mehr auf Glaubwürdigkeitsaspekte in der Kommunikation achtet, wenn er die Täuschungsabsicht verschleiern will (vgl. Buller und Burgoon 1996, S. 209).

Wahrhaftigkeit gilt als weiterer Bestandteil glaubwürdiger Kommunikation von Organisationen (Lock 2016, S. 422). Wenn Rezipienten den Absichten von Organisationen nicht glauben (Geise und Baden 2014, S. 54), kann deren Aufrichtigkeit oder Wahrhaftigkeit infrage gestellt werden, was durch inkongruente Kommunikation befördert wird. Möllering (2008, S. 22) stellt hierzu fest, dass Wahrhaftigkeit und Täuschung ambivalent sind, da sie sich gegenseitig ermöglichen und verhindern. Allen Täuschungsdefinitionen gleich ist die Idee, dass der Sender absichtlich täuschen will (vgl. Furner und George 2012, S. 1428), was im Geltungsanspruch Wahrhaftigkeit reflektiert ist (vgl. Habermas 1981). Im Sinne des allgemeinen Verständnisses von strategischer Kommunikation in den Public Relations, zu der Inhalte auf Webseiten zu zählen sind, kommunizieren Organisationen grundsätzlich absichtlich (vgl. Hallahan et al. 2007, S. 23).

Wahrhaftige Kommunikation gilt als Standard zwischenmenschlicher Kommunikation (vgl. Levine 2014). Täuschung verletzt diesen Wahrheitsanspruch, kann aber auch nur stattfinden, wenn zuvor Standards für Wahrheit festgelegt wurden. Da Rezipienten jedoch den Wahrheitsgehalt von Botschaften kaum überprüfen können, ist es für sie schwierig, täuschende Kommunikation zu erkennen (vgl. Ekman und Friesen 1974). Denn Sender haben unterschiedliche und bisweilen komplexe Motive, ihr Gegenüber zu täuschen (vgl. Finneman und Thomas 2018, S. 351). Der Kontext der Täuschung ist also entscheidend (vgl. Möllering 2008, S. 22; Dulek und Campbell 2015, S. 135).

Diese kontextgebundene normative Richtigkeit, die alle Diskursteilnehmer teilen müssen, ist auch für die Glaubwürdigkeit von Bedeutung (vgl. Habermas 1981). Abgesehen von Verständlichkeit, die oft auch als Vorbedingung für Kommunikation behandelt wird, kann Täuschung daher als Konzept gelten, das die drei Dimensionen glaubwürdiger Organisationskommunikation (Wahrheit, Wahrhaftigkeit, normative Richtigkeit) verletzt. Glaubwürdigkeit und Täuschung sind also theoretisch verbunden, jedoch keine Gegensätze.

Täuschende Kommunikation stellt die Daseinsberechtigung von Organisationen infrage (vgl. Thummes 2018). Im Gegensatz dazu billigen Anspruchsgruppen glaubwürdig kommunizierenden Organisationen Legitimität zu (vgl. Lock 2016, S. 422). Kongruente Text-Bild-Sprache führt zu positiven Wahrnehmungen (vgl. Burgoon et al. 2002, S. 671), was organisationale Legitimität befördert (vgl. Heath 2013), während inkongruente multimodale Kommunikation zu geringerer Verständigung führt und Legitimität anficht (vgl. Dulek und Campbell 2015, S. 132). Überträgt man diese Denkweise auf Glaubwürdigkeit beziehungsweise Täuschung einerseits und modale Zusammenstellung der Botschaft andererseits, kann man annehmen, dass kongruente Text-Bild-Sprache eher glaubwürdig und weniger täuschend wirkt, während inkongruente Kommunikation zu geringerer Glaubwürdigkeit und höherer Täuschung führt. Dieses Spektrum bezieht Graubereiche wie Verschweigen und Ambiguitäten ein (vgl. Thummes 2018; Park et al. 2002).

In dieser Untersuchung wird daher angenommen:

H1a

Kongruente multimodale Kommunikation führt zu höherer wahrgenommener Glaubwürdigkeit als inkongruente Kommunikation.

H1b

Kongruente multimodale Kommunikation führt zu geringerer wahrgenommener Täuschung als kongruente Kommunikation.

2.2.2 Der Kontext: Die Debatte um Migration und Integration

Die Migrationsdebatte war in den letzten Jahren in Deutschland ein heiß debattiertes Thema (vgl. Vowe 2016), weshalb auch emotionale Effekte zu berücksichtigen sind. Die „integrated threat theory“ (vgl. Stephan et al. 1998) legt dar, dass Einstellungen gegenüber Migration in Teilen durch die wahrgenommene Bedrohung, die ein Migrant für die eigene Umgebung darstellt, bestimmt wird. Diese Bedrohungen sind realistisch, wenn sie zum Verlust des sozioökonomischen Status beitragen, oder symbolisch, wenn es um Werte und Glauben geht. Schlechter Gebildete nehmen sie im allgemeinen stärker wahr als besser gebildete (vgl. Matthes und Marquardt 2013, S. 252). Die Medienwirkungsforschung belegt außerdem, dass Bedrohungsgefühle unter schlechter Gebildeten stärker sind, wenn Bilder benutzt werden, weil diese schneller verarbeitet werden und Emotionen ansprechen (Matthes und Schmuck 2017, S. 559 und 572). Kongruente Kommunikation verstärkt diesen Effekt, da beide Modi dieselbe Botschaft transportieren. Folglich war auch die Unterstützung für Flüchtende bei passender Text-Bild-Sprache höher und schwand bei inkongruentem Framing (vgl. Powell et al. 2019, S. 575). Um den Kontext der Debatte in dieser Studie abzubilden, wird daher ein moderierender Einfluss von Bedrohungsgefühlen auf Wahrnehmungseffekte angenommen:

H2a

Eine geringer gefühlte Bedrohung durch Migration verstärkt den positiven Zusammenhang zwischen multimodaler Kongruenz und wahrgenommener Glaubwürdigkeit.

H2b

Eine geringer gefühlte Bedrohung durch Migration verstärkt den negativen Zusammenhang zwischen multimodaler Kongruenz und wahrgenommener Täuschung.

2.2.3 Handlungsabsichten

Mehrere Rezeptionsstudien stellten neben Wahrnehmungseffekten multimodaler Kommunikation auch Auswirkungen auf das Verhalten oder die Handlungsabsichten fest (vgl. Smith-Rodden und Ash 2012, S. 23). Jedoch liegt der Schwerpunkt meist nicht auf den Wahrnehmungen der Botschaft, wie hier konzeptualisiert mit dem Spektrum Glaubwürdigkeit versus Täuschung. Inspiriert sind diese Studien meist von der Framing-Wirkungsforschung und zeigen Handlungs(absichts)effekte in den Bereichen Marketing, Gesundheitskommunikation und der politischen Kommunikation (für einen Überblick vgl. z. B. Schuck und de Vreese 2006). Im Kontext multimodalen Framings zeigt sich, dass das Text-Bild-Framing von Medienberichten, speziell die Emotionalität der Bilder, einen positiven Effekt auf die Absichten von Lesern hat, sich für ein politisches Thema zu engagieren (vgl. Powell et al. 2015). Wenn Unternehmen ihre gesellschaftlichen Aktivitäten mit Bildern und Texten kommunizieren, erhöht das die Wahrscheinlichkeit, dass sich Rezipienten online und offline für eine Sache engagieren wollen (vgl. Chung und Lee 2019). Die Autoren begründen diesen Effekt mit der Theorie des vernünftigen Handelns (vgl. Ajzen und Fishbein 2010). Danach wirken sich Einstellungen direkt auf die Handlungsabsichten aus. Zivilgesellschaftliches Engagement kann viele Formen annehmen, zum Beispiel die Teilnahme an Wahlen, das Unterzeichnen von Petitionen, Spenden an zivilgesellschaftliche Organisationen, aber auch allgemeines Interesse an oder Diskussionsbereitschaft bei öffentlich relevanten Themen. Major (2018, S. 54) definiert es als „a real and meaningful chance for citizens to come together and get involved in the process of discussing, considering, and discovering solutions to societal problems“.

Es wird angenommen, dass diese positiven Wirkungen auch bei kongruenten multimodalen Internetseiten von Organisationen zu beobachten sind, und zwar als Folge von Wahrnehmungseffekten der Kommunikation:

H3a

Je glaubwürdiger die Kommunikation, desto eher sind Rezipienten geneigt, sich on- und offline zu engagieren.

H3b

Je täuschender die Kommunikation, desto weniger sind Rezipienten geneigt, sich on- und offline zu engagieren.

2.2.4 Organisationstypen und Legitimität

Legitimität ist für öffentliche Organisationen mit administrativen oder exekutiven Befugnissen von großem Belang. Ministerien zum Beispiel sind teilweise – zumindest was deren Führung betrifft – durch Wahlen legitimiert. Durch den weitreichenden Einfluss ihrer Politik auf die Lebensbereiche der Bürger sind Regierungsorganisationen, um als legitim betrachtet zu werden, jedoch auch abseits von Wahlen auf öffentliche Unterstützung angewiesen (vgl. Arnesen 2017). Diese Unterstützung äußert sich in regem öffentlichem Diskurs oder bürgerschaftlichem Engagement. Im Gegensatz dazu gibt es für zivilgesellschaftliche gemeinnützige Organisationen keine Input-Legitimität durch demokratische Wahlen. Sie sind daher auf moralische, also kommunikativ verhandelte Legitimität angewiesen (vgl. Baur und Palazzo 2011). Ob die Aktivitäten solcher Organisationen als moralisch richtig und wertig angesehen sind, wird im öffentlichen Diskurs verhandelt. Da ihre Finanzierung zudem oftmals von Spenden abhängt, sind gute Beziehungen zu Anspruchsgruppen für diese Organisationen noch bedeutender, und diese Beziehungen werden über den zentralen Kommunikationskanal Internetseite aufgebaut (vgl. Waters 2007, S. 62). Gerade gemeinnützige Organisationen, die stark im Lichte der Öffentlichkeit stehen und durch ihre mediale Präsenz auch Einfluss auf politische Entscheidungen nehmen können, sind daher auf moralische Legitimität angewiesen (vgl. Baur und Palazzo 2011). Da sich also Regierungsorganisationen und gemeinnützige Organisationen in ihrer Legitimierung unterscheiden, nehmen wir an, dass die Art der Organisation moderierend auf die Effekte multimodaler Kommunikation wirkt:

H4a

Die positive Beziehung zwischen multimodaler Kongruenz, wahrgenommener Glaubwürdigkeit und Handlungsabsichten (H1 und H3) ist stärker für gemeinnützige Organisationen als für Regierungsorganisationen.

H4b

Die negative Beziehung zwischen multimodaler Kongruenz, wahrgenommener Täuschung und Handlungsabsichten (H1 und H3) ist stärker für gemeinnützige Organisationen als für Regierungsorganisationen.

Das konzeptionelle Modell der Studie ist in Abb. 1 abgebildet.

Abb. 1
figure 1

Konzeptionelles Modell

3 Methode

3.1 Experimentelles Design und Teilnehmer

Die Hypothesen wurden in einem 2 (Regierungsorganisation vs. zivilgesellchaftliche Organisation) × 3 (kongruent vs. inkongruent vs. textbasiert)-Between-Subjects-Experiment getestet. Im Oktober 2018 wurden Teilnehmer durch das SoSci-Panel (vgl. Leiner 2014) rekrutiert und konnten über eine Verlosung Gutscheine gewinnen.

Von 550 Reaktionen waren 428 vollständig. Davon bestanden N = 406 einen einfachen Aufmerksamkeitscheck und bildeten somit das finale Sample. Einen komplexeren Manipulationscheck (nach Oppenheimer et al. 2009) beantworteten 65,5 % der Teilnehmer korrekt. T‑tests mit unabhängigen Stichproben auf alle abhängigen Variablen ergaben aber keine signifikanten Unterschiede zwischen Teilnehmern, die diese Prüfung bestanden, und jenen, die sie nicht bestanden, so dass schließlich alle Antworten zum Testen der Hypothesen verwendet wurden (54,9 % weiblich, 44,6 % männlich, 0,5 % divers, Alter: M = 41,6 Jahre, SD = 14,45). Dieses Vorgehen deckt sich mit Untersuchungen, die vor einem starken zusätzlichen Bias warnen, wenn Subjekte nur aufgrund eines solch – in diesem Fall – schwierigen Tests ausgeschlossen werden (siehe auch Anduiza und Galais 2016). Die Teilnehmer waren weit höher gebildet als im deutschen Durchschnitt: 0,8 % Hauptschulabschluss, 4,8 % Realschulabschluss, 22,4 % Abitur, 17,3 % Bachelorabschluss, 45,7 % Masterabschluss, 8,0 % Doktortitel, 1,0 % nicht abgeschlossen und 2,0 % keine Angabe. 93,6 % waren deutscher, 4,4 % österreichischer und 1,2 % schweizerischer Nationalität (3,7 % sonstige). Ein Jahreseinkommen unter 30.000 € gaben 41,8 % an, zwischen 30.000 und 60.000 € verdienten 36,7 %, zwischen 60.000 und 90.000 16,8 % und über 90.000 4,6 % (9,4 % keine Angabe). Die Mehrzahl der Teilnehmer hatte Arbeit (48,8 %), 16 % waren Studenten, 9,1 % verbeamtet, 8,9 % selbstständig, 7,6 % in Rente und Pension (10,2 % sonstige).

3.2 Stimuli und Manipulationen

Die Internetseiten der beiden Organisationen bildeten die Grundlage für das Online-Experiment mit je zwei Stimuli pro Kondition (12 Stimuli). In zwei Pretests testeten Teilnehmer zweier Crowdsourcing-Dienste diese Vignetten. Die Stimuli wurden von den Internetseiten der Organisationen abgeleitet, um die externe Validität des Designs zu erhöhen (vgl. Koch et al. 2019, S. 88). Zwei Texte (120–200 Wörter) zum Thema Migration und Integration und vier Bilder (zwei kongruent zum Thema Integration und Migration, zwei inkongruent zu anderen Themen) pro Organisation wurden ausgewählt. Je zwei Bilder pro Text-Bild-Kondition sollten spezifische Effekte für einzelne Bilder ausschließen, wobei der Text gleich blieb (siehe auch Powell et al. 2015, 2019; für Beispiele siehe Anhang B). Der Text für die Text-Bild-Konditionen des BMI trägt den Titel „Warum Integration so wichtig ist“, jener für Bertelsmann „Städte sind ‚Laboratorien‘ des Zusammenlebens“. Für die reinen Textkonditionen wurden pro Organisation je zwei Texte gewählt, um spezielle Effekte einzelner Texte auszuschließen (siehe auch Fragenschema Anhang A). Pretest A bestätigte diese Inhalte, und in Pretest B wurden sie auf ihre wahrgenommene Kongruenz überprüft, so dass am Ende zwölf Stimuli für die Hauptstudie verwendet wurden.

Dieselben zwei Items aus dem Pretest testeten im finalen Experiment nochmals Manipulation der Text-Bild-Kombinationen; die Ergebnisse sind in Tab. 1 abgebildet. Alle Manipulationen waren erfolgreich, und es ergaben sich innerhalb einer Kondition keine signifikanten Unterschiede zwischen den StimuliFootnote 1.

Tab. 1 Mittelwerte. Stichprobengröße und Standardabweichungen der experimentellen Konditionen

3.3 Variablen

Die validierte deutsche Version der16-Item Skala für wahrgenommene Glaubwürdigkeit (vgl. Lock und Seele 2017) wurde auf Internetseiten angepasst und auf einer 5‑Punkt-Likert-ähnlichen Skala gemessen (1 = „stimme überhaupt nicht zu“; 5 = „stimme voll und ganz zu“). Die Skala ist reliabel (M = 3,60, SD = 0,62, Cronbach’s α = 0,89).

Um wahrgenommene Täuschung zu messen, wurde auf die 4‑Item-Skala von Darke und Ritchie (2007; 11-Punkt Likert-ähnliche Skala von 1 = „überhaupt nicht“; 11 = „absolut“) zurückgegriffen. Die Skala mit den Items wahr (rekodiert), aufrichtig (rekodiert), irreführend und täuschend (eigene Übersetzung) ist reliabel α = 0,85 (M = 2,25, SD = 2,26).

Handlungsabsichten für Online- und Offline-Engagement der Teilnehmenden wurde mit vier Items abgefragt (offline: Absicht zu diskutieren, spenden, auf eine Veranstaltung zu gehen; online: Absicht, über soziale Medien zu teilen; 5‑Punkt-Likert-ähnliche Skala von 1 = „sehr unwahrscheinlich“ bis 5 = „sehr wahrscheinlich“). Die Items wurden in eine Skala zusammengefügt, die mit α = 0,66 (M = 2,26, SD = 0,84) ausreichend reliabel ist.

Gefühlte Bedrohung durch Migration wurde mit der deutschen Skala von Rippl et al. (2005) getestet im Hinblick auf symbolische Bedrohung (Einfluss fremder Kulturen, eigene Sprache und Kultur, eigene Werte und Normen) und realistische Bedrohung (Preisniveau, Arbeitslosigkeit, deutsche Wirtschaft; alle auf 5‑Punkt-Likert-ähnlicher Skala von 1 = „stimme überhaupt nicht zu“; 5 = „stimme voll und ganz zu“). Aus den Items wurde eine Skala für wahrgenommene Bedrohung berechnet, die reliabel ist α = 0,89 (M = 2,24, SD = 1,05).

Politische Einstellungen der Teilnehmer wurden über das Links-Rechts-Spektrum (11-Punkte-Skala, 6 neutral) politischer Orientierung (vgl. Kroh 2007) erhoben. 15,5 % der Teilnehmer gaben an, neutral zu sein, 64,3 % ordneten sich vom neutralen Punkt aus gesehen dem linken (Skalenpunkte 1–5) und 20,2 % dem rechten (Skalenpunkte 7–11) Spektrum zu (M = 3,15, SD = 13,66, 1,7 % keine Angabe).

Vorkenntnisse über Migration wurden mit vier Items gemessen, angelehnt an Mehta und Sivadas (1995), und rangierten zwischen 1 = „stimme überhaupt nicht zu“ und 5 = „stimme voll und ganz zu“. Skalenreliabilität ist mit α = 0,81 nachgewiesen (M = 3,40, SD = 0,82).

Ihre Einstellung gegenüber den Organisationen bewerteten die Teilnehmer anhand einer Skala mit vier Adjektivpaaren (schlecht – gut; unnötig – notwendig; nutzlos – nützlich; unsympathisch – sympathisch; eigene Übersetzung. 5‑Punkte-Skala; vgl. MacKenzie und Lutz 1986; und Spears und Singh 2004). Skalenreliabilität ist gegeben mit α = 0,80 (M = 3,55, SD = 0,80).

Demographische Variablen waren: Alter, Geschlecht, Nationalität, jährliches Bruttoeinkommen, Bildungsstatus und Berufsstatus.

3.4 Ablauf

Nach einer Aufklärung über ihre Rechte und den Datenschutz, wurden die Teilnehmer per Zufallsverfahren einer der 12 Stimuli (sechs Konditionen) zugeteilt. Bevor sie den Stimulus sahen, erhielten sie Fragen zu ihrem Wissen über Migration und ihrer Einstellung zur Organisation. Nach Ansicht des Stimulus (Verweildauer mindestens 30 s) wurde die wahrgenommene Glaubwürdigkeit der Internetseite inklusive Aufmerksamkeitscheck abgefragt. Danach beantworteten sie einen Instructional Manipulation Check, bevor ihre Absichten, sich online oder offline zu engagieren gemessen wurden. Schließlich wurden ihre Bedrohungsgefühle durch Migration erhoben und demographische Parameter, inklusive der dritten Kontrollvariable politische Einstellung, abgefragt. Am Ende konnten Teilnehmer Kommentare hinterlassen, bevor sie ein Debriefing bekamen und an der Verlosung teilnehmen konnten.

4 Ergebnisse

4.1 Randomisierung

Die Randomisierung über alle Konditionen in Bezug auf Alter, Geschlecht und die Kontrollvariablen politische Einstellung, Vorwissen zu Migration und gefühlte Bedrohung war erfolgreich. Einstellungen gegenüber der Organisation waren gleichmäßig über alle Gruppen verteilt, allein bei der inkongruenten Kondition Bertelsmann zeigte sich ein signifikant höherer Wert zur Einstellung gegenüber Bertelsmann bei beiden Stimuli als in den anderen Konditionen. Abb. 2 zeigt die Verteilung der Teilnehmer auf die Stimuli und Konditionen.

Abb. 2
figure 2

Anzahl der Teilnehmer pro Stimulus und Kondition

4.2 Hypothesentests

Die Hypothesen wurden in einem moderierten Mediationsmodell mit dem PROCESS-Makro (v3.0, Modell 21, vgl. Hayes 2013) in SPSS 25 getestet. Modell A und die dazu passenden Hypothesen mit der Endung a hatte wahrgenommene Glaubwürdigkeit als Mediator, während wahrgenommene Täuschung in Modell B (mit entsprechenden Hypothesen b) als Mediator fungierte, ceteris paribus.

Modell A (N = 406) war signifikant und erklärt 25 % der Varianz in der abhängigen Variable Handlungsabsichten (R2 = 0,25, F(8, 397) = 16,70, p < 0,001, MSE = 0,54). Kontrollvariablen waren politische Einstellung, Einstellung gegenüber der Organisation und VorwissenFootnote 2.

In Hypothese 1a wurde angenommen, dass kongruente Text-Bildsprache (n = 132) zu höherer wahrgenommener Glaubwürdigkeit führt. Dieser Effekt war positiv und signifikant (B = 0,40, SE B = 0,16, p < 0,05) verglichen mit der Referenzkategorie der inkongruenten Kondition (n = 137). Kein signifikanter Unterschied wurde jedoch für die rein textbasierte (n = 137) Kondition festgestellt (B = 0,27, SE B = 0,17, p > 0,05).

Hypothese 2a nahm an, dass wahrgenommene Bedrohung durch Migration moderierend auf den positiven Effekt zwischen kongruenter Kommunikation und Glaubwürdigkeit wirkt. Geringe Bedrohungsgefühle verstärken die positive Beziehung zwischen kongruenter Kommunikation (n = 132) und Glaubwürdigkeitswahrnehmung (B = −0,15, SE B = 0,07, p < 0,05). Dieser Effekt ist bei der reinen Textkondition (n = 137) mit geringerem Signifikanzwert auch zu erkennen (B = −0,11, SE B = 0,07, p < 0,10).

Je glaubwürdiger die kongruente Kommunikation wahrgenommen wird, desto wahrscheinlicher ist es, dass daraus Handlungsabsichten entstehen: Hypothese 3a wurde bestätigt (B = 0,16, SE B = 0,08, p < 0,10). Dass dieser Effekt für eine zivilgesellschaftliche Organisation (n = 58) stärker ausfällt als für eine Regierungsorganisation (n = 74; Hypothese 4a), wurde ebenfalls nachgewiesen (B = 0,24, SE B = 0,12, p < 0,05): De facto ist der Effekt stärker für Bertelsmann (Effekt = 0,40, SE B = 0,09, p < 0,01) als für das BMI (Effekt = 0,16, SE B = 0,09, p < 0,10). Allerdings ergab sich kein Moderationseffekt durch den Organisationstyp auf die Beziehung in H1a (B = −0,04, SE B = 0,14, p>0,1).

Die Ergebnisse von Modell A sind in Abb. 3 zusammengefasst.

Abb. 3
figure 3

Statistische Ergebnisse und resultierendes Modell

Modell B (N = 406), das wahrgenommene Täuschung als Mediationsvariable inbegriffen hat, war ebenfalls signifikant und erklärt 27 % der Varianz in der abhängigen Variable Handlungsabsichten (R2 = 0,27, F(8, 397) = 16,70, p < 0,001, MSE = 0,53). Kontrollvariablen waren politische Einstellung (B = 0,00, SE B = 0,00, p > 0,05), Einstellung gegenüber der Organisation (B = 0,11, SE B = 0,05, p < 0,05) und Vorwissen (B = 0,40, SE B = 0,05, p < 0,01).

Hypothese 1b nahm an, dass kongruente Kommunikation (n = 132) zu geringerer wahrgenommener Täuschung führt als inkongruente Text-Bild-Sprache, was durch die Analyse bestätigt wurde (B = −1,15, SE B = 0,57, p < 0,05). Allerdings wird dieser Effekt nicht durch Bedrohungsgefühle moderiert (Hypothese 2b), weder in der kongruenten (n = 132; B = 0,36, SE B = 0,23, p > 0,05) noch in der rein textbasierten Kondition (n = 137; B = 0,13, SE B = 0,23, p > 0,05). Wahrgenommene Täuschung hatte auch keine negative Wirkung auf die Handlungsabsichten der Teilnehmer (Hypothese 3b; B = −0,03, SE B = 0,02, p > 0,05), weshalb auch der angenommene Moderationseffekt in Hypothese 4b nicht nachweisbar war.

5 Diskussion und Fazit

Wenn Texte und Bilder in der Online-Kommunikation von Organisationen inhaltlich zusammenpassen, hat das einen positiven Einfluss auf die Handlungsabsichten von Bürgern, weil diese Kommunikation als glaubwürdig wahrgenommen wird. Das Zusammenspiel von Texten und Bildern ist also zentral für die Wahrnehmung von Kommunikation durch Rezipienten. Eine kongruente Text-Bild-Sprache erhöht die Wahrnehmung von Glaubwürdigkeit und wird als weniger täuschend empfunden. Da Bilder vor allem online immer wichtiger werden, aber nur in ihrem Kontext zu verstehen sind (vgl. Wittgenstein 1977), kommt es auf die Art der Text-Bild-Kombination an. Zwar reduzieren reichhaltigere Medien wie kombinierte Text-Bild-Botschaften generell Unklarheiten und Unsicherheiten in der Kommunikation (vgl. Daft und Lengel 1986), aber nur inhaltlich passende Text-Bild-Sprache macht eine einfachere Verarbeitung der Botschaft möglich, weil sie besser verständlich ist. Dadurch sind Rezipienten weniger verleitet, die Absichten des Kommunikators zu hinterfragen (vgl. Geise und Baden 2014). Dieser Befund ist gerade für die Online-Kommunikation von Organisationen von Bedeutung: Durch glaubwürdige Kommunikation wird das öffentliche Vertrauen in Organisationen gesteigert (vgl. Bentele und Nothaft 2011) und die Bereitschaft zu zivilgesellschaftlichem Engagement angeregt, womit sie zu einer voll funktionierenden Gesellschaft beiträgt (vgl. Heath 2013).

Dieser positive Effekt von kongruenter multimodaler Kommunikation auf Handlungsabsichten durch wahrgenommene Glaubwürdigkeit hängt jedoch auch vom spezifischen Kontext der Debatte ab. In Bezug auf die öffentliche Diskussion um Zuwanderung und Integration zeigt sich, dass Bedrohungsgefühle durch Migration (vgl. Stephan et al. 1998) wichtig sind: Je größer die wahrgenommene Bedrohung durch Zuwanderung, desto weniger positiv fällt der Effekt von kongruenter Kommunikation auf Glaubwürdigkeit aus. Emotionale Reaktionen auf multimodale Kommunikation wirken also auch hier auf Wahrnehmungen (vgl. Matthes und Schmuck 2017).

Je glaubwürdiger die kongruente Text-Bild-Kommunikation, desto eher sind Rezipienten auch geneigt, sich in der Sache zu engagieren. Wie erwartet, ist hier auch die Art der Organisation von Bedeutung. Die Einstellungen der Teilnehmer waren gegenüber der Bertelsmann Stiftung grundsätzlich positiver als gegenüber dem BMI. Handlungsabsichten sind also stärker, wenn die Kommunikation von einer zivilgesellschaftlichen Organisation ausgeht als von einer Regierungsorganisation. Eine mögliche Erklärung liegt in der unterschiedlichen Legitimation dieser Organisationstypen. Während zivilgesellschaftliche Organisationen wie die Bertelsmann Stiftung viel mehr auf moralische Legitimität angewiesen sind als das BMI (vgl. Baur und Palazzo 2011), ist es für sie auch wichtiger, glaubwürdig zu kommunizieren. Zivilgesellschaftliche Organisationen bauen auf das Engagement der Bürger, daher ist vermutlich auch mit einer größeren Offenheit von Bürgern in Bezug auf Mitwirkung zu rechnen. Regierungsorganisationen hingegen sind – zumindest in der Leitung – durch Wahlen legitimiert (vgl. Arnesen 2017) und haben daher eine zusätzliche Ressource, um ihre Legitimität aufrechtzuerhalten. Der Person des Ministers oder der Ministerin kommt dabei eine besondere Rolle zu, da sie als „zentrale Legitimationsquellen für das politische Gemeinwesen“ (Hoffmann und Raupp 2006, S. 467) fungiert. In der Flüchtlingsdebatte war gerade der Bundesinnenminister medial sehr präsent: Ihm wurde vorgeworfen, die Debatte zu polarisieren und damit für anstehende Wahlen zu instrumentalisieren (z. B. Buchsteiner 2018). Diese Kontroverse hat möglicherweise negativ auf das Image des Ministeriums abgefärbt.

Die Wirkung kongruenter Text-Bild-Kommunikation auf Handlungsabsichten sind vor allem in Bezug auf öffentlich heiß debattierte Themen wie Zuwanderung und Integration von Bedeutung (vgl. Vowe 2016). Eine voll funktionierende Gesellschaft lebt durch Diskussion und zivilgesellschaftliches Engagement. Glaubwürdige Kommunikation von Organisationen ist Teil einer verständigungsorientierten Kommunikationsstrategie (vgl. Burkart 2015) und führt zu erhöhten Handlungsabsichten. Damit befördert sie öffentliches Vertrauen in Organisationen der demokratischen Gesellschaft (vgl. Bentele und Nothaft 2011). Dies ist vor allem für folgenreiche Themen und Debatten wie Zuwanderung und Integration wichtig. Daher gilt für Organisationen, die mediale Aufmerksamkeit auf sich ziehen und nutzen, wie die die Bertelsmann Stiftung oder das BMI, dass glaubwürdige Kommunikation als langfristiges strategisches Kommunikationsziel gelten sollte.

6 Limitationen und Ausblick

Dieses Online-Experiment fand im Kontext der Zuwanderungs- und Integrationsdebatte in Deutschland statt, die sehr emotional geführt wurde. Daher wurden Kontrollvariablen zu Vorwissen über Migration, Einstellungen zur Organisation und politischer Orientierung mit aufgenommen. Einstellungen gegenüber der Person des Bundesinnenministers wurden nicht abgefragt, da es um die Perspektive auf die Kommunikation der Organisation, nicht des Politikers ging. Die hier gefundenen Effekte kongruenter multimodaler Kommunikation würden von Replikationsstudien in anderen nationalen oder thematischen Kontexten und aus der Perspektive der politischen Kommunikation profitieren.

Wie jedes Experiment kann auch diese Studie nicht gleichzeitig vollständig extern und intern valide sein (vgl. Koch et al. 2019, S. 51–53). Um externe Validität zu erhöhen, wurden die Stimuli den Internetseiten der Organisationen entnommen. Im Pretest wurden neben thematischer Übereinstimmung auch Valenz, Ambiguität, Aufmerksamkeitspotential und Komplexität der Bilder erhoben, um sicherzustellen, dass die Bilder auch anhand dieser Variablen vergleichbar sind. Folgestudien könnten zum Beispiel Aufmerksamkeitspotential und Ambiguität der Bilder manipulieren, um die Effekte dieser affektiven Variablen zu isolieren. Interne Validität wurde durch die strukturelle Gleichheit der Experimentalgruppen hergestellt. Zudem ist einschränkend festzuhalten, dass die Stichprobe weitaus höher gebildet war als der Bevölkerungsdurchschnitt, weshalb eine pauschale Übertragung der Ergebnisse auf die Gesamtbevölkerung nicht gegeben ist. Um die Familiarität der Probanden mit dem Untersuchungsthema zu prüfen, wurden jedoch Vorkenntnisse zu Migration und Einstellungen zu den Organisationen als Kontrollvariablen in die Analyse aufgenommen.

Diese Studie fand unabhängig von den untersuchten Organisationen statt, weshalb die Attraktivität dieser Webseiten in Bezug auf Besucherzahlen nicht einbezogen werden konnte. Folgestudien, die Zugang zu diesen Daten bekommen und diesen Aspekt daher berücksichtigen können, wären aufschlussreich.

Täuschung als Gegenpol zu Glaubwürdigkeit konnte die Studie nicht bestätigen. Das mag neben den theoretischen Erwägungen, die oben diskutiert wurden, auch an den bestehenden Operationalisierungen dieses Konzepts liegen. Im Gegensatz zu komplexeren Skalen zu wahrgenommener Glaubwürdigkeit erschien die aus semantischen Differenzialen zusammengesetzte Skala für wahrgenommene Täuschung weniger facettenreich. Dieses weit zitierte Konzept verdiente daher auch eine entsprechend breitere Operationalisierung.