1 Zur Einordnung der Hassrede

In Zeiten einer Krise, wie beispielsweise der globalen COVID-19-Pandemie, beobachten und berichten Wissenschaftler*innen weltweit einen Anstieg von Hasskommentaren in den sozialen Medien (Forsa, 2021; Landesanstalt für Medien NRW, 2021). Beispielsweise gaben laut einer aktuellen repräsentativen Umfrage unter deutschen Internetnutzer*innen 79 % der Befragten an, dass die Kommentare im Netz aggressiver geworden sind bzw. sie Zeuge/Zeugin von Hassrede wurden, wobei fast ein Fünftel aller Befragten bereits selbst auch Opfer von Hasskommentaren war. Bei den Männern sowie den unter 30-Jährigen insgesamt lag dieser Anteil mit bis zu 37 % deutlich höher (Hovel, 2020). Die Gründe für den Anstieg sind mannigfaltig, aber Hassrede entsteht oft aufgrund von persönlicher Unzufriedenheit, gepaart mit der vermeintlichen Anonymität im Internet (Reid-Steere, 2000, S. 275) und der Asynchronität in der Kommunikation, die es dem Urheber/der Urheberin zusätzlich erleichtert, sich von eigenen Äußerungen innerlich zu distanzieren und das „Gegenüber“ weniger stark als Mensch wahrzunehmen. Man spricht in diesem Zusammenhang auch vom „Online-Enthemmungseffekt“ (BARMER, 2021), der sich nicht nur gegen Individuen, sondern auch gegen ganze Gruppen von Menschen richten kann. Vor diesem medienbezogenen Hintergrund ist es nicht überraschend, dass der Neologismus Hassrede oder hate speech vor allem auch durch Medien geprägt wurde (Brown, 2017).

Neben Hass gegen Individuen oder Gruppen kann Hassrede im Internet als gezieltes Mittel der Anstiftung zur Gewalt genutzt werden. Dies ist besonders in den vergangenen Jahren deutlich geworden, etwa im Zusammenhang mit dem Völkermord an der muslimischen Minderheit der Rohingya in Myanmar (BARMER, 2021). Dass Hassrede praktisch gegen jede und jeden gezielt eingesetzt werden kann, trägt zur Wahrnehmung einer wachsenden Hassredeproblematik bei (Mathew et al., 2019; Mondal et al., 2017). Insofern geht die wachsende Hassredeproblematik nicht allein auf einen Anstieg entsprechender Beleidigungen oder Bedrohungen im Internet zurück, sondern zeugt ebenfalls von einer erhöhten Sensibilität für dieses Thema.

Letztere schließt auch kontroverse Diskussionen mit ein. Diese betreffen vor allem das Spannungsfeld zwischen Hassrede als Ausdruck freier Meinungsäußerung einerseits und Hassrede als Straftatbestand andererseits, etwa in Verbindung mit Volksverhetzung (nach § 130 StGB) oder Beleidigungen (nach § 185 StGB), bei Verleumdung (§ 187 StGB) sowie Nötigung (§ 240 StGB) oder Bedrohung (§ 241 StGB) und bei Aufforderungen zu Straftaten in der Öffentlichkeit (§ 111 StGB) (vgl. BARMER, 2021). Solange sich die Definition von Hassrede allerdings als schwierig gestaltet, kann das betreffende Verhalten keinen festen, juristischen Begriff abbilden. Tatsächlich manifestiert sich Hassrede in den vielfältigsten sprachlichen Formen und Variationen, z. B. als Ironie, figurative Sprache oder Imperativ (z. B. Baumgarten et al., 2019; Bick, 2020; Mondal et al., 2017), und sie tritt zudem mit sehr unterschiedlicher Deutlichkeit auf, was eine Identifizierung zusätzlich erschwert.

Dass Hassrede indes einen enormen Einfluss auf die psychische Gesundheit der Opfer haben kann, ist inzwischen als erwiesen anzusehen. Zu den gesundheitlichen Folgen, die von den Opfern in der bislang größten bundesweiten Untersuchung namens #Hass-im-Netz genannt werden (BARMER, 2021), zählen Stress, Angst, Selbstwertprobleme, Übelkeit und Depressionen. Besonders unter 25-Jährige leiden laut dieser Umfrage der BARMER stärker unter den gesundheitlichen Folgen von Hassrede – und Frauen mehr als Männer, obwohl oder vielleicht gerade weil letztere Gruppe sowohl häufiger Hassrede ausgesetzt ist als auch häufiger für solche Kommentare verantwortlich zu sein scheint, siehe auch Bryant und Stephenson (2018).

2 Die Rolle der Prosodie in der Hassredeforschung

Die Vielfalt in Form und Medium ist mit ein Grund dafür, dass Hassrede in den vergangenen Jahren verstärkt in den Fokus der Linguistik und damit auch in den Fokus der Prosodieforschung gerückt ist. Letztere hat Hassrede „hörbar“ gemacht und erlaubt somit einen direkten Vergleich zwischen geschriebener und gesprochener bzw. gelesener und gehörter Hassrede (z. B. Neitsch et al., 2021). Menschen reagieren sehr sensibel auf die Perzeption von Emotionen in Sprache. Dazu zählen auch solche, die in Zusammenhang mit Hass stehen (z. B. Schwartz & Pell, 2012).

Die prosodische Realisierung von Hassrede kann eigenständige Erkenntnisse und Charakteristika liefern, die neue Einblicke in die Erforschung von Hassrede geben und damit auch neue Wege der Detektierbarkeit eröffnen können; z. B. dahingehend, wie genau Prosodie vor dem Hintergrund der Implicit Prosody Hypothesis (Fodor, 2002) die Wahrnehmung von Hassrede beeinflusst. Diese Hypothese besagt, dass nicht nur gesprochene Sprache über Prosodie verfügt (also Intonation, Lautheit, Timing, Timbre, vgl. Arvaniti, 2020), sondern dass auch Leser*innen geschriebener Sprache unwillkürlich und immer eine bestimmte Prosodie im Kopf haben, sobald sie einen Satz oder Text lesen. Selbst in geschriebener Sprache sind es also nicht ausschließlich lexikalische Indikatoren, die Hassrede und deren Stärkegrad bestimmten, sondern auch prosodische. Ein besseres Verständnis des Zusammenspiels von prosodischen Mustern und deren Wirkungen im Hassredekontext kann somit entscheidend dazu beitragen, die Reaktionen auf Hassrede zu verstehen und inter-individuelle Unterschiede auf Rezipientenseite sowie Diskrepanzen in der Wahrnehmung zwischen Urheber*in und Rezipient*in zu erklären, siehe die ersten Schritte dazu in Niebuhr (2022).

Um dies zu verdeutlichen, schauen wir einmal auf den Satz „Das hast du wirklich großartig gemacht!“. Je nachdem, wie dieser Satz (real oder im Kopf der Leser*innen) prosodisch klingt, kann er entweder als ehrliches Lob verstanden werden, oder aber als Tadel und damit als ironische Äußerung. Ein anderes Beispiel ist die Frage: „Wer würde Muslime willkommen heißen?“. Die Prosodie entscheidet, ob es sich um eine tatsächliche Frage handelt, die durchaus auf die Unterstützung der genannten Minderheit abzielen kann, oder um eine rhetorische Frage, die keineswegs im Sinne bzw. zum Wohle der genannten Minderheit gemeint sein muss.

Vor diesem Hintergrund umfasste unser von der VELUX-Stiftung finanziertes Forschungsprojekt XPEROHS (Towards Balance and Boundaries in Public Discourse: Expressing and Perceiving Online Hate Speech) auch ein Modul über die vergleichende Analyse geschriebener und gesprochener Hassrede im Deutschen und Dänischen (Baumgarten et al., 2019; Bick & Didriksen, 2015). Im Zentrum dieses Moduls stand das Herausarbeiten unterschiedlicher Hassredetypen und die Einschätzung von deren negativer Wirkung. Im Folgenden konzentrieren wir uns auf die Ergebnisse zum Deutschen.

3 Die Evaluierung geschriebener und gesprochener Hassredetypen im Deutschen

Die hier zusammengefassten, als Teil des XPEROHS Projektes durchgeführten Studien basieren auf einem Datenkorpus, das aus geschriebenen Hassrede-Posts besteht, die auf den sozialen Medienplattformen von Twitter und Facebook veröffentlicht wurden. In einem umfassenden Analyseprozess der originalen Posts (ORIG)Footnote 1 wurden in zwei Schritten zum einen die häufigsten Hassredetypen und zum anderen die häufigsten Zielgruppen identifiziert (siehe Neitsch et al., 2021). Als die häufigsten Typen von Hassrede (im Deutschen) kristallisierten sich heraus: Ironie (IRO), rhetorische Fragen (RQ), Imperative (IMP), bildliche (d. h. figurative) Sprache (FGL), Holocaust-Bezug (HOL) und Indirektheit (IND). Die Zielgruppen, gegen die sich die Posts am häufigsten richteten, waren Ausländer und Muslime, also zum einen eine sehr allgemeine und zum anderen eine eher spezifische Zielgruppe.

In einem weiteren Schritt wurden für gezielte Untersuchungen aus allen ORIG Posts der Datenbank insgesamt 12 ausgewählt, die sowohl von naiven Teilnehmer*innen als auch von einem Panel aus Expert*innen eindeutig als Fälle von Hassrede deklariert wurden – je 6 mit der Zielgruppe der Ausländer und der Muslime. Aus jedem dieser 12 ORIG Stimuli wurden anschließend alle oben aufgelisteten Typen von Hassrede abgeleitet. Dies geschah auf Basis der im Korpus gefundenen charakteristischen Formulierungen des jeweiligen Hassredetyps in einer konstanten Prozedur, zumeist durch das Voranstellen oder Anhängen von weiteren Äußerungsteilen, wie es nachstehend exemplarisch für die Zielgruppe der Muslime dargestellt ist:

  1. 1.

    Original (ORIG): „Muslime wissen einfach nicht, was wir unter Arbeit verstehen: das können und wollen die nicht.“

  2. 2.

    Ironie (IRO): „Muslime sind ja noch viiiieeel fleißiger als wir Deutschen.“

    Um Ironie zu erzeugen, wurden die ORIG Stimuli nach dem Muster der authentischen Posts in ihr Gegenteil umgewandelt (unterstützt durch die Wiederholung von Buchstaben „viiiieeel fleißiger“, vgl. Bick et al., 2021).

  3. 3.

    Rhetorische Frage (RQ): „Muslime wissen einfach nicht, was wir unter Arbeit verstehen: das können und wollen die nicht. Woher sollten die denn wissen, was Arbeit ist?“

    Die rhetorischen Fragen wurden am Ende des jeweiligen ORIG Posts angehängt.

  4. 4.

    Imperative (IMP): „Lasst uns dafür sorgen, dass Muslime endlich kapieren, was wir unter Arbeit verstehen! Das können und wollen die nicht.“

    Imperative wurden durch Phrasen wie „Lasst uns“ am Beginn des ORIG Posts ergänzt.

  5. 5.

    Figurative Sprache (FGL): „Der Muslimdreck weiß einfach nicht, was wir unter Arbeit verstehen: das können und wollen die nicht.“

    Nach dem in der Korpusanalyse gefundenen Muster wurde die jeweilige Zielgruppe in einer Nominalkomposition mit einem weiteren Nomen verschmolzen (z. B. „Muslim“ + „Dreck“ = „Muslimdreck“; vgl. Kleene & Geyer, 2021).

  6. 6.

    Holocaust-Bezug (HOL): „Muslime wissen einfach nicht, was wir unter Arbeit verstehen: das können und wollen die nicht. Also steckt sie alle ins KZ.“

    Ein zusätzlicher Satz, der einen Holocaust-Bezug herstellt, wurde als eigener Satz an den ORIG Post angehängt.

  7. 7.

    Indirektheit (IND): „Ich hab’ ja nichts gegen Muslime, aber sie wissen einfach nicht, was wir unter Arbeit verstehen: das können und wollen die nicht.“

    Mit IND bezeichnen wir die verbale Form der persönlichen Distanzierung durch einleitende Phrasen wie „Ich habe nichts gegen Muslime/Ausländer, aber__“. Dadurch versuchen Urheber*innen das, was folgt (also ihre tatsächliche Meinung) vorab zu entschärfen, was meist in einem Widerspruch resultiert (Geyer et al., 2022).

Der Prozess der Stimulusgenerierung resultierte in insgesamt 84 Stimuli, von denen 42 auf Muslime und 42 auf Ausländer als Zielgruppe referierten. Zur Untersuchung der gesprochenen Sprache bzw. Prosodie wurden ebendiese Stimuli zusätzlich von einem professionellen Sprecher realisiert.

Die Stimuli wurden in ein webbasiertes Experiment integriert, das Teilnehmer*innen ortsunabhängig am eigenen Laptop durchführen konnten. Alle Teilnehmer*innen absolvierten an zwei unterschiedlichen Tagen und mit mindestens drei Tagen Abstand zwei experimentelle Listen. Liste 1 umfasste die 84 geschriebenen und Liste 2 die 84 gesprochenen Stimuli. Die Reihenfolge, in der die Listen absolviert wurden, wurde vorab zufällig festgelegt und war über die Teilnehmer*innen hinweg ausbalanciert. Demnach erhielten 50 % der Teilnehmer*innen zuerst Liste 1 gefolgt von Liste 2, während es sich bei den anderen 50 % umgekehrt verhielt.

Die Instruktion, die vor der Studie schriftlich präsentiert wurde, führte die Teilnehmer*innen in die von Neitsch und Niebuhr (2019) entwickelte, zweidimensionale Bewertungsmethode ein. Durch einen einzigen Mausklick konnten die Teilnehmer*innen so jeden Stimulus intuitiv hinsichtlich zweier Dimensionen gleichzeitig bewerten: Auf der x-Dimension erfolgte eine Stimulusbewertung nach persönlicher Inakzeptabilität und auf der y-Dimension nach der Notwendigkeit für gesetzliche/gesellschaftliche Konsequenzen für den Urheber/die Urheberin, siehe Abb. 1.

Abb. 1
figure 1

Zweidimensionaler Bewertungsraum (2D Rating Space) von geschriebener bzw. gesprochener Hassrede in den Studien von Neitsch und Niebuhr (2019) inter alia

In den Ergebnissen dieses Experiments bildete sich eine erste Rangordnung im Sinne eines Kontinuums der Hassredetypen heraus. Am unteren Ende – also am wenigsten inakzeptabel und mit der geringsten Forderung nach Konsequenzen – standen IRO sowie RQ. Am oberen Ende fanden sich die HOL Stimuli, die zumeist als ‚deutlich inakzeptabel‘ und ‚sollte starke Konsequenzen haben‘ bewertet wurden. Dass Hassrede, die Holocaustbezüge herstellt, bei weitem die negativsten und schärfsten Bewertungen auf beiden Achsen erhielt, spiegelt die Sensibilität deutscher Teilnehmer*innen bezüglich Holocaust involvierender Hassrede wider (auch deswegen, weil die dänischen Teilnehmer*innen im Forschungsprojekt weit weniger intensiv und negativ auf HOL Stimuli reagierten, vgl. Neitsch & Niebuhr, 2021). Etwa in der Mitte des Bewertungsraumes standen ORIG, IND und FGL; IMP befand sich insgesamt näher an HOL.

Darüber hinaus gab es klare Unterschiede zwischen beiden Präsentationsmodi (geschrieben vs. gesprochen). Einige Hassredetypen waren geschrieben inakzeptabler als gesprochen. Für andere Typen verhielt es sich umgekehrt. Beispielsweise stellte sich die persönliche Inakzeptanz für gesprochene IMP und HOL Stimuli als wesentlich höher heraus als in geschriebener Form. Dies legt nahe, dass explizite, hörbare Prosodie bei denjenigen Stimuli, die bereits lexikalisch offensichtliche Fälle von Hassrede darstellen, eine zusätzlich intensivierende Funktion haben kann. Umgekehrt kamen IRO und RQ Stimuli als weniger gravierend in gesprochener als in geschriebener Hassrede heraus; ein plausibler Befund, da dies die beiden Stimulustypen sind, bei denen die Prosodie entscheidend zur Kennzeichnung des Wortlautes als ironisch bzw. rhetorisch beiträgt. Prosodie kann also, wenn sie explizit gehört wird, vermeintliche Hassredestimuli auch abschwächen, ja vielleicht sogar gänzlich in Nicht-Hassrede verwandeln, wie am Ende dieses Beitrags diskutiert werden wird.

Zuletzt zeigt diese Studie auch, dass Stimuli, die sich gegen die Zielgruppe der Muslime richteten, in beiden Dimensionen signifikant höher bewertet wurden, als wenn die Hassrede auf die Zielgruppe der Ausländer im Allgemeinen ausgerichtet war.

In einer Nachfolgeuntersuchung (Neitsch & Niebuhr, 2019, 2020a) wurden die Extrempunkte des Spektrums der Hassredetypen hinsichtlich ihrer prosodischen Eigenschaften genauer untersucht. Hierbei handelte es sich einerseits um die HOL Stimuli, die aus der Sicht persönlicher Inakzeptanz wie auch aus Sicht von Konsequenzen für den Urheber/die Urheberin am negativsten bewertet wurden; und andererseits um die IRO Stimuli, die diesbezüglich am wenigsten scharf bewertet wurden. Beide Typen wurden mit den ORIG Stimuli verglichen, die in dieser Untersuchung als Referenzbedingung dienten, siehe die in Abb. 2a–b dargestellten dreifach-Abstufungen der Stimuli auf beiden Achsen.

Abb. 2
figure 2

Normalisierte durchschnittliche Bewertung (in % der Achsenlänge) für HOL, IRO und ORIG Stimuli in (a) der x-Dimension (persönliche Inakzeptabilität) und (b) der y-Dimension (Konsequenzen für den Urheber/die Urheberin) des 2D-Bewertungsraums; editiert entnommen aus Neitsch und Niebuhr (2020a)

Die Untersuchung der prosodischen Realisierung der drei Hassredetypen zeigt, dass höhere Bewertungen auf beiden Achsen typenübergreifend mit tieferen Tonhöhenbewegungen, geringerem Sprechtempo und behauchterer bzw. leiserer sowie knarrigerer Stimmqualität einhergehen. Ein ruhiger, tiefer, bestimmter Tonfall macht Hassredeinterpretationen also schärfer und nicht etwa schwächer. Diese prosodische Parameterkonstellation ist auch mit „cold anger“ assoziiert (im Vergleich zu „hot anger“, siehe auch Neitsch & Niebuhr, 2020b für den Vergleich zwischen Deutsch und Dänisch). HOL Stimuli zeigten diese „cold anger“ Konstellation in ihrer gesprochenen Form inhärent häufiger als ORIG Stimuli und diese wiederum häufiger als IRO Stimuli.

4 Die Auswirkung von Hassrede auf menschliche Biosignale

Dass die Wirkung von sprachlichem Hass nicht ohne gesundheitliche Folgen bleibt, wurde bereits einleitend thematisiert. Wie sich Hassrede aber konkret auf menschliche Biosignale auswirkt, etwa auf die Atmungs- oder Herzfrequenz, wurde erst kürzlich in einer Untersuchung analysiert (Neitsch & Niebuhr 2020c, d). Die Ergebnisse zeigen, dass Teilnehmer*innen während des Hörens und Lesens unserer obigen Hassredetypen mit einer erhöhten Herz- und Atmungsfrequenz reagieren. Zudem nimmt die Schweißbildung und damit die Hautleitfähigkeit an den Fingern der Teilnehmer*innen als Reaktion auf Hassredestimuli zu. Die Ergebnisse der Biosignal-Messungen legen nahe, dass Menschen während der Perzeption von Hassrede unwillkürlich und selbst in Laborsettings verstärkt Stress und negative Emotionen empfinden. Besonders deutlich waren diese Reaktionen bei zwei Hassredetypen: IMP und HOL. Diese Befunde stehen insgesamt im Einklang mit den oben zusammengefassten Befunden aus dem 2D-Bewertungsraum sowie den Umfrageergebnissen der #Hass-im-Netz Studie, in der Stress und Angst als Folgen von Hassrede von den Opfern genannt wurden (BARMER, 2021).

In einem weiteren Schritt wurde die Aktivität in unterschiedlichen Hirnarealen während des Hörens bzw. Lesens der unterschiedlichen Hassredetypen gezielt mittels Elektroenzephalografie (EEG) untersucht (Neitsch & Niebuhr, 2020d). Die Areale, die mit Stress und Emotionen assoziiert sind, zeigten generell eine höhere Gehirnaktivität für gesprochene als für geschriebene Stimuli – sowie darüber hinaus Unterschiede zwischen den Hassredetypen, die mit den anderen gemessenen Biosignalen konform gingen.

5 Ein detaillierterer Blick auf den Faktor Kontext

Dass Teilnehmer*innen auf Muslime bezogene Hassredestimuli negativer bewerteten als auf Ausländer bezogene Stimuli, zeigt die grundsätzliche Relevanz des Faktors Kontext für die Identifikation und Evaluation von Hassredestimuli. Aus den Biosignalbefunden geht darüber hinaus hervor, dass unwillkürliche körperliche Reaktionen beispielsweise in ihrer Stärke mit der expliziten Bewertung der Hassredestimuli grundsätzlich konform gehen.

Einen Umstand hatten dabei alle zuvor zusammengefassten Studien gemeinsam; einen Umstand, der nicht zwangsläufig repräsentativ für die Rezeption von Hassrede im Alltag ist: Die Teilnehmer*innen waren im Rahmen des experimentellen Settings allein. Jüngere Studien zeigen indes, dass sowohl negative Stressauslöser als auch negative Emotionen durch einen sozialen Kontext positiv beeinflusst werden können. In der Studie von Allen et al. (2002) wurde beispielsweise die Herzfrequenz gemessen, während Teilnehmer*innen Stressauslösern wie starker Kälte (Hand im Eiswasser) und schweren Rechenaufgaben ausgesetzt waren. Die Teilnehmer*innen waren beim Experiment entweder allein oder befanden sich in Gesellschaft eines Freundes, Ehepartners oder Haustieres. Im Ergebnis zeigte sich ein signifikant geringerer stressbedingter Anstieg der Herzrate als Folge der negativen Stressoren, wenn der Teilnehmer bzw. die Teilnehmerin in vertrauter Gesellschaft war, insbesondere in der des eigenen Haustieres. Die Studien von Sahi et al. (2020) und Morawetz et al. (2021) waren der von Allen et al. (2002) in Design und Ziel ähnlich, mit dem Unterschied, dass es hierin um die Bewältigung bzw. die Regulation negativer Emotionen ging. Die Teilnehmer*innen wurden negativen emotionalen Reizen ausgesetzt, beispielsweise negativen Bildern, während sie entweder allein im Raum oder in Gesellschaft eines Freundes waren. Beide Studien zeigen anhand von Biosignalen (fMRI) und expliziten Urteilen, dass die Bewältigung bzw. Regulation negativer emotionaler Reize allein signifikant schlechter verlief als in Gesellschaft, wobei die Gesellschaft eines guten Freundes einen besonders positiven Einfluss ausübte.

Ob diese Variable ‚Sozialer Kontext‘, also die „power of social connectedness“ in den Worten von Morawetz et al. (2021), auch im Zusammenhang mit der Wahrnehmung von Hassrede funktioniert, wollten wir im Rahmen eines neuen und daher nachfolgend ausführlicher dargelegten Experiments wissen. Sollten sich entsprechende Effekte nachweisen lassen, wäre ein weiterer, auch in puncto Alltagsrelevanz wichtiger Kontextfaktor identifiziert und die Schlussfolgerung gestärkt, dass linguistische und/oder inhaltliche Merkmale allein für die Identifikation als auch die Evaluation von Hassrede nicht ausreichen, sondern dass die Rezipient*innen bzw. die damit verbundenen kontextuellen Faktoren eine entscheidende Rolle spielen.

5.1 Methode

5.1.1 Teilnehmer*innen

Insgesamt nahmen 28 Personen am Experiment aktiv teil. Bei allen Teilnehmenden handelte es sich um deutsche Muttersprachler*innen im Alter von 21–25 Jahren (ø 22,3). Sie wurden aus dem Studierendenpool der Süddänischen Universität (SDU) rekrutiert. Besonders in diesem Alter repräsentieren sie die Gruppe all derjenigen, die im Netz sehr aktiv sind und dadurch auch mit hoher Wahrscheinlichkeit irgendwann Opfer oder Zeuge/Zeugin von Hassrede werden (siehe Ergebnis für unter 30-Jährige in Hovel, 2020 sowie Bryant & Stephenson, 2018). Jeder der Teilnehmer*innen brachte seinen besten Freund bzw. seine beste Freundin zum Experiment mit. Insgesamt involvierte das Experiment also (2 × 28) 56 Personen bzw. 28 Personenpaare.

Von den insgesamt 28 aktiven Teilnehmer*innen waren 18 männlich (64,3 %). Bei den besten Freund*innen war das Geschlechterverhältnis ausgewogen (50 % bzw. 14 von 28), weil alle 10 Teilnehmerinnen eine beste Freundin, aber nur 14 der 18 Teilnehmer einen besten Freund mitbrachten.

5.1.2 Stimuli

Das hier verwendete Material entspricht den oben beschriebenen (7 × 12) 84 Stimuli. Neben dem Umstand, dass die Wirkung und Subkategorisierung dieser Stimuli bereits gut verstanden ist, besteht ein weiterer Vorteil darin, dass die Ergebnisse der Referenzbedingung des aktuellen Experiments (allein im Raum) mit den Ergebnissen früherer Experimente verglichen werden kann. Eine Replikation dieser früheren Ergebnisse würde die auch interne und externe Validität der Testbedingung des aktuellen Experiments (mit bestem Freund/bester Freundin im Raum) untermauern.

5.1.3 Datenerhebung

Die Datenerhebung fand aus zweierlei Gründen mittels Biosignalen statt. Erstens zeigten unsere vorangegangenen Studien (Niebuhr & Neitsch, 2020c), dass Biosignale ein mit expliziten Ratings erlangtes Ergebnisbild zu Hassredestimuli angemessen abbilden können und dabei gleichzeitig den Vorteil haben, dass die Teilnehmer*innen während der Präsentation der Stimuli keine komplexe, potentiell mehrdeutige oder unnatürliche Aufgabe erfüllen müssen. Zweitens spiegeln Biosignale die unwillkürliche Reaktion der Teilnehmer*innen auf die Stimuli wider und verhindern somit, anders als explizite Beurteilungen, dass Teilnehmer*innen sozial wünschenswerte Urteile abgeben. Vorangegangene Studien enthalten Hinweise auf solche Socially Desirable Responses in Form von Abweichungen zwischen expliziten Urteilen und Biosignalen (Neitsch & Niebuhr, 2021); z. B. für die IND Stimuli („Ich hab’ ja nichts gegen ___, aber“), die in den Biosignalen eine weniger starke negative Reaktion hervorriefen als in den expliziten Urteilen.

Als Quelle der Biosignale wurde die Elektroenzephalografie (EEG) gewählt. Die EEG-Signale wurden mittels des MUSE II Headsets gemessen, das über Bluetooth mit der dafür entwickelten Softwareanwendung Muse Monitor verbunden war (Richer et al., 2018). Wie Abb. 3a zeigt, handelt es sich beim MUSE II um eine Art Stirnband, in das vier Trockenelektroden eingelassen sind, jeweils zwei an der linken und rechten Seite des Frontallappens und des Temporallappens (Abb. 3b). Gemäß des Standard-Referenzsystems zur Platzierung von EEG-Elektroden über dem Gehirn der Teilnehmer*innen (Klem et al., 1999) erfasst das MUSE II Headset die Messpunkte AF7, AF8, TP9 und TP10 (Abb. 3c).

Abb. 3
figure 3

(a) Foto des MUSE II EEG-Headsets; (b) Darstellung von Lage und Funktion des Frontallappens im Gehirn in Seitenansicht; (c) Lage der relevanten Messelektroden AF7 und AF8 im Frontallappen

Die Muse Monitor Software führt auf Basis der aus dem MUSE II Headset ausgelesenen Rohdaten eine Spektralanalyse durch. Sie erlaubt eine Aufschlüsselung der Rohdaten an jeder der vier Elektroden in fünf Frequenzbänder: Delta (< 4 Hz), Theta (4–7 Hz), Alpha (8–15 Hz), Beta (16–31 Hz) und Gamma (> 31 Hz) (siehe Garcia-Moreno et al., 2020). Die Werte werden als Logarithmus der spektralen Leistungsdichte (Power Spectral Density) pro Frequenzband in dBμV bei einer Abtrastrate von 256 Hz aufgezeichnet. Der Wertebereich der gemessenen dBμV-Werte variiert zwischen –1 und + 1.

Eine Metastudie von LaRocco et al. (2020) belegt, dass das MUSE II Headset über eine Vielzahl an Untersuchungen hinweg reliable und präzise Messungen geliefert hat, die hochgradig mit verhaltens- oder urteilsbasierten Emotions- und Stresszuständen der Teilnehmer*innen korreliert werden konnten (Asif et al., 2019; Garcia-Moreno et al., 2020; Herman et al., 2021).

Für die Zwecke des aktuellen Experiments wurde die Datenerhebung auf die beiden Frontallappenelektroden AF7 und AF8 beschränkt (siehe Abb. 3b–c), da dieser Bereich des Gehirns (mehr als der Temporallappen) mit Aufmerksamkeit, Sprache bzw. Sprechen, Emotion bzw. Affekt, Persönlichkeit und moralischem wie sozialem Denken in Verbindung steht (Chayer & Freedman, 2001). Mit Bezug auf eben diese Zustände und Prozesse konzentriert sich die Datenerhebung außerdem auf zwei Frequenzbänder: das Alpha- und das Betaband. Die Frequenzenergie in diesen beiden Bändern lässt Rückschlüsse zu sowohl auf das Ausmaß der Stressempfindung als auch auf die Empfindung negativer Emotion (García-Acosta et al., 2021; Herman et al., 2021; Zhang et al., 2018; Zhao et al., 2018).

Das Ausmaß der Stressempfindung korreliert direkt mit der beta Frequenzenergie (Herman et al., 2021). Hinsichtlich der Emotionsmessungen ist wichtig zu berücksichtigen, dass sich eine Emotionsempfindung aus (mindestens) zwei Dimensionen konstituiert: Dem Grad der Erregung, auch als Arousal bezeichnet, und der Polarität der Emotion (positiv/negativ), auch als Valenz bezeichnet (García-Acosta et al., 2021). Beides lässt sich mittels der AF7- und AF8-Signale einschätzen. Den Resultaten früherer Studien folgend, haben wir Arousal in Form der beta Frequenzenergie im Verhältnis zur alpha Frequenzenergie (beta/alpha ratio, nachfolgend BAR) bestimmt. Je größer dieser BAR-Wert ausfällt, desto höher ist das emotionale Arousal (García-Acosta et al., 2021). Die Valenz der Emotion wurde über die sogenannte Frontal Alpha Asymmetry (nachfolgend FAA) bestimmt (García-Acosta et al., 2021; Zhang et al., 2018; Zhao et al., 2018). Der FAA-Wert misst das Verhältnis der alpha Signalenergie zwischen der linken Frontallappenelektrode AF7 und der rechten Frontallappenelektrode AF8 (AF7/AF8). Je tiefer dieser FAA-Wert unter 1 liegt, desto negativer ist das Emotionsempfinden.

5.1.4 Experimentaufbau

Die obigen Erläuterungen zusammenfassend umfasst das Experiment drei unabhängige Variablen. Die zentrale unabhängige Variable ist die Zwischensubjektvariable Sozialer Kontext. Sie beschreibt, wie das Experiment mit den Teilnehmer*innen durchgeführt wurde und hat dabei zwei Ausprägungen: Die Referenzbedingung ‚allein‘ und die Testbedingung ‚begleitet‘ (in Gesellschaft des besten Freundes bzw. der besten Freundin).

Daneben gibt es durch die Zusammenstellung der Stimuli zwei Innersubjektvariablen: Stimulustyp (ORIG, FGL, IMP, HOL, IND IRO, und RQ) und Stimulusmodus. Das heißt, neben der schriftlichen Variante des Stimulus wurde die mündliche Variante mit einbezogen, die, wie oben angesprochen, auf Basis der schriftlichen Variante durch einen professionellen Sprecher elizitiert wurde. Als männlicher Sprecher kaukasischen Typs im Alter zwischen 35–50 Jahren verkörperte er das typische Profil eines Urhebers von Hassrede (Hrdina, 2016).

Demgegenüber stehen drei abhängige Variablen: Die auf μV Biosignal-Messungen des EEG-Systems MUSE II an den Frontallappenpositionen AF7 und AF8 (links, rechts) basierenden Werte der beta Frequenzenergie sowie die aus den Rohdaten der Messungen abgeleiteten Werte der BAR- und FAA-Energieverhältnisse.

5.1.5 Durchführung

Vor der eigentlichen Durchführung des Experiments wurden die 28 Teilnehmer*innen wie in unseren früheren Studien nach dem Zufallsprinzip einer von zwei experimentellen Listen zugewiesen: 50 % der Teilnehmer*innen begannen mit den gesprochenen Stimuli und durchliefen anschließend die geschriebenen Stimuli. Die anderen 50 % der Teilnehmer*innen begannen mit den geschriebenen Stimuli, gefolgt von den gesprochenen. Um Ermüdungs- oder Routineartefakten vorzubeugen, durften die Teilnehmer*innen eine 15-minütige Pause zwischen den Listen einlegen.

Das Experiment wurde im Akustiklabor des Centre for Industrial Electronics (CIE) an der SDU durchgeführt. Die Teilnehmer*innen saßen in einer schallberuhigten Umgebung vor einem PC-Bildschirm, siehe Abb. 4. Nachdem die Teilnehmer*innen durch das Klicken eines Buttons auf dem Bildschirm die Kenntnisnahme einer Warnmeldung zur Natur der Stimuli bestätigt und ihr Einverständnis zur Teilnahme gegeben hatten, gelangten sie zu einer Eingabemaske, auf der allgemeine Personendaten zum Zwecke der statistischen Auswertung anonymisiert abgefragt wurden. Zuletzt erschien die Information, dass die Teilnehmer*innen in diesem Experiment nichts weiter tun müssten, als sich konzentriert und so authentisch und natürlich wie möglich den nachfolgenden Stimuli auszusetzen, die sowohl schriftlich als auch mündlich präsentiert werden würden.

Abb. 4
figure 4

Schallberuhigte Umgebung des Akustiklabors des CIE an der SDU, in dem das Experiment durchgeführt wurde

Hiernach wurden die Teilnehmer*innen gebeten, erst das MUSE II Headset einzuschalten und aufzusetzen und danach die ebenfalls bereitgelegten Kopfhörer (Quite Comfort 35 II) aufzusetzen. Die aktive Geräuschunterdrückung der Kopfhörer war abgeschaltet. Die Kopfhörer kamen in der Bedingung der gesprochenen Stimuli zum Einsatz, wurden aber auch in der Bedingung der geschriebenen Stimuli noch/schon getragen, um den besonderen akustischen Effekt des Kopfhörers als konfundierte Variable des Stimulusmodus im Experiment zu kontrollieren.

Im Falle der sozialen Kontextbedingung ‚allein‘ wartete der beste Freund bzw. die beste Freundin vor dem Gebäude. In der Bedingung ‚begleitet‘ saß er/sie mit einigem Abstand neben dem Teilnehmer/der Teilnehmerin, jedoch stets in dessen/deren Sichtfeld. Der beste Freund bzw. die beste Freundin erhielt die Instruktion, während der Dauer des Experiments ein paar absichtlich durcheinander gebrachte, längere Kabel auseinander zu sortieren und aufzurollen. Diese Aktivität war, unseren Pilottests zufolge, stimmig der Umgebung angepasst und gleichermaßen lebendig wie repetitiv, sodass sich der Teilnehmer/die Teilnehmerin stets der Anwesenheit seiner/ihrer Begleitperson gewahr war, ohne jedoch durch diese abgelenkt zu werden.

Die 12 Stimuli jedes Typs wurden blockweise präsentiert, also z. B. erst die 12 HOL Stimuli, dann die 12 IRO Stimuli usw. Der Sinn der blockweisen Präsentation bestand darin, die Teilnehmer*innen etwa 85–95 Sekunden lang durchgehend einem einzigen Stimulustyp auszusetzen. Im Gegensatz zur Dauer einzelner Stimuli war dieses Blockintervall lang genug, um signifikante Veränderungen in den Biosignalen des Teilnehmers bzw. der Teilnehmerin als Folge des Stimulustyps hervorrufen zu können.

Vor den sieben blockweisen Stimuluspräsentationen erhielt der Teilnehmer/die Teilnehmerin die Aufgabe, 30 Sekunden lang gar nichts zu tun. Diese Ruhephase diente als Null-Stimulus-Referenzbedingung, mit der alle Messwerte bzw. Resultate der späteren Stimulusblöcke (d. h. Stimulustypen) verglichen werden konnten. Bei einem ordnungsgemäßen Funktionieren der Messungen ist zu erwarten, dass die Referenzbedingung (RUHE) signifikant niedrigere Messwerte liefert als alle oder zumindest die meisten anderen Stimulustypen. Noch wichtiger wäre, dass sich die RUHE-Werte zwischen den Bedingungen ‚allein‘ und ‚begleitet‘ nicht unterscheiden, damit dahingehende Unterschiede während der Stimulusrezeption als stress-/emotionsbeeinflussende Effekte des sozialen Kontexts interpretiert werden können und nicht als Offset-Effekte zweier verschiedener Teilnehmer*innengruppen.

Der Experimentleiter verließ bereits vor der Null-Stimulus-Referenzbedingung den Raum und kam erst nach dem letzten Stimulusblock wieder herein, sodass der Teilnehmer/die Teilnehmerin in der ‚allein‘ Bedingung tatsächlich gänzlich allein war und in der ‚begleitet‘ Bedingung nur den besten Freund/die beste Freundin an seiner/ihrer Seite hatte.

Eine komplette Experimentsession dauerte insgesamt ca. 40 Minuten, bestehend aus zehn Minuten pro Stimulusmodus, einer fünfzehnminütigen Pause zwischen den Modi sowie einem kurzen Briefing und De-Briefing am Anfang und Ende der Session.

5.2 Ergebnisse

5.2.1 Stressempfinden

Die Messungen zur Betaband-Energie wurden in einem linearen gemischten Modell mit Messwiederholung analysiert. Das statistische Modell umfasste die beiden Innersubjektfaktoren Stimulustyp und Stimulusmodus sowie den Zwischensubjektfaktor Sozialer Kontext. Der Faktor Stimulustyp hatte in diesem Modell 8 anstelle von 7 Faktorstufen, weil neben den 7 Typen ORIG, FGL, IND, HOL, IMP, IRO, RQ auch die 30-sekündige Ruhephase des Teilnehmers/der Teilnehmerin – die oben genannte Null-Stimulus-Referenzbedingung RUHE – mit einbezogen wurde.

Die Ergebnisse zeigen signifikante Haupteffekte für alle drei Faktoren (Stimulustyp: F[7,182] = 420,4; p < 0.001, η2p = 0.942; Stimulusmodus: F[1,26] = 822,9; p < 0.001, η2p = 0.969; Sozialer Kontext: F[1,26] = 201,8; p < 0.001, η2p = 0.886). Daneben gibt es signifikante Interaktionen des Sozialen Kontexts sowohl mit Stimulusmodus (F[1,26] = 65,4; p < 0.001, η2p = 0.716) als auch mit Stimulustyp (F[7,182] = 32,5; p < 0.001, η2p = 0.556) sowie eine signifikante Interaktion zwischen Stimulusmodus und Stimulustyp (F[7,182] = 41,1; p < 0.001, η2p = 0.613). Die Dreifachinteraktion war nicht signifikant.

Zur Aufschlüsselung der Haupteffekte und deren Interaktionen wurden multiple Paarvergleiche (mit Sidak-Korrektur) zwischen den Faktorstufen der Inner- und Zwischensubjektfaktoren durchgeführt. Das Gesamtbild der Ergebnisse ist überdies in den Abb. 5a–c dargestellt. Als erstes soll herausgestellt werden, dass laut der Paarvergleiche des Faktors Stimulustyp die Betaband-Energie in der Null-Stimulus-Referenzbedingung RUHE signifikant niedriger lag als für alle gelesenen und gehörten Stimulustypen (Abb. 5a). Außerdem gibt es zwischen den RUHE-Messungen der beiden sozialen Kontextbedingungen ‚allein‘ und ‚begleitet‘ keinen signifikanten Unterschied. Damit sind die Grundvoraussetzungen für die interne Validität der Daten und die darauf aufbauende Ergebnisinterpretation erfüllt.

Abb. 5
figure 5

Mittelwerte der EEG-Messungen für die beta Frequenzenergie (in dBμV über AF7&8) über alle 2 × 14 Teilnehmer*innen und Experimentbedingungen (Fehlerbalken entsprechen 95 % CI)

Abb. 5a zeigt, dass der Haupteffekt des Sozialen Kontexts darauf beruht, dass die Betaband-Energie bei den Teilnehmer*innen über alle Stimuli hinweg in der ‚allein‘ Bedingung um durchschnittlich 24 % höher lag als in der ‚begleitet‘ Bedingung (ø 0.356 dBμV vs. ø 0.272 dBμV). Im Einzelnen variierte dieser Prozentwert allerdings stark mit dem Stimulustyp. Für IRO und IND lagen die ‚allein‘-Werte nur um wenige Prozent (allerdings weiterhin signifikant) oberhalb der ‚begleitet‘-Werte. Für IMP und HOL sowie für die ORIG Stimuli erhöhten sich die Werte hingegen stark von ‚begleitet‘ zu ‚allein‘. Darüber hinaus fiel das Niveau der Betaband-Energie für die geschriebenen Stimuli sehr viel höher aus als für die gesprochenen Stimuli (Abb. 5b). Generell gilt: Je höher das Niveau der Betaband-Energie in der ‚allein‘ Bedingung, desto stärker war die Absenkung dieses Energieniveaus durch die Anwesenheit des besten Freundes/der besten Freundin. Dies ist die Basis für die Interaktionen des Sozialen Kontexts mit Stimulustyp und Stimulusmodus.

Was den Stimulusmodus betrifft, so geht aus Abb. 5c hervor, dass die Betaband-Energie für die geschriebenen Stimuli im Mittel um 62 % höher lag als für die gesprochenen Stimuli (ø 0.388 dBμV vs. ø 0.240 dBμV). Das gilt nicht (signifikant) für IND, jedoch umso mehr für IRO, RQ und ORIG, für die die absoluten dBμV Unterschiede von gesprochen zu geschrieben um zirka 100 % anstiegen. Aus diesem differenzierten Effektauftreten resultiert die oben genannte Interaktion zwischen Stimulusmodus und -typ. Bemerkenswert ist, dass die Betaband-Energie in der gesprochenen RQ-Bedingung, also in den Stimuli, in denen die rhetorischen Fragen mit entsprechender Prosodie perzipiert werden, auf das Niveau der RUHE-Referenzbedingung absank und sich nicht signifikant davon unterscheidet. Wenn die IRO Stimuli mit entsprechend gesprochener Prosodie präsentiert wurden, ergab sich ein ähnliches Bild. Allerdings ist hier der Unterschied zur RUHE-Bedingung weiterhin signifikant.

5.2.2 Emotionsempfinden

Im Rahmen der Emotionsempfindung wurden zwei statistische Modelle berechnet. Sie waren vom gleichen Typ wie das zur Betaband-Energie oben. Eines der Modelle betraf die BAR-Werte des Arousals und das andere die FAA-Werte der Valenz. Das letztgenannte Model wird hier nur kurz in Tab. 1 zusammengefasst wiedergegeben; einerseits, weil sich keine signifikanten Effekte des Sozialen Kontextes gezeigt haben, und andererseits, weil das Gesamtbild der Ergebnisse dem gleicht, was aus den Studien zur expliziten Beurteilung der hier verwendeten Stimuli (im 2D-Urteilsraum, Abb. 1) bereits bekannt ist. Es sei vor diesem Hintergrund nur erwähnt, dass sich für die Stimulustypen ORIG, FGL und HOL im Mittel ein Wertebereich zwischen 0,6–0,8 und damit eine klare Negativität in der Valenz der Emotionsempfindung ergeben hat. Für die Stimulustypen IRO, RQ und IND galt dies hingegen nicht. Ihr Wertebereich lag zwischen 0,95 und 1,0 bzw. für die gesprochenen Stimuli zum Teil auch deutlich über 1,0 dBμV.

Tab. 1 Übersicht über die deskriptive und inferenzstatistische Analyse der mittels EEG gemessenen FAA-Werte des Experiments. HE = Haupteffekt, INT = Interaktion, n.s. = nicht signifikant

Das statistische Modell zum Arousal zeigt keine signifikanten Unterschiede zwischen den BAR-Werten in der RUHE-Bedingung der beiden Personengruppen, die die unterschiedlichen sozialen Kontextbedingungen repräsentieren. Zudem lagen die BAR-Werte in der RUHE-Bedingung signifikant niedriger als für alle gelesenen und gehörten Stimulustypen (Abb. 6a). Der RUHE-Wert lag im Mittel unter 1,0, das heißt, die Energie im Alphaband überstieg die im Betaband. Damit sind abermals die Grundvoraussetzungen für die interne Validität der Daten und die darauf aufbauende Ergebnisinterpretation erfüllt.

Abb. 6
figure 6

Mittelwerte der EEG-Messungen für BAR (über AF7&8) über alle 2 × 14 Teilnehmer*innen und Experimentbedingungen (Fehlerbalken entsprechen 95 % CI)

Das statistische Modell zum Arousal umfasst signifikante Haupteffekte für Stimulustyp (F[7,182] = 146,6; p < 0.001, η2p = 0.849) und Stimulusmodus (F[1,26] = 43,1; p < 0.001, η2p = 0.624) sowie für den sozialen Kontext (F[1,26] = 141,7; p < 0.001, η2p = 0.845). Daneben gibt es signifikante Interaktionen des Sozialen Kontexts sowohl mit Stimulusmodus (F[1,26] = 6,5; p = 0.017, η2p = 0.200) als auch mit Stimulustyp (F[7,182] = 6,3; p < 0.001, η2p = 0.194) sowie eine signifikante Interaktion zwischen Stimulusmodus und Stimulustyp (F[7,182] = 30,8; p < 0.001, η2p = 0.542). Die Dreifachinteraktion war nicht signifikant.

Das Gesamtbild der Ergebnisse ähnelt dem der Betaband-Energie, siehe Abb. 6a–c. Allerdings gibt es ein paar nennenswerte Unterschiede. Erstens hatte die Anwesenheit des besten Freundes/der besten Freundin zwar wie bei der Betaband-Energie einen positiven Effekt in Form einer Absenkung der BAR-Arousal-Werte, allerdings war dieser Effekt mit im Mittel –13 % geringer als im Falle der Betaband-Energie (–24 %). Zweitens fiel der Effekt signifikant stärker für die gesprochenen (–17 %) als für die geschriebenen Stimuli aus (–9 %). Bei der Betaband-Energie war es gerade umgekehrt. Ein weiterer Unterschied besteht darin, dass das Niveau der Betaband-Energie für die geschriebenen Stimuli durchweg über dem für die gesprochenen Stimuli lag; oder auf vergleichbarem Niveau im Falle einiger Stimulustypen. Im Falle der BAR-Arousal-Werte dreht sich dieses Verhältnis gerade um. Die gesprochenen Stimuli erzeugten höhere Werte als die geschriebenen, mit Ausnahme von IRO und RQ, in denen die Prosodie eine entscheidende Rolle spielt für die Interpretation der Stimuli als ironisch bzw. rhetorisch fragend.

5.3 Diskussion

Wir wollten mit unserem Experiment eine erste, grundsätzliche Antwort auf die Frage erhalten, ob die „power of social connectedness“ (Morawetz et al., 2021) bzw. der soziale Kontext nicht nur im Rahmen von physischen Schmerzreizen (Hände im Eiswasser) oder negativen Bildreizen eine Rolle spielt, sondern auch in der Wahrnehmung von Hassrede. Die hierzu erlangten experimentellen Ergebnisse untermauern dies nachdrücklich. In Begleitung ihres besten Freundes/ihrer besten Freundin kamen die Teilnehmer*innen mit den Hassredestimuli signifikant besser zurecht. Teilnehmer*innen, die den Hassredestimuli allein ausgesetzt waren, zeigten ein um fast ein Viertel (24 %) höheres Stressniveau im EEG. Die Intensität des negativen Emotionserlebens (Arousal) erhöhte sich um knapp ein Siebtel (13 %). Insgesamt manifestierte sich der Unterschied, Hassrede allein oder in Begleitung ausgesetzt zu sein, mehr im Stress- als im Emotionsempfinden.

Was Letzteres anbelangt, legen die EEG-Daten zudem nahe, dass weder der soziale Kontext noch das Hassredemedium die Valenz der Emotionsempfindung signifikant verändern konnte. Der jeweilige Hassredestimulus wurde demnach immer als gleichermaßen negativ empfunden, ob er nun geschrieben, gesprochen, allein oder in Begleitung rezipiert wurde. Die Stärke der Negativität variierte einzig in Abhängigkeit vom Stimulustyp. Das dazu entstandene Bild passt zu all unseren früheren Biosignal- und Bewertungsergebnissen insofern, als IRO, RQ und IND schwächer negativ gewirkt haben als ORIG, FGL, IMP und HOL. Über unsere früheren Studien hinaus offenbart das EEG mit FAA-Werten von zum Teil > 1,0 dBμV auch, dass insbesondere gesprochene IRO und RQ Stimuli nicht durchgängig und von allen Teilnehmer*innen überhaupt als negativ valent empfunden wurden.

Hinsichtlich des Faktors Medium können die aktuellen EEG-Befunde die Ergebnisse früherer Studien überdies dahingehend präzisieren, dass gesprochene Stimuli gegenüber geschriebenen eine geringere Stressreaktion, dafür aber eine intensiver negative Emotionsreaktion auslösen. Obwohl auf den ersten Blick unvereinbar, könnte beides mit der Prosodie zu tun haben. In geschriebener Hassrede bleibt die Bedrohung durch die fehlende Prosodie abstrakter und löst so zwar mehr Stress bzw. Unsicherheit aber eine geringere negative Emotionsstärke aus. In gesprochener Sprache verhält es sich genau umgekehrt, wobei zusätzlich die bekannte, verstärkende Wirkung der Prosodie bei ORIG, FGL, IMP und HOL hinzukommt. Nachfolgende Studien müssen dem genauer nachgehen.

6 Zusammenfassung

Es gibt fraglos eine wachsende Notwendigkeit, sich des Phänomens der Hassrede anzunehmen. Dies gilt nicht allein für die Wirtschaft und Politik. Es gilt allem voran auch für die empirische, linguistische und phonetische Forschung, deren diesbezügliche Aufgabe darin bestehen muss, den gesellschaftlichen Entscheidungsträgern Daten, Kriterien und Leitplanken dafür an die Hand zu geben, wie Hassrede identifiziert, evaluiert und ggf. sanktioniert werden kann. Vor diesem Hintergrund fasste der vorliegende Beitrag die fortlaufenden phonetischen Forschungen des XPEROHS Projektes zum Deutschen mit Blick auf zwei relevante und vielfach unterschätzte Faktoren zusammen: Prosodie und Kontext.

Es wurde beschrieben, dass Hassrede selbst kein homogenes Phänomen ist. Erstens kristallisieren sich verschiedene Subtypen von Hassrede heraus. Zweitens sind diese Subtypen mit jeweils eigenen Prosodien assoziiert. Das heißt, obwohl bestimmte prosodische Veränderungen systematisch damit einherzugehen scheinen, als wie persönlich inakzeptabel und folgenschwer für den Urheber/die Urheberin die jeweilige Hassrede bewertet wird (tieftonigeres, leiseres, knarrigeres Sprechen verstärkt den Hassredecharakter), gibt es keine eigenständige, spezifische Prosodie der Hassrede. Vielmehr folgt die Prosodie stets der zugrundeliegenden kommunikativen Funktion des Hassredetyps. Bei rhetorischen Fragen findet sich eine dafür passende Prosodie, und Gleiches gilt für Ironie, Imperative usw. Drittens gibt es bemerkenswerte Unterschiede in der Bewertung von geschriebener und gesprochener Hassrede. In welcher Weise diese Unterschiede wirken, hängt wiederum vom Typ der Hassrede ab. Einfach gesagt: Typen mit bereits klaren Hassredeindikatoren im Wortlaut (z. B. HOL, FGL, IMP) entfalten eine stärkere negative Wirkung, wenn sie laut ausgesprochen und gehört statt nur gelesen werden. Typen, in denen hingegen die prosodische Funktion zur Abschwächung des Hassredecharakters beitragen kann, z. B. durch das Hinzufügen einer ironischen Note oder einer rhetorischen Frage (Neitsch & Marinis, 2020; Niebuhr, 2014), werden in ihren negativen Wirkungen abgeschwächt, wenn sie laut ausgesprochen und gehört statt nur gelesen werden. In all diesen Zusammenhängen hat sich überdies gezeigt, dass Hassrede, die auf klar umrissene, konkrete Zielgruppen bzw. Minderheiten wie Muslime abzielt, als negativer empfunden wird als Hassrede, die unspezifischere, allgemeinere Zielgruppen wie Ausländer adressiert. Diese Erkenntnisse weisen gleichzeitig auch den Weg hin zu gezielteren und damit effektiveren Gegenstrategien in der Bekämpfung von Hassrede, z. B. hinsichtlich der Fragen, welche Kommentare im Netz für eine Gegenrede ausgewählt werden sollten und welcher Art diese Gegenrede sein müsste. An dieser Stelle können diese möglichen Strategien allerdings nicht weiter vertieft werden, da dies den Rahmen unseres Beitrags sprengen würde.

Den beiden Kontextfaktoren Medium (geschrieben vs. gesprochen) und Zielgruppe (Ausländer vs. Muslime) wurde hier erstmalig – und daher ausführlicher beschrieben – ein weiterer Kontextfaktor hinzugefügt: sozialer Kontext. Die diesbezügliche Studie bestätigt erneut die Wirkungsweise des Kontextfaktors ‚Medium‘ und liefert überdies klare experimentelle Belege für die Relevanz des sozialen Kontexts. Diese Belege gehen mit Befunden aus Studien zu anderen negativen Einflüssen konform und zeigen, allgemein gesagt, dass ein negativer Stimulus schwächer ausgeprägte Stress- und Emotionsreaktionen triggert, wenn er nicht allein, sondern in Begleitung perzipiert wird, hier in Anwesenheit des besten Freundes bzw. der besten Freundin. Der in diesem Sinne positive Effekt des Nicht-Alleinseins fällt für die stark negativen Hassredestimuli (FGL, IMP, HOL, ORIG) größer aus als für die schwach negativen Stimuli (IRO, RQ, IND).

Des Weiteren verdichten sich mit Blick auf die gesprochenen RQ- und IRO-Versionen – zusammen mit den diesbezüglichen Befunden aus dem 2D-Bewertungsraum (Abb. 1) – die Hinweise darauf, dass die Prosodie grundsätzlich über das Potential verfügt, Stimuli, die in geschriebener Form als Hassrede bewertet werden, in gesprochener Sprache in Nicht-Hassrede zu verwandeln. Für die IND Stimuli hat sich im Einklang mit früheren Studien hier außerdem erneut gezeigt, dass die physiologische Reaktion auf diese Stimuli schwächer ausfällt als dies aufgrund ihrer expliziten Bewertungen im 2D-Raum der Abb. 1 zu erwarten gewesen wäre. In letzteren Bewertungen waren die IND Stimuli klar inakzeptabel und lösten einen deutlichen Ruf nach Konsequenzen für den Urheber/die Urheberin aus. In den Biosignalen hingegen rangierten die IND Stimuli eher auf dem schwachen Reaktionsniveau der IRO und RQ Stimuli. Wie schon in Abschn. 5.1.3 vermutet, könnte sich in dieser Diskrepanz der Effekt einer Socially Desired Response manifestieren. Das heißt, in den expliziten 2D-Bewertungen geben die Teilnehmer*innen die vermeintlich gewünschte Antwort und verurteilen die IND Stimuli deutlich als Hassrede, wohingegen die Biosignale offenbaren, dass dieser Typ von Hassrede („Ich hab’ nichts gegen ___, aber__“) für die Teilnehmer*innen eigentlich in gewissem Grade tolerabel ist.

Bezüglich Ratschlägen für den Alltag ließe sich aus den zusammengefassten und neu gewonnenen Daten zweierlei konstatieren: 1) Potentielle Opfer von erwartbaren Hasskommentaren sollten sich diesen nicht allein aussetzen, sondern vorher (bekannte) Gesellschaft suchen. 2) Urheber*innen von Hass im Netz müssen sich bewusst sein, dass selbst kleine Änderungen in Wortlaut ihrer Kommentare eine große (negative) Wirkung entfalten können, dass das Lesen von Hasskommentaren Stress und andere negative Reaktionen auslöst – selbst bei denjenigen Rezipienten, die gar nicht primär adressiert sind – und dass geschriebene Hassrede zum Teil eine negativere Wirkung entfalten kann als gesprochene. Wenn man also Dinge nicht laut aussprechen mag, dann sollte das im Zweifelsfall umso mehr für ihr Aufschreiben gelten.

Im Ausblick zeigen diese Ratschläge und Möglichkeiten nur allzu klar, wie wichtig es perspektivisch ist, den Faktoren Prosodie und Kontext in zukünftigen Studien weiter intensiv nachzugehen. Biosignale bieten sich hierfür als experimentelles Instrument besonders an. Sie erfordern keine explizite Bewertung der Stimuli oder eine ähnliche metasprachliche Aufgabe von den Teilnehmer*innen, liefern dabei gleichzeitig Einblicke in unwillkürliche physiologische Stimulusreaktionen und haben wiederholt durch ein hohes Maß an Übereinstimmung mit expliziten Bewertungen ihre externe Validität unter Beweis gestellt. Das gilt besonders für EEG-Messungen, aber mit Blick auf Neitsch & Niebuhr (2020c) auch für Hautleitwiderstand und Atmung.

Insbesondere in Relation zu einer Null-Stimulus-Referenzbedingung könnten Biosignalanalysen zudem effektiv dafür sein, die Schwelle zwischen Hassrede und Nicht-Hassrede für verschiedene Inhalte und Kontextfaktoren zu bestimmen – und damit schrittweise endlich eine Hassrededefinition zu abstrahieren, die erstens den Rezipienten ins Zentrum stellt und die zweitens weit über Schlüsselwörter und -phrasen hinausgeht, wie sie derzeit von Wirtschaft und Politik für die Identifikation und Evaluation von Hassrede hauptsächlich eingesetzt werden. In diesem Zusammenhang sehen wir natürlich die Limitation, dass unsere eigenen Studien bislang noch nicht mit den eigentlichen Zielgruppen der Hassredestimuli als Teilnehmer*innen durchgeführt worden sind, also z. B. Ausländern im Allgemeinen und Muslimen im Besonderen. Hierin – sowie in der generellen Ausdifferenzierung des Faktors ‚Rezipient‘ (beispielsweise nach Beruf und Geschlecht) – werden die weiteren Schritte unserer Forschung bestehen. In diesem Rahmen werden wir auch der impliziten Prosodie in (geschriebener) Hassrede und den vermeintlichen Diskrepanzen hierin zwischen Urhebern bzw. Urheberinnen und Rezipienten bzw. Rezipientinnen nachgehen. Wenn etwa Bedingungen gefunden werden, unter denen Urheber*innen eine weniger hassvolle, negative Prosodie beim Verfassen von Hassrede im Kopf haben als auf Rezipientenseite beim Lesen entsteht, dann ließe sich auf dieser Basis ein gezieltes Sensibilisierungsprogramm gegen Hass im Netz entwickeln.

Abschließend wirft der zuvor umrissene Ausblick die generelle Frage auf, inwieweit Ergebnisse zur Hassrede aus einer experimentellen Situation in die reale Lebenssituation von Menschen übertragbar sind. Wir sind optimistisch, was diese Frage der Generalisierbarkeit angeht, obwohl wir uns natürlich gerade bei der Erforschung kontextueller Faktoren der Hassredewahrnehmung sehr wohl des Umstands bewusst sind, dass viele dieser Faktoren aktuell weder identifiziert noch untersucht sind, insbesondere nicht solche, die ein Experiment von der realen Welt unterscheiden. Unser Optimismus ist in der Tatsache begründet, dass sich alle hier berichteten Befunde (d. h. Unterschiede und Effekte) stets als sehr robust erwiesen haben, obwohl wir Umgebungsbedingungen bislang nicht sonderlich streng kontrolliert haben bzw. kontrollieren konnten. Die Bewertung der Stimuli im 2D-Urteilsraum etwa fand als Online-Experiment statt und wurde von den Teilnehmer*innen in sehr verschiedenen Umfeldern durchgeführt, die von der heimischen Couch bis zum Büro am Arbeitsplatz reichten. Die Biosignalerhebungen wurden nicht nur wie im hier berichteten, neuen Experiment im Labor der Universität durchgeführt, sondern in vorherigen Experimenten auch beim Experimentleiter zuhause, und trotzdem ist ein vergleichbares Ergebnisbild entstanden. Diese Robustheit steht nicht etwa im Widerspruch zur Relevanz des Kontextes, sie zeigt lediglich, dass Kontextfaktoren unabhängig voneinander untersucht werden können und dass auch die Identifikation relevanter Kontextfaktoren für die Hassredewahrnehmung eine weitere bedeutsame Aufgabe für die zukünftige Forschung ist.