3.1 Zielsetzung und Fragestellungen

Hauptzielsetzung der zweiten Pilotstudie ist die Entwicklung und Erprobung eines Selbstberichtfragebogens, mit dem die sozial-kognitiven und affektiven Reaktionen auf Bullying, welche relevant für das Bystander-Intervention-Modell und zur Vorhersage des Rollenverhaltens erscheinen, einheitlich und vergleichbar erfasst werden können. Im Besonderen sollen konkret die mentalen Reaktionen auf Bullying-Vorfälle abgefragt werden und nicht allgemeiner gefasste Denk- und Erlebensmuster beziehungsweise generelle soziale oder sozial-kognitive Kompetenzen. So soll es beispielsweise um Empathie mit den Opfern von Bullying – nicht um allgemeines Empathievermögen, um Moral Disengagement in Bezug auf schikanierendes Verhalten – nicht die allgemeine Disposition zu Moral Disengagement und um Verantwortungsbewusstsein für eine Bullying-freie Klassengemeinschaft – nicht um generelle soziale Verantwortung gehen. Die vieleingesetzten Instrumente zur Erfassung von Empathie (z. B. Basic Empathy Scale, Jolliffe & Farrington, 2006a; Empathic Responsiveness Scale, Olweus & Endresen, 1998; für einen Überblick siehe auch Zych, Baldry et al., 2019), die sich nicht explizit ausschließlich auf Bullying beziehen, sind für den hiesigen Zweck somit nur bedingt verwendbar. Passende Instrumente existieren bereits für Moral Disengagement in Bezug auf Bullying (Moral Disengagement in Bullying Scale, Thornberg & Jungert, 2014), die Verteidiger-Selbstwirksamkeitsüberzeugung (Defender Self-Efficacy Scale, Thornberg et al., 2017) und die Verantwortungsübernahme in Bullying-Situationen (Personal Responsibility Scale, Pozzoli & Gini, 2010). Diese scheinen sich bislang jedoch kaum außerhalb der jeweiligen Forschungsgruppen durchgesetzt zu haben und unterscheiden sich hinsichtlich Itemformulierungen und Antwortformat. Hinzu kommt, dass bei den genannten Instrumenten nicht zwischen verschiedenen Formen von Bullying unterschieden wird. Zu den Handlungsergebniserwartungen für verteidigendes Verhalten in Bullying-Situationen liegt kaum quantitative Forschung und somit auch kein verbreitetes Instrument vor. Aufgabe für diese Arbeit ist dementsprechend die Zusammenstellung von Items zur Erfassung der fünf interessierenden sozial-kognitiven und affektiven Reaktionen in Anlehnung an die existierenden Instrumente. Dies soll eine einheitliche und vergleichbare Erfassung gewährleisten, den direkten Bezug zu Bullying sicherstellen und eine Differenzierung zwischen Schul- und Cyberbullying ermöglichen. Konkrete Teilziele und Fragestellungen der Pilotierung des SKARB sind:

  1. (A)

    Feststellen der Praktikabilität des Erhebungsformates: Sind Definitionen, Instruktionen und Itemformulierungen für die angestrebte Zielgruppe verständlich?

  2. (B)

    Itemselektion anhand von Item- und Faktorenanalysen sowie Prüfung der Testgütekriterien: Welche Items weisen günstige Itemkennwerte auf? Lässt sich die angenommene Faktorenstruktur entsprechend der fünf postulierten mentalen Reaktionen bestätigen? Wie hoch ist die interne Konsistenz der Skalen?

  3. (C)

    Analyse der Zusammenhänge zwischen SKARB und soziodemographischen Merkmalen: Zeigen sich die aus der Literatur zu erwartenden Zusammenhänge mit Geschlecht, Alter und akademischer Leistung?

  4. (D)

    Analyse der Zusammenhänge zwischen SKARB und Art der Erfahrungen mit Bullying: Unterscheiden sich die sozial-kognitiven und affektiven Reaktionen auf Bullying, je nachdem auf welche Weise jemand von den Schikanen mitbekommt?

  5. (E)

    Vergleich zwischen Schul- und Cyberkontext: Zeigen sich in Abhängigkeit vom Kontext unterschiedliche Ausprägungen in sozial-kognitiven und affektiven Reaktionen?

In Hinblick auf soziodemographische Merkmale wird angenommen, dass Empathie mit dem weiblichen Geschlecht assoziiert ist und bei älteren Jugendlichen höher ausfällt (vgl. Abschnitt 1.4.2). Zudem gibt es Hinweise für einen positiven Zusammenhang mit schulischer Leistung (Feshbach & Feshbach, 2009). Das umgekehrte Muster wird für Moral Disengagement erwartet (vgl. Abschnitt 1.4.3, sowie Bandura, Barbaranelli, Caprara & Pastorelli, 1996b). Hinsichtlich des Verantwortungsgefühls werden keine Geschlechts- und Altersunterschiede erwartet (vgl. Abschnitt 1.4.4). Keine Befunde sind zum Zusammenhang zwischen Verantwortungsbewusstsein und Schulleistung bekannt. Für einen positiven Zusammenhang würde allerdings sprechen, dass Verantwortungsübernahme mit prosozialem Verhalten einhergeht (vgl. Abschnitt 1.4.4), welches wiederum mit gutem akademischen Leistungsvermögen assoziiert ist (Caprara et al., 2000). Die Befundlage zu Geschlechts- und Altersunterschieden hinsichtlich der Verteidiger-Selbstwirksamkeit ist heterogen (vgl. Abschnitt 1.4.5), sodass keine gerichteten Hypothesen möglich sind. Soziale und selbstregulatorische Selbstwirksamkeitsüberzeugung sind positiv mit Schulleistung assoziiert (Bandura et al., 1996b), weshalb ein derartiger Zusammenhang auch für die Verteidiger-Selbstwirksamkeit plausibel scheint. Zu Handlungsergebniserwartungen für verteidigendes Verhalten ist kaum Forschung vorhanden und dementsprechend nichts zu möglichen Assoziationen mit Geschlecht, Alter und Leistung bekannt (vgl. Abschnitt 1.4.5). Vermuten ließe sich jedoch, dass Mädchen stärker zu negativen Handlungsergebniserwartungen sprich Befürchtungen neigen, da sie mehr Angstsymptome aufweisen (Ohannessian, Milan & Vannucci, 2017), also möglicherweise generell besorgter sind.

Die Erfahrungen mit Bullying betreffend scheint vor allem relevant, wie und durch wen jemand von den Schikanen mitbekommt. So ist denkbar, dass Empathie und Verantwortungsgefühl besonders stark ausgeprägt sind, wenn eine Person eigene Opfererfahrungen gemacht hat oder vom Opfer selbst von den Schikanen erfährt. Doch auch Befürchtungen dürften in diesem Fall stärker und Selbstwirksamkeitserwartungen möglicherweise geringer ausgeprägt sein, als wenn eine Person die Schikanen aus einer neutralen Position heraus erlebt. Ob Personen, die Bullying aus der Täter-Perspektive erleben, also selbst Täter sind oder auf Seite der Täter stehen, sich dazu im Stande sehen etwas gegen die Schikanen zu unternehmen und sich sicher fühlen oder ob sie eine geringe Verteidigerselbstwirksamkeit und starke Befürchtungen haben, ist bislang unklar. Im Fall der Täter-Perspektive ist jedoch ein hohes Moral Disengagement sowie wenig Empathie und Verantwortungsgefühl zu erwarten.

Was den Vergleich zwischen Schul- und Cyberkontext anbelangt, so lassen es verschiedene theoretische Ansätze als wahrscheinlich erscheinen, dass im Cyberkontext Empathie und Verantwortungsübernahme gehemmt, Moral-Disengagement-Mechanismen hingegen gefördert werden (vgl. Abschnitt 1.4.6). Selbstwirksamkeitsüberzeugungen und Handlungsergebniserwartungen betreffend sind diametrale Argumentationen denkbar, doch kann aufgrund der Besonderheiten von Cyberbullying (Persistenz, großes Publikum, keine Fluchtmöglichkeit) gemutmaßt werden, dass die Schwierigkeiten und Gefahren einer Intervention im Online-Kontext schwerer wiegen und die Erfolgsaussichten geringer wahrgenommen werden (vgl. Abschnitt 1.4.6).

Ausdifferenziert ergeben sich somit folgende Hypothesen für die auf Bullying bezogenen sozial-kognitiven und affektiven Reaktionen:

  1. 1.1.

    Empathie ist bei Mädchen höher als bei Jungen.

  2. 1.2.

    Empathie ist positiv mit dem Alter assoziiert.

  3. 1.3.

    Empathie ist positiv mit schulischen Leistungen assoziiert.

  4. 1.4.

    Empathie ist stärker ausgeprägt bei Erfahrungen aus der Opfer-Perspektive und schwächer ausgeprägt bei Erfahrungen aus der Täter-Perspektive verglichen mit Erfahrungen als nicht-involvierter Zeuge.

  5. 1.5.

    Empathie ist im Kontext von Cyberbullying schwächer als im Kontext von Schulbullying.

  1. 2.1.

    Moral Disengagement ist bei Jungen höher als bei Mädchen.

  2. 2.2.

    Moral Disengagement ist negativ mit dem Alter assoziiert.

  3. 2.3.

    Moral Disengagement ist negativ mit schulischen Leistungen assoziiert.

  4. 2.4.

    Moral Disengagement ist schwächer ausgeprägt bei Erfahrungen aus der Opfer-Perspektive und stärker ausgeprägt bei Erfahrungen aus der Täter-Perspektive verglichen mit Erfahrungen als nicht-involvierter Zeuge.

  5. 2.5.

    Moral Disengagement ist im Kontext von Cyberbullying ausgeprägter als im Kontext von Schulbullying.

  1. 3.1.

    Verantwortungsgefühl unterscheidet sich nicht zwischen Jungen und Mädchen.

  2. 3.2.

    Verantwortungsgefühl soll explorativ hinsichtlich Altersunterschieden untersucht werden.

  3. 3.3.

    Verantwortungsgefühl hängt positiv mit schulischen Leistungen zusammen.

  4. 3.4.

    Verantwortungsgefühl ist stärker ausgeprägt bei Erfahrungen aus der Opfer-Perspektive und schwächer ausgeprägt bei Erfahrungen aus der Täter-Perspektive verglichen mit Erfahrungen als nicht-involvierter Zeuge.

  5. 3.5.

    Verantwortungsgefühl ist im Kontext von Cyberbullying schwächer als im Kontext von Schulbullying.

  1. 4.1.

    Vereidiger-Selbstwirksamkeit soll explorativ hinsichtlich Geschlechtsunterschieden untersucht werden.

  2. 4.2.

    Verteidiger-Selbstwirksamkeit soll explorativ hinsichtlich Altersunterschieden untersucht werden.

  3. 4.3.

    Verteidiger-Selbstwirksamkeit hängt positiv mit schulischen Leistungen zusammen.

  4. 4.4.

    Verteidiger-Selbstwirksamkeit ist schwächer ausgeprägt bei Erfahrungen aus der Opfer-Perspektive verglichen mit Erfahrungen als nicht-involvierter Zeuge.

  5. 4.5.

    Verteidiger-Selbstwirksamkeit ist im Kontext von Cyberbullying schwächer als im Kontext von Schulbullying.

  1. 5.1.

    Befürchtungen sind bei Mädchen höher ausgeprägt als bei Jungen.

  2. 5.2.

    Befürchtungen sollen explorativ hinsichtlich Altersunterschieden untersucht werden.

  3. 5.3.

    Befürchtungen sollen explorativ auf Zusammenhänge mit schulischen Leistungen untersucht werden.

  4. 5.4.

    Befürchtungen sind stärker ausgeprägt bei Erfahrungen aus der Opfer-Perspektive verglichen mit Erfahrungen als nicht-involvierter Zeuge.

  5. 5.5.

    Befürchtungen sind im Kontext von Cyberbullying ausgeprägter als im Kontext von Schulbullying.

3.2 Konstruktion des Fragebogens

Das zweite neu entwickelte Instrument erfasst die sozial-kognitiven und affektiven Reaktionen auf Bullying und ist dementsprechend als SKARB-Fragebogen oder kurz SKARB benannt. Anders als beim RoleGrid handelt es sich um einen Selbstberichtfragebogen, da es nicht um äußerlich beobachtbare, sondern um innere, mentale Prozesse geht. Hauptanliegen war, diejenigen mentalen Prozesse abzubilden, die relevant für die Übergänge zwischen den Stufen des Bystander-Intervention-Modells (Latané & Darley, 1970) scheinen. Bei der Zusammenstellung eines Itempools wurde dafür ein besonderer Fokus auf die Konzepte Empathie, Moral Disengagement, Verantwortungsübernahme, Selbstwirksamkeitsüberzeugung und Handlungsergebniserwartungen gelegt. Dabei fand eine Orientierung an bereits bestehenden Instrumenten statt. Alle Variablen wurden jedoch ausdrücklich als Reaktionen auf Bullying-Vorfälle formuliert, nicht als allgemeine Disposition. Zu diesem Zweck diente der immer gleiche Itemstamm „Wenn ich mitbekomme, wie jemand in der Schule schikaniert wird,…“. Zum Vergleich mit Cyberbullying werden dieselben Items mit leicht variiertem Itemstamm („Wenn ich mitbekomme, wie jemand über digitale Medien schikaniert wird,…“) vorgegeben. Es liegen somit zwei parallele Fragebogenversionen für Schul- und Cyberbullying vor – der SKARBoff und der SKARBon. Die zusammengestellten 44 Items sind in Tabelle 3.1 gegliedert nach den Stufen des Bystander-Intervention-Modells dargestellt.

Für den Übergang zur zweiten Stufe, in der der Vorfall als Notfall mit Handlungsbedarf anerkannt wird, wurden entsprechend theoretischer Überlegungen (siehe Abschnitt 1.4.1) Empathie und Moral Disengagement in Betracht gezogen. Es wurden sowohl affektive als auch kognitive Aspekte der Empathie (vgl. affective/cognitive empathy in Basic Empathy Scale von Jolliffe & Farrington, 2006a) sowie auch empathische Anteilnahme (vgl. empathic concern im Interpersonal Reactivity Index von Davis, 1983 oder im Empathic Responsiveness Questionnaire von Olweus & Endresen, 1998) berücksichtigt. Des Weiteren wurden auch negativ gepolte Items entworfen, um einen Mangel an Empathie wiederzugeben. Moral Disengagement betreffend wurden Beschuldigung des Opfers, Rechtfertigung des Schikanierens, Verharmlosung, vorteilhafter Vergleich und Beschönigung abgedeckt (vgl. Moral Disengagement in Bullying Scale von Thornberg & Jungert, 2013). Items zur Dehumanisierung des Opfers wurden aus ethischen Bedenken ausgelassen. Bei der Itemformulierung wurde darauf geachtet, dass diese für Moral Disengagement bei aggressivem wie auch passivem Verhalten greift. Wiederum wurden auch umgekehrt gepolte Items entwickelt, welche das Gegenteil von Moral Disengagement, also die unumstößliche moralische Ablehnung – hier bezeichnet als Moral Engagement – abbilden sollten.

Darüber hinaus enthält der Itempool auch Items, welche das Abweisen von Verantwortung adressieren. Dies stellt ebenfalls einen Mechanismus des Moral Disengagement dar, ist jedoch bereits der nächsten Stufe des Bystander-Intervention-Modells zuzuordnen. Positiv gepolte Items spiegeln in diesem Zusammenhang die Annahme von persönlicher Verantwortung wider, wobei kognitive (Verantwortungsbewusstsein, vgl. Pozzoli, 2010) und affektive Aspekte (moralische Emotionen wie Schuld- und Schamgefühl, vgl. Menesini et al., 2003) einbezogen wurden.

Auf letzter Stufe vor der Umsetzung der Intervention, geht es um eine Abwägung der eigenen Handlungsmöglichkeiten und der Entscheidung zur Intervention – oder zum Passivbleiben. Die dazu generierten Items sollten also die Zuversicht widerspiegeln, etwas tun zu können, das die Situation verbessert. Dies umfasst zum einen das Wissen, was getan werden könnte, die Überzeugung dies selbst umzusetzen zu können (Selbstwirksamkeitsüberzeugung) und die Erwartung, dass dies zum gewünschten Ergebnis führt (positive Handlungsergebniserwartungen). Dem entgegengesetzt steht die Resignation aufgrund von Hilflosigkeit und der Befürchtung negativer Konsequenzen eines Eingreifens (negative Handlungsergebniserwartungen). Die Art und Weise des Eingreifens wurde sowohl für die positiven als auch die negativen Items relativ offengelassen, da auch der Wissensaspekt entscheidend für die Entscheidung zur Intervention ist und dementsprechend nicht vorweggenommen werden sollte. Dies hat allerdings zur Folge, dass auch die Items zu Selbstwirksamkeitsüberzeugung und Handlungsergebniserwartungen eine Wissenskomponente enthalten.

Tabelle 3.1 Itempool des SKARB-Fragebogens gegliedert nach den Stufen des Bystander-Intervention-Modells

Die Items sollten auf einer vierstufigen verbalen Ratingskala mit den Antwortoptionen nie, manchmal, meistens und immer beurteilt werden. Auf eine neutrale Mittelkategorie wurde verzichtet, da diese von Probanden nicht zuverlässig ausschließlich zur Angabe einer mittleren Merkmalsausprägung genutzt wird (Moosbrugger & Kelava, 2012). Um gerade jüngere Probanden nicht zu überfordern, wurden vier anstelle von beispielsweise sechs Antwortstufen zur Wahl gestellt.

Um zu gewährleisten, dass sich die Befragten bei der Bearbeitung des Fragebogens wirklich auf konkrete Bullying-Vorfälle beziehen, wird dies nicht nur im Itemstamm explizit formuliert und wie im RoleGrid eine ausführliche Definition von Schikanieren samt Beispielen für Schul- und Cyberkontext vorangestellt (siehe Abschnitt 2.2), sondern die eigenen Erfahrungen mit Schul- oder Cyberbullying vorab auch jeweils erfragt. So wird gefragt, wie das Bekanntschaftsverhältnis zum Betroffenen ist (aus eigener Klasse oder nicht) und aus welcher Perspektive der- oder diejenige von den Schikanen mitbekommen hat (bspw. ob er oder sie zu dem Zeitpunkt mit Täter oder Opfer zusammen war, das Geschehen aus einer neutralen Position beobachtet oder erst nachträglich davon erfahren hat). Das Verständnis des Bystanders beinhaltet somit nicht ausschließlich physisch oder virtuell anwesende Zeugen im Moment des Geschehens, sondern wurde entsprechend der Empfehlung von Jones und Kolleginnen (2015) erweitert auf jegliche Personen, die der Schikanen gewahr werden und somit die Möglichkeit zum Helfen hätten (siehe Abschnitt 1.2.2). Auch wurden in den Fragen die drei Dimensionen des konzeptuellen Rahmens von Cyberbystanding nach Pfetsch (2016) berücksichtigt: Virtualität, Nähe und soziale Beziehung (siehe Abschnitt 1.2.3). Die Pilotfassung des SKARB-Fragebogens ist in Anhang A2 (ESM) einsehbar.

3.3 Methode

Zur Pilotierung des SKARB-Fragebogens wurde dieser im Juli sowie im Oktober 2017 in einer Stichprobe von Schülerinnen und Schülern der sechsten und achten Klassenstufe eingesetzt. Die Erhebungen fanden wie bei der Pilotstudie zum RoleGrid innerhalb einer Unterrichtsstunde statt und wurden von sechs angehenden Lehrkräften im Rahmen ihrer wissenschaftlichen Arbeiten zur Ersten Staatsprüfung durchgeführt. Alle Arbeiten wurden von der Autorin betreut, welche alle benötigten Unterlagen (Fragebogen, Schulanschreiben und Elternbriefe) zur Verfügung stellte. Zudem wurden die Erhebungspersonen von der Autorin zum Thema Bullying und zum Einsatz des Fragebogens intensiv geschult. Schulen in Baden-Württemberg wurden von den Lehramtsstudierenden persönlich, telefonisch oder per E-Mail kontaktiert, um die Teilnahmebereitschaft zu erfragen. Allen Schulen wurde ein Informationsschreiben zukommen gelassen, in welchem Inhalt und Zweck der Befragung sowie das Vorgehen erklärt wurden. Auch ethische Aspekte wie Freiwilligkeit, Anonymität und Datenschutz wurden angesprochen. War die Teilnahmebereitschaft seitens der Schule gegeben, wurde über Elternbriefe das Einverständnis der Erziehungsberechtigten eingeholt. Lag die Einverständniserklärung im Voraus für weniger als ein Drittel der Klasse vor, wurde die Befragung aufgrund des unverhältnismäßigen Aufwands für Schule und Erhebungsperson nicht durchgeführt. Dies war bei zwei Schulklassen der Fall. Die bei der Befragung anwesenden Schülerinnen und Schüler bekamen nach der Befragung als Dankeschön eine kleine Süßigkeit. Es wurden Anlaufstellen für den Fall von Bullying genannt, die sowohl von selbst Betroffenen aber auch von Klassenkameraden genutzt werden können. Die Klassenlehrkräfte erhielten ein kleines Informationsschreiben zum Thema Bullying und nach Abschluss der wissenschaftlichen Arbeiten eine kurze Rückmeldung zu den Ergebnissen der jeweiligen Abschlussarbeit.

3.3.1 Stichprobe

Insgesamt wurden 28 Klassen von 10 verschiedenen Schulen erhoben. Es nahmen drei Realschulen, vier Werkrealschulen, zwei Gemeinschaftsschulen und ein Gymnasium teil. Die teilnehmenden Klassen umfassten 647 Schülerinnen und Schüler, von denen 486 (75.1 %) an der Befragung teilnahmen. Von den Teilnehmenden waren 56 % weiblich. Gründe für die Nicht-Teilnahme waren das Fehlen der Einverständniserklärung (18.5 %), die Abwesenheit in der Erhebungsstunde (5.3 %) oder die eigene Entscheidung des Jugendlichen, nicht teilnehmen zu wollen (1.1 %). Die Teilnahmequote in den verschiedenen Klassen schwankte zwischen 32 % und 100 %. Die minimale Teilnehmerzahl pro Klasse betrug 7 Personen. Es wurden Heranwachsende aus 13 sechsten Klassen (n = 237) und 15 achten Klassen (n = 249) befragt. Das Alter der befragten Schülerinnen und Schüler lag zwischen 10 und 16 Jahren (M = 13.0; SD = 1.29). Informationen zur Herkunft (Geburtsland der Eltern) lagen bei 479 Jugendlichen vor. Von diesen hatten 36.3 % einen Migrationshintergrund (mindestens ein Elternteil nicht in Deutschland geboren). Die nach Deutschland am häufigsten genannten Geburtsländer der Eltern waren Türkei, Russland und Kasachstan.

3.3.2 Instrument und Datenerhebung

Das Vorgehen bei der Itemzusammenstellung für den SKARB-Fragebogen wurde in Abschnitt 3.2 ausführlich beschrieben und begründet. An dieser Stelle soll das letztlich eingesetzte Instrument sowie der Ablauf der Erhebung kurz und bündig dargestellt werden. Wie beim RoleGrid wurde zunächst ein genereller Ausblick gegeben, worum es in der Befragung gehen soll und der Begriff des Schikanierens erklärt. Gleich wird deutlich gemacht, dass ein Streit zwischen Gleichstarken kein Schikanieren ist. Die Informationen zum Untersuchungsgegenstand sind auf der ersten Seite des Fragebogens abgedruckt und werden auch mündlich mit den potenziellen Teilnehmern besprochen. Diese werden auf die Freiwilligkeit der Teilnahme hingewiesen, um anschließend deren Teilnahmebereitschaft schriftlich abzufragen. Ist diese gegeben, werden die Heranwachsenden gebeten die Fragen sorgfältig und ehrlich zu beantworten. Es wird in diesem Zusammenhang auf die Anonymität verwiesen und gegebenenfalls die Sitzordnung angepasst und Sichtschutz aufgestellt, um eine ungestörte Bearbeitung des Fragebogens zu ermöglichen. Als erstes werden soziodemografische Angaben zu Geschlecht, Alter und Herkunft sowie die letzten Zeugnisnoten in den Fächern Mathematik, Deutsch und der ersten Fremdsprache erhoben. Es folgen ein Fragebogenabschnitt zu den eigenen Erfahrungen mit Schulbullying respektive Cyberbullying sowie den sozial-kognitiven und affektiven Reaktionen darauf. Zur Vermeidung von Reihenfolge-Effekten wurden beide Teile – SKARBoff und SKARBon – klassenweise ausbalanciert: In 16 Klassen wurde zuerst der Teil zu Schikanieren in der Schule vorgegeben (n = 222), in den übrigen 12 Klassen (n = 264) zuerst der Teil zu Schikanieren über digitale Medien.

Jeder Teil beginnt mit einer konkreteren Beschreibung des Phänomens durch Beispiele, wo diese Schikanen stattfinden können (z. B. in Unterrichts- oder Pausenräumen bei Schulbullying und über Smartphone oder Computer bei Cyberbullying) sowie Beispiele, wie jemand schikaniert werden kann (z. B. durch verbale Angriffe oder durch Ausgrenzung). Es folgt eine Erinnerung an den Wiederholungscharakter mit konkreten Angaben zu Häufigkeit (mindestens wöchentlich) und Zeitraum (mehrere Wochen). Dann werden die persönlichen Erfahrungen mit Schul- oder Cyberbullying erfragt, zum Beispiel wie schwer es den Probanden fällt Schikanieren zu erkennen, ob sie es schon einmal mitbekommen haben, ob dabei jemand aus der eigenen Klasse schikaniert wurde und aus welcher Perspektive die Schikanen erlebt wurden (als Täter oder Opfer, gemeinsam mit Täter oder Opfer, aus neutraler Position, nachträglich). Im Teil zu Cyberbullying wird zusätzlich Smartphone-Besitz und Nutzungsumfang digitaler Medien abgefragt. Erst anschließend werden jeweils die Items des SKARB für Schul- oder Cyberbullying bearbeitet. Die Items zu den verschiedenen angenommenen Konstrukten (Empathie, Moral Disengagement, Verantwortungsübernahme, Selbstwirksamkeit und Handlungsergebniserwartungen) werden dabei gemischt vorgegeben, wobei als letztes Item – aus ethischen Gründen – bewusst ein positiv konnotiertes Item zur Selbstwirksamkeitserwartung gewählt wurde. Die Analyse von Itemkennwerten, Faktorenstruktur und Reliabilitäten der SKARB-Skalen sowie dessen Auswertungsmöglichkeiten sind Hauptgegenstand dieser Pilotstudie. Ziel ist unter anderem eine Itemauswahl zu treffen, mit der die relevanten Konstrukte effizient erfasst werden können. Auswertungsvorgehen und Befunde werden daher detailliert in den nachfolgenden Kapiteln dargestellt.

3.3.3 Auswertungsstrategie und statistische Analysen

Alle statistischen Analysen wurden mit der Statistiksoftware IBM SPSS Statistics 25 sowie der Softwareumgebung R Version 3.6.3 (2020-02-29) durchgeführt. Die Daten der Pilotstudie zum SKARB-Fragebogen wurden zunächst deskriptiv ausgewertet, wobei der Fokus auf Itemverteilungen beziehungsweise -kennwerten sowie Intraklassenkorrelationen lag. Die Intraklassenkorrelationen und Designeffekte für Item- und Skalenwerte konnten übersichtlich mit einer Funktion von Michael Hock (persönliche Kommunikation) generiert werden. Zur Ermittlung der faktoriellen Struktur wurden mit Hilfe von SPSS exploratorische Faktorenanalysen und mit dem R-Paket lavaan Version 0.6-5 (Rosseel et al., 2019; siehe auch Rosseel, 2012) konfirmatorische Faktorenanalysen gerechnet. Die Voraussetzung der multivariaten Normalverteilung wurde mittels Mardia-Test und multivariatem Q-Q-Plot aus dem MVN-Paket (Korkmaz, Goksuluk & Zararsiz, 2014) überprüft. Um die genestete Datenstruktur zu berücksichtigen, wurde auf die Prozedur von F. L. Huang (2017) zurückgegriffen. Zur graphischen Darstellung der Faktorenmodelle wurde das Paket semPlot (Epskamp, 2019) genutzt. Für die Punktschätzer der internen Konsistenzen (Cronbachs Alpha, McDonalds Omega) der Skalen sowie deren Konfidenzintervalle (bias-corrected and accelerated Bootstrapping) wurde das MBESS-Paket (Kelley, 2019) hinzugezogen.

Die Hauptanalysen wurden mit der lmer-Funktion des lme4-Paketes Version 1.1-23 (Bates et al., 2020) für lineare Mehrebenenregressionen umgesetzt (siehe auch Bates et al., 2015). Zum einen wurde lmer genutzt, um die Skalenwerte für die sozial-kognitiven und affektiven Reaktionen mit soziodemographischen Merkmalen sowie den Erfahrungen mit Bullying in Zusammenhang zu bringen – teils um die Kriteriumsvalidität zu bewerten, teils zu explorativen Zwecken. Des Weiteren wurde lmer für den Vergleich zwischen Schul- und Cyberkontext eingesetzt, wozu die Daten in ein langes Format (long format) umstrukturiert werden mussten. Signifikanzwerte zu den t-Tests der Parameterschätzungen wurden mittels lmerTest (Kuznetsova, Brockhoff & Christensen, 2017) ergänzt. Als standardisiertes Maß der multivariaten Assoziation zwischen festen Prädiktoren und beobachtetem Outcome wurde schließlich mit der r2beta-Funktion des r2glmm-Paketes (Jaeger, 2017) Rβ2 berechnet.

3.4 Ergebnisse

Wie auch beim RoleGrid war das erste grundlegende Ziel der Pilotierung des SKARB-Fragebogens die Prüfung der praktischen Einsetzbarkeit an weiterführenden Schulen. Die Befragungen gelangen gut innerhalb des vorgesehenen Zeitrahmens von einer Unterrichtsstunde und die geschulten Erhebungspersonen meldeten keine besonderen Zwischenfälle. Wie auch beim RoleGrid entstand der Eindruck, dass bis auf wenige Ausnahmen die meisten Schülerinnen offen und auskunftsbereit an der Befragung teilnahmen. Mit Instruktionen und Antwortformat schienen die Befragten gut zurecht zu kommen. Bei manchen Items traten – insbesondere in den sechsten Klassen – Verständnisschwierigkeiten auf. Dies betraf vermehrt verneinte Formulierungen und bestimmte Ausdrucksweisen wie „kalt lassen“, „gleichgültig“ oder „Abhärtung“ und wird im Zusammenhang mit der Itemauswahl für die finale Fragebogenversion berücksichtigt (siehe Abschnitt 3.4.2). Grundsätzlich konnten Unklarheiten jedoch von den Erhebungspersonen geklärt und die Fragebogenbearbeitung erfolgreich beendet werden.

3.4.1 Erfahrungen mit Schul- und Cyberbullying

Von den Befragten besaßen 98.8 % ein eigenes Smartphone und 80.8 % gaben an täglich das Internet zu nutzen, weitere 15.3 % zumindest mehrmals wöchentlich. Die technischen Voraussetzungen in Berührung mit Cyberbullying zu kommen, können also als gegeben angenommen werden. Bei Schulbullying waren sich 50.7 % sicher dies schon mitbekommen zu haben, weitere 21.5 % waren sich diesbezüglich nicht ganz sicher. Cyberbullying hatten 39.4 % sicher schon mitbekommen und 22.3 % waren unsicher, ob es wirklich Cyberbullying war. Nur 2.9 % der Befragten gaben entschieden an noch nie Schulbullying mitbekommen zu haben. Bei Cyberbullying waren es immerhin 13.3 %.

Offline-Bullying hatten 61.1 % bei Klassenkameraden mitbekommen und 57.8 % bei Personen, die nicht zur eigenen Klasse gehören (Doppelnennung möglich). Online-Bullying hatten 37.9 % bei Klassenkameraden mitbekommen und 58.6 % bei Personen, die nicht zur eigenen Klasse gehören. Tabelle 3.2 gibt detailliert Einblick, auf welche Weise beziehungsweise aus welcher Position das Bullying mitbekommen wurde. Ein Großteil der Befragten hatten Bullying auf mehr als eine Weise mitbekommen: Bezüglich Schulbullying gaben 60.7 % mindestens zwei Arten an, bezüglich Cyberbullying 49.2 %. Jeweils 8.8 % der Befragten gaben zu selbst Schultäter oder Cybertäter gewesen zu sein, 11.9 % berichteten Opfer von Schulbullying und 9.3 % Opfer von Cyberbullying geworden zu sein. Zusammengefasst wird deutlich, dass die meisten (45.9 %) angeben Schulbullying ausschließlich aus der Bystander-Perspektive mitbekommen zu haben (beobachtet, davon gehört, von anderen erzählt bekommen). Ein Drittel (33.3 %) berichtet Schulbullying aus der Opfer-Perspektive erlebt zu haben (selbst Opfer, mit Opfer zusammen, von Opfer erzählt) und 6.6 % geben zu es nur aus der Täter-Perspektive (selbst Täter, mit Täter zusammen) erlebt zu haben. Zusätzlich gibt es 5.3 %, welche aus Opfer- und aus Täter-Perspektive von Schulbullying erfahren haben. Bei Cyberbullying sind die Verhältnisse ähnlich: 42.8 % berichten die reine Bystander-Perspektive, 24.9 % die Opfer-Perspektive, 5.1 % die Täter-Perspektive und 5.8 % sowohl die Täter- als auch die Opfer-Perspektive. Weiterhin lässt sich aus den Daten herleiten, dass 68.2 % der Befragten Schulbullying persönlich mitbekommen haben, während 23.0 % es ausschließlich über Dritte – also von Tätern, Opfern oder Unbeteiligten – erfahren haben. Cyberbullying hatten 58.2 % der Befragten persönlich mitbekommen und 20.4 % nur durch Erzählungen.

Tabelle 3.2 Wie die Befragten Bullying mitbekommen haben: Prozentuale Häufigkeit derjengen, die eine der folgenden Optionen angekreuzt haben (Mehrfachnennung möglich)

3.4.2 Itemstatistiken der SKARB-Fragebögen

Zunächst wurde die Quote fehlender Werte bei den einzelnen Items der beiden SKARB-Fragebögen betrachtet. Bei der Mehrheit der Items (rund 70 % des SKARBoff, rund 80 % des SKARBon) lag die Anzahl fehlender Werte bei unter einem Prozent. Am seltensten beantwortet wurden das Item 28 „ist mir gleichgültig“ und das Item 31 „lässt mich kalt“ mit einer Fehlquote von 3.5 % und 2.7 %, gefolgt von drei weiteren Items zu Empathiemangel oder Moral Disengagement (13, 37, 40 mit jeweils 1.9 % Fehlquote) im SKARBoff, beziehungsweise einem Item zu Handlungsmöglichkeiten (22 mit 1.9 % Fehlquote) im SKARBon. Auffällig ist in diesem Zusammenhang, dass viele der Items mit einer hohen Fehlquote von den Erhebungspersonen hinsichtlich Verständnisproblemen gemeldet wurden. So gab es zu den Begriffen „gleichgültig“ (Item 28), „kalt lassen“ (Item 31) und „Abhärtung“ (Item 37) vermehrte Nachfragen. Auch die verneinten Items 13 („… dann kümmert mich das nicht weiter.“) und 40 („… kann ich mir keinen Grund vorstellen, der sowas rechtfertigt.“) mussten mehrfach erklärt werden.

Tests auf Normalverteilung (Kolmogorov-Smirnov-Test und Shapiro-Wilk-Test) zeigten für alle Items eine signifikante Abweichung von der Normalverteilung an. Da ein signifikantes Testergebnis jedoch bei großen Stichprobengrößen auch auf geringfügige Unregelmäßigkeiten zurückgehen kann (Field et al., 2012; Tabachnick & Fidell, 2014), wurden die Verteilungen der Items auch mittels Itemstatistiken (Lageparameter, Schiefe und Exzess) sowie visuell mit Hilfe von Histogrammen, Q-Q-Plots und Boxplots inspiziert. Die Probanden nutzen das Antwortspektrum bei allen Items aus (Spannweite 0–3). Der Median betrug für fast alle Items eins oder zwei, nur bei drei Items zu Moral Disengagement (6, 21, 37) und einem zu Empathiemangel (20 nur SKARBon) war der Median null, was eine äußerst geringe Zustimmung zu diesen Items anzeigt. Der Modus lag bei zwei Dritteln der Items ebenfalls bei eins oder zwei. Bei 11 Items war die Zustimmung so gering, dass die meisten Befragten „nie“ angaben (Modus = 0). Überwiegend war dies bei Items zu Empathiemangel (13, 20, 28, 31) und Moral Disengagement (2, 6, 16, 21, 37) der Fall. Bemerkenswert ist, dass ein Großteil der Befragten (je rund 40 %) auch keine Angst vor negativen Konsequenzen zu haben schien (Items 15, 41). Bei drei weiteren Items zu Empathie (32, 43, 7 im SKARBoff, 1 im SKARBon) und zwei umgekehrt gepolten Items zu Moral Disengagement (11, 25) war die Zustimmung hingegen so hoch, dass die meisten Befragten „immer“ angaben (Modus = 3). Die Items mit einem Modus am oberen oder unteren Antwortspektrum fielen auch bei der visuellen Inspektion auf. Darüber hinaus waren Abweichungen von der Normalverteilung für drei weitere Items erkennbar: zwei linkssteil verteilte Items zu Moral Disengagement (9 nur bei SKARBoff, 18) und ein relativ flach verteiltes rechtssteiles Empathie-Item (17). Insgesamt fällt auf, dass die Items zu Empathie tendenziell rechtssteil und breitgipflig sind, während Items zu Moral Disengagement und Empathiemangel eher linkssteil und schmalgipflig sind. Alle relevanten Itemstatistiken des SKARB-Fragebogens zu Schulbullying und zu Cyberbullying sind in einer umfassenden Tabelle im elektronischen Zusatzmaterial einsehbar (Tabelle B12).

Da die Erhebungen in Schulklassen stattfanden, wurde anhand von Intraklassenkorrelationen (ICC) und Designeffekten geprüft, in welchem Ausmaß dadurch die Annahme der Unabhängigkeit der Messungen verletzt wurde (vgl. Maas & Hox, 2005). Dazu wurde das R-Paket multilevel Version 2.6 (Bliese, 2016) genutzt. Designeffekte von größer als zwei (vgl. Maas & Hox, 2005) ergaben sich für 12 Items des SKARBoff und sieben Items des SKARBon. Interessanterweise waren in den beiden Fragebogenversionen weitgehend unterschiedliche Items betroffen. Im SKARBoff waren es vor allem Items zu Empathie (1, 10, 38) und Moral Disengagement (6, 9, 21, 29, 30) sowie zu Selbstwirksamkeitsüberzeugungen (22, 33, 34). Beim SKARBoff wiesen gehäuft Items zur Verantwortungsübernahme (3, 24, 39) erhöhte Designeffekte auf.

Zusammengenommen verdeutlicht diese erste Prüfung der Items, dass bei den folgenden Analysen zum einen die genestete Datenstruktur berücksichtigt werden sollte, da einige Items erhöhte Designeffekte erkennen lassen, und zum anderen bei der Interpretation von Zusammenhängen die unterschiedliche Verteilungsform der verschiedenen Items bedacht werden sollte. Aufgrund der Item- und Verteilungsanalysen sowie Rücksprachen mit den Erhebungspersonen wurde zudem die Entscheidung getroffen acht der Items für die zukünftige Anwendung aus dem Itempool zu streichen. Grund dafür waren aufgetretene Verständnisschwierigkeiten seitens der Befragten, welche sich oftmals auch in erhöhten Raten von Fehlwerten äußerten. Die Verständnisschwierigkeiten traten teils aufgrund unbekannter Begriffe auf (28 „gleichgültig“, 31 „kalt lassen“, 37 „Abhärtung“, 40 „rechtfertigen“), teils aufgrund verneinter Formulierung in Kombination mit den Antwortoptionen „nie“ bis „immer“ auf (13 „kümmert mich nicht“, 20 „berührt mich nicht“, 35 „glaube ich nicht, dass das nur Spaß ist“; 40 „kann ich mir keinen Grund vorstellen, der sowas rechtfertigt“, 42 „bin ich der Ansicht, dass es nicht meine Pflicht ist, etwas dagegen zu unternehmen“). Es wurden somit die vier Items zu Empathiemangel (13, 20, 28, 31), ein Item zu Moral Disengagement (37), ein Item zu Verantwortungsleugnung (42) und zwei Items zu Moral Engagement (35, 40) ausgeschlossen. Die identifizierten problematischen Items kamen nicht in Frage für die Weiterentwicklung des Instruments und für den Einsatz in der Hauptstudie. Die übrigen Items wurden einer kritischen theoretischen Prüfung unterzogen und schließlich fünf weitere Items ausgesondert. Es handelt sich um zwei Items (11, 25) die im Sinne eines Moral Engagements als Gegenstück zu Moral Disengagement gedacht waren, jedoch keine solide theoretische Untermauerung haben. Weiterhin wurden zwei Items zu Resignation (8: mangelndes Wissen, 33: mangelnde Selbstwirksamkeit) sowie das einzige Item zu positiven Handlungserwartungen (4) ausgeschlossen, um eine klare Differenzierung zwischen positiver Selbstwirksamkeitsüberzeugung und negativen Handlungsergebniserwartungen zu ermöglichen. Somit dienen 31 verbleibende Items als Grundlage für die folgenden Analysen.

3.4.3 Faktorenstruktur der SKARB-Fragebögen

Die Zusammenstellung des Itempools für den SKARB-Fragebogen erfolgte orientiert an theoretischen Konzepten. Dennoch lassen sich keine eindeutigen Annahmen zur faktoriellen Struktur treffen. So ist beispielsweise offen, ob sich die Items zur Verantwortungsabweisung dem Faktor des Moral Disengagement zuordnen oder gemeinsam mit den Items zur Verantwortungsübernahme eine Skala bilden lassen. Ebenso wenig unumstößlich ist, ob die Differenzierung zwischen positiver Selbstwirksamkeitsüberzeugung und negativen Handlungsergebniserwartungen andererseits gelingt oder ob die Items einen gemeinsamen Faktor für die vierte Stufe des Bystander-Intervention-Modells bilden. Theoretisch gesehen wären folglich verschiedene Konstellationen mit jeweils vier bis fünf Faktoren zu erwarten. Um dieser Frage nachzugehen, sollte mittels exploratorischer Faktorenanalyse ein erster Eindruck von der Datenstruktur gewonnen werden. Ziel war an dieser Stelle auch eine weitere Itemauswahl für die effiziente Erfassung der interessierenden Konstrukte zu treffen. Weil einige der Items erhöhte Designeffekte aufwiesen, werden die Analysen mit klassenweise zentrierten Items durchgeführt, wodurch Niveauunterschiede zwischen den Klassen eliminiert werden, welche ansonsten zu einer Überschätzung der Zusammenhänge führen könnten. Die Begutachtung mittels Mardia-Test und multivariatem Q-Q-Plot zeigt deutliche Abweichungen von der multivariaten Normalverteilung. Da jedoch eine Kreuzvalidierung mittels konfirmatorischer Faktorenanalyse angestrebt wird und bei keinem der Items die Schiefe > 2 oder der Exzess > 7 war (Schiefe gruppenzentrierter Werte zwischen −0.43 und 1.07; Exzess gruppenzentrierter Werte zwischen -0.98 und 1.00), wurde die Maximum-Likelihood-Methode gewählt (Bühner, 2006).

Das nötige Ausmaß linearer Zusammenhänge zwischen den 31 auf Basis der Itemstatistiken und theoretischer Überlegungen ausgewählten Items (siehe Abschnitt 3.4.2) ist laut Kaiser-Meyer-Olkin-Koeffizient (SKARBoff: KMO = .923; SKARBon: KMO = .928) und Bartletts Test auf Sphärizität (SKARBoff: χ2(465) = 5934.2; p < .001; SKARBon: χ2(465) = 5572.6; p < .001) für beide Fragebogenversionen gegeben. Unabhängig von der Fragebogenversion deutet das Kaiser-Guttman-Kriterium auf fünf Faktoren, der Scree-Plot hingegen auf drei. Beim SKARBon sprechen auch Parallelanalyse und MAP-Test für eine Drei-Faktoren-Lösung, wohingegen beim SKARBoff vier Faktoren laut Parallelanalyse und fünf Faktoren laut originalem MAP-Test herauskommen. Aufgrund dieser uneindeutigen Ergebnisse werden oblique Faktorrotationen (Promax, Kappa = 4) mit drei bis fünf Faktoren durchgeführt. Die Drei-Faktoren-Lösung untergliederte sowohl für SKARBoff als auch SKARBon inhaltlich zwischen antisozialen, prosozialen und hemmenden mentalen Reaktionen von Bystandern. Auf den ersten Faktor luden – allerdings negativ – die Moral-Disengagement-Items sowie einige gefühlsbetonte Empathie-Items (positiv). Auf den zweiten Faktor luden Selbstwirksamkeitserwartung, Verantwortungsgefühl und die übrigen Empathie-Items. Auf den dritten Faktor luden die Items zu negativen Handlungsergebniserwartungen. Diese vier Items luden immer auf einem gemeinsamen eigenen Faktor, auch wenn mehr Faktoren zugelassen wurden. In dem Fall differenzierte sich ein eigener Faktor für die Selbstwirksamkeitserwartung heraus, beim SKARBon zudem ein separater Faktor für Verantwortungsübernahme, wohingegen diese im SKARBoff weiterhin einen Faktor mit einigen Empathie-Items bildete. Explorative Analysen mit jeweils nur den Items einer Stufe des Bystander-Intervention-Modells sprechen für eine klare Ausdifferenzierung zwischen Moral Disengagement und Empathie auf Stufe 2, mit Ausnahme des ersten Items („tut mir leid“), welches eine Doppelladung aufweist. Weiterhin bilden die Items zu Verantwortungsübernahme und Verantwortungsabweisung einen gemeinsamen Faktor auf Stufe 3. Auf Stufe 4 lassen sich schließlich Selbstwirksamkeitsüberzeugung und negative Handlungsergebniserwartungen trennen.

Da der Itempool weiterhin zu groß für die geplante Haupterhebung in Kombination mit dem RoleGrid ist, werden auf Basis der explorativen Analysen und pragmatischen Überlegungen weitere Items ausgesondert. Item 1 („tut mir leid“) war in vielen der Analysen dadurch aufgefallen, dass es am stärksten auf dem Faktor mit den Moral-Disengagement-Items lud und wurde daher ausgeschlossen. Auch andere Items wurden ausgeschlossen, weil sie vergleichsweise schwach auf der erwarteten Skala oder sogar häufiger auf einer anderen Skala luden (3, 7, 32). Hinzu kam ein Ausschluss aufgrund eines Bodeneffektes (6 „lernt es nicht anders“). Von den Items zu Selbstwirksamkeitserwartung und Handlungsergebniserwartung wurde ebenfalls jeweils ein Item gestrichen, eines passte inhaltlich schlechter zu den übrigen (34 „kann es stoppen“) und das andere könnte – insbesondere bei jüngeren Schülern – zu Verständnisschwierigkeiten führen (36 „rechne damit, dass Täter sich rächen“). Im Anhang befindet sich eine Tabelle (B13 im ESM), in der für jedes Item Auswahl versus Ausschluss sowie dessen Begründung dokumentiert sind. Bei der Auswahl wurde darauf geachtet, dass die Breite der Konstrukte nicht verloren geht, dass also verschiedene Facetten der Empathie sowie des Moral Disengagement abgedeckt waren. Weiterhin wurde eine regelmäßige Itemaufteilung angestrebt. So waren sechs Items für die Empathie-Skala, sechs für die Moral-Disengagement-Skala, sechs für die Verantwortungsskala und jeweils drei für Selbstwirksamkeits- und Handlungsergebniserwartungen vorgesehen.

Mit diesen 24 Items werden erneut exploratorische Faktorenanalysen durchgeführt. Auch diese Itemauswahl scheint für eine Faktorenanalyse geeignet: Für beide Fragebogenversionen zeigt der Kaiser-Meyer-Olkin-Koeffizient substanzielle Korrelationen an (SKARBoff: KMO = .911; SKARBon: KMO = .922), Bartletts Test auf Sphärizität ist signifikant (SKARBoff: χ2(276) = 4276.8; p < .001; SKARBon: χ2(276) = 3983.8; p < .001) und die MSA-Koeffizienten aller Items deuten auf eine angemessene Eignung (SKARBoff: alle MSA ≥ .71, nur vier MSA < .80; SKARBon: alle MSA ≥ .75, nur zwei MSA < .80). Die anfänglichen Kommunalitäten liegen bis auf eine Ausnahme zwischen h2 = .30 und h2 = .61 beim SKARBoff beziehungsweise h2 = .27 und h2 = .59 beim SKARBon. Item 18 („bloß Spaß“) hat eine äußerst geringe Kommunalität (h2 = .19 im SKARBoff, h2 = .17 im SKARBon), wird jedoch beibehalten, da es als zentral für das Konstrukt angesehen wird. Scree-Plot, Parallelanalyse und MAP-Test sprechen bei beiden Fragebogenversionen für drei Faktoren, das Kaiser-Guttman-Kriterium ließe jedoch auch vier (SKARBon) oder fünf (SKARBoff) Faktoren in Betrachtung ziehen. Dementsprechend werden wiederum Analysen mit drei bis fünf Faktoren durchgeführt (oblique Rotation: Promax, Kappa = 4).

Unabhängig von Fragebogenversion und zugelassener Faktorenzahl laden alle Moral-Disengagement-Items, inklusive jener zur Verantwortungsabweisung, auf einem gemeinsamen Faktor. Auch die Items zu negativen Handlungsergebniserwartungen (Befürchtungen) laden relativ konsistent auf einem separaten Faktor. Die prosozialen sozial-kognitiven und affektiven Reaktionen differenzieren sich aus, wenn mehr als drei Faktoren zugelassen werden: Bei fünf Faktoren bilden Empathie, Selbstwirksamkeitsüberzeugung und Verantwortungsübernahme jeweils einen eigenen Faktor. Die Fünf-Faktoren-Lösung ermöglicht somit die beste Interpretierbarkeit. Zudem liefert sie die klarste Itemzuordnung, die überdies für beide Fragebogenversionen identisch ist. Die fünf Faktoren klären beim SKARBoff 47.6 % der Gesamtvarianz auf und beim SKARBon 45.5 %. Werden die Korrelationen anhand der fünf Faktoren reproduziert, erhält man 5 % nicht-redundante Residuen für den SKARBoff und 6 % für den SKARBon. Faktorladungen und Kommunalitäten der Items sind für die Fünf-Faktoren-Lösung im Anhang in Tabelle B14 (ESM) für beide Fragebogenversionen aufgeführt.

Für die konfirmatorischen Faktorenanalysen wurde das Vorgehen der explorativen Faktorenanalysen fortgeführt und den Berechnungen aufgrund der genesteten Datenstruktur die Within-Group-Kovarianzen zugrunde gelegt. Weiterhin wurde der Maximum-Likelihood-Schätzer mit robusten Standardfehlern und Santorra-Bentler-skalierter Teststatistik (estimator = „MLM“) eingesetzt. Als alternatives Vorgehen werden zusätzlich die Ergebnisse der von F. L. Huang (2017) bereitgestellte Prozedur für das R-Paket lavaan berichtet, welche den Analysen die gepoolte Kovarianzmatrix zugrunde legt und der Mehrebenenstruktur so noch besser gerecht wird, jedoch keine robuste Schätzung erlaubt. Eine weitere Alternative, die zwar nicht der genesteten Datenstruktur Rechnung trägt, wohl aber dem ordinalen Charakter der Itemantworten (vier diskrete Antwortkategorien), ist die Nutzung eines Schätzers, welcher auf polychorischen Korrelationen beruht (Flora & Curran, 2004; Holgado-Tello, Chacón-Moscoso, Barbero-García & Vila-Abad, 2010). Dementsprechend wurden die Rohdaten einer weiteren Analyse mit diagonal gewichtetem Least-Squares-Schätzer und skalierter Teststatistik (estimator = „WLSMV“) unterzogen. Die verschiedenen Vorgehensweisen kommen zu ähnlichen Einschätzungen der Modellpassung – die Diskrepanzen zwischen verschiedenen Passungsindizes beträgt maximal 0.01 (vgl. Tabelle 3.3). Wie signifikanter χ2-Test und Konfidenzintervalle des RMSEA zeigen, liegt kein exakter Modellfit vor. Die inkrementellen Fit-Indizes CFI und TLI liegen durchweg etwas unter dem empfohlenen Cut-off-Wert von .95, die absoluten Fit-Indizes und der Quotient aus χ2-Statistik und Freiheitsgraden sprechen hingegen für eine akzeptable bis gute Passung (vergleiche dazu auch Tabelle 2.1).

Tabelle 3.3 Teststatistiken und Fit-Indizes der konfirmatorischen Faktorenanalysen der SKARB-Fragebögen

In Abbildungen C2 und C3 des Anhangs (ESM) sind die vollständig standardisierten Faktorladungen sowie die Korrelationen zwischen den Faktoren jeweils für SKARBoff und SKARBon dargestellt. Stellvertretend erfolgt die Darstellung nur für die Analysen mit robustem MLM-Schätzer und gruppenzentrierten Daten, da sich die Parameterschätzungen zwischen den verschiedenen Vorgehensweisen nur geringfügig unterscheiden. Bei robustem MLM-Schätzer mit gruppenzentrierten Werten und ML-Schätzer mit gepoolter Kovarianzmatrix sind sie nahezu identisch. Die Abweichungen zwischen ML-Schätzern und WLSMV-Schätzers sind höher, nachfolgende Zusammenfassung trifft weitgehend jedoch auch beim WLSMV-Schätzer zu. Alle Items laden signifikant auf den vorgesehenen Faktoren. Am geringsten ist die Ladung von Item 18 („bloß Spaß“) auf dem Moral-Disengagement-Faktor (SKARBoff: λ = .41; SKARBon: λ = .38). Ein Großteil der Ladungen liegt bei mindestens .60 (79 % der SKARBoff-Items, 67 % der SKARBon-Items). Doch auch alle Fehlervarianzen sind signifikant von null verschieden, ein beachtlicher Varianzanteil geht somit auf andere Einflüsse als die angenommenen Konstrukte zurück (unsystematische oder itemspezifische Varianz, andere Einflussfaktoren). Weiterhin fällt auf, dass alle Faktoren – mit Ausnahme von Selbstwirksamkeitsüberzeugung und negativen Handlungsergebniserwartungen – signifikant untereinander korrelieren. Die Korrelationen gehen in die erwarteten Richtungen. So korrelieren die Faktoren der prosozialen Reaktionen Empathie, Verantwortungsgefühl und Selbstwirksamkeitserwartung positiv untereinander und allesamt negativ mit Moral Disengagement. Besonders stark ist der Zusammenhang zwischen Empathie und Verantwortungsgefühl. Die negativen Handlungsergebniserwartungen korrelieren positiv mit Empathie und Verantwortungsgefühl sowie leicht negativ mit Moral Disengagement.

Da die Modellpassung nicht völlig zufriedenstellend ausfällt, wurden die residualen Kovarianzen sowie die Modifikationsindizes betrachtet. Diese verdeutlichen, dass durch das Modell ein großer Teil der Zusammenhänge in den Daten nicht durch die angenommene Faktorenstruktur erklärt werden kann. Theoriebasiert wurden Residual-Kovarianzen zwischen den jeweiligen Indikatoren einer Subfacette (10 + 26 affektive Empathie, 17 + 43 kognitive Empathie, 23 + 38 empathische Anteilnahme, 2 + 18 Verharmlosung, 9 + 21 Schuldzuweisung, 5 + 30 Verantwortungsleugnung, 14 + 39 moralische Emotionen, 12 + 22 Verteidigerwissen) zugelassen, was den Modellfit verbesserte (SKARBoff: ∆χ2(8) = 49.13, p < .001; SKARBon: ∆ χ2(8) = 49.42, p < .001) und die Fit-Indizes verbesserte, sodass die inkrementellen Fit-Indizes nun ebenfalls in einem akzeptablen Bereich lagen (SKARBoff: CFI = .954, TLI = .946, RMSEA = .041, 90 % CI [.034, .048] und SRMR = .051; SKARBon: CFI = .964, TLI = .957, RMSEA = .036, 90 % CI [.028, .043] und SRMR = .049). Signifikant auf einem Niveau von p < .05 wurden im SKARBoff die Residualkovarianzen für affektive und kognitive Empathie, Verharmlosung, Schuldzuweisung und Verteidigerwissen, im SKARBon für Schuldzuweisung, Verantwortungsleugnung und Verteidigerwissen. Die standardisierten Parameterschätzungen für Faktorladungen und Faktorkorrelationen ändern sich nicht wesentlich durch das selektive Zulassen tatsächlich korrelierter Fehler – die Differenz beträgt maximal .09. Ein Drei-Faktoren-Modell – wie von Scree-Plot, MAP-Test und Parallelanalyse in der exploratorischen Faktorenanalyse impliziert – kann die Daten hingegen nicht besser abbilden. Als Grundlage für die Skalenbildung dient daher das konfirmatorisch geprüfte Fünf-Faktoren-Modell.

3.4.4 Reliabilitäten und Skalenstatistiken der SKARB-Fragebögen

Die interne Konsistenz der fünf Skalen des SKARB-Fragebogens lässt sich für beide Fragebogenversionen als zufriedenstellend bis gut einstufen (Kline, 2011). In Tabelle 3.4 sind sowohl Cronbachs Alpha, der am weitesten verbreitete Reliabilitätskoeffizient, als auch McDonalds Omega aufgeführt. Letzterer stellt eine adäquate Alternative dar, wenn die Eindimensionalität einer Skala und die Annahme essentiell tau-equivalenter Messung nicht sichergestellt ist. Beide Koeffizienten sind nahezu identisch. Auch macht es keinen Unterschied, ob die Reliabilitäten auf Grundlage der Itemrohwerte oder der klassenweise zentrierten Itemscores berechnet werden – die Differenz zwischen beiden Vorgehensweisen beträgt maximal 0.02. Die Trennschärfen der Items liegen zwischen .35 (Item 18 “bloß Spaß”) und .76 (Item 38 “voll von Mitgefühl”), die meisten Items haben Trennschärfen über .50. Keines der Items verschlechtert die interne Konsistenz der Skala maßgeblich.

Tabelle 3.4 Interne Konsistenzen der SKARB-Fragebögen

Die Betrachtung von Histogrammen, Boxplots und Q-Q-Plots sowie den Statistiken für Schiefe und Exzess der Skalenscores zeigt, dass diese für beide Fragebogenversionen ähnlich verteilt sind. Die Scores der Empathieskala sind relativ symmetrisch, aber breitgipflig verteilt. Auch Verantwortungs-, Selbstwirksamkeits- und Befürchtungsscores sind eher breitgipflig und zudem eher linkssteil. Insbesondere bezüglich der Befürchtungen scheint sich ein Bodeneffekt zu zeigen. Die Moral-Disengagement-Scores sind ebenfalls linkssteil, jedoch nicht breitgipflig, sodass das obere Ende der Verteilung dünn ausfällt. Dies spiegelt sich auch in der Spannweite wider, welche nur bei Moral Disengagement nicht von null bis drei reicht (MaxMD = 2.78). Die Skalenstatistiken sind in Tabelle 3.5 aufgeführt. Dort sind auch die Intraklassenkorrelationen sowie Designeffekte ablesbar. Erhöhte Designeffekte sind offline für Moral Disengagement und Selbstwirksamkeitsüberzeugung gegeben. Leicht erhöht sind weiterhin die Designeffekte für Empathie offline sowie Verantwortungsgefühl und Selbstwirksamkeitsüberzeugung online.

Tabelle 3.5 Skalenstatistiken der SKARB-Fragebögen

Während in Abschnitt 3.4.3 sowie Abbildungen C2 und C3 (ESM) bereits die Korrelationen zwischen den latenten Faktoren beschrieben wurden, sollen hier nochmals die Korrelationen zwischen den manifesten Skalenwerten berichtet werden (siehe Tabelle 3.6). Das Muster der manifesten Variablen gleicht dem der latenten Konstrukte: Die stärkste Korrelation besteht sowohl beim SKARBoff als auch SKARBon zwischen Empathie und Verantwortungsübernahme, beide korrelieren positiv mit Selbstwirksamkeitserwartung und diese drei wiederum negativ mit Moral Disengagement. Eine positive Korrelation besteht auch zwischen Empathie und Befürchtungen. Dabei macht es kaum einen Unterschied, ob mit gruppenweise zentrierten Skalenwerten oder Skalenrohwerten gearbeitet wird. Berechnet man statt Pearsons Korrelationskoeffizienten Kendalls Rangkorrelationskoeffizienten Tau, welcher robuster bei nicht-normalverteilten Daten ist (Howell, 2010) und dem Umstand besser Rechnung trägt, dass auch die Skalenwerte streng genommen nicht intervallskaliert sind, zeigt sich wiederum das gleiche Korrelationsmuster, obgleich Kendalls Tau betragsmäßig durchweg geringer ausfällt. Im Vergleich der unterschiedlichen Korrelationsarten zeigen sich die Zusammenhänge als äußerst konsistent. In Tabelle 3.6 sind überdies auch die Korrelationen zwischen Offline- und Online-Version angeführt. Am stärksten ist die korrelative Übereinstimmung zwischen Offline- und Online-Version hinsichtlich Empathie, am geringsten hinsichtlich Selbstwirksamkeitsüberzeugung.

Tabelle 3.6 Korrelationen zwischen den Skalen des SKARB-Fragebogens sowie zwischen den Fragebogenversionen

3.4.5 Zusammenhänge mit soziodemographischen Merkmalen

Korrelative Analysen zeigen, dass die Skalen des SKARB-Fragebogens Zusammenhänge mit Geschlecht und Alter aufweisen, jedoch keine deutlichen Zusammenhänge mit der akademischen Leistung bestehen (siehe Tabelle 3.7). Dies ist für beide Fragebogenversionen gleichermaßen zutreffend.

Tabelle 3.7 Korrelative Zusammenhänge der SKARB-Skalen mit Geschlecht, Alter und Notenschnitt

Die Geschlechtsunterschiede sind derart, dass Mädchen mehr Empathie, Verantwortungsgefühl und Befürchtungen, aber weniger Moral Disengagement berichten als Jungen. Mädchen und Jungen unterscheiden sich nicht in ihrer Selbstwirksamkeitserwartung etwas gegen die Schikanen tun zu können. Die deskriptiven Mittelwertunterschiede im Geschlechtervergleich lassen sich Tabelle B15 im elektronischen Zusatzmaterial entnehmen. Weniger konsistent und weniger stark ausgeprägt sind die Zusammenhänge mit dem Alter. Es besteht eine negative Korrelation mit Empathie und eine sehr schwache negative Korrelation mit Befürchtungen, jedoch jeweils nur über die Gesamtstichprobe hinweg – nicht innerhalb der Klassen (d. h. nicht mit klassenweise zentrierten Variablen). Weiterhin besteht ein positiver Zusammenhang mit Moral Disengagement, sowohl innerhalb der Klassen als auch über alle Klassen hinweg. Ältere Heranwachsende berichten also generell mehr Moral Disengagement und jene, die älter als der Klassendurchschnitt sind, berichten auch im Vergleich zu ihren Klassenmitgliedern überdurchschnittlich viel Moral Disengagement. Hinsichtlich der akademischen Leistung zeigt sich nur eine schwach positive Korrelation des Notenschnitts mit Moral Disengagement bei Schulbullying, welche innerhalb der Klassen nicht signifikant wird.

Zur multivariaten Absicherung der bivariaten Zusammenhänge wurden in R lineare Regressionsanalysen mit Random Intercepts gerechnet, wobei die fünf Skalen des SKARB-Fragebogens jeweils offline und online die abhängigen Variablen darstellten. Als Prädiktoren wurden zunächst Geschlecht, Alter und Notenschnitt geprüft. Der Notenschnitt erwies sich in keiner der Analysen als signifikant. Das Alter zeigte hier jedoch in 7 von 10 Fällen einen marginal signifikanten Zusammenhang (p < .10) mit der jeweiligen Variablen. Da Studienbefunde auf eine geschlechtsspezifische Entwicklung einiger sozial-kognitiver und affektiver Reaktionen hindeuten (vgl. Abschnitt 1.4.2 und 1.4.3), wurden im Folgenden auch die Interaktionen zwischen Alter und Geschlecht geprüft. Der Notenschnitt wurde dabei nicht wieder in die Analysen aufgenommen, da er viele Fehlwerte aufwies – insbesondere fielen zwei komplette Gemeinschaftsschulklassen weg, in denen gar keine Noten kommuniziert wurden.

Die Ergebnisse der Regressionsanalysen sind in Tabelle 3.8 dargestellt. In Einklang mit den bivariaten Befunden erweist sich Geschlecht als signifikanter Prädiktor für Empathie, Moral Disengagement, Verantwortungsgefühl und Befürchtungen, nicht aber für Selbstwirksamkeitserwartungen. Dies war gleichermaßen für den Offline- und den Online-Kontext zutreffend. Obgleich der Interaktionsterm für Geschlecht und Alter in keiner der Analysen signifikant wurde, zeigte sich das Alter in dieser Konstellation für drei Variablen als signifikanter Prädiktor auf einem Niveau von p < .05. Für Offline-Empathie und Online-Verantwortungsgefühl war Alter negativ prädiktiv, für Offline-Moral-Disengagement positiv.

Eine graphische Inspektion zeigt, dass die Variablen – mit Ausnahme der Befürchtungen – die Annahmen der linearen Regression erfüllen. Der Plot von vorhergesagten Werten gegen die Residuen zeigt für keine der Skalen eine Trichter- oder Kurvenform, welche auf Heteroskedastizität oder Nicht-Linearität hinweisen würden. Für Empathie, Moral Disengagement, Verantwortungsgefühl und Selbstwirksamkeitserwartungen sind zudem die Histogramme der Residuen einigermaßen normalverteilt und auch in den Q-Q-Plots liegen die Werte größtenteils auf einer Linie. Abweichungen zeigen sich jedoch in den Extrembereichen. Bei der Skala Befürchtungen zeigen sich hingegen eine linkssteile Verteilung der Residuen und deutlichere Abweichungen in den Q-Q-Plots. Dies passt auch zur Beobachtung eines Bodeneffektes bei den Skalenwerten der Befürchtungen. Es wurden daher Quadratwurzel- und Logarithmus-Transformation zur Reduktion der positiven Schiefe getestet. Die Quadratwurzel-Transformation führte zu einer negativen Schiefe der Skalenwertverteilung, die Logarithmus-Transformation hingegen konnte die Schiefe eliminieren, wobei jedoch die Verteilung sehr flach wurde. Auch die Residuen waren nach der Regression mit den logarithmierten Werten eher normal verteilt, aber sehr flach. Da die Transformationen keinen Unterschied für die Signifikanz der Prädiktoren machten, werden zugunsten der Interpretierbarkeit und Vergleichbarkeit mit den anderen Skalen die Regressionsergebnisse für die nicht-transformierten Skalenwerte berichtet.

Die generelle Modellgüte lässt sich anhand von Rβ2, welches die multivariate Assoziation zwischen festen Prädiktoren und beobachtetem Outcome quantifiziert (siehe Tabelle 3.8), sowie Modellvergleichen abschätzen. Das Modell mit Geschlecht und Alter sowie deren Interaktion klärt für Empathie und Moral Disengagement den vergleichsweise höchsten Varianzanteil auf (12–15 %). Für Verantwortungsgefühl und Befürchtungen sind es hingegen nur 3–5 % und für die Selbstwirksamkeitserwartungen hat dieses Modell keinen Erklärungswert. Vergleiche mit dem Nullmodell (Random-Intercept-Modell ohne Prädiktoren) zeigen damit übereinstimmend für alle Skalen außer die Selbstwirksamkeit, dass die Hinzunahme der Prädiktoren zu einer Abnahme des AIC und einer signifikanten Modellverbesserung führt (ps < .001, außer Befürchtungen offline: p = .004). Lässt man Alter und Interaktionsterm weg steigt das AIC nur bei den Modellen für Empathie und Moral Disengagement leicht an, doch nur für Moral Disengagement offline verschlechtert sich die Modellpassung signifikant (p = .049, übrige ps < .10). Bei den Modellen zu Verantwortungsgefühl, Selbstwirksamkeit und Befürchtungen bleibt das AIC gleich oder sinkt sogar leicht ab. Das sparsamere Modell ist hier in keinem Fall signifikant schlechter.

Tabelle 3.8 Lineare Regressionen mit Random Intercepts und soziodemographischen Prädiktoren für die fünf Skalen der SKARB-Fragebögen

3.4.6 Zusammenhänge mit der Perspektive der Bullying-Erfahrung

In Abschnitt 3.4.1 wurde beschrieben, auf welche Weise die Befragten schon einmal von Schul- oder Cyberbullying mitbekommen haben. Diese Bullying-Erfahrungen lassen sich danach kategorisieren, ob man Bullying aus der Opfer-Perspektive (selbst Opfer gewesen, mit Opfer zusammen gewesen während der Schikanen, von Opfer erzählt bekommen), aus der Täter-Perspektive (selbst Täter gewesen, mit Täter zusammen gewesen) oder ausschließlich aus einer neutralen Position (beobachtet, davon gehört, von anderen erzählt bekommen) erlebt hat. Inwiefern dies einen Einfluss auf die berichteten sozial-kognitiven und affektiven Reaktionen hat, wurde wiederum mittels linearer Regressionen mit Random Intercepts geprüft. Täter- und Opfer-Perspektive wurden dazu jeweils mit der ausschließlich neutralen Position kontrastiert. Geschlecht und Alter wurden als Kontrollvariablen aufgenommen.

Die Opfer-Perspektive erwies sich in allen Modellen als signifikanter Prädiktor. Heranwachsende, die Bullying bereits aus Perspektive des Opfers erlebt hatten, berichteten mehr Empathie, weniger Moral Disengagement, mehr Verantwortungsgefühl, mehr Selbstwirksamkeitsüberzeugung sowie auch mehr Befürchtungen als jene, die Bullying nur aus einer neutralen, nicht selbst beteiligten Position kannten. Des Weiteren berichten Heranwachsende, die Bullying aus der Perspektive des Täters erlebt hatten, mehr Moral Disengagement als neutrale Bystander. Neben diesen Befunden, welche für Schul- und Cyberbullying konsistent auftraten, zeigten sich weitere vereinzelte Effekte für die Täter-Perspektive: ein negativer Zusammenhang mit Empathie bei Cyberbullying und ein negativer Zusammenhang mit Selbstwirksamkeitsüberzeugung bei Schul-bullying. Den höchsten Erklärungswert haben die untersuchten Prädiktoren wieder für Empathie und Moral Disengagement (Rβ2 = .162–.210).

Die Prüfung auf Multikolinearität der Prädiktoren (mittels Variance Inflation Factor VIF und Toleranzstatistik) sowie auf Heteroskedastizität, nicht-lineare Zusammenhänge und nicht-normalverteilte Residuen ließ keine klaren Anzeichen für Voraussetzungsverletzungen erkennen. Ausnahme war wiederum die Skala der Befürchtungen, bei der die Residuen deutlich linkssteil verteilt waren. Eine Quadratwurzeltransformation verschlimmerte die Situation nur (deutliche Abweichungen im Q-Q-Plot, bimodale Verteilung der Residuen) und auch eine Logarithmus-Transformation kann keine gleichmäßige Normalverteilung der Residuen erreichen (symmetrischer, aber sehr flach). Da sich an der Signifikanz der Prädiktoren durch die Logarithmierung zudem nichts ändert, werden in Tabelle 3.9 die Ergebnisse für die nicht-transformierten Werte aller Skalen berichtet. Deskriptive Statistiken zu den Skalen getrennt nach den drei untersuchten Perspektiven finden sich im elektronischen Zusatzmaterial in Tabelle B16.

Tabelle 3.9 Lineare Regressionen mit Random Intercepts und Bullying-Erfahrung als Prädiktor für die fünf Skalen der SKARB-Fragebögen

3.4.7 Vergleich von Schul- und Cyberkontext

Nach einer separaten Betrachtung der Skalen von Offline- und Online-Version des SKARB-Fragebogens soll im Folgenden auch ein direkter Vergleich der beiden Kontexte vorgenommen werden. Dazu wurden erneut lineare Regressionen mit Random Intercepts gerechnet, wobei spezifiziert wurde, dass die Intercepts sowohl zwischen den Klassen als auch zwischen den Individuen variieren können. Die Bullyingform (offline vs. online) stellt den interessierenden Within-Subjects-Faktor dar, Geschlecht und Alter wurden als Kontrollvariablen aufgenommen. Folgende Ergebnisse sind bereits von Knauf, Eschenbeck und Hock (2018) veröffentlicht worden. Die Bullyingform erwies sich als prädiktiv für vier der fünf Skalen. Im Kontext von Cyberbullying wurde mehr Moral Disengagement (t(479) = 2.78, p = .006), hingegen weniger Verantwortungsgefühl (t(471) = 2.92, p = .004), weniger Selbstwirksamkeit (t(473) = 2.03, p = .043) und weniger Befürchtungen (t(474) = 2.53, p = .012) berichtet als im Kontext von Schulbullying. Kein Unterschied zwischen Schul- und Cyberbullying zeigte sich für Empathie (t(479) = 1.89, p = .060). Wie in den vorausgehenden Analysen berichteten Mädchen weniger Moral Disengagement sowie mehr Empathie, Verantwortungsgefühl und Befürchtungen als Jungen. Für Empathie zeigte sich ein schwach negativer und für Moral Disengagement ein schwach positiver Alterseffekt. Es wurden für jede Skala auch mögliche Interaktionen zwischen Kontext und Geschlecht oder Alter getestet, welche jedoch nicht signifikant wurden und nichts am Befundmuster änderten, sodass in Tabelle 3.10 die Modelle ohne Interaktionen im Detail berichtet werden. Eine graphische Inspektion der Residuen aller Modelle lässt keine deutlichen Hinweise auf Heteroskedastizität, nicht-lineare Zusammenhänge oder nicht-normalverteilte Residuen erkennen.

Tabelle 3.10 Lineare Regressionen mit Random Intercepts zum Vergleich von SKARBoff und SKARBon für die fünf Skalen des SKARB-Fragebogens

3.5 Diskussion

Hauptzielsetzung der Pilotierung des SKARB-Fragebogens war die Erprobung, die Analyse der Faktorenstruktur sowie die Auswahl von Items, mittels derer die interessierenden sozial-kognitiven und affektiven Reaktionen auf Bullying effizient erfasst werden können. Die so gebildeten Skalen sollten hinsichtlich Geschlechts- und Altersunterschieden sowie Zusammenhängen mit der schulischen Leistung untersucht werden. Es sollte der Einfluss der Perspektive der Bullying-Erfahrung geprüft und schließlich ein Vergleich zwischen Schul- und Cyberkontext angestellt werden.

3.5.1 Beantwortung der Fragestellungen

Der neu entwickelte SKARB-Fragebogen erwies sich alles in allem als praktikables Instrument zur Erfassung der sozial-kognitiven und affektiven Reaktionen auf Schul- und Cyberbullying. Die Teilfragen der Pilotstudie sollen nachfolgend im Einzelnen geklärt werden.

(A) Feststellen der Praktikabilität des Erhebungsformates:

Insgesamt bekräftigt die Erprobung des Fragebogens mit knapp 500 Sechst- und Achtklässlern von verschiedenen Schulformen eine breite Einsetzbarkeit des Instruments. Es traten keine grundsätzlichen Verständnisprobleme in Hinblick auf das Thema Schikanieren oder das Erhebungsformat auf. Wohl aber riefen einzelne Items Verständnisschwierigkeiten hervor. Generell war ein Großteil der Befragten bereits mit Bullying in der Schule oder mit Cyberbullying in Berührung gekommen, was bestätigt, dass es sich um eine geeignete Stichprobe zur Beantwortung der Fragestellungen handelt.

(B) Itemselektion und Prüfung der Testgütekriterien:

Da der SKARB-Fragebogen für die Hauptstudie gemeinsam mit dem RoleGrid eingesetzt werden sollte, war ein wichtiges Ziel, eine Reduktion des Itempools von je 44 Items in SKARBoff und SKARBoff auf das nötige Mindestmaß, um die Teilnehmenden nicht zu überfordern. Erster Schritt hierzu war die Aussonderung von acht Items, die durch Verständnisschwierigkeiten aufgefallen waren, welche sich oftmals auch in erhöhten Raten von Fehlwerten äußerten. Weiterhin ausgeschlossen wurden nach einer kritischen theoretischen Reflexion fünf Items, die die interessierenden Konstrukte nicht treffend abbildeten. Erste exploratorische Faktorenanalysen sowie pragmatische Überlegungen führten zum Ausschluss weiterer sieben Items, sodass schließlich ein Itempool mit 24 Items je Fragebogenversion blieb. Erneute exploratorische Faktorenanalysen mit diesem Itempool deuten auf drei bis fünf Faktoren. Während sich bei der Drei-Faktoren-Lösung Faktoren abzeichnen, die pro-bullying orientierte, prosoziale und hemmende mentale Reaktionen spiegeln, differenzieren sich bei der Fünf-Faktoren-Lösung die prosozialen mentalen Reaktionen zu Empathie, Verantwortungsgefühl und Selbstwirksamkeitsüberzeugung aus. Zu beachten ist, dass der hier der Einfachheit halber als „Selbstwirksamkeits-überzeugung“ bezeichnete Faktor auch einen Wissensaspekt enthält. Obgleich die Extraktionskriterien (Scree-Plot, MAP-Test, Parallelanalyse) überwiegend für eine Drei-Faktoren-Lösung sprechen, wurde aus zwei Gründen die Fünf-Faktoren-Lösung weiterverfolgt: Zum einen wird eine Überfaktorisierung als unproblematischer erachtet als eine Unterfaktorisierung (Bühner, 2006), zum anderen war nur bei fünf Faktoren die Itemzuordnung für den SKARBoff und SKARBon exakt identisch. Die Vergleichbarkeit beider Kontexte stellt ein zentrales Anliegen der Entwicklung des neuen Instruments dar und die fünf Faktoren ermöglichen zudem eine bessere Interpretierbarkeit und differenziertere Betrachtung. Die fünf Faktoren entsprechen den angestrebten Skalen, nur sind die Items der Verantwortungsleugnung nicht dem Konstrukt des Verantwortungsgefühls, sondern dem Moral Disengagement zugeordnet. Die konfirmatorische Prüfung des Fünf-Faktoren-Modells legt offen, dass keine exakte Modellpassung gegeben ist und auch die inkrementellen Fit-Indizes nicht zufriedenstellend sind. Die absoluten Fit-Indizes hingegen liegen im akzeptablen bis guten Bereich. Da mit einer relativ großen Stichprobe getestet wurde, kann man davon ausgehen, dass der signifikante χ2-Test auf geringe Modellfehlspezifikationen bei hoher Teststärke zurückgeht. Ein Drei-Faktoren-Modell kann die Daten nicht besser abbilden. Modellpassung und inkrementelle Fit-Indizes verbessern sich jedoch, wenn Residual-Kovarianzen zwischen den Indikatoren der Subfacetten zugelassen werden. Die internen Konsistenzen der Skalen liegen allesamt in einem ausreichenden, meist sogar sehr guten Bereich. Zusammengenommen scheint die weitere Arbeit mit den fünf Skalen für Empathie, Moral Disengagement, Verantwortungsgefühl, Selbstwirksamkeitsüberzeugung und Befürchtungen (negative Handlungsergebniserwartungen) durchaus gerechtfertigt.

(C) Analyse der Zusammenhänge zwischen SKARB und soziodemographischen Merkmalen:

Die erwarteten Zusammenhänge der sozial-kognitiven und affektiven Reaktionen auf Bullying mit soziodemographischen Merkmalen ließen sich nur zum Teil bestätigen. Dies mag daran liegen, dass zu den angenommenen Zusammenhängen bislang nur wenig empirische Forschung vorliegt und sie daher entweder theoretisch hergeleitet oder von allgemeinen, nicht auf Bullying bezogenen Befunden auf diesen spezifischen Aspekt übertragen wurden. Grundsätzlich sind die Ergebnisse für SKARBoff und SKARBon nahezu identisch und werden daher gemeinsam diskutiert. Im Einklang mit den Erwartungen standen weitgehend die Befunde zu Geschlechtsunterschieden – sowohl bei bivariater als auch multivariater Betrachtung: Mädchen berichten mehr Empathie und mehr Befürchtungen, Jungen hingegen mehr Moral Disengagement. Unerwartet aus der bisherigen Forschungslage (Pozzoli & Gini, 2010, 2012) berichteten Mädchen zudem ein ausgeprägteres Verantwortungsgefühl, was jedoch dazu passt, dass Mädchen häufiger die Verteidiger-Rolle einnehmen (vgl. Abschnitt 1.5.4). Keine Geschlechtsunterschiede zeigen sich für die Selbstwirksamkeitserwartung. Die Zusammenhänge mit dem Alter sind entgegengesetzt zu den Hypothesen: Bullying-bezogene Empathie ist negativ und Bullying-bezogenes Moral Disengagement positiv mit Alter assoziiert. Dies widerspricht zwar längsschnittlichen Befunden zu allgemeiner Empathie und allgemeinem Moral Disengagement (siehe Abschnitt 1.4.2 und 1.4.3), passt aber zu Altersunterschieden hinsichtlich verteidigendem und schikanierendem Verhalten (siehe Abschnitt 1.5.2 und 1.5.4). Die übrigen Skalen wurden rein explorativ auf Alterseffekte hin untersucht. Hier zeigt sich ein schwach negativer bivariater Zusammenhang mit Befürchtungen: Ältere Jugendliche berichten seltener negative Konsequenzen des Verteidigens zu erwarten. Weiterhin ist in der multivariaten Analyse das Verantwortungsgefühl bei Cyberbullying negativ mit Alter assoziiert. Dieser Befund reiht sich in eine heterogene Forschungslage von teils negativen und teils nicht-vorhandenen Altersunterschieden. Schulleistungsunterschiede in Zusammenhang mit den sozial-kognitiven und affektiven Reaktionen auf Bullying lassen sich bis auf eine Ausnahme weder bi- noch multivariat bestätigen. Nur für Moral Disengagement tritt wie erwartet ein negativer Zusammenhang mit der schulischen Leistung auf (positive Korrelation mit dem Notenschnitt). Dieser ist allerdings ausschließlich für den Kontext Schulbullying und nicht innerhalb der Klassen erkennbar. Die vermuteten positiven Zusammenhänge zwischen Schulleistung und Empathie, Verantwortung und Selbstwirksamkeitserwartung zeigen sich nicht. Die diesbezüglichen Hypothesen basierten ausschließlich auf theoretischen Überlegungen und vereinzelten allgemeinen Befunden, welche sich möglicherweise nicht ohne Weiteres auf die Bullying-bezogene Forschung übertragen lassen. Ein weiterer Grund für die nicht gefundenen Zusammenhänge, könnte die Operationalisierung mittels Selbstbericht der Zeugnisnoten sein. Dies ist vermutlich deutlich fehlerbehafteter (Gedächtniseffekte, Selbstdarstellung) als der Einsatz standardisierter Schulleistungstests oder der Rückgriff auf Notenlisten. Aus Zeit- respektive Datenschutzgründen ist der Selbstbericht hier jedoch die pragmatisch beste Lösung. Im Ganzen gesehen zeigen sich die theoretisch wie empirisch am besten gesicherten Geschlechtsunterschiede auch für den SKARB-Fragebogen, wohingegen weniger solide begründbare Hypothesen keine Unterstützung erfahren.

(D) Analyse der Zusammenhänge zwischen SKARB und Art der Erfahrungen mit Bullying:

Dies ist die erste Studie, die untersucht, inwiefern die mentalen Reaktionen auf Bullying damit zusammenhängen, wie eine Person von Bullying mitbekommen hat, konkreter aus welcher Perspektive die Schikanen erlebt wurden. Hierzu wurden Heranwachsende zusammengefasst, die berichteten Opfer gewesen zu sein, mit dem Opfer zusammen gewesen zu sein oder es durch das Opfer erfahren zu haben. Zusammengefasst wurden auch jene, die zugaben selbst Täter gewesen zu sein oder sich auf Seiten des Täters sahen. Kontrastiert wurden die beiden Gruppen mit allen, die Bullying ausschließlich aus einer neutralen Beobachterposition mitbekommen hatten. Die regressionsanalytische Überprüfung bestätigt einen Großteil der getroffenen Annahmen: Diejenigen, die Bullying aus der Opfer-Perspektive mitbekommen hatten, berichten im Vergleich zu neutralen Bystandern mehr Empathie, weniger Moral Disengagement, mehr Verantwortungsgefühl und mehr Befürchtungen. Entgegen der Hypothesen berichten sie jedoch auch mehr Selbstwirksamkeitserwartungen in Hinblick auf das Verteidigen. Es scheint also nicht so, als würden sich Personen mit Viktimisierungserfahrung oder jene, denen das Opfer von seinen Erfahrungen erzählt, besonders hilflos fühlen, obgleich sie durchaus auch negative Konsequenzen verteidigender Handlungen fürchten. Dies könnte daran liegen, dass möglicherweise gerade die potenziellen Verteidiger von den Opfern ins Vertrauen gezogen werden. Heranwachsende, die Bullying aus der Täter-Perspektive erlebt hatten, berichten mehr Moral Disengagement, im Online-Kontext auch weniger Empathie und im Offline-Kontext weniger Verteidiger-Selbstwirksamkeit als neutrale Bystander. Letzteres steht im Einklang mit dem Befund, dass Verteidiger-Selbstwirksamkeit negativ mit selbstberichtetem Pro-Bullying-Verhalten der Bystander von Schulbullying assoziiert ist (Thornberg & Jungert, 2013; Thornberg et al., 2020). Täter und täternahe Bystander scheinen sich selbst also gar nicht zuzutrauen, etwas gegen die Schikanen tun zu können. Keine Unterschiede zu neutralen Bystandern zeigen sich hinsichtlich Verantwortungsgefühl und Befürchtungen, was daran liegen könnte, dass diese auch bei neutralen Bystandern relativ gering ausgeprägt sind. Generell sind die Befunde zur Täter-Perspektive vorsichtig zu betrachten, da dies eine kleine Gruppe war und die Standardfehler für die Regressionsgewichte vergleichsweise hoch ausfielen. Zusammengenommen stützen diese ersten Befunde die Annahme, dass die Art und Weise, wie und durch wen jemand von Bullying mitbekommt beziehungsweise in Bullying involviert ist, relevant für die sozial-kognitiven und affektiven Reaktionen ist.

(E) Vergleich zwischen Schul- und Cyberkontext:

Hinsichtlich des Vergleichs der sozial-kognitiven und affektiven Reaktionen zwischen Schul- und Cyberkontext stützen die Daten drei der fünf Hypothesen. Wie erwartet hat Moral Disengagement in Reaktion auf Cyberbullying eine stärkere Ausprägung als bei Schulbullying. Dies steht im Einklang mit der These von Runions und Bak (2015), dass strukturelle und funktionale Merkmale des Online-Kontexts gewisse Affordanzen für Moral Disengagement bieten (vgl. Abschnitt 1.4.6). Durch Mangel an emotionalen Hinweisreizen, physische Distanz und zeitliche Asynchronität entsteht eine emotionale Lücke, welche es sowohl Tätern als auch Bystandern ermöglicht, die negativen Konsequenzen für das Opfer zu leugnen oder bagatellisieren sowie die Taten zu beschönigen oder dem Opfer die Schuld zu geben (Runions & Bak, 2015). Kein Unterschied findet sich wider Erwarten zwischen empathischen Reaktionen auf Schul- versus Cyberbullying, obgleich diese durch die emotionale Lücke sowie erleichterte Schuldzuweisungen im Cyberspace reduziert sein sollten (Runions & Bak, 2015). Mögliche Erklärung hierfür ist, dass im Cyberspace vor allem die affektive Komponente der Empathie gehemmt ist, die entsprechende SKARB-Skala jedoch sowohl kognitive als auch affektive Empathie-Items umfasst. Weiterhin ist das Verantwortungsgefühl helfen zu müssen online schwächer ausgeprägt, was sich durch Verantwortungsdiffusion (Latané & Darley, 1970; Obermaier et al., 2015), weniger salienten Beziehungen sowie der Orientierung an lokalen passiven Gruppennormen (Postmes & Spears, 1998) erklären lasst. Auch Selbstwirksamkeitserwartungen fallen im Kontext von Cyberbullying geringer aus, was zur Annahme passt, dass Cybertäter aufgrund der Besonderheiten des Online-Kontexts (ständige Erreichbarkeit, Persistenz der Inhalte, Anonymität des Täters) als übermächtig wahrgenommen und eigene Einflussmöglichkeiten als gering eingeschätzt werden. Überraschenderweise fallen jedoch auch die Befürchtungen negativer Handlungsergebnisse bei Cyberbullying schwächer aus als bei Schulbullying. Dies könnte darauf zurückgehen, dass technische Möglichkeiten auch potenziellen Verteidigern einen gewissen Schutz bieten. Ein weiterer Erklärungsansatz für die Unterschiede zwischen Schul- und Cyberkontext könnte sein, dass Cyberbullying in schulischen Präventionsmaßnahmen bislang vergleichsweise wenig Beachtung geschenkt wird. So könnte es sein, dass Übungen zur Schulung von Empathie kontextunspezifisch wirken, während eine Stärkung von Verantwortungsgefühl und praktischen Fertigkeiten zur Verteidigung des Opfers kontextspezifisch erfolgen sollte.

Zusammengenommen erweist sich der SKARB-Fragebogen in der Pilotstudie als geeignetes Instrument zur Erfassung der fünf interessierenden sozial-kognitiven und affektiven Reaktionen auf Schul- und Cyberbullying, welche im Rahmen des Bystander-Intervention-Modells (Latané & Darley, 1970) als relevant für das Bystander-Verhalten erachtet werden: Empathie, Moral Disengagement, Verantwortungsgefühl, Selbstwirksamkeitserwartung und Befürchtung negativer Handlungs-ergebnisse. Die faktorielle Prüfung zeigt eine annehmbare Passung und die internen Konsistenzen der Skalen liegen überwiegend im guten Bereich. Inhaltlich liefert die Pilotstudie Befunde zu Geschlechts- und Alterseffekten sowie erste Erkenntnisse zu den Zusammenhängen dieser Bullying-bezogenen mentalen Reaktionen mit der Art und Weise, wie jemand von Bullying mitbekommen hat, und zu Unterschieden zwischen Schul- und Cyberbullying.

3.5.2 Reflexion des methodischen Vorgehens

Das methodische Vorgehen bei der Pilotierung des SKARB-Fragebogens soll an dieser Stelle kritisch reflektiert werden. Dabei sollen die Gestaltung des Instruments, das Design der Pilotierungsstudie sowie die statistische Auswertung betrachtet werden. Die Gestaltung des Instruments betreffend kann vor allem das Antwortformat überdacht werden. Als eine von vielen möglichen Optionen wurde ein vierstufiges Antwortformat mit den Beschriftungen nie, manchmal, meistens und immer gewählt. Die Abfrage der Häufigkeit von Reaktionen wurde aufgrund der möglichen Konfundierung mit der Häufigkeit von Zeugenerfahrungen bereits kritisiert (Sjögren et al., 2020). Eine Häufigkeitsskala wurde dessen ungeachtet gewählt, da die Häufigkeit bestimmter Gefühle und Gedanken insbesondere für jüngere Befragungsteilnehmer vermutlich besser vorstellbar ist als deren Intensität oder ihr Grad der Zustimmung. Die gerade Anzahl an Antwortoptionen sollte die aus Gleichgültigkeit oder Ambivalenz auftretende Tendenz zur Mitte verhindern (vgl. Hollenberg, 2016). Bei sechs Antwortstufen wurde die Gefahr einer Überforderung gerade für jüngere oder intellektuell schwächere Schülerinnen und Schüler gesehen, weshalb vier vollverbalisierte Stufen genutzt wurden, obgleich optimale Messungen erst zwischen fünf und sieben Abstufungen zu erwarten sind (siehe Hollenberg, 2016; Menold & Bogner, 2014). Inwiefern ein alternatives Antwortformat mit fünf oder sechs Abstufungen ebenfalls praktikabel ist und möglicherweise sogar zu besseren Ergebnissen führt, müsste in methodisch versierten Folgestudien geklärt werden.

Der vielfachen Kritik an Items mit wenigen Antwortkategorien in Bezug auf Skalenniveau (ordinal) und Verteilungsannahme (diskret, ergo nicht normalverteilt) wurde Rechnung getragen, indem für die konfirmatorischen Faktorenanalysen der WLSMV-Schätzer eingesetzt wurde, welcher auf polychorischen Korrelationen basiert (vgl. Holgado-Tello et al., 2010; Li, 2016; Moshagen & Musch, 2014). Wesentliche Unterschiede in Modellpassung oder Parameterschätzungen konnten zwischen robustem ML-Schätzer und WLSMV-Schätzer nicht festgestellt werden. Kritisch angemerkt werden muss im Zusammenhang mit der Faktorenstruktur, dass letztlich die Entscheidung getroffen wurde fünf Faktoren zu extrahieren, obgleich für die SKARBon-Version nur vier Faktoren einen Eigenwert > 1 hatten. Dies bedeutet, dass ein Faktor in diesem Fall knapp weniger Varianz aufklärt, als ein standardisiertes Item besitzt (Bühner, 2006). Nichtsdestoweniger spricht vieles für die Extraktion von fünf Faktoren: die gute theoretische Interpretierbarkeit, die identische Itemzuordnung in SKARBoff und SKARBon sowie die Annahme, dass es weniger kritisch ist, zu viele als zu wenige Faktoren zu extrahieren (Bühner, 2006). Die Stichprobengröße für die konfirmatorische Faktorenanalyse lag mit 464 Probanden beim SKARBoff und 454 Probanden beim SKARBon unter dem empfohlenen Minimum von 10-mal mehr Probanden als zu schätzende Parameter (Kline, 2011, S. 12). Für das Modell mit fünf korrelierten Faktoren und 24 Variablen müssen 58 Parameter geschätzt werden, wozu mindestens 580 Probanden herangezogen werden sollten.

Bezüglich der gerechneten Regressionen können die Operationalisierungen der Prädiktoren kritisch betrachtet werden. So stellen das selbstberichtete Alter in Jahren und die selbstberichteten Zeugnisnoten keine sehr genauen Messungen dar. Studien mit explizitem Fokus auf die Entwicklung der sozial-kognitiven und affektiven Reaktionen auf Bullying sollten das Alter exakter erfassen, eine größere Altersspanne umfassen und vor allem längsschnittlich angelegt sein. Ist eine tiefergehende Klärung der Zusammenhänge mit akademischen Leistungen angestrebt, sollten diese mittels Leistungstests und tatsächlich eingetragenen Zeugnisnoten erfasst und mögliche Moderatoren und Mediatoren berücksichtigt werden. Schließlich ist auch die Operationalisierung der Perspektive, aus welcher Bullying erlebt wurde, nicht unkritisch zu sehen. Die Kategorisierung in Opfer-Perspektive, Täter-Perspektive und neutrale Bystander-Perspektive ist zunächst relativ grob und unterscheidet nicht zwischen Opfern und opfernahen Bystandern sowie zwischen aktiven Tätern und täternahen Bystandern. Auf diese Differenzierung wurde bewusst verzichtet, da dies – insbesondere bei den Tätern und täternahen Bystandern – kleine Gruppengrößen zur Folge gehabt hätte. Zudem ist anzunehmen, dass gerade die Täterschaft betreffend eventuell Selbstdarstellungstendenzen dazu führen, dass aktive Täter berichten, nur dabei gewesen zu sein. In diesem Fall wäre eine saubere Trennung dieser beiden Gruppen mittels Selbstbericht nicht möglich. Letztlich ging es in dieser Pilotstudie jedoch darum, erste Eindrücke zu Gruppenunterschieden und Korrelaten der sozial-kognitiven und affektiven Reaktionen auf Bullying zu erhalten, welche in Folgestudien präzisiert und vertieft werden können.

3.5.3 Ausblick

Die vorgestellte Pilotstudie zum SKARB-Fragebogen erlaubt es Implikationen für die Hauptstudie zu ziehen, aber auch einen generellen Ausblick für die künftige Forschung zu geben. Für die Hauptstudie soll der Fragebogen in seiner gekürzten und mittels konfirmatorischer Faktorenanalyse geprüften Version eingesetzt werden. An der grundsätzlichen Fragebogengestaltung oder am Itemformat muss nichts geändert werden, obgleich – wie bereits erwähnt – methodische Vergleichsstudien mit einer höheren Zahl an Antwortkategorien aufschlussreich wäre. Etwas umstrukturiert und umformuliert werden sollten für die Haupterhebung die Fragen zu den eigenen Erfahrungen mit Bullying und wie man davon mitbekommen hat, um den Denkfluss der Befragten besser zu lenken. So entstand bei den Erhebungen der Eindruck, dass die anfängliche Frage, ob der- oder diejenige schon einmal Bullying mitbekommen hat, schnell verneint wurde, obgleich spätere Angaben auf eine sekundäre Zeugenschaft schließen lassen. Die Antwortoption, dass der Täter oder die Täterin es einem erzählt habe, war wohl bei der Formatierung verloren gegangen und sollte für die Haupterhebung wieder eingefügt werden, damit alle Perspektiven mit drei Items erfasst werden.

Zukünftige Studien könnten sich intensiver mit weiteren Testgütekriterien des SKARB-Fragebogens wie Retest-Reliabilität, Normierung und Messinvarianz zwischen den Versionen sowie verschiedenen Gruppen befassen. Auch das optimale Antwortformat in Hinblick auf Verständnis, Fehlwerten, Reliabilitäten und Skalenniveau könnte im Rahmen der Item-Response-Theorie ermittelt werden. Weiterhin wäre eine Validierung unter Hinzunahme etablierter Instrumente – soweit diese vorhanden sind – wünschenswert. Erstaunlich ist in diesem Zusammenhang, dass es sich nur für Moral Disengagement und Selbstwirksamkeitserwartung durchgesetzt hat, diese Bullying- beziehungsweise Verteidiger-spezifisch abzufragen – nicht der Fall ist dies für Empathie mit dem Opfer von Bullying. Auch für Befürchtungen im Kontext von Bullying gibt es kein etabliertes Instrument. Interessant für die weitere Forschung wäre also auch ein Abgleich mit allgemeineren Konstrukten der Empathie, des Moral Disengagement, der Verantwortungsübernahme, der Selbstwirksamkeit und der Ängstlichkeit. Spannend wäre dazu auch die Interaktionen der Konstrukte zu betrachten. So könnte es beispielsweise sein, dass Personen mit allgemein hohem Empathievermögen bei gleichzeitig hohem Bullying-bezogenem Moral Disengagement wenig Empathie mit dem Opfer von Bullying empfinden.

Darüber hinaus könnten sich zukünftige Studien mit den Einflussfaktoren auf die sozial-kognitiven und affektiven Reaktionen auf Bullying befassen. Relevant sein könnten hier eigene Erfahrungen mit Bullying, Sozialisationserfahrungen (Erziehung, schulische Präventionsmaßnahmen), die Umstände der Zeugenschaft (z. B. physische Nähe oder Asynchronität), die wahrgenomme Haltung der anderen Bystander sowie persönliche Merkmale (z. B. Persönlichkeitseigenschaften, Fähigkeiten). Insbesondere wäre auch eine längsschnittliche Untersuchung der Entwicklung der sozial-kognitiven und affektiven Reaktionen auf Bullying unter Berücksichtigung potenzieller Einflussfaktoren aufschlussreich. Wichtigstes Anliegen für die Hauptstudie ist jedoch vorerst diese Reaktionen in Zusammenhang mit den Rollen im Bullying-Gefüge zu bringen.