1 Einleitung

Die Integration von Kindern mit besonderen Bedürfnissen in die Regelschule wurde durch den Artikel 24 im Übereinkommen über die Rechte von Menschen mit Behinderungen politisch verbindlich anerkannt. Seither ist die Integration im inklusiven Schulsetting ein weltweit viel untersuchter Forschungsgegenstand (vgl. Koster et al. 2009). Die Literaturrecherche von Koster et al. (2009) über die in der Forschung verwendeten Begriffe zeigt allerdings, dass die Termini soziale Partizipation, soziale Integration und soziale Inklusion uneinheitlich verwendet und operationalisiert werdenFootnote 1. Ein wichtiges Konzept für die Operationalisierung ist die Soziometrie von Moreno (1996 [1974]) aus den 1930er-Jahren, welche sich zur heutigen Netzwerkanalyse weiterentwickelte. Das Nominationsverfahren von Moreno (1996), bei dem für ein zu bestimmendes Kriterium drei positive und drei negative Wahlen getroffen werden, wurde von Peery (1979) zu den Massen social impact (Summe der positiven und negativen Wahlen für ein Individuum) und social preference (Differenz aus positiven und negativen Wahlen) weiterverarbeitet, welche wiederum die Grundlage des Klassifikationsmodells von Coie et al. (1982) bilden. Coie et al.’s (1982) Klassifikationsmodell gilt häufig als Standardmodell, um den sozialen Status zu berechnen (Cillessen und Marks 2011). Auch heute wird ihr Klassifikationsmodell noch angewendet, obwohl es mindestens seit den 1970er-Jahren Autorinnen und Autoren gibt, die das Wahlverfahren – insbesondere die Negativwahl – als ethisch bedenklich einstufen (z. B. Bell-Dolan und Wessler 1994; Hayvren und Hymel 1984). Child und Nind (2012, S. 1) kritisieren die Fokussierung auf diese Status-Kategorien: „This practice of categorising individuals as popular, and so on, may construct and reinforce social difficulties, especially for disabled children“. Die moderne Netzwerkforschung ist nun von der Kategorisierung nach sozialem Status weggekommen und verrechnet die erfassten Nennungen direkt in statistischen Modellen (Hunter et al. 2008; Snijders et al. 2010).

1.1 Ethik und Soziometrie

Auf ethische Bedenken bei soziometrischen Verfahren wird häufig in sonderpädagogischen Studien hingewiesen, jedoch sind sie selten der explizite Gegenstand der Forschung. Ein häufig geäußertes Bedenken ist, dass der Eingriff der Peernominierung oder des -ratings einen Einfluss auf die soziale Gruppe habe und die „risikoreichen“ Kinder noch stärker exkludiert werden könnten, als dies bereits der Fall ist (z. B. Eckhart 2012; Mayeux et al. 2007). Obwohl diese Befürchtung nicht empirisch gestützt wird, wird sie von Eltern, Lehrpersonen und Forschenden geäußert (Hayvren und Hymel 1984). Gerade bei der Forschung zur inklusiven Schule, wo es um die Erfassung der sozialen Partizipation und Integration von Kindern mit sonderpädagogischem Förderbedarf (SPF) geht, sollten solche Bedenken besondere Aufmerksamkeit erhalten.

Es können zwei verschiedene Ansätze im Umgang mit ethischen Bedenken in der Grundschulforschung festgestellt werden. Einerseits wurde empirisch untersucht, ob verschiedene soziometrische Verfahren negative Auswirkungen auf die teilnehmenden Kinder haben (z. B. Iverson und Iverson 1996) und andererseits wurde versucht, Messinstrumente konzeptuell so zu gestalten, dass sie ethisch vertretbar sind (z. B. Sozio von Eckhart 2005).

1.2 Ziel dieser Studie

Aufgrund ethischer Bedenken muss bei soziometrischen Instrumenten besonderer Wert auf ihre Legitimation gelegt werden. Wie im nächsten Kapitel jedoch dargelegt wird, ist diese durch empirische Untersuchungen schwierig zu liefern. Instrumente, die in ihrer Konzeption explizit ethische Aspekte bedenken, sind deshalb für die (sonderpädagogische) Forschung besser vertretbar.

In diesem Artikel wird zuerst untersucht, inwiefern das durch Eckhart (2005) weiterverarbeitete Peerrating von Krüger (1976), bei dem wahrgenommene Sprech- und Ärgerkontakte erfragt werden und das aufgrund ethischer Überlegungen entstanden ist, mit einer gängigen Freundschaftsnomination übereinstimmt. Danach wird inhaltlich analysiert, ob durch das Peerrating und die Peernomination soziale Netzwerke entstehen, welche mit den gleichen sozialen Prozessen und exogenen Faktoren erklärt werden können. Wenn die beiden Erhebungsmethoden stark übereinstimmen und zu sehr ähnlichen inhaltlichen Ergebnissen führen, so würde Sozio (Eckhart 2012) für die weitere Verwendung in der (Inklusions‑)Forschung vorgeschlagen.

2 Ethische Diskussionen zu soziometrischen Verfahren

2.1 Empirische Ergebnisse

In der neueren Inklusionsforschung besteht ein Konsens, wonach die Ergebnisse aus soziometrischen Studien dafürsprechen, dass Kinder mit SPF in Regelschulen signifikant weniger Freundschaftsnennungen und Interaktionen erhalten als ihre Mitschülerinnen und Mitschüler ohne SPF – bei gleichzeitig gleich vielen ausgehenden Freundschafts- und Interaktionsnennungen wie diese (z. B. Garrote 2016; Henke et al. 2017).

Mayeux et al. (2007) weisen auf die Paradoxie hin, dass mittels soziometrischer Verfahren die soziale Entwicklung von Kindern und ihre soziale Integration untersucht und im besten Fall verbessert werden soll, jedoch z. T. die Kinder aufgefordert werden, sich an störende oder verletzende Erfahrungen zu erinnern, wodurch sie möglicherweise eine vorher nicht wahrgenommene Zurückweisung oder Ablehnung spüren. Die bereits genannten Bedenken gegenüber der Soziometrie führten bereits so weit, dass selbst ethisch durchdachte und von Behörden unterstützte Forschungsprojekte aufgrund von elterlichen Beschwerden abgebrochen werden mussten (siehe Underwood et al. 2006, S. 95–97). Bei Krüger (1976) werden diese Bedenken so formuliert, dass je nach Kriterium und Entwicklungsstand der Kinder eine noch nicht sprachlich gefestigte oder bewusste Beurteilung über andere Kinder evoziert und gefestigt werden könne. Aus diesem Grund sollten nur Kriterien erfragt werden, welche in der Erfahrungswelt der Kinder bereits existieren – also z. B. Sprechen und Ärgern. Zudem weist Krüger (1976) darauf hin, dass mit seiner Methode die sozialen Interaktionen beurteilt werden und nicht der Mitschüler oder die Mitschülerin.

Die wenigen empirischen Untersuchungen, die zu den Auswirkungen soziometrischer Testungen vorliegen (Hayvren und Hymel 1984; Iverson und Iverson 1996; Mayeux et al. 2007), kommen allesamt zum Schluss, dass es keine Evidenz für negative Auswirkungen auf das Verhalten in der Gruppe oder auf die Gefühle der Kinder gibt. Alle drei Studien weisen jedoch methodische Mängel auf. So beruhen Hayvren und Hymel’s (1984) Analyse auf lediglich zwei Schulklassen (N = 27) und die Überprüfung des Impacts der Erhebung erfolgte mittels zeitlich sehr limitierter Beobachtung. In der Studie von Iverson und Iverson (1996) wurde das soziometrische Verfahren in der Woche vor den Sommerferien im Mai durchgeführt und nach den Ferien im September wurden Kinder in Einzelinterviews über ihre Reaktionen zum Test befragt, wobei die Stichprobe im September systematisch verzerrt war, da vorwiegend beliebtere Kinder an der zweiten Erhebung teilnehmen durften. Bei Mayeux et al. (2007) konnten lediglich 91 Kinder aus der 3. Klasse von potenziell 382 Kindern an der soziometrischen Untersuchung und am nachfolgenden Interview teilnehmen. Das Interview zu den Reaktionen auf die soziometrische Erhebung wurde zwischen 7 und 31 Wochen nach der ersten Testung durchgeführt. Diese Zeitspanne wird auch von der Autorengruppe hinsichtlich des Erinnerungsvermögens der Kinder kritisch gesehen. Die empirische Datenlage muss als defizitär bezeichnet werden und mehr empirische Untersuchungen sind wünschenswert. Derweil besteht ein erfolgversprechender Ansatz darin, ethische Aspekte bereits in der Instrumentenkonstruktion zu berücksichtigen.

2.2 Prinzipien und Standards

Bell-Dolan und Wessler (1994) und Underwood et al. (2006) verweisen für die Verwendung von soziometrischen Methoden auf die Übereinstimmung mit den ethischen Prinzipien für Psychologinnen und Psychologen und dem Verhaltenskodex (ethischer Kodex) der American Psychological Association (APA). Im ethischen Kodex werden keine Instrumente pauschal abgelehnt. Für jede neue Untersuchung sollten die Kriterien durchgegangen und reflektiert werden, ob die eingesetzten Methoden ethisch vertretbar sind. Nachfolgend werden passende Prinzipien und ethische Standards aus dem ethischen Kodex der APA (2017) auf die beiden verwendeten Methoden angewandt.

Prinzip A handelt vom Wohlwollen und der Schadensvermeidung. Da das ultimative Ziel soziometrischer Untersuchungen generell – und in der Sonderpädagogik besonders – darin liegt, die Situation von sozial exkludierten oder vernachlässigten Kindern besser zu verstehen, um sie besser zu integrieren, ist das Wohlwollen sicherlich gegeben. Bei der Schadensvermeidung sollte es darum gehen, die eingesetzten Instrumente so taktvoll („decent“ in Underwood et al. 2006, S. 106) wie möglich zu wählen oder zu gestalten, um die sozialen Prozesse in den untersuchten Klassen nicht zu verändern (Krüger 1976). Hierzu können Unterschiede zwischen der Nomination und dem Rating festgehalten werden: Bei der Nomination werden häufig auch negative Nennungen erfragt, was auf die Moreno’sche Tradition zurückzuführen ist und auch für die klassische Kategorisierung nach Coie et al. (1982) gebraucht wird. Wie bereits ausgeführt, ist genau dies der Auslöser für die häufig vorgebrachten ethischen Bedenken. Weiter könnte argumentiert werden, dass selbst Positivwahlen immer eine implizite Negativwahl bedeuten, womit allenfalls nicht bewusste affektive Zustände verfestigt werden könnten. Beim Rating kommt es auch häufig vor, dass negative Verhaltensweisen beurteilt werden. Diese haben ihre Berechtigung, wenn sie den explizit zu untersuchenden Gegenstand darstellen (Underwood et al. 2006). Dennoch kann aus einem ethischen Gesichtspunkt bemängelt werden, dass bei diesen Ratingverfahren suggeriert wird, dass die zu beurteilenden Verhaltensweisen dem beurteilten Kind als festes Attribut zugeschrieben werden können. Das Instrument Sozio versucht diese Kritik zu vermeiden, indem klargestellt wird, dass die wahrgenommene Interaktion (Sprechen und Ärgern) zwischen zwei Kindern beurteilt wird und dass diese zu einem anderen Zeitpunkt anders aussehen kann. Dadurch werden potenziell problematische, affektive Zuschreibungen vermieden.

Prinzip B – Redlichkeit und Verantwortung – gibt vor, dass Forschende die Schulleitungen, Lehrpersonen, Eltern und Kinder ehrlich über die Forschungsinteressen und -inhalte aufklären und mögliche Bedenken ernst nehmen (Underwood et al. 2006).

Prinzip C ist Integrität. In soziometrischer Forschung kann die Integrität eingehalten werden, indem z. B. keine Daten zu Kindern ohne Einverständnis erhoben werden. Täuschungen (z. B. über Forschungsinteressen) sind ethisch vertretbar, wenn dadurch bessere Erkenntnisse gewonnen und Schaden verhindert werden kann.

Prinzip D – Gerechtigkeit – beinhaltet, dass die Untersuchungsteilnehmerinnen und -teilnehmer gleichbehandelt werden. Im sonderpädagogischen Setting kann dies bedeuten, dass alle Kinder gemeinsam befragt werden – also z. B. nicht Kinder mit SPF in einem abgesonderten Raum – und dass durch individuelle Hilfestellungen sichergestellt wird, dass alle die Fragen und Items verstehen und ausfüllen können.

Der ethische Standard 9 – Assessment – verlangt, dass die angewendeten Forschungsinstrumente den neuesten Standards entsprechen und obsolete und überholte Methoden nicht verwendet werden (9.08). Bei der Peernomination werden häufig auf drei oder fünf Nennungen limitierte Verfahren gewählt (vgl. Cillessen und Marks 2017). Cillessen und Marks (2017) erläutern, dass solche limitierten Verfahren nicht ökologisch valide sind. Es wurde befürchtet, dass Kinder bei gänzlicher Aufhebung der Limitierung wahllos Freundinnen und Freunde aufschreiben könnten, weshalb in unserer Studie auf neun Nennungen beschränkt wurde.

3 Fragestellungen

Die häufigen ethischen Bedenken weisen darauf hin, dass die soziometrischen Instrumente einer guten Legitimation bedürfen. Eine empirische Überprüfung der ethischen Vertretbarkeit scheint jedoch schwierig, weshalb ethische Aspekte bereits in der Instrumentenkonstruktion mitgedacht werden sollten. Durch die Beantwortung der folgenden Fragen soll in dieser Studie überprüft werden, ob in der Inklusionsforschung eine gewöhnliche Peernomination durch ein ethisch durchdachteres Erhebungsverfahren ersetzt werden sollte.

  1. 1.

    Wie stark stimmen die zwei soziometrischen Verfahren Peernomination (Freundschaft) und Sozio (Interaktion) überein?

  2. 2.

    Inwiefern unterscheiden sich soziale Netzwerkanalysen von Freundschaftsnennungen und Interaktionsratings inhaltlich – unter Einbezug von endogenen und exogenen Kontrollvariablen?

4 Methodik

Die Daten für die vorliegende Studie stammen aus dem Projekt „Soziale Partizipation im Sport“ (SoPariS), das vom Schweizerischen Nationalfonds unterstützt wird. Für das Projekt wurden insgesamt 109 inklusive Primarschulklassen (3. bis 6. Klasse) aus der Deutschschweiz befragt. Da die Gruppe der Kinder mit SPF sehr heterogen ist, wurde sie auf Kinder mit SPF aufgrund einer kognitiven Beeinträchtigung (KB) eingegrenzt. Die Kinder mit einer KB wurden von einer offiziellen Stelle abgeklärt (standardisiertes Abklärungsverfahren) und haben einen ausgewiesenen Anspruch auf verstärkte Massnahmen (vgl. EDK 2014).

4.1 Stichprobe

Die erste Fragestellung wird mittels Intrarater-Reliabilität (Cohen’s Kappa) beantwortet, wobei die Daten von allen 109 Klassen einbezogen werden können. Die zweite Fragestellung wird mittels exponential random graph models (ERGMs) untersucht. Dabei konvergierten in der Analyse nur 77 Netzwerke. In jeder Klasse wird mindestens ein Kind mit SPF aufgrund einer KB unterrichtet. Tab. 1 beschreibt die Stichprobe.

Tab. 1 Stichprobendeskription

Die für die ERGMs ausgeschlossenen Klassen unterscheiden sich hinsichtlich des Mittelwerts der Anzahl Kinder und der Dichte in den Netzwerken signifikant von den eingeschlossenen Klassen (siehe Tab. 2). Die ausgeschlossenen Klassen sind tendenziell kleiner und dichter. Ein- und ausgeschlossene Klassen überlappen sich aber stark hinsichtlich Größe und Dichte.

Tab. 2 Unterschiede in für ERGMs ein- und ausgeschlossenen Klassen

4.2 Datenerhebung

Das aktive Einverständnis wurde von der Ethikkommission der Fakultät der Universität Bern sowie von den Schulleitungen, Lehrpersonen und den Eltern eingeholt. Die Erhebungen wurden immer von einem Mitglied des Projektteams sowie einem speziell dafür geschulten Masterstudenten, resp. -studentin durchgeführt. Jedes Item wurde vom Untersuchungsleiter laut vorgelesen. Es füllten alle Kinder den Fragebogen gemeinsam im Klassenzimmer aus, wobei das Kind mit einer KB häufig von der Heilpädagogin oder dem Heilpädagogen unterstützt wurde. Einige Kinder mit KB konnten den Fragebogen auch ohne zusätzliche Hilfe ausfüllen.

4.3 Messinstrumente

4.3.1 Soziale Interaktionen im Schulunterricht

Um die soziale Partizipation zu erfassen, wurde die Peerratingmethode Sozio (Eckhart 2012) verwendet. Sozio baut auf dem Instrument und den Überlegungen von Krüger (1976) auf und die enthaltenen Beurteilungskriterien sind sowohl theoretisch wie ethisch geleitet. Positive Interaktionen werden dabei durch wahrgenommene Sprechkontakte angegeben, bei der die Kinder gefragt werden, wie häufig sie mit jeder und jedem ihrer Mitschülerinnen und -schüler in der Schule sprechen (fünfstufige Likertskala von 0 = fast nie bis 4 = sehr viel).

Die Berechnung der ERGMs erfolgt mittels dichotomer Angaben (Lusher et al. 2013), weshalb fast nie, selten und manchmal als 0 und viel und sehr viel als 1 codiert werden (Borgatti und Quintane 2018). Durch Aufsummieren der dichotomisierten aus-, resp. eingehenden Sprechkontakte werden individuelle Aktivitäts-, resp. Popularitätswerte generiert.

4.3.2 Freundschaftsnennungen

Für die Freundschaftsnetzwerke konnten die Kinder bis zu neun Freundinnen und Freunde aus ihrer Klasse auf leere Linien aufschreiben. Für die deskriptive Statistik wird der Popularitätswert gleich wie beim Sozio hinsichtlich der Klassengröße standardisiert. Für die Beschreibung der Aktivität werden die absoluten Werte verwendet.

4.3.3 Kontrollvariablen für ERGMs

Nebst den sozio-demografischen Angaben wie Alter, Geschlecht und SPF können weitere exogene Variablen für die Erklärung der sozialen Netzwerke herangezogen werden. Diese werden nach theoretischen Überlegungen ausgewählt.

Für das schulische Selbstkonzept (SK) wird die leistungsmotivationale Integration aus dem KFDI (Venetz et al. 2014) herangezogen. Die Skala besteht aus vier Items (Bsp.: „Ich kann auch sehr schwierige Aufgaben lösen“) und wird auf einer vierstufigen Likertskala (von 0 = stimmt nicht bis 3 = stimmt genau) bewertet (Mittelwert = 2,01, Cronbach’s Alpha = 0,78). Es wird davon ausgegangen, dass Kinder, die einen höheren Wert erzielen, lieber in die Schule gehen und deshalb auch mehr Freundschafts- und Interaktionsnennungen machen.

Weiter wurde der sozioökonomische Status (SES) über den Beruf der Eltern erhoben. Der angegebene Beruf wird nach der internationalen Berufsnomenklatur (ISCO-08) codiert und in den ISEI-Wert umgewandelt (Ganzeboom 2010). Für jedes Kind wird nur der höhere ISEI-Wert des jeweiligen Elternteils berücksichtigt. Der SES erreicht eine Spannweite von 14,21 (Putzpersonal) bis 88,96 (Richter/in) mit Mittelwert 51,02. Beim SES wird davon ausgegangen, dass sich ein Homophilieeffekt zeigt: Kinder, die aus ähnlichen sozioökonomischen Verhältnissen stammen, geben eher eine Freundschaftsbeziehung oder Interaktion zueinander an.

Und schließlich wurde als zusätzliche Einflussvariable auf das soziale Netzwerk die Sportvereinszugehörigkeit erhoben (0 = nein, 1 = ja). Es wird angenommen, dass sportliche Aktivität als positives Attribut wahrgenommen wird, weshalb Kinder, die in einem Sportverein sind, mehr Freundschaftsnennungen oder Interaktionen erhalten als Kinder, die nicht in einem Sportverein sind. Von den Kindern mit SPF sind 51 von 99 (52 %) in einem Sportverein, bei den Kindern ohne SPF 402 von 1309 (31 %).

4.4 Datenanalyse

Die erste Fragestellung wird mittels Intrarater-Reliabilität (Cohen’s Kappa κ, R‑package DescTools, Signorell et al. 2021) überprüft. Dabei wird die Übereinstimmung zwischen den dichotomen Angaben im Freundschafts- und Interaktionsnetzwerk berechnet – korrigiert um zufällige Übereinstimmung. Hierfür werden für jedes Kind und jede Klasse die ausgehenden Nennungen und Ratings gepaart. Wenn in einem der beiden Netzwerke ein Wert fehlt, so wird diese Dyade von der Berechnung ausgeschlossen. Für die Beurteilung der κ‑Statistik wird Landis und Koch’s (1977) Maßstab angewendet.

Für die zweite Fragestellung werden für jede Klasse für die Schätzung der Freundschafts- und Interaktionsnetzwerke ERGMs gerechnet (R‑package ergm, Hunter et al. 2008). In der bisherigen Inklusionsforschung wurde aus den eingehenden Nominationen soziale Akzeptanz- oder Popularitätswerte berechnet, welche dann entweder mittels t‑Tests verglichen oder im Rahmen einer Regressionsanalyse verrechnet wurden. Ein anderer Ansatz bilden die ERGMs (Lusher et al. 2013). Hier wird nicht anhand von Netzwerkstatistiken ein individueller Status berechnet, sondern individuelle Attribute der Personen (exogene Faktoren) sowie netzwerkinhärente Strukturen (endogene Faktoren) werden verwendet, um die Beziehungen im sozialen Netzwerk zu erklären (Lusher et al. 2013). In ERGMs wird das Netzwerk als die abhängige Variable betrachtet.

Das Finden der richtigen Modellspezifikation für ein Netzwerk sollte theoriegeleitet geschehen (Lusher et al. 2013). Für unseren Vergleich ist es wichtig, dass pro Klasse jeweils Modelle mit den möglichst gleichen Parametern für das Freundschafts- und Interaktionsnetzwerk geschätzt werden, da die Netzwerkstatistiken von den einbezogenen Parametern abhängen und sonst nicht vergleichbar sind. Deshalb wird folgendermaßen verfahren: Es wird vorgängig ein Vollmodell spezifiziert, das die gewünschten Effekte beinhaltet (siehe Tab. 3).

Tab. 3 Effekte und Effektbeschreibungen für die Spezifikation des Vollmodells

40 Freundschaftsnetzwerke und 39 Interaktionsnetzwerke konvergierten mit dem Vollmodell. Bei den Netzwerken, die nicht konvergierten, wurde nach einer besseren Modellspezifikation gesucht, indem die Effekte Popularität, Aktivität und Zwei-Pfad schrittweise aus- und eingeschlossen wurden (Reziprozität und Transitivität wurden nie ausgeschlossen, da diese in affektiven oder kollaborativen sozialen Netzwerken wichtige Parameter sind und exogene Variablen wurden nur ausgeschlossen, wenn das Netzwerk nur aufgrund dieser nicht konvergierte). Es wurden nur Klassen in die Analyse eingeschlossen, bei denen beide Netzwerke mit den gleichen Parametern konvergierten (es gab sechs Ausnahmen, bei denen jeweils ein Netzwerk einen Parameter weniger hat als das andere) und bei denen beide Netzwerkanalysen einen guten Daten-Fit aufwiesen. Mit adjustierter Modellspezifikation konnten insgesamt 77 Klassen eingeschlossen werden. Für diese Klassen wurde für jeden Parameter eine univariate random effects Meta-Analyse (R‑package metafor, Viechtbauer 2010) gerechnet. Eine Moderator-Analyse gibt an, ob sich der jeweilige Effekt zwischen Freundschafts- und Interaktionsnetzwerk signifikant unterscheidet.

5 Resultate

Als erstes wird eine deskriptive Analyse der abhängigen Variablen gezeigt. Bei der Aktivität (ausgehende Nennungen) werden die absoluten Zahlen angegeben (siehe Abb. 1). Die beiden Verteilungen unterscheiden sich, da die Freundschaften auf neun begrenzt sind, während im Sozio die Anzahl ausgehender Nennungen nur durch die Klassengröße beschränkt ist (empirisches Maximum ist 21). Bei den Interaktionen ist der Mittelwert leicht höher als bei den Freundschaftsnennungen (MFreund = 6, MInter. = 6,15, SDFreund = 2,2, SDInter. = 3,45). Ein Welch t‑Test ergibt, dass sich die Mittelwerte der Aktivität nicht signifikant unterscheiden (t(2393,3) = 1,41, p = 0,16).

Abb. 1
figure 1

Verteilungen der Aktivität (ausgehende Nennungen) in absoluten Zahlen

Die eingehenden Nennungen sind für beide Instrumente nur durch die Klassengröße beschränkt. Indem die absoluten eingehenden Nennungen durch die Klassengröße geteilt werden, erhält man ein relatives Popularitätsmaß, das über die Klassen hinweg vergleichbar ist. Die Verteilungen dieses Popularitätswerts weisen sehr hohe Überlappungen auf (MFreund = 0,34, MInter. = 0,35, SDFreund = 0,16, SDInter. = 0,15, siehe Abb. 2). Auch bei der Popularität zeigt ein Welch t‑Test, dass sich die Mittelwerte nicht signifikant voneinander unterscheiden (t(2804,4) = 1,31, p = 0,19).

Abb. 2
figure 2

Verteilungen der eingehenden Nennungen in relativen Zahlen

In Abb. 3 sind die berechneten Kappa-Werte für alle 109 Klassen ersichtlich (ohne Ausreißer: Min = 0,4, Max = 0,86; Übereinstimmung zwischen moderat und fast perfekt). Wird κ für die gesamte Stichprobe mittels Meta-Analyse berechnet, so zeigt sich eine beachtliche Übereinstimmung zwischen Freundschaftsnennungen und dichotomisierten Interaktionsratings (κ = 0,64). Eine Klasse ist als krasser Ausreißer erkennbar (κ = −0,05).

Abb. 3
figure 3

Kappa-Werte für alle 109 Klassen nach Klassengröße (z. B. bei 20 Kindern in einer Klasse und keinen fehlenden Werten ergeben sich 20 * 20 − 20 = 380 Dyaden)

Die inferenzstatistischen Resultate der Netzwerkanalyse sind in Tab. 4 dargestellt. Praktisch alle Netzwerkeffekte weisen die gleichen Vorzeichen und Signifikanzen auf. Unterschiede diesbezüglich gibt es nur in der Aktivität und im schulischen SK (ausgehend) – beide Effekte hängen mit den ausgehenden Nennungen zusammen.

Tab. 4 Random effects Meta-Analysen der ERGMs und Moderatoranalyse

Die Netzwerke können folgendermaßen interpretiert werden: Wenn eine Nennung von j zu i vorliegt, so ist die Wahrscheinlichkeit sehr hoch, dass diese Nennung erwidert wird (Reziprozität). Auch wird Partnerinnen und Partnern von Partnerinnen und Partnern überzufällig häufig eine Nennung vergeben – d. h. Triaden tendieren dazu, geschlossen zu werden (Transitivität). In den Netzwerken gibt es Kinder, die besonders häufig Nennungen erhalten (Popularität). Im Interaktionsnetzwerk ist zudem ersichtlich, dass es besonders aktive Kinder gibt, jedoch nicht im Freundschaftsnetzwerk (nicht signifikanter Effekt bei Aktivität). Nennungen werden v. a. an gleichgeschlechtliche und gleichaltrige Kinder, sowie an solche mit ähnlichem SES vergeben. Kinder, die in einem Sportverein sind, erhalten weniger Nennungen, wobei sie sich bei den ausgehenden Nennungen nicht von Kindern unterscheiden, die nicht im Verein sind (kein sign. Effekt). Kinder mit höherem schulischem SK erhalten in beiden Netzwerken mehr Nennungen, geben jedoch nur im Interaktionsnetzwerk signifikant mehr Nennungen als Kinder mit niedrigem SK-Wert. Und schließlich erhalten und senden Kinder mit SPF weniger Nennungen als Kinder ohne SPF, allerdings ist nur der erste Effekt signifikant.

Bei jenen beiden Effekten, die sich nach Erhebungsmethode hinsichtlich Signifikanz unterscheiden, ist der Unterschied bei der Aktivität signifikant (Moderatoranalyse p < 0,0001), jedoch nicht der beim schulischen SK (ausgehend) (Moderatoranalyse p = 0,22).

6 Diskussion

6.1 Netzwerkvergleich

Die Berechnungen der Intrarater-Reliabilität (Cohen’s Kappa) zeigen eine beachtliche Übereinstimmung zwischen den beiden Erhebungsverfahren. Es zeigt sich auch, dass diese stark vom gewählten Grenzwert für die Dichotomisierung der Interaktionen abhängig ist. Wenn man bei der Ausreißerklasse das Rating manchmal statt als 0 als 1 codiert, so springt die Übereinstimmung der dichotomisierten Interaktionen mit den Freundschaftsnennungen von unter 0 auf 0,65 – was einer beachtlichen Übereinstimmung entspricht und zeigt, dass in dieser Klasse die Interaktionen konsistent tiefer eingeschätzt wurden.

Darauf aufbauend zeigen die sozialen Netzwerkanalysen, dass die endogenen und exogenen Faktoren für Freundschaften und Interaktionen praktisch dieselben Ausprägungen haben. Die einzigen Unterschiede finden sich in der Aktivität und im schulischen SK für ausgehende Nennungen, wobei sich die Effekte beim schulischen SK zwischen den Erhebungsmethoden nicht statistisch signifikant unterscheiden. Der Unterschied in der Aktivität scheint zudem ein methodisches Artefakt zu sein, da die ausgehenden Nennungen für Freundschaften auf neun begrenzt waren, während sie bei Sozio nur durch die Klassengröße limitiert sind. Aufgrund statistischer Auswertungsbeschränkungen (Cillessen und Marks 2017) waren früher limitierte Nominationsverfahren vertretbar. Mithilfe der modernen Netzwerkanalyse können allerdings auch unlimitierte Angaben statistisch ausgewertet werden, weshalb limitierte Verfahren obsolet sind. Aus pragmatischen Gründen wurde in unserer Studie für neun Nennungen optiert: Erstens ist das Freundinnen- und Freunde-Aufschreiben zeitintensiv und zweitens sollte ein wahlloses Nominieren verhindert werden – für die statistischen Auswertungen wird jedoch von diesem Vorgehen abgeraten.

Es muss beachtet werden, dass ERGMs allein keine Validierung der Messmethoden zulassen. In ERGMs wird gemessen, ob sich die Verteilung der in der Analyse einbezogenen Strukturen überzufällig stark von jenen in Zufallsnetzwerken unterscheidet. Dies ist in Freundes- und Interaktionsnetzwerken in sehr ähnlichem Ausmaß der Fall. Die Validierung der Übereinstimmung erfolgt durch die Intrarater-Reliabilität. Folglich sind die ERGMs als inhaltliche Ergänzung zu sehen, die zeigt, dass sich die sozialen Netzwerke unabhängig der Erhebungsmethode sehr ähnlich gestalten.

Anhand der Intrarater-Reliabilität und der ERGMs kommen wir zum Schluss, dass sich die Freundschaftsnetzwerke nicht bedeutsam von den Interaktionsnetzwerken unterscheiden, weswegen soziale Partizipation generell mit dem Sozio (Eckhart 2012) erhoben werden kann und – in der Inklusionsforschung – sollte. Das mögliche Argument, dass sich Freundschaftswahlen qualitativ von Interaktionsratings unterscheiden, da es bei Freundschaften in erster Linie um den emotional-affektiven Aspekt einer Beziehung geht und bei wahrgenommenen Interaktionen dieser Aspekt fehlt, wird dadurch irrelevant, dass es für die abhängige Variable – also die sozialen Netzwerke – keine Rolle spielt, ob sie mittels Freundschaften oder Interaktionen erfasst werden.

6.2 Anwendungsbereich

Soziometrische Untersuchungen werden durchgeführt, um daraus – falls nötig – Interventionen für die bessere Integration bestimmter Kinder vorzunehmen. In gängigen Peernominationen werden auch negative Kriterien erfragt, damit die Kinder einem sozialen Status nach Coie et al. (1982) zugeordnet werden können. Der Nutzen liegt darin, dass Interventionen auf den Statustyp angepasst werden können (z. B. für Abgelehnte vs. Vernachlässigte). Jedoch wird eine Fokussierung auf den sozialen Status aus ethischer Sicht kritisiert (Child und Nind 2012). Zudem können Interventionen auch aus der hier vorgestellten Analyse mittels ERGMs abgeleitet werden. Eine solche Intervention würde auf das ganze Netzwerk abzielen, was mit den Schlussfolgerungen von Garrote et al. (2017) zu Interventionen in inklusiven Klassen konform ist, wonach Interventionen v. a. dann erfolgreich sind, wenn sie die ganze Gruppe einbeziehen. Eine netzwerkgeleitete Intervention sollte die vorhandenen Strukturen im Netzwerk ausnutzen, um sozial weniger eingebundene Kinder zu mehr Interaktionen zu verhelfen. Die sozialen Netzwerke scheinen stark durch Reziprozität, Transitivität, Aktivität und Geschlechterhomophilie geprägt zu sein. Deshalb kann vorgeschlagen werden, Kinder, die aufgrund exogener Faktoren signifikant weniger Interaktionen erhalten, bei Arbeiten in geschlechtshomogene Gruppen mit besonders aktiven Kindern zusammenzutun. Durch die Prozesse der Reziprozität und Transitivität könnten dann die betroffenen Kinder profitieren.

6.3 Limitierungen und Ausblick

Die Verwendung der neusten Netzwerkanalyse ist eindeutig eine Stärke dieses Artikels. Trotzdem ergeben sich gerade auch im methodisch-analytischen Bereich Limitierungen. Aus technischen Gründen war es nicht möglich, die Interaktionen auch als gewichtete Netzwerke zu rechnen. Die Dichotomisierung geht mit einem Informationsverlust einher, der hier in Kauf genommen werden musste. Das Rating per se ist eigentlich ein weiteres Argument für ein Ratingverfahren gegenüber einer rein dichotomen Nomination, da die Beziehung zwischen Subjekten differenzierter erfasst wird. Eine weitere Meta-Analyse mit gewichteten Netzwerken würde die empirische Grundlage weiter bereichern. Weiter wären längsschnittliche Daten wünschenswert. Mittels stochastischen Akteur-orientierten Modellen (Snijders et al. 2010) können in längsschnittlichen Netzwerkanalysen Selektions- und Einflussmechanismen unterschieden werden, was in ERGMs nicht möglich ist.

Schließlich muss erwähnt werden, dass von 109 Klassen 32 (29 %) für ERGMs ausgeschlossen wurden, da die Modelle nicht konvergierten. Die Nicht-Konvergenz kann verschiedene Gründe haben, einer ist die Kollinearität von Variablen (z. B. Reziprozität und Geschlechterhomophilie). Ein anderer möglicher Grund ist, dass die spezifizierten Modelle für diese Klassen nicht passen – d. h., es hätten andere Effekte berücksichtigt werden müssen. Evtl. hätten sich in den ausgeschlossenen Klassen Unterschiede in den Freundschafts- und Interaktionsnetzwerken gezeigt. Gleichwohl darf auch darauf hingewiesen werden, dass die Meta-Analyse auf 77 Klassen beruht und dies eine starke Evidenz für die vorgestellten Resultate bedeutet.

6.4 Konklusion

Die Diskussion um ethisch vertretbare Instrumente in der Forschung kann nie als abgeschlossen gelten (APA 2017). Es gibt bereits Bemühungen, die ethische Vertretbarkeit durch empirische Untersuchungen zu stützen. Aufgrund methodischer Schwierigkeiten sehen wir bei diesem Ansatz nur geringe Erfolgschancen. Stattdessen schlagen wir vor, auf die Berücksichtigung ethischer Aspekte bei der Testkonstruktion Wert zu legen. Unsere Untersuchung hat gezeigt, dass die gängige Freundschaftswahl verglichen mit dem hier verwendeten Interaktionsrating eine beachtliche Übereinstimmung sowie starke inhaltliche Ähnlichkeit aufweisen. Gerade in der Inklusionsforschung ist es wichtig, dass Forscherinnen und Forscher für den ethischen Aspekt soziometrischer Instrumente sensibel sind.