1 Hypothesen

Die zweite Studie sollte weitestgehend die Hypothesen zu Geschlechts-Professions-Assoziationen der ersten Studie (s. Kapitel 13) mit einem bildreizunabhängigen Design erneut überprüfen.

Hypothese 1::

Weibliche Lehrkräfte werden im Unterrichtsfach Deutsch kompetenter eingeschätzt als männliche Lehrkräfte.

Hypothese 2::

Männliche Lehrkräfte werden im Unterrichtsfach Mathematik kompetenter eingeschätzt als weibliche Lehrkräfte.

Zusätzlich wurde die Schulform der Lehrkräfte berücksichtigt. Der Lehrberuf an allgemeinbildenden Schulen ist beruflich eine „weibliche“ Domäne (vgl. Horstkemper, 2000; s. Kapitel 13). Der Anteil der Frauen im Lehrberuf variiert allerdings je nach Schul- und Unterrichtsform und spiegelt das Bild wider, dass die größten Frauenanteile eher in Berufen der Pflege und Erziehung zu finden sind (Autorengruppe Fachkräftebarometer, 2019; Bundesagentur für Arbeit, 2021), wo kommunale Eigenschaften (z. B. kommunikativ, kooperativ, emotional), die eher Frauen zugeschrieben werden (u. a. Bosak et al., 2008; Diehl et al., 2004; Eagly & Mladinic, 1994), besonders relevant sind. So sind zwar 73 % der Lehrkräfte weiblich, allerdings 89 % in Grundschulen, 81 % in schulartunabhängigen Orientierungsstufen, 78 % in Förderschulen, 76 % in Schulen des Gesundheitswesens, 66 % in Realschulen, 65 % in Hauptschulen, 61 % in Gymnasien und 53 % in beruflichen Schulen (Statistisches Bundesamt, 2020d). In Hochschulen liegt der Anteil der Frauen bei 40 % (hauptberufliches wissenschaftliches und künstlerisches Personal; Statistisches Bundesamt, 2020b).

Für den Lehr-Lern-Kontext sollten also nun stereotypkonform in Bereichen, in denen erzieherische Aspekte stärker im Fokus stehen (z. B. in der Grundschule), Frauen als geeigneter angesehen werden als Männer. Männer hingegen sollten als geeigneter oder mindestens als genauso geeignet beurteilt werden wie Frauen, wenn der Fokus weniger auf erzieherischen und stärker auf fachlichen Aspekten liegt (z. B. im Gymnasium). Dies sollte sich auch in der Kompetenzbeurteilung niederschlagen:

Hypothese 3::

Männliche Lehrkräfte werden im Gymnasium kompetenter eingeschätzt als in der Grundschule.

Hypothese 4::

Weibliche Lehrkräfte werden in der Grundschule kompetenter eingeschätzt als im Gymnasium.

Hypothese 5::

Weibliche Lehrkräfte werden in der Grundschule kompetenter eingeschätzt als männliche Lehrkräfte in der Grundschule.

Wie in der ersten Studie soll auf Basis des stereotype content model (s. Kapitel 5) für die Wärmebeurteilung, die der Kompetenzbeurteilung vorausgeht, kontrolliert und die Hypothesen sowie weitere Haupt- und Interaktionseffekte explorativ gemeinsam betrachtet werden.

2 Methodik

2.1 Stichprobe

An der Umfrage nahmen insgesamt 284 Proband*innen teil, von denen 19 ausgeschlossen wurden, weil sie weniger als 50 % der Items (der nicht-soziodemografischen Variablen) beantworteten, und weitere elf Proband*innen, weil sie an der ersten Studie teilnahmen. Somit ergab sich eine Stichprobe von 254 Personen. Davon waren 206 weiblich und 46 männlich, zwei Personen machten keine Angabe zu ihrem Geschlecht. Das Durchschnittsalter war mit 24.9 Jahren (SD = 5.88; Spannweite: 18–60) unter dem der ersten Studie. Das Alter wurde von einer teilnehmenden Person nicht angegeben. Der Großteil der Proband*innen studierte (n = 224, davon 58 Psychologie und 78 ein Lehramt), 24 Personen waren keine Studierenden (psychosozialer Beruf: n = 6 eindeutig identifizierbar; wissenschaftlicher Beruf: n = 6 eindeutig identifizierbar), sechs Personen machten hierzu keine Angabe.

2.2 Vorgehen

Es wurde eine Online-Umfrage (unipark, Questback GmbH) erstellt, die vom 15.12.2015 bis zum 11.08.2016 geöffnet war. Die Proband*innen wurden über E-Mail-Verteiler für Psychologie-Studierende (in Braunschweig und Osnabrück) sowie über soziale Medien akquiriert. Bei der Akquise wurde wie in der ersten Studie die Beschreibung „Studie zur Einschätzung von Personen“ genutzt.

Nachdem die Teilnehmenden über die Freiwilligkeit, Anonymität und den Datenschutz aufgeklärt wurden, wurde zufällig eine von acht textbasierten Fallvignetten präsentiert, zu der die Proband*innen ihre persönliche Einschätzung geben sollten. Innerhalb der Fallvignetten, die auf denen von Zander et al. (2015) basierten, wurde eine Lehrkraft beschrieben, wobei das Geschlecht der Lehrkraft durch die Anrede (Herr, Frau), das Unterrichtsfach (Deutsch, Mathematik) und die Schulform (3. Klasse in der Grundschule, 8. Klasse im Gymnasium) zufällig variierten. Es handelte sich um ein 2 × 2 × 2-Design. Textbasierte Fallvignetten haben sich auch in bisher beschriebenen Studien zur sozialen Wahrnehmung und Kognition im Lehr-Lern-Kontext bewährt (u. a. Auwarter & Aruguete, 2008; Glock, 2016; Glock & Krolak-Schwerdt, 2013, 2014; Meltzer & McNulty, 2011; Müller et al., 2017; Zander et al., 2015). Im Folgenden ist die Vignette beispielhaft für die weibliche Deutschlehrkraft am Gymnasium präsentiert:

Stellen Sie sich vor, Sie sind Schüler/in eines städtischen Gymnasiums. Mit dem Start in die achte Klasse bekommen Sie für den Deutschunterricht eine neue Fachlehrerin, Frau Beck. Frau Beck ist gerade auf die Schule gewechselt, nachdem sie ihr Referendariat in einem anderen Gymnasium abschloss und ein paar Jahre dort gearbeitet hat. In der ersten Deutschstunde des Schuljahres sehen Sie sie zum ersten Mal. Vor dem Unterricht ist es wie immer sehr laut, dann klingelt die Glocke. Frau Beck stellt sich am Anfang der Unterrichtsstunde vor und beginnt anschließend mit dem ersten Thema des Schuljahres.

Bitte stellen Sie sich Frau Beck bildlich vor, wie sie den Unterricht durchführt. Nehmen Sie sich dafür etwas Zeit. Beantworten Sie anschließend spontan die folgende Frage. Es gibt keine richtigen oder falschen Antworten.

Anschließend wurden soziodemografische Daten erhoben und am Ende über das konkrete Anliegen der Befragung aufgeklärt sowie sich bei den Proband*innen für die Teilnahme bedankt. Die Daten wurden mittels IBM SPSS Statistics 25 und MPlus 8 ausgewertet.

2.3 Instrumente und Variablen

Als abhängige Variable wurde die Beurteilung der Kompetenz betrachtet und die Beurteilung der Wärme wurde als Kontrollvariable herangezogen (Fragebogen s. Zusatzmaterial).

Kompetenzbeurteilung: Die Einschätzung der Kompetenz wurde mittels der sieben Adjektive der ersten Studie erfasst (kompetent, fähig, effizient, intelligent, konkurrenzfähig, selbstbewusst, eigenständig), wobei nur auf die 4-Item-Lösung (kompetent, effizient, fähig, intelligent) zurückgegriffen wurde. Abweichend zur ersten Studie mit einer vierstufigen Skala sollten die Proband*innen ihre Zustimmung auf einer siebenstufigen Likert-Skala angeben (1 = „stimme gar nicht zu“ bis 7 = „stimme vollkommen zu“), um differenziertere Antworten zu ermöglichen und somit die Varianz der Variablen zu erhöhen. Zusätzlich gab es eine „Keine Angabe“-Option. Die Reliabilität (Cronbachs Alpha) war mit α = .845 zufriedenstellend.

Wärmebeurteilung: Die Einschätzung der Wärme wurde mit den gleichen sieben Adjektiven der ersten Studie (warmherzig, gutmütig, wohlwollend, sympathisch, offen, tolerant, vertrauenswürdig) und mit der gleichen siebenstufigen Likert-Skala (und zusätzlich „Keine Angabe“) wie die Kompetenzbeurteilung erfasst. Die Items wurden zusammen mit denen der Kompetenzbeurteilung in einer gemeinsamen Adjektivliste zufällig variierend präsentiert. Es konnte für die ausgewählten vier Items der Wärmebeurteilung (warmherzig, gutmütig, wohlwollend, sympathisch) eine gute interne Konsistenz mit einem Cronbachs Alpha von α = .892 erzielt werden. Die Wärme wurde auch in dieser Studie im Sinne des stereotype content model als Kontrollvariable herangezogen.

Die konfirmatorische Faktorenanalyse mit robuster Maximum-Likelihood-Schätzung (MLR) ergab im Vergleich zur ersten Studie schlechtere Fitmaße für zwei Faktoren mit je vier Items (χ2/df = 2.982; CFI = .942; TLI = .915; RMSEA = .092; SRMR = .062; Hu & Bentler, 1999; Weiber & Mühlhaus, 2014; Itemschwierigkeiten und Trennschärfen s. Zusatzmaterial). Eine einfaktorielle Lösung mit acht Items ergab keine Verbesserung der Fitmaße (χ2/df = 10.290; CFI = .735; TLI = .629; RMSEA = .191; SRMR = .124). Auch unter Berücksichtigung der ursprünglichen 14 Items in einem Faktor (χ2/df = 6.274; CFI = 717; TLI = .662; RMSEA = .144; SRMR = .133) oder in zwei Faktoren (χ2/df = 2.533; CFI = .917; TLI = .901; RMSEA = .078; SRMR = .083) konnten keine ausreichenden Fitmaße erzielt werden. Aufgrund der relativ kleinen Stichprobengröße, die der Faktorenanalyse zugrunde lag (N < 250; aufgrund von missing data), wurde ein stärkeres Gewicht auf den CFI und den SRMR gelegt (gemäß den Empfehlungen von Hu & Bentler, 1999; vgl. Weiber & Mühlhaus, 2014) und die 2-Faktoren-Lösung mit jeweils vier Items angenommen.

3 Ergebnisse

Die Kennwerte der Variablen sowie die Korrelationen sind in Tabelle 14.1 aufgelistet, die Kennwerte nach Gruppen können der Tabelle 14.2 entnommen werden. Da kaum Normalverteilungen vorlagen (auf Basis von Shapiro-Wilk-Tests) und die Quantil-Quantil-Diagramme optisch auffällig waren, wurde der Schwerpunkt der multivariaten Auswertung auf robuste und nicht-parametrische Berechnungen gelegt.

Tabelle 14.1 Kennwerte und Korrelationen der Variablen (Studie 2)

Die Hypothesen wurden in der bivariaten Betrachtung mit t-Tests überprüft. Es zeigten sich weder Geschlechts-Professions-Assoziation im Unterrichtsfach Deutsch (t(104) = 0.539, p1 = .296; d = 0.105; 1–β = .134) noch im Unterrichtsfach Mathematik (t(122) = 0.456, p1 = .325; d = 0.082; 1–β = .117). Auch bei der Kompetenzbeurteilung männlicher (t(109) = 0.718, p1 = .237; d = 0.137; 1–β = .176) und weiblicher Lehrkräfte in Abhängigkeit von der Schulform (t(109.469) = 0.616, p1 = .270; d = 0.113; 1–β = .151) gab es keine signifikanten Unterschiede. Dies bedeutet, dass sowohl Frauen als auch Männer als Lehrkräfte über die Schulformen hinweg gleich kompetent beschrieben wurden. Außerdem war der Unterschied zwischen der Kompetenzbeurteilung für weibliche und männliche Grundschullehrkräfte nicht signifikant (t(106) = 0.063, p1 = .475; d = 0.012; 1–β = .057). Insgesamt erhielten männliche und weibliche Lehrkräfte auch gleich hohe Kompetenzzuschreibungen (t(106) = 0.063, p = .950; d = 0.008; 1–β = .050). Somit müssen auf Basis der bivariaten Betrachtungen alle aufgestellten Hypothesen abgelehnt werden.

Tabelle 14.2 Mittelwerte, Standardabweichungen und Normalverteilungsüberprüfungen der Skalen getrennt nach Gruppen (Studie 2)

Zur Überprüfung der Hypothesen unter Berücksichtigung der Wärmebeurteilung sollte eine Kovarianzanalyse berechnet werden. Die Voraussetzungen dafür lagen jedoch nicht vor. Zum einen gab es Verletzungen der Normalverteilungsannahme, wogegen varianzanalytische Verfahren allerdings robust sind (Harwell, 2003; vgl. Bortz & Schuster, 2010), außerdem gab es eine interaktive Wirkung einer Kontrollvariablen (Wärmebeurteilung) mit einem Faktor (Schulform) auf die Kompetenzbeurteilung. Letzteres kann zu einer Verzerrung der Ergebnisse führen (Huber et al., 2014). Deswegen wurde zur Hypothesenprüfung eine robuste Regressionsanalyse mit Bootstrap durchgeführt (vgl. Urban & Mayerl, 2018), in die die Variablen Geschlecht der Lehrkraft, Unterrichtsfach, Schulform und deren Interaktionsterme sowie die Wärmebeurteilung eingingen.

Vorweg wurde eine Regressionsanalyse mit Bootstrap zur Überprüfung einer Eigengruppenbevorzugung (Balliet et al., 2014; DiDonato et al., 2011; Robbins & Krueger, 2005) auf Basis der Geschlechtszugehörigkeit durchgeführt. In diese gingen das Geschlecht der beschriebenen Lehrkräfte und das der Proband*innen als Regressoren ein. Dabei ergaben sich weder signifikante Haupteffekte (Geschlecht der Lehrkraft: β = .138, pbt = .649; Geschlecht der Proband*innen: β = −.031, pbt = .058) noch eine signifikante Interaktion (β = .045, pbt = .528; s. Zusatzmaterial). Deswegen wurde das Geschlecht der Proband*innen nicht als Kontrollvariable in der explorativen multivariaten Regressionsanalyse berücksichtigt.

Tabelle 14.3 Ergebnisse der Regressionsanalyse mit der Kompetenzbeurteilung als Regressand (Studie 2)

Die Ergebnisse der multivariaten Regressionsanalyse sind in Tabelle 14.3 dargestellt. Insgesamt konnten 26 % der Varianz der Kompetenzbeurteilung aufgeklärt werden. Dies lag im Haupteffekt der Wärmebeurteilung (β = .510, p < .001) begründet, der in die gleiche Richtung wies wie die Korrelation (rS = .423, p < .001). Alle weiteren Regressoren sowie deren Interaktionen zeigten keinen signifikanten Zusammenhang mit der Kompetenzbeurteilung.

4 Zusammenfassung, Interpretationen und Limitationen

Mithilfe der zweiten Studie sollte eine zur ersten Untersuchung dieser Arbeit (s. Kapitel 13) zusätzliche Überprüfung von Geschlechts-Professions-Assoziationen bei Lehrkräften und somit von Substereotypisierungen vorgenommen werden. Außerdem sollte überprüft werden, ob Frauen im Grundschullehramt positiver resp. kompetenter beurteilt werden als Männer, da vermeintlich kommunale Eigenschaften bedeutsamer erscheinen.

Weder das Geschlecht der Lehrkraft noch das Unterrichtsfach und die Schulform konnten in der durchgeführten Studie mit textbasierten Fallvignetten bedeutsam die Kompetenzbeurteilung vorhersagen. Auch statistische Interaktionen blieben aus. Somit sind alle aufgestellten Hypothesen zu verwerfen. Es zeigten sich keine klassischen Geschlechts-Professions-Stereotype für Lehrkräfte – wie auch in den multivariaten Analysen der ersten Studie. Dies unterstützt die Interpretation der ersten Studie, dass lediglich wenige Unterrichtsfächer (z. B. Physik) mit männlichen oder weiblichen Lehrkräften assoziiert sind.

Außerdem scheint auf Basis der hier erzielten Ergebnissen der Erziehungsaspekt bei der Kompetenzbeurteilung von Lehrkräften keine Rolle zu spielen. Dies kann jedoch daran liegen, dass die Manipulation des Erziehungsaspekts innerhalb der Fallvignetten ungenügend war. Da in allen Fallvignetten eine Fachlehrkraft, auch in der Grundschule, beschrieben wird, kann die Beschreibung der Schulform – also Grundschule und Gymnasium, die unterschiedliche Anteile an Erziehungsaufgaben für Lehrkräfte innehaben – für die Beurteilung der Lehrkräfte irrelevant werden. Des Weiteren ist eine Fachlehrkraft in der Grundschule eher untypisch, was die Imagination der Situation für die Proband*innen erschwert haben bzw. Irritationen ausgelöst haben könnte.

Die Wärmebeurteilung stand in einem besonders hohen Zusammenhang mit der Kompetenzbeurteilung (rS = .423, p < .001) und dies in einem höheren Ausmaß als in Studie 1 (rS = .343, p < .001). Dies stützt die Interpretation, dass sympathisches und fürsorgliches Verhalten für Lehrkräfte einen besonderen Kompetenzbereich darstellt. In Kompetenzmodellen für Lehrkräfte, z. B. im heuristischen Modell professioneller Handlungskompetenz COACTIV (Baumert & Kunter, 2006; Kunter et al., 2011), hat dieser Aspekt hingegen keine große explizite Bedeutsamkeit. Nichtsdestotrotz scheint es in der Lehrkräfteaus- und -weiterbildung lohnenswert zu sein, die Wärmedimension stärker zu berücksichtigen, wie z. B. in Klassenführungstrainings (z. B. Kiel et al., 2013; Marzano et al., 2003; vgl. Haag, 2018).

Die Limitationen gleichen denen der ersten Studie (s. Kapitel 13): Es wurde eine Gelegenheitsstichprobe herangezogen und die Proband*innen waren größtenteils Studierende und/oder aus dem psychosozialen Bereich. Dies begrenzt die Generalisierbarkeit (vgl. u. a. Bortz & Döring, 2016; Bühner, 2010). Außerdem wurden erneut ausschließlich kognitive Schemata von erwachsenen Proband*innen erfasst. Weitergehend waren die Items ausschließlich positiv gepolt.

Basierend auf den Ergebnissen kann insgesamt resümiert werden, dass es keine bedeutsamen Subgruppen von Lehrkräften gibt, die die Kompetenzbeurteilung in einem hohen Ausmaß beeinflussen. Auch bei Zander et al. (2015) ergibt sich lediglich ein kleiner Effekt für das Geschlecht der Lehrkraft auf die Beurteilung der Physiklehrfähigkeit. Nichtsdestotrotz ergeben sich Streuungen in der Beurteilung der Kompetenz. Auf welchen kognitiven Schemata oder situativen Einflüssen diese Streuungen beruhen, kann hier nicht abschließend geklärt werden und bedarf weiterer Forschung.