Kompetenzerwartungen von Lehrpersonen an Lernende können auf einer Reihe von Informationen beruhen, darunter auf Berichten von Kolleg*innen oder Erzählungen von Erziehungsberechtigten bzw. Angehörigen. Ohne solche Informationen spielen insbesondere Stereotype eine Rolle: Die stereotypen Bilder von Angehörigen bestimmter sozialer Gruppen gehen mit Eigenschaftszuschreibungen und somit auch mit Erwartungshaltungen einher (u. a. Stangor, 2009; s. Kapitel 5). In einer Meta-Analyse von Südkamp et al. (2012) konnte ein relativ hoher Zusammenhang zwischen der Lehrendeneinschätzung zur Leistung von Lernenden und der tatsächlichen akademischen Leistung der Lernenden ausgemacht werden (r = .63). Wenngleich Erwartungen häufig zutreffend sind, können sie dennoch stereotypbasiert zu selbsterhaltenden Prophezeiungen führen (vgl. Ludwig, 2018), sodass sich Lernende (im Sinne eines Andorra-Effekts) an die Lehrendenerwartungen anpassen (vgl. Lies et al., 2015; s. Kapitel 3 und Kapitel 4). Erste ggf. zutreffende Lehrendenerwartungen basierend auf Stereotypen (z. B. „Mädchen sind schlecht in Physik“) können also zuerst selbsterfüllend sein, dann aber selbsterhaltend werden, da sich die Lernenden innerhalb der Interaktion dem Stereotyp immer weiter annähern (z. B. „Ich bin ein Mädchen, ich kann kein Physik“), obwohl sie potenziell in der Lage wären, das Stereotyp zu widerlegen. Nach einem solchen Prozess kann die Lehrendeneinschätzung einen hohen Zusammenhang mit der akademischen Leistung haben, nicht aber mit dem akademischen Potenzial.

Bei der sozialen Wahrnehmung – auch in akademischen Settings – spielen in erster Linie die automatischen Kategorien (Fiske & Neuberg, 1990; Krings & Kluge, 2020) eine Rolle sowie die physische Attraktivität. Zu den automatischen Kategorien gehören Geschlecht, Ethnie und Alter, da sie sehr schnell (und automatisiert) über das optische Erscheinungsbild vermeintlich relativ zutreffende Informationen liefern. Darüber hinaus beeinflusst auch der sozioökonomische Status der Lernenden die Lehrendenerwartungen (vgl. Brophy & Good, 1976). Im Folgenden wird ein Überblick über empirische Befunde zu stereotypbasierten Lehrendenerwartungen dargestellt.

1 Geschlecht

Es sei hier darauf hingewiesen, dass es mehr als zwei Geschlechter gibt (vgl. Hackbart & Tischoff, 2020; Timmermanns & Böhm, 2020). Allerdings werden in der Forschung zu Stereotypen kaum Geschlechtlichkeiten über ein binäres Modell hinaus berücksichtigt (vgl. Hackbart, 2020).

In Alltagsdiskursen findet sich häufig die Auffassung, dass Mädchen und Frauen bessere sprachliche Fähigkeiten haben als Jungen und Männer. Letztere wiederum sind vermeintlich kompetenter im mathematischen und technischen Bereich (u. a. Nosek et al., 2009; Su et al., 2009). In Meta-Analysen konnte im Widerspruch zu solchen Stereotypen jedoch kein bedeutsamer Leistungsunterschied zwischen männlichen und weiblichen Lernenden in Mathematik-Leistungstests (d = 0.05; Lindberg et al., 2010) oder in verbalen Fähigkeiten (d = 0.11, dabei d = 0.20 für die generelle verbale Fähigkeit, Hyde & Linn, 1988; d = 0.19 für die Leseleistung, Lietz, 2006) ausgemacht werden. Dennoch wurden solche Stereotype von Lehrpersonen und angehenden Lehrpersonen teilweise berichtet (u. a. Li, 1999; Lorenz et al., 2016; Tiedemann, 1995, 2002). Auch bei Gentrup et al. (2018) hatten Grundschullehrkräfte signifikant höhere Erwartungen an Mädchen bezüglich ihrer Sprachfähigkeit und an Jungen hinsichtlich ihrer Mathematikleistung. Erwähnenswert ist zudem, dass die Lehrkräfte mehr Motivation und eine höhere Arbeitsmoral von den Mädchen im Vergleich zu den Jungen erwarteten.

Insgesamt zeichnet sich domänenunabhängig eine positivere Bewertung von weiblichen Lernenden im Vergleich zu männlichen ab und es wird von „männlichen Bildungsverlierern“ (u. a. Diefenbach, 2010) gesprochen. Dies erscheint vor dem Hintergrund, dass die kommunalen Eigenschaften (z. B. kommunikativ, kooperativ, emotional), die eher Mädchen und Frauen zugeschrieben werden (u. a. Bosak et al., 2008; Diehl et al., 2004), dem Wunschbild einer lernenden Person (Ntemiris, 2011; Rosemann, 1978; Voss & Eicher, 2015; vgl. Kapitel 8) entsprechen, nicht verwunderlich. So schrieben Lehrkräfte in einer Studie von Heyder und Kessels (2015) insbesondere sich „maskulin“ verhaltenden männlichen Schülern ein geringeres akademisches Engagement zu. Voyer und Voyer (2014) zeigten meta-analytisch, dass Frauen und Mädchen bessere Noten erzielen als ihre männlichen Kommilitonen bzw. Klassenkameraden (d = 0.23), wobei das Ausmaß über verschiedene Fächer variiert (d = 0.37 für Sprachen bzw. Sprachwissenschaften, d = 0.07 für Mathematik, d = 0.15 für Naturwissenschaften (sciences) und d = 0.17 für Sozialwissenschaften (social sciences)). Für den schulischen Kontext in Deutschland resümiert Budde (2008, S. 16): „In allen Fächern erhalten Jungen auch bei gleichen Kompetenzen schlechtere Noten.“ Wenngleich viele Studien keine bedeutsamen Unterschiede zwischen den Kompetenzerwartungen an Frauen bzw. Mädchen und Männern bzw. Jungen fanden (u. a. Auwarter & Aruguete, 2008), zeigten die meisten Studien mit Unterschieden leicht höhere Lehrendenkompetenzerwartungen an weibliche Lernende (d = 0.20 in der Meta-Analyse von Dusek & Joseph, 1983).

2 Ethnie und Migrationshintergrund

Ethnie und Migrationshintergrund werden in dieser Arbeit synonym für nicht-autochthone Bevölkerungsgruppen verwendet.

In Deutschland leben etwa 20.1 Millionen Menschen mit Migrationshintergrund, das entspricht 24 % der Gesamtbevölkerung (im Kalenderjahr 2019; Statistisches Bundesamt, 2020a). Von ihnen hatten die meisten einen türkischen Migrationshintergrund oder eine türkische Migrationsbiografie (2.8 Millionen, 14 %; Statistisches Bundesamt, 2020a). Menschen mit türkischem Migrationshintergrund werden in Deutschland als prototypische Ausländer*innen angesehen (vgl. Cohrs & Asbrock, 2009) und ihnen werden weniger positive als negative Eigenschaften zugeschrieben (Froehlich et al., 2016; Kahraman & Knoblich, 2000). Auf den Dimensionen des stereotype content model werden Türk*innen kalt und inkompetent bis mittelhoch kompetent bewertet (Asbrock, 2010; Cuddy et al., 2007).

Glock und Krolak-Schwerdt (2013) ließen Lehramtsstudierende vermeintliche Kommiliton*innen auf der Basis textbasierter Fallvignetten bewerten, in denen die ethnische Zugehörigkeit mithilfe des Namens (Michael als deutscher, autochthoner Student oder Aslan als türkischstämmiger Student) und eine Kompetenzerwartung („Bester in der Klasse“ oder „unterdurchschnittlicher Student“) systematisch variierten. Insgesamt zeigte sich, dass der autochthone Student über alle Bedingungen hinweg als leistungsstärker bewertet wurde als der türkischstämmige Student. Allerdings ergaben sich bedeutsame Unterschiede nur bei der Golem-Bedingung („unterdurchschnittlicher Student“) für die verbale Leistungsfähigkeit. Für die mathematische Leistungsfähigkeit und in der Galatea-Bedingung konnten keine signifikanten Unterschiede in den Beurteilungen ausgemacht werden. Die Ergebnisse konnte Glock (2016) an einer Stichprobe mit berufstätigen Lehrkräften replizieren. Bei einem Vergleich von türkischstämmigen Kindern mit Kindern ohne Information zur Ethnie beurteilten Lehrkräfte und Lehramtsanwärter*innen die Leistung beschriebener Kinder ähnlich (Glock & Krolak-Schwerdt, 2014). Der eigene ethnische Background der Lehrperson scheint die Zusammenhänge jedoch zu moderieren. So zeigten Lehramtsanwärter*innen einer ethnischen Minderheit positivere Einstellungen gegenüber Schüler*innen mit Migrationsbiografie als Lehramtsanwärter*innen der ethnischen Majorität (Glock & Kleen, 2019).

Lorenz (2019) resümiert für Deutschland, dass Grundschullehrkräfte verzerrte Kompetenzerwartungen auf Basis des Migrationshintergrundes haben. So wurden türkischstämmige Schüler*innen sowohl im Fach Deutsch als auch in Mathematik als weniger kompetent angesehen als deutsche. Demgegenüber gab es keine Verzerrung bei Kindern mit osteuropäischem Migrationshintergrund im Fach Deutsch und eine Verzerrung der Kompetenzerwartungen zugunsten von Kindern mit osteuropäischem Migrationshintergrund im Fach Mathematik (vgl. Lorenz et al., 2016).

In anderen kulturellen Kontexten spielen aufgrund von Einwanderung andere Ethnien eine Rolle. So wird beispielsweise in Neuseeland zu Beginn eines Schuljahres ostasiatischstämmigen Kindern von Lehrkräften die höchste mathematische Kompetenz zugeschrieben und den Kindern der Mãori die geringste (Peterson et al., 2016). In der US-amerikanischen Meta-Analyse von Dusek und Joseph (1983) zeigte sich, dass „dunkelhäutigen“ Menschen (persons of color; Afroamerikaner*innen und Mexikaner*innen) eine geringere Kompetenz zugeschrieben wird als „hellhäutigen“. Dieser Effekt ist mit d = 0.11 jedoch sehr klein. In einer späteren Meta-Analyse von Tenenbaum und Ruck (2007) ergab sich das Bild, dass im Vergleich zu angloamerikanischen Lernenden asiatisch-amerikanische (Asien Americans) von Lehrpersonen als besonders kompetent (d = 0.17) und lateinamerikanische (d = 0.46) sowie afroamerikanische Lernende (d = 0.25) als weniger kompetent betrachtet werden.

3 Sozioökonomischer Status und Namen

Häufig sind Menschen, die einen Migrationshintergrund haben bzw. einer von der Mehrheit abweichenden Ethnie angehören, auch Mitglieder sozioökonomisch schwacher Gruppen. So ist der Anteil von Personen ohne Schulabschluss bei Menschen mit Migrationshintergrund (10 %) höher als bei autochthonen (1 %; Statistisches Bundesamt, 2020a). Außerdem sind prozentual mehr Menschen mit Migrationshintergrund als autochthone erwerbslos (6 % zu 2 %) und haben im Durchschnitt ein geringeres Nettoeinkommen (1837 € zu 2225 €; Statistisches Bundesamt, 2020a). Aber auch Menschen ohne Migrationshintergrund können, wie die genannten Zahlen zeigen, einen geringen sozioökonomischen Status haben, der sich auf die interpersonalen Erwartungen auswirken kann.

Bei Auwarter und Aruguete (2008) zeigte sich, dass Lehrkräfte auf Basis von textbasierten Fallvignetten von Schüler*innen geringere Leistung in der Zukunft erwarten, wenn die Schüler*innen einen geringen sozioökonomischen Status haben. Glock und Krolak-Schwerdt (2014) konnten hingegen mithilfe von zwei Fallvignetten, die beide Kinder mit Migrationshintergrund beschrieben, keinen Einfluss des sozioökonomischen Status auf die Leistungsbewertung ausmachen. Bei Lehrkräften, die Lorenz et al. (2016) untersuchten, konnte ein Einfluss des sozioökonomischen Status auf die Lehrendenkompetenzerwartungen gefunden werden. Bei der Meta-Analyse von Dusek und Joseph (1983) werden mit einer Effektstärke von d = 0.47 Lernende aus dem Mittelstand für kompetenter gehalten als Lernende aus „unteren Schichten“.

Ist der sozioökonomische Status nicht bekannt, können auch Namen einen Hinweis liefern und Erwartungen formen (vgl. Dusek & Joseph, 1983). Bei Tobisch und Dresel (2017) erwarteten Lehrkräfte auf Basis des Namens von einem Murat (Migrationshintergrund und geringer sozioökonomischer Status) eine an den bisherigen Leistungsergebnissen angepasste Note, wohingegen von einem Justin (kein Migrationshintergrund und geringer sozioökonomischer Status) und von einem Julius (kein Migrationshintergrund und hoher sozioökonomischer Status) bessere Noten als bisher. Der sozioökonomische Status, der mit den Namen verknüpft wurde, hing signifikant mit der Einschätzung der generellen Fähigkeit und der der Anstrengung sowie mit Erwartungen an die Leistungen in Deutsch und in Sozialwissenschaften (social sciences) zusammen. Eine andere Umfrage zur Bewertung von Vornamen durch Lehrkräfte kam zu folgenden Ergebnissen (Kaiser, 2009, Absatz 1):

Als eher freundlicher, leistungsstärker und verhaltensunauffällig stellen sich Kinder mit Vornamen wie Charlotte, Sophie, Marie, Hannah, Alexander, Maximilian, Simon, Lukas oder Jakob im Bewusstsein von LehrerInnen dar, während Namen wie Chantal, Mandy, Angelina, Kevin, Justin oder Maurice eher mit Leistungsschwäche und Verhaltensauffälligkeit assoziiert werden. Besonders „Kevin“ hat sich als stereotyper Vorname für einen „verhaltensauffälligen“ Schüler herausgestellt. In einem Fragebogen fand sich der Kommentar „Kevin ist kein Name, sondern eine Diagnose!“.

4 Physische Attraktivität

Physische Attraktivität bzw. Schönheit ist ein schwer zu definierendes Konstrukt und wird häufig als Mittel subjektiver Bewertungen operationalisiert (Langlois et al., 2000).

Ein wichtiges Ergebnis [bisheriger Attraktivitätsforschung] ist beispielsweise die Erkenntnis, dass – anders als der Volksmund behauptet – Schönheit eben nicht (nur) im Auge des Betrachters liegt, sondern dass es bei allen „Geschmacksunterschieden“ dennoch eine gemeinsame Basis für menschliche Attraktivität gibt, sowohl innerhalb einer Kultur als auch mit Abstrichen zwischen verschiedenen Kulturen. (Gründl, 2011, S. 1)

So werden beispielsweise symmetrische Gesichter mit reiner Haut als besonders attraktiv wahrgenommen.

Attraktiveren Menschen werden mehr positive Eigenschaften zugeschrieben als weniger attraktiven Menschen. Dies ist als „beauty is good“ stereotype (bzw. „what is beautiful is good“ stereotype; Dion et al., 1972) bekannt. Meta-analytisch zeigten Eagly et al. (1991), dass Attraktivität u. a. einen Effekt auf die Einschätzung der intellektuellen Kompetenz (d = 0.46 entspricht r = .22) hat. In einer späteren Meta-Analyse von Jackson et al. (1995) zeigte sich, dass der Zusammenhang von Attraktivität und der Wahrnehmung der intellektuellen Kompetenz bei d = 0.65 (r = .31) liegt. Dabei ist der Effekt am stärksten bei der Beurteilung von erwachsenen Männern (d = 0.93 entspricht r = .42), am zweitstärksten für erwachsene Frauen (d = 0.70 entspricht r = .33) und am schwächsten für Kinder (d = 0.49 entspricht r = .24). Auch bei Langlois et al. (2000) zeigten sich meta-analytisch Zusammenhänge zwischen Attraktivität und angenommener akademischer Kompetenz bei Kindern (r = .48) und der angenommenen beruflichen Kompetenz bei Erwachsenen (r = .41).

Das „beauty is good“ stereotype zeigte sich auch in pädagogischen Kontexten: In einer viel beachteten Studie von Landy und Sigall (1974) wurde männlichen Studierenden entweder ein gutes oder ein schlechtes Essay vorgelegt. Zusätzlich wurde den Proband*innen ein Foto der vermeintlichen (weiblichen) Autorin vorgelegt, das entweder eine attraktive Person oder eine unattraktive zeigte. Eine weitere Gruppe erhielt keine Informationen über die Attraktivität der Verfasserin. Es zeigte sich, dass die guten Essays tatsächlich besser bewertet wurden. Zugleich zeigte sich aber auch, dass eine attraktive Verfasserin bessere Bewertungen erhielt als eine unattraktive Verfasserin oder eine Verfasserin mit unbekanntem Aussehen.

In einem Experiment von Shapiro et al. (2007) wurde das vermeintliche Gewicht als ein Merkmal von Attraktivität eines Trainees mithilfe von Bildern manipuliert, bevor ein Training via Gegensprechanlage durchgeführt wurde. Dabei zeigte sich, dass vermeintlich übergewichtigen Personen von den Lehrpersonen mit weniger hohen Erwartungen bezüglich des Trainingserfolgs und der Arbeitsmoral begegnet wurde. Außerdem beurteilten die Lehrpersonen das Training negativer und zudem weibliche Lehrpersonen die lernende Person negativer, wenn sie von einer übergewichtigen Person ausgingen. Müller et al. (2017) untersuchten in einem ähnlichen Design wie Glock und Krolak-Schwerdt (2013) bzw. Glock (2016) zu ethnischen Stereotypen die Bewertung übergewichtiger Studierender durch Lehramtsanwärter*innen. Dabei zeigte sich entgegen den Hypothesen der Autor*innen, dass ein beschriebener übergewichtiger Student in den Leistungs- und Kompetenzdomänen (Mathematik, niederländische Sprachfähigkeit, Intelligenz) konstant besser beurteilt wurde als ein beschriebener normalgewichtiger Student. Müller et al. (2017) erklären diesen Befund damit, dass entweder die Lehramtsanwärter*innen keine negativen Stereotype gegenüber übergewichtigen Menschen aufgebaut hatten oder dass sie bewusst stereotypes Denken kontrollierten. Insgesamt werden trotz einzelner, widersprechender Befunde jedoch meta-analytisch attraktive Lernende von Lehrpersonen akademisch fitter (d = 0.30 bei Dusek & Joseph, 1983; d = 0.36 bei Ritts et al., 1992) und sozial kompetenter (d = 0.19 bei Dusek & Joseph, 1983; d = 0.48 bei Ritts et al., 1992) bewertet als unattraktive Lernende.

5 Resümee zu stereotypbasierten Lehrendenerwartungen

Die Darstellung der empirischen Ergebnisse zu stereotypbasierten Lehrendenerwartungen konnte an dieser Stelle nur an exemplarischen Studien ausschnitthaft und reduziert dargestellt werden. So werden viele Zusammenhänge über verschiedene moderierende und mediierende Mechanismen erklärt. Beispielsweise zeigte sich in der Längsschnittstudie von Sorhagen (2013), dass im sprachlichen Bereich die unzutreffende Lehrendenkompetenzerwartung an Lernende in der ersten Klassenstufe die Leistungen in standardisierten Tests im Alter von 15 Jahren signifikant vorhersagen konnte. Allerdings wurde dieser Zusammenhang vom sozioökonomischen Status (Einkommen der Familie) moderiert, d. h., dass der Zusammenhang bei Kindern aus sozioökonomisch schwachen Familien größer war. Bei Kindern aus sozioökonomisch starken Familien war der Zusammenhang sehr klein oder kehrte sich bei einigen Tests sogar um, d. h., dass Kinder, die in der ersten Klasse von ihren Lehrkräften unterschätzt wurden, im Alter von 15 Jahren besser abschnitten als Kinder, die überschätzt wurden. Für den mathematischen Bereich zeigten sich hingegen keine Langzeiteffekte.

Resümierend kann festgehalten werden, dass Leistungserwartungen auf Basis von Stereotypen existieren, die aber nicht bei jeder Lehrperson in jeder Situation zum Tragen kommen. In der Regel ist der Zusammenhang zwischen Gruppenzugehörigkeit der Lernenden und Leistungserwartungen der Lehrpersonen an die Lernenden eher klein (Geschlecht, ethnische Minoritätszugehörigkeit) bis moderat (Attraktivität, sozioökonomischer Status, ethnische Minoritätszugehörigkeit).