Der bereits erwähnte und kurz beschriebene Pygmalion-Effekt und damit die selbsterfüllenden Prophezeiungen im Lehr-Lern-Kontext wurden durch das Oak School-Experiment von Rosenthal und Jacobson (1966, 1971) bekannt und berühmt. Die sogenannte Oak School stand in einer größeren Stadt und die meisten Schüler*innen stammten aus der „unteren Klasse“, wobei niemand aus besonders prekären Verhältnissen stammte. Im Mai 1964 wurden im Rahmen einer Studie der „Harvard National Science Foundation“ mehr als 500 Kinder in Kindergartenklassen bis zur Klassenstufe 5 mit dem test of general ability (TOGA; bestehend aus einem Reasoning- und einem verbalen Subtest) überprüft (Vortest). Am Ende des Sommers 1964, vor Schuljahresbeginn, erhielten die Lehrkräfte eine Rückmeldung, welche Kinder ihrer Klasse auf Basis des Vortests intellectual bloomers (geistig Schnellentwickelnde bzw. Aufblühende) seien. Es wurden insgesamt ein Fünftel der Kinder als intellectual bloomers bezeichnet; die Auswahl beruhte aber nicht auf den Testergebnissen, sondern auf einer zufälligen Ziehung. „Der Unterschied zwischen den Kindern, die als intellektuell besonders entwicklungsfähig gekennzeichnet worden waren, und den Kontrollkindern, bei denen diese Kennzeichnung nicht stattgefunden hatte, bestand somit nur in den Köpfen der Lehrer“ (Rosenthal & Jacobson, 1971, S. 93). Ein vorläufiger Wiederholungstest wurde im Januar 1965, der grundlegende Nachtest im Mai 1965 mit weniger als 400 Kindern und ein weiterer Wiederholungstest im Mai 1966 mit weniger als 300 Kindern (u. a. weil Kinder die Schule wechselten) ausgerichtet. Alle Tests wurden von Lehrkräften durchgeführt und von Forschungsassistent*innen, die blind gegenüber den Versuchsbedingungen waren, ausgewertet. Während nach einem Semester keine signifikanten Unterschiede zwischen Experimental- und Kontrollgruppe zu verzeichnen waren, gab es zum grundlegenden Nachtest, also nach einem Schuljahr, einen signifikanten Effekt (s. Abbildung 6.1): Schüler*innen der Experimentalgruppe erzielten über alle Klassenstufen hinweg insgesamt vier Punkte mehr beim TOGA als Schüler*innen der Kontrollgruppe. Werden die einzelnen Klassenstufen getrennt betrachtet, ergaben sich nur für die Klassenstufen 1 (ΔM = 15, p < .05) und 2 (ΔM = 10, p < .05) signifikante Unterschiede. Erstaunlich ist, dass nach zwei Jahren (ein Jahr nach dem grundlegenden Nachtest) nur für die Klassenstufe 5 ein signifikanter Vorteil für die Experimentalgruppe (ΔM = 11, p < .05) zu beobachten war.

Abbildung 6.1
figure 1

Erwartungsvorteil für intellectual bloomers beim Oak School-Experiment im Gesamt-IQ nach Zeit (Rosenthal & Jacobson, 1971)

Angelehnt an die griechische Mythologie (s. Kapitel 4), bezeichneten Rosenthal und Jacobson (1971) dieses Phänomen als Pygmalion-Effekt, da Pygmalion seine Erwartungen und Vorstellungen in die Statue hineinmeißelte – wie die Erwartungen der Lehrkräfte die Schüler*innen „formten“. Rosenthal und Jacobson (1971) erklärten diesen Erwartungseffekt wie folgt: „Vielleicht behandelten die Lehrer ihre Schüler auch freundlicher und liebevoller und zeigten ein größeres Interesse für sie, wenn sie positivere Erwartungen über deren intellektuelle Entwicklung hatten“ (S. 199). Brophy und Good (1976; vgl. Tauber, 1997) beschreiben den Pygmalion-Effekt in verschiedenen Phasen: Die Lehrperson entwickelt unterschiedliche (Kompetenz-)Erwartungen an die Lernenden und behandelt sie in Abhängigkeit der Erwartungsausprägung unterschiedlich. Das Verhalten der Lehrperson transportiert somit die Erwartung. Dadurch verändern sich das Selbstkonzept und die Motivation der Lernenden sowie die Interaktion mit der Lehrperson, was die Erwartungen der Lehrperson verstärkt und – je nach Erwartungsausprägung – zu geringeren oder höheren Leistungen führt. Sind die Erwartungen der Lehrpersonen jedoch flexibel, wird sich mit der Zeit eine realistische, zutreffende Erwartung ausbilden.

Wie sich das Verhalten der Lehrpersonen auf Basis der Erwartungen genau verändert, beschreibt Rosenthal in einer 4-Faktoren-Theorie (u. a. Harris & Rosenthal, 1985; Rosenthal, 1994). Demnach werden Erwartungen über die Atmosphäre (climate), das Feedback, den Input und die Output-Möglichkeiten mediiert. Lehrpersonen schaffen für vermeintlich kompetente Lernende (wie im Fall der intellectual bloomers) ein wärmeres sozioemotionales Klima und sie geben schneller, kontingenter und differenzierter Feedback auf Antworten (vermeintlich) kompetenter Lernender. Weitergehend geben Lehrpersonen Lernenden, an die sie hohe Kompetenzerwartungen haben, mehr Input, d. h., diese Lernenden erhalten mehr Material und schwierigere Aufgaben, und mehr Output-Möglichkeiten, also mehr Möglichkeiten, sich zu äußern und sich in den Unterricht zu integrieren. Die Mediation über diese vier Faktoren konnte auch meta-analytisch untermauert werden (Harris & Rosenthal, 1985). Auch in einer jüngeren Untersuchung ergab sich bei Rubie-Davis (2007), dass Lehrkräfte mit hohen Kompetenzerwartungen an die Leseleistung der unterrichteten Klasse u. a. mehr Feedback gaben, mehr offene Fragen stellten, häufiger transparente Aufgabenstellungen gaben (procedural statements) und häufiger positives Verhaltensmanagement (im Sinne positiver Verstärkung) zeigten.

Die Ergebnisse von Rosenthal und Jacobson (1966, 1971) sind schon früh kritisiert worden (z. B. Elashoff & Snow, 1972; vgl. u. a. Jussim & Harber, 2005; Lorenz, 2019; Ludwig, 2018). Dass die Intelligenzentwicklung ungewöhnlich hoch und die Intelligenzmessung unreliabel sowie nicht objektiv war (z. B. haben teilweise die Lehrkräfte selbst die ersten Tests durchgeführt), stand allen Kritiken voran. Weitergehend zeigten sich die Unterschiede zwischen Experimental- und Kontrollgruppe nur in den unteren Jahrgängen (Klasse 1 und 2) und nicht mehr in den höheren (Klasse 3 bis 6), sodass insgesamt nur ein schwacher Effekt zu beobachten ist (d = 0.28, eigene Berechnung auf Basis der berichteten Mittelwerte, Standardabweichungen und Stichprobengrößen bei Rosenthal und Jacobson (1966, 1971); Raudenbush (1984) berichtet eine Gesamteffektstärke von d = 0.21). Außerdem hätten die Lehrkräfte durch die Cover-Story, es ginge um die Identifikation von Hochbegabten, ein besonderes Verpflichtungs- und Verantwortungsgefühl gegenüber den vermeintlichen intellectual bloomers spüren können. Auch konnte sich ein Großteil der Lehrkräfte in anschließenden Interviews kaum an die vermeintlich hochbegabten Kinder erinnern. All diese Überlegungen führen zu der Frage, wie groß der Einfluss der Kompetenzerwartungen von Lehrpersonen ist.

Hattie (2015) kam unter Berücksichtigung von acht Meta-Analysen, in denen insgesamt 784 Effekte berücksichtigt wurden, auf eine Effektstärke von d = 0.43 („erwünschte Effekte“) von Lehrendenkompetenzerwartungen für den Unterricht. Dies entspricht einem kleinen bis mittleren Effekt (Cohen, 1988). Bei einer genaueren Betrachtung der eingegangenen Meta-Analysen stellt sich heraus, dass diese selten den Effekt von Lehrendenkompetenzerwartungen auf Lernende fokussieren (wie beim Pygmalion-Effekt), sondern auch die Ausbildung bzw. Quellen von (Kompetenz-)Erwartungen betrachten. Auch gingen Kompetenzerwartungen über das Lernen bei Tieren in den von Hattie (2015) berichteten Effekt ein. Es ist also nicht eindeutig, was genau Hattie (2015) unter „Lehrererwartungen“ fasst. Weitergehend ist stellenweise intransparent, wie Hattie (2015) die mittleren Effektstärkemaße bestimmte und wie die berichteten Angaben zustande kamen. So stimmt beispielsweise die Anzahl der eingegangenen Studien für die Meta-Analyse von Smith (1980) mit 47 nicht mit der Angabe von 46 bei Hattie (2015) überein. Außerdem ermittelte Raudenbush (1984) eine mittlere Effektstärke von d = 0.11, die Hattie (2015) mit d = 0.08 angibt.

Smith (1980) berichtet in einer Meta-Analyse einen Einfluss der Lehrendenkompetenzerwartung auf die Lernendenleistung mit einer Effektstärke von Glass’ Δ = 0.38Footnote 1, Footnote 2 und auf den IQ mit einer Effektstärke von Glass’ Δ = 0.16. Raudenbush (1984) bestimmte eine ähnliche, mittlere Effektstärke von d = 0.11 für Lehrendenkompetenzerwartungen auf den IQ von Kindern. Einen Wert von d = 0.54 ermittelten Rosenthal und Rubin (1978) für die Kategorie Lernen und Fähigkeiten (darunter IQ-Testergebnisse und verbale Fähigkeiten) sowie einen Wert von d = 0.88 für alltägliche Situationen wie Symbollernen und athletische Leistung. Insgesamt machten Rosenthal und Rubin (1978) eine Effektstärke von d = 0.70 von Kompetenzerwartungen auf Leistungsergebnisse aus (über 345 Experimente, darunter auch Studien zum Lernen bei Tieren). Später bestimmte Rosenthal (1991, nach Rosenthal, 1994) meta-analytisch über 464 Studien eine Effektstärke von d = 0.63.

Jussim und Harber (2005) stellen in einem Review heraus, dass es unklar ist, ob durch Erwartungseffekte der IQ beeinflusst werden kann. Insgesamt wird jedoch an anderen Stellen resümiert, dass die Effekte für akademische Leistung i. d. R. größer ausfallen als die für die allgemeine intellektuelle Fähigkeit (Smith, 1980; vgl. u. a. Lorenz, 2019, Ludwig, 2018). Trotz Kritik an der Originalstudie von Rosenthal und Jacobson (1966, 1971) halten Jussim und Harber (2005) fest, dass Erwartungseffekte in Lehr-Lern-Kontexten auftreten und der Pygmalion-Effekt besonders bei beginnenden Interaktionen sowie bei Interaktionen mit Lernenden aus stigmatisierten Gruppen bedeutsam ist.

Der Pygmalion-Effekt ist ein fremdbezogener Erwartungseffekt, aber im Prozess können auch selbstbezogene Erwartungen und Erwartungs-Erwartungen bedeutsam sein (s. Kapitel 4). So werden durch die Wahrnehmung des Verhaltens und die Äußerungen der Lehrpersonen durch die Lernenden das akademische Selbstbild der Lernenden beeinflusst (vgl. Brophy & Good, 1976) und weitergehend selbstbezogene Erwartungen induziert. Darüber hinaus (oder alternativ) können die Lernenden auch Erwartungs-Erwartungen aufbauen, z. B. bei geringen Lehrendenkompetenzerwartungen („Egal, was ich mache und wie ich mich anstrenge, die Lehrperson nimmt meine Anstrengungen nicht wahr, also lohnt sich die Mühe nicht“). In der Lehr-Lern-Interaktion können diese Prozesse zeitversetzt, aber auch parallel verlaufen. Das bedeutet, dass Lehrendenkompetenzerwartungen in die Interaktion hineingetragen werden (z. B. durch vorherige Informationen über Lernende oder Stereotype) und ursächlich für Interaktionsmuster (fremdbezogener Erwartungseffekt) sein können, aber sie können auch Resultat von selbstbezogenen Erwartungen und/oder Erwartungs-Erwartungen aufseiten der Lernenden sein.