Zusammenfassung
Die vergleichenden Schulleistungsstudien der 2000er Jahre haben gezeigt, dass ein enger Zusammenhang zwischen Sprachlernen und Fachlernen besteht. Seitdem erfahren sprachsensible Unterrichtsansätze in Bildungspolitik und -praxis zunehmend Aufmerksamkeit, mit dem Ziel, schulische Leistungen besser zu fördern. Eine umfassende empirische Bewertung der Wirkung solcher Ansätze stand jedoch bislang noch aus. Der Beitrag berichtet erstmalig die Forschungssynthese eines großangelegten systematischen Reviews, das untersucht hat, ob sprachsensible Unterrichtsansätze im Primar- und Sekundarbereich nachweislich wirkungsvoller sind, als regulärer Fachunterricht. Aus 3016 Dokumenten wurden 55 internationale Wirkungsstudien zu sprachsensiblen Ansätzen identifiziert. Nach der Qualitätsbewertung der Befunde flossen 53 Studien in die Forschungssynthese ohne Metaanalyse ein. Im Ergebnis liegen Wirkbefunde zu 30 sprachsensiblen Ansätzen vor. Translanguaging, Reciprocal Teaching (RT), Collaborative Strategic Reading (CSR), Scaffolding nach Gibbons und das Sheltered Instruction Observation Protocol (SIOP) sind mehrfach überprüft, zu 25 weiteren Ansätzen wurde nur jeweils eine Belegstudie ermittelt. Die meisten Untersuchungen (n = 38) zeigen in Teilbereichen des Lernens bessere, mindestens aber vergleichbare Effekte. Die Forschungssynthese liefert ein umfassendes Bild des internationalen Forschungsstandes zur Wirkung von sprachsensiblem Unterricht im Primar- und Sekundarbereich und zeigt die unterschiedliche Qualität der empirischen Evidenz zu den jeweiligen Unterrichtsansätzen.
Abstract
The comparative school performance studies of the 2000s have shown the strong connection between language learning and subject learning. Since then, teaching models that integrate language and content objectives have received much acclaim in educational politics and practice, to better promote school performances. However, a comprehensive empirical evaluation of the effectiveness of such approaches has not yet been carried out. The paper presents the research synthesis of a large-scale systematic review on the effectiveness of such models in classrooms at primary and secondary school level in comparison to regular content teaching. Out of 3016 documents, the search identified 55 international intervention studies. After quality assessment, 53 studies were included in a research synthesis without meta-analysis. In the result, the review comprises findings on 30 language and content learning approaches. Within the sample, Sheltered Instruction Observation Protocol (SIOP), Reciprocal Teaching (RT), Collaborative Strategic Reading (CSR), Scaffolding according to Gibbons, and translanguaging have been tested in several studies; for 25 other approaches, only one study was identified in the sample. Most studies (n = 38) show better, or at least comparable effects in some areas of learning. The synthesis provides a comprehensive picture of the international state of research on the effectiveness of content and language learning in primary and secondary education and give insights into the quality of empirical evidence for the different teaching models.
Avoid common mistakes on your manuscript.
1 Einleitung
Sekundäranalysen nationaler (z. B. Mücke 2007; Paetsch et al. 2014) sowie international vergleichender Schulleistungsdaten (z. B. Reiss et al. 2019) haben seit den 2000er Jahren gezeigt, dass sprachliche Fähigkeiten in der Unterrichtssprache hochgradig mit den Leistungen in anderen Fächern korrelieren (vgl. auch Kempert et al. 2016). Für das deutsche Bildungssystem, das im ersten PISA-Vergleich 2000 weit hinter den Erwartungen zurückblieb, forderte die Kultusministerkonferenz (KMK 2001, o. S.) eine „Verbesserung der Sprachkompetenz bereits im vorschulischen Bereich“. Als Folge wurden Bildungsstandards für das Fach Deutsch eingeführt, Bund und Länder starteten zahlreiche Initiativen, z. B. das umfangreiche Programm „Förderung von Kindern und Jugendlichen mit Migrationshintergrund – FörMiG“ (Gogolin et al. 2011), aus dem die Idee der durchgängigen Sprachbildung hervorgegangen ist und seitdem Eingang in die Curricula gefunden hat sowie auch im Programm „Bildung durch Sprache und Schrift – BiSS“ (Schneider et al. 2012) bis heute fortgesetzt wird. Dabei steht v. a. eine unterrichtsintegrierte Förderung im Vordergrund, die individuelle Lernbedürfnisse auf der Grundlage sprachlicher Fähigkeiten und Fertigkeiten von Lernenden berücksichtigt und fachliche Inhalte zusammen mit sprachlichen systematisch und durchgehend vermittelt. Als ein solches unterrichtsintegriertes Förderkonzept setzt der „sprachsensible Unterricht“ an. Unter diesem Begriff subsumieren sich unterschiedliche didaktisch-methodische Vorgehensweisen (z. B. ein Wortspeicher oder Glossar als sprachliche und kontextuelle Hilfe, verbale Modellierungstechniken oder die Nutzung von Sprachvergleichen im Kontext von Mehrsprachigkeit, vgl. u. a. Kniffka 2012; Leisen 2013), deren Ziel es ist, Schülerinnen und Schüler im Fachunterricht dabei zu unterstützen, fachliche Inhalte sprachlich zu durchdringen sowie allgemein- und fachsprachliche Fertigkeiten auszubauen, um schulische Anforderungen besser bewältigen zu können (Becker-Mrotzek und Woerfel 2020). In Abgrenzung zu sprachlichen Lernhilfen zur Erreichung primär sprachlicher Lernziele (wie im Fremdsprachenunterricht oder im Fach Deutsch als Zweitsprache) ist das wesentliche Element sprachsensiblen Unterrichts, fachliches und sprachliches Lernen zu verknüpfen, um dadurch fachlich relevante Leistungen zu verbessern. Sprache dient dabei v. a. als Mittel des fachlichen Wissenserwerbs, da sie ein wichtiges Werkzeug des Denkens ist, mit dessen Hilfe kognitive Prozesse nachvollzogen oder Vorstellungsbilder aufgebaut werden sowie Wissen bearbeitet oder neu erzeugt wird (vgl. Vygotsky 1964). International bekannte sprachsensible Unterrichtsansätze sind z. B. sprachfokussierendes Scaffolding (Gibbons 2002), das Sheltered Instruction Observation Protocol (SIOP) (Echevarria et al. 2000) und Translanguaging, das in der Mehrsprachigkeitsdidaktik mittlerweile auch sprachsensibel umgesetzt wird (z. B. García und Wei 2014).
Die Bestrebungen von Bildungspolitik und -administration, sprachsensiblen Unterricht in der Praxis zu implementieren, wurden zwar bis dato aus dem (zumeist theoretischen) Wissen abgeleitet, dass Sprache und Lernen untrennbar miteinander verbunden sind (vgl. z. B. Vygotsky 1964), sie beziehen sich aber aktuell kaum auf Erkenntnisse der empirischen Interventionsforschung (Busse 2019, S. 14). Paetsch et al. (2014, S. 336) sprechen gar von einer „klaffende[n] Forschungslücke“ aufgrund fehlender Wirkungsbelege zu sprachfördernden bzw. sprachbildenden Angeboten. Sofern bislang überhaupt empirische Argumente in die Debatte zum Nutzen des sprachsensiblen Unterrichts zur Steigerung schulischer Kompetenzen einfließen, rekurrieren diese auf einzelne, aus der Studienlage herausgegriffene Untersuchungen, die bisweilen auch widersprüchliche Ergebnisse zur Wirkung sprachsensibler Ansätze berichten (z. B. Vidot 2011 versus Echevarria et al. 2006). Es liegen zwar aktuell einige nicht-systematische Literaturüberblicke vor, die je einen kleinen Ausschnitt der empirischen Datenlage zur Wirkung einzelner Ansätze zusammentragen (z. B. zu SIOP, vgl. Echevarria 2012; Echevarria und Short 2011). Um die Einführung von sprachsensiblen Maßnahmen in die Unterrichtspraxis sowie in die Aus- Fort- und Weiterbildung von Lehrpersonen wissenschaftlich zu begründen, ist aber eine umfassende und systematische Bewertung der vorliegenden empirischen Evidenz erforderlich, welche die Bewertung der internen und externen Validität der Befunde einschließt. Dies können nur systematische Reviews (mit oder ohne Metaanalyse) leisten.
Dass bis heute nur wenige solcher systematischen Übersichtsstudien vorliegen, zeigen die Ergebnisse strukturierter Abfragen in der Datenbank Scopus sowie manuelle Suchen in den speziell für systematische Reviews ausgelegten Online-Bibliotheken vom EPPI-Centre, dem What Works Clearinghouse (WWC) und der Campbell Collaboration (vgl. Höfler et al. in Vorbereitung). Eine systematische Überblicksarbeit zu SIOP liefert etwa What Works Clearinghouse (2009, 2013), jedoch ohne zusammenfassende Wirkungsaussage, weil die berücksichtigten SIOP-Studien die dort gesetzten Evidenzstandards nicht erfüllen. Zu Scaffolding finden sich zwei systematische Reviews (Swanson und Lussier 2001; van de Pol et al. 2010), die jedoch keinen expliziten Bezug zu sprachfokussiertem Scaffolding aufweisen. Systematische Übersichtsarbeiten, die mehrere sprachsensible Unterrichtsansätze zusammenfassen, oder gar ihre gesamte Vielfalt einbeziehen, liegen bislang nicht vor.
Um diese Forschungslücke zu adressieren, wurde von 2018 bis 2022 am Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache der Universität zu Köln ein großangelegtes systematisches Review zur Wirkung didaktisch-methodischer Ansätze des sprachsensiblen Unterrichts durchgeführt, das folgender übergeordneter Fragestellung nachging: Belegen Wirkungsstudien zu sprachsensiblen Unterrichtsansätzen, dass Schülerinnen und Schüler des Primar- und Sekundarbereichs, die sprachsensibel unterrichtet werden, bessere sprachliche und/oder fachliche Lernziele erreichen als Schülerinnen und Schüler, die nicht sprachsensibel unterrichtet werden?
Der vorliegende Beitrag berichtet erstmalig die Ergebnisse zur Forschungssynthese dieses systematischen Reviews. Nach Darstellung der Methodik der Übersichtsstudie (Kap. 2) erfolgt die Präsentation und Diskussion der Ergebnisse entlang der folgenden drei Teilfragen:
-
1.
Zu welchen sprachsensiblen Unterrichtsansätzen liegen im internationalen Kontext empirische Wirkbefunde vor? (Abschn. 3.1)
-
2.
Welche Effekte sind für diese Ansätze bestätigt? (Abschn. 3.2)
-
3.
Welche interne und externe Validität zeigen die jeweiligen Wirkungsstudien? (Abschn. 3.2)
Die zentralen Erkenntnisse, Limitationen und Implikationen für den Transfer in die Praxis werden in Kap. 4 zusammengefasst.
2 Methodik
Fragestellung und Konzeption des Reviews wurden in Zusammenarbeit mit Stakeholdern (Expertinnen und Experten aus Forschung und Praxis) erarbeitet (entsprechend der Empfehlungen für systematische Reviews, vgl. Petticrew und Roberts 2006).
Um im Zuge des Reviews relevante Studien zur Wirkung sprachsensibler Unterrichtsansätze im (mit Deutschland vergleichbaren) Primar- und Sekundarschulbereich zu identifizieren, wurden folgende Inklusionskriterien definiert (ausführlichere Beschreibung, vgl. Woerfel et al. 2020):
-
1.
Die Studien untersuchen Schülerinnen und Schülern im Alter von 5 bis 20 Jahren ohne sonderpädagogischen/lerntherapeutischen Unterstützungsbedarf,
-
2.
getestet wird ein didaktisch-methodischer Ansatz, der (zur Abgrenzung von einzelnen sprachsensiblen Methoden) mindestens zwei verschiedene sprachsensible Vorgehensweisen integriert, die gezielt sprachliche Mittel und/oder kommunikative Verfahren einbinden bzw. Sprachkompetenzen fördern (siehe Kap. 1), um fachlich relevante Lernleistungen zu unterstützen; der Ansatz wird im Fachunterricht angewendet, in dem Sprache nicht selbst der zentrale Unterrichtsgegenstand ist; Unterrichtszielsprache ist die jeweilige Amtssprache,
-
3.
der Vergleichsunterricht ist Fachunterricht ohne sprachsensiblen Ansatz; es handelt sich um Fachunterricht, bei dem Sprache nicht selbst der zentrale Unterrichtsgegenstand ist,
-
4.
die Wirkung des Unterrichts wird anhand von Indikatoren des sprachlichen und/oder fachlichen Lernens überprüft,
-
5.
die Effektmessung erfolgt im experimentellen, quasi-experimentellen oder nicht-experimentellem Studiendesign, mit inferenzstatistischer Gruppenvergleichsanalyse.
Entsprechend der Kriterien wurden demnach keine Studien in das Review einbezogen, die primär sprachsensiblen Unterricht untersuchen, in dem Sprache selbst der Kerngegenstand des Unterrichts ist (z. B. Deutschunterricht in Deutschland, Österreich oder der Schweiz oder Englischunterricht in den USA, Großbritannien oder Australien). Auch Untersuchungen im Rahmen des Fremdsprachenunterrichts sowie klassische Ansätze des Content and Language Integrated Learning (CLIL) und Content Based Instruction (CBI), bei denen eine Fremdsprache die Zielsprache des Unterrichts darstellt, waren kein Gegenstand der Übersichtsstudie.
Dem Standardverfahren für systematische Reviews folgend (u. a. Petticrew und Roberts 2006, S. 27) wurden strukturierte Abfragen in sechs internationalen Datenbanken durchgeführt: SCOPUS, ERIC, FIS-Bildung, PSYNDEX, PsycINFO und OpenGrey. Damit die Stichwörter für die Suchanweisungen in den Datenbanken nicht ausschließlich auf Entscheidungen von Einzelpersonen beruhten, wurden Text Mining-Verfahren angewandt (ausführlicher in Twente und Woerfel 2020). Hierfür wurden mittels des R-Pakets litsearchr in einem Datensatz (bestehend aus Titel, Abstracts und Schlagwörtern von 2668 Dokumenten in Scopus und ERIC sowie 58 in FIS) Begriffe automatisch ermittelt, die gemeinsam auftreten und eine bestimmte Bindungsstärke bezogen auf ihr Vorkommen im Datensatz aufweisen. Diese für den Inhalt einschlägiger Dokumente besonders repräsentativen Begriffe ergänzten die Suchbegriffsauswahl aus dem Fachkollegium. Die finalen Suchanweisungen kombinierten Fachtermini zu Population, Intervention, Outcome und Studiendesign (Intervention wurde z. B. über bekannte Namen sprachsensibler Ansätze erfasst, wie SIOP, aber auch über indirekte Begriffskombinationen von sprachlichem und fachlichem Lernen, z. B. „academic language instruction“ und „math“; zur ausführlichen Darstellung der Suchanweisungen, vgl. Höfler et al. in Vorbereitung).
Wie Abb. 1 zeigt, wurden die Datenbankabfragen durch Handsuchen in 21 Fachzeitschriften, durch Suchen nach unveröffentlichten Studien mittels eines Call for Preprints über die akademischen Online-Plattformen linguistlist.org und researchgate.net und über die Fachverteiler der Gesellschaft für Angewandte Linguistik, des DaZ-Portals der Universität Jena und die Sektion Interkulturelle und International Vergleichende Erziehungswissenschaft sowie durch eine Expert:innen-Abfrage ergänzt. Passend zur sich herausbildenden Wirkungsforschung zu sprachsensiblen Ansätzen wurden in einem Zeitraum ab 1990 bis 2021 insgesamt 3016 englisch- und deutschsprachige Dokumente ermittelt. Diese Dokumente wurden entlang der vorab definierten Inklusionskriterien für Wirkungsstudien zu sprachsensiblen Ansätzen in einem zweistufigen Verfahren gescreent. Die hierdurch ermittelten 55 relevanten Studien wurden anschließend mittels dafür entwickelter Kriterienraster hinsichtlich ihrer internen Validität (methodische Qualität) und externen Validität (Generalisierbarkeit der Befunde) bewertet. Die interne Validität (IV) wurde über ein Kriterienraster mit 13 Items bewertet, speziell die Bereitstellung von Informationen und Daten zu Population (IV1), Setting (IV2) und Intervention (IV3), die Übereinstimmung von diskutierten und gemessenen Outcomes (IV4) sowie von diskutierten und gemessenen Interventionen (IV5), die wissenschaftliche Güte der Outcome-Messungen (IV6), die Vergleichbarkeit der Gruppen (IV7), die Vergleichbarkeit der Behandlung der Gruppen (IV8) sowie der Outcome-Messinstrumente (IV9), aber auch die Berücksichtigung fehlender Daten (IV10), adäquate Studienlänge (IV11) und Stichprobengröße (IV12) sowie die Verblindung der Outcome-Bewertung zum Gruppenstatus (vgl. Höfler und Vasylyeva 2023). Die Kriterien wurden alle für die Bewertung operationalisiert (ohne quantitatives Ranking). Beispielsweise galt IV1 als vollständig erfüllt, wenn Informationen zu Altersspanne, -Mittelwert und -Standardabweichung, ebenso wie zur Geschlechterverteilung für jede Vergleichsgruppe vorlagen, und als teilweise bzw. nicht erfüllt, wenn einige bzw. alle Angaben dazu fehlten (ausführliche Darstellung und Begründung der Operationalisierungen, vgl. Höfler und Vasylyeva 2023). Die externe Validität (EV) wurde mit sieben Kriterien überprüft. Diese bezogen sich auf die Generalisierbarkeit der Befunde auf verschiedene Populationen (EV1: Altersgruppen, EV2: Geschlechter), Settings (EV3: Regionen, EV4: Lernsettings, EV5: Fachbereiche) und Outcomes (EV6: Sprachbereiche, EV7: Leistungsindikatoren) (vgl. Woerfel et al. 2020; ausführliche Darstellung und Begründung, vgl. Höfler et al. in Vorbereitung). Die Items wurden deskriptiv, ohne mehrstufiges Antwortformat, bewertet.
Im Screening, in der DatenextraktionFootnote 1 und Qualitätsbewertung wurden die ermittelten Dokumente unter vier Wissenschaftlerinnen und Wissenschaftlern aufgeteilt und im Single-Verfahren über die Software EPPI-Reviewer bearbeitet. Um Einheitlichkeit in den Urteilen beim Screening und der Qualitätsbewertung sicherzustellen, wurden drei Tests der Interrater-Reliabilität (IRR) mit randomisiert gezogenen Studien-Stichproben aus den ermittelten Dokumenten durchgeführt. Im Titel/Abstract-Screening überprüften zwei IRR-Testpaare je 32 Dokumente (ca. 1 % der identifizierten Dokumente n = 3016, vgl. Abb. 1) auf Übereinstimmung bei Inklusion und Exklusion auf Basis der Einschlusskriterien (die o. a. Einschlusskriterien umfassen insgesamt 16 Teilkategorien, die überprüft wurden, vgl. Woerfel et al. 2020). Da ein Testlauf zur Erreichung der gesetzten Prozenthürde (95 %) wiederholt werden musste, wurden hier insgesamt 96 Dokumente (ca. 3 %) der Stichprobe in den IRR-Test einbezogen. Auf Ebene des Volltext-Screenings testeten zwei IRR-Testpaare von den insgesamt 811 Dokumenten (vgl. Abb. 1) jeweils 20 auf die Übereinstimmung in den Bewertungscodes Inklusion, Exklusion und fehlende InformationenFootnote 2. Da auch hier ein Testlauf eines IRR-Paares zur Erreichung der Prozenthürde (95 %) wiederholt werden musste, wurden insgesamt 60 (ca. 7,5 %) der gescreenten Dokumente einbezogen. Bei der Qualitätsbewertung testeten zwei IRR-Paare von den insgesamt 55 bewerteten Wirkungsstudien (vgl. Abb. 1) mit jeweils fünf Studien je Testlauf insgesamt 10 Dokumente (rund 20 % der bewerteten Studien). Überprüft wurden hier die vier Bewertungskategorien „trifft voll zu“, „trifft zu mit Einschränkungen“, „trifft nicht zu“ und „unklar“, mit denen die o. a. 13 Qualitätskriterien bewertet wurden (vgl. Höfler und Vasylyeva 2023). In den IRR-Tests des Reviews wurde mittels der paarweisen Testung der Prozentualen Übereinstimmung (PÜ) die hierfür einfachste Kennwertberechnung gewählt (vgl. Wirtz und Caspar 2002). Da trotz der Vielzahl an einbezogenen Codes (auf Ebene der Qualitätsbewertung z. B. die vier o. a. Bewertungskategorien bei 13 Kriterien, d. h. 52 Codes je Studie insgesamt) eine Überschätzung der Konkordanz aufgrund zufälliger Übereinstimmung möglich ist (vgl. Wirtz und Caspar ebd.), wurde die zu erreichende Prozenthürde mit 95 % im Screening und maximalen 100 % in der Qualitätsbewertung bei den Ausschlusskriterien hoch angesetzt. Wenn im Zuge der Bewertung Unklarheiten auftraten, wurde die betreffende Studie in fortlaufenden Kolloquien des Review-Teams diskutiert oder in Einzelfällen von einem zweiten Team-Mitglied blind, d. h. ohne Informationen über die Erstbewertung geprüft.
Der IRR-Test zeigte auf Ebene des Titel‑/Abstract-Screenings eine sehr gute prozentuale Übereinstimmung (PÜ) bei beiden Testpaaren (je 96,9 %). Auf Ebene des Volltext-Screenings zeigte sich eine sehr gute bis exzellente Übereinstimmung (95 % und 100 %). In der Qualitätsbewertung, bei der die IRR für die Bewertung der internen Validität der Studien ermittelt wurde, erreichten die Test-Paare die definierten 100 % bezüglich der Cutoff-Kriterien, die den Studienausschluss aufgrund methodischer Mängel festlegten (PÜ für alle 52 Bewertungscodes gesamt = 87,7 und 98,5 %, vgl. Höfler und Vasylyeva 2023).
Im Zuge der Studienbewertung erfüllten zwei Wirkungsstudien die methodischen Mindestanforderungen nicht und wurden exkludiert (siehe die Reciprocal Teaching-Studien von Darsono 2015 sowie Qohar und Sumarmo 2013), weshalb insgesamt 53 Untersuchungen in die Forschungssynthese einflossen (Abb. 1). Aufgrund der ausgeprägten Heterogenität der Studienlage, insbesondere in Hinblick auf die Operationalisierung und Messung der abhängigen und unabhängigen Variablen (ausführlicher dazu, vgl. Vasylyeva et al. in Vorbereitung), wurde, wie geplant, keine metaanalytische Aggregierung der Wirkbefunde durchgeführt (vgl. Woerfel et al. 2020). Das Vorgehen orientierte sich an Guidelines und Lehrwerken, die für Synthesen ohne Metaanalysen vorliegen (u. a. Campbell et al. 2020; Petticrew und Roberts 2006).
3 Ergebnisse des systematischen Reviews
3.1 Empirisch überprüfte sprachsensible Ansätze
Sprachsensible Unterrichtsansätze wurden inzwischen international breit gestreut auf ihre Wirkung hin überprüft. Die 53 Interventionsstudien, die in die Forschungssynthese eingeflossen sind, wurden neben Deutschland in den USA, den Niederlanden, in Chile, Indonesien, Finnland, Spanien, Südafrika und Großbritannien durchgeführt (Tab. 1).
Die Studien berichten quantitative Wirkbefunde zu 30 verschiedenen sprachsensiblen Unterrichtsansätzen. Diese sind in Tab. 2 dargestellt. Einige (n = 5) davon sind durch mehrere Studien überprüft, zu den meisten Ansätzen (n = 25) wurde jedoch nur eine einzelne Wirkungsstudie ermittelt. Wenn mehrere Studien einem sprachsensiblen Ansatz zugeordnet sind (Tab. 2), untersuchen diese alle dasselbe didaktische Konzept: Untersuchungen zu Reciprocal Teaching (n = 10) beziehen sich z. B. alle auf das Konzept von Palincsar und Brown (1984), und alle SIOP-Studien (n = 11) auf die Arbeiten der Forschergruppe um Echevarria (Echevarria et al. 2000). Unter den sehr heterogen konzeptualisierten Scaffolding-Ansätzen ist der didaktische Ansatz nach Gibbons (2002) der einzige, zu dem mehrere Wirkungsstudien ermittelt wurden (n = 5). Da die sprachsensiblen Unterrichtsansätze jeweils unterschiedliche Sprachkompetenzen fokussieren und fördern, sind in Tab. 2 auch die übergeordneten Sprachbereiche Lesen, Schreiben, Mündlichkeit und Wortschatz abgebildet, denen die Ansätze schwerpunktmäßig zuordnet werden können (Systematisierung der Sprachbereiche erfolgt nach Lindauer et al. 2013; Darstellung der konkret gemessenen Lern-Outcomes, die sich z. T. vom sprachlichen Fokus des Ansatzes unterscheiden können, vgl. Abschn. 3.2). Ansätze, die im didaktisch-methodischen Vorgehen mehr als einen sprachlichen Bereich berücksichtigen bzw. solche, die hier übergreifend angelegt sind, sind der Kategorie Mehrere/Übergreifend zugeordnet. Die Ansätze unterscheiden sich in Bezug auf definierte Bildungsinhalte, -ziele und Methoden (vgl. Vasylyeva et al. in Vorbereitung).
3.2 Effekte der Ansätze und Qualität der Befunde
Nachfolgend sind die empirischen Befunde zu den sprachsensiblen Ansätzen sowie die interne und externe Validität der Studien(ergebnisse) dargestellt (ausführlichere Informationen zu den einzelnen Ansätzen, vgl. Höfler et al. in Vorbereitung; stat. Werte sind, wie in den Studien bereitgestellt, angegeben).
3.2.1 Sheltered Instruction Observation Protocol
Zum Sheltered Instruction Observation Protocol (SIOP) (Echevarria et al. 2000) wurden elf Wirkungsstudien ermittelt. Dieser ursprünglich für Zweitsprachlernende konzipierte und inzwischen in vielen U.S.-Schulbezirken implementierte Ansatz umfasst klassischerweise 30 Prinzipien zur Unterrichtsplanung und Durchführung, die das Fach- und Sprachlernen umfänglich verbinden (z. B. die Förderung der mündlichen Sprechpraxis und des akademischen Wortschatzes, vgl. Short et al. 2011, S. 364).
Quantitative Wirkbefunde
In Bezug auf sprachliche Lern-Outcomes sind am häufigsten die Effekte von SIOP auf die Leseleistung der Schülerinnen und Schüler untersucht (n = 6): Zwar belegt Skujins (2014) Wirkvorteile im Vergleich zum Kontrollunterricht (p = 0,001, η2part = 0,168); die anderen fünf der insgesamt sechs Untersuchungen zum Lesen ergeben jedoch keine Leistungsunterschiede zugunsten von SIOP (Tab. 3). In Bezug auf die Schreibleistung von Schülerinnen und Schülern zeigen dagegen drei von fünf Studien Leistungsvorteile (p = 0,001, vgl. Echevarria et al. 2006; p = 0,031; η2part = 0,117, vgl. Skujins 2014; d = 0,31, vgl. Short et al. 2012). Die Befunde zum Erwerb von mündlichen Kompetenzen durch SIOP-Unterricht finden sich in nur wenigen Studien (n = 2) und sind uneinheitlich. Effekte auf den Wortschatzerwerb wurden nicht überprüft. In Hinblick auf die Fachleistung, z. B. in Biologie oder Mathematik, belegen drei Untersuchungen bessere Lernergebnisse (Tab. 3). Die CREATE Study (Echevarria et al. 2011), die auch Erstsprachlernende einbezieht, ist dagegen eine der vier Untersuchungen, die keine fachlichen Leistungsunterschiede durch SIOP-Unterricht feststellt (hier speziell im Biologie-Inhaltsverstehen: p = 0,672, g = 0,103). Keine der Studien findet im finalen Berechnungsmodell Nachteile durch das sprachsensible ModellFootnote 3.
Bewertung der internen und externen Validität der Datenlage
Die Datenlage zu SIOP ist insgesamt wenig belastbar (Abb. 2). Nur selten werden Informationen zum Ablauf des untersuchten Unterrichts bereitgestellt (IV3), was die Einordnung der Ergebnisse erschwert, da aufgrund der allgemein formulierten SIOP-Prinzipien die getesteten Interventionen sehr heterogen gestaltet sein können. Unter den SIOP-Studien befinden sich auch alle fünf der im Gesamtsample (n = 53) identifizierten nicht-experimentellen Untersuchungen, in denen nachträglich Schulleistungsdaten ausgewertet wurden (Griese 2018; Ingram 2017; Paeplow 2011; Skujins 2014; Vidot 2011). Da bei diesen Informationen zum Unterrichtsablauf gänzlich fehlen und Design-bedingt Einschränkungen in der Gruppen-Vergleichbarkeit (IV7, IV8) bestehen, sind deren Ergebnisse zum Wirkvergleich wenig aussagekräftig, was v. a. die Befunde zur Wirkung auf fachliche Leistungen betrifft.
Die Befunde verweisen auf eine relativ hohe Ergebnisreichweite in den überprüften Populationen, Settings und Outcomes (Tab. 3). Die SIOP-Studien stammen zwar ausschließlich aus den USA, beziehen sich dort aber auf Schülerinnen und Schüler aus nahezu allen Altersgruppen der mit Deutschland vergleichbaren Primar- und Sekundarstufe, vorwiegend auf Zweit-, aber auch auf Erstsprachlernende, mit unterschiedlichen sprachlichen Leistungsniveaus und sozioökonomischen Hintergründen, aus ländlichen Gegenden (Ardisana 2007, S. 62) und Großstädten (Echevarria et al. 2011, S. 338). SIOP wurde inzwischen in vielfältigen Fächern der Natur‑, Gesellschaftswissenschaften und Technologie überprüft.
3.2.2 Reciprocal Teaching
Zu Reciprocal Teaching (RT) konnten 10 Wirkungsstudien ermittelt werden. In den Studien wird das RT-Konzept, welches als Leseförderung ursprünglich auf Palincsar und Brown (1984) zurückgeht, im Fachunterricht umgesetzt, z. B. in den Naturwissenschaften, in Sozialkunde oder Geschichte (d. h. immer auch in einem Unterricht ohne primären Fokus auf sprachliches Lernen, vgl. die Einschlusskriterien in Kap. 2). Der Ansatz umfasst didaktisch-methodische Vorgehensweisen, wie scaffolding (i. S. einer sukzessive zurückgefahrenen Unterstützung des Leseverstehens), kollaboratives Lernen, und sprachliche Modellierung, um Schülerinnen und Schüler in der zunehmend selbstregulierten Nutzung der Lesestrategien – Voraussagen zum Text treffen (predicting), Fragen stellen (questioning), Inhalte klären (clarifying) und Zusammenfassen (summarizing) – zu unterstützen. Einige Studien ergänzen die Basisstrategien durch weitere didaktische Elemente (z. B. die Untersuchung von Zubaidah et al. 2020 zu Remap RT, mit selbstständiger Literatursuche und der Erstellung von Concept Maps, S. 122–125).
Quantitative Wirkbefunde
In insgesamt sieben Studien werden Effekte von RT auf das Leseverstehen getestet (Tab. 4). Fünf davon weisen hier bessere Leistungen durch RT-Unterricht als durch den Unterricht ohne sprachsensiblen Ansatz nach, etwa die Prä-Post-Studie von Lederer (1997), die entsprechend der Klassifizierung nach Cohen (1988) mittlere bis große Wirkunterschiede berichtet (p < 0,05, Glass’s ∆: 0,53–0,83). In Bezug auf die Entwicklung von fachlichen Schulleistungen, die seltener überprüft werden (n = 4), zeigen drei Untersuchungen positive Effekte. Zubaidah et al. (2020) belegen z. B. Leistungsvorteile durch RT im Fachwissen in Biologie (p = 0,000), und Taylor und Cox (1997) im Lösen von mathematischen Textaufgaben (p < 0,001, Taylor und Cox 1997). Letzterer Befund wird aber von Collen (2011) in Frage gestellt (p = 0,469, η2part = 0,007, d = −0,17), die bei mathematischen Textaufgaben keine Kompetenzunterschiede findet. Taylor und Frye (1992) finden in Bezug auf ihren kombinierten RT-Ansatz als einzige auch schlechtere Ergebnisse im Vergleich zur Kontrollbedingung, allerdings nur in einem Teil-Indikator des Lernens (im Leseverstehen, speziell im Fragen zum Text beantworten) und nur bei einem von vier untersuchten Vergleichsgruppen-Paaren (zwei zeigen hier sogar bessere Ergebnisse durch RT, S. 45 f.).
Interne und externe Validität der Datenlage
Die Hälfte der RT-Studien zeigt ernstzunehmende Verzerrungspotenziale d. h. sechs Untersuchungen erfüllen mindestens eines der 13 Qualitätskriterien nicht. Grund dafür sind z. B. ein zu geringer Stichprobenumfang (IV12, z. B. n = 12/Vergleichsgruppe, vgl. Dandeles 1996) oder ausschließlich berichtete Querschnittdaten zur Gruppenvergleichsmessung (IV11, vgl. Dermody und Speaker 1995; King und Parent Johnson 1992). Die Studie von Taylor und Cox (1997) zeigt neben unzureichender Studienlänge und Stichprobengröße keine Verblindung (IV13), d. h. der Gruppenstatus ist bei der Lernergebnis-Bewertung bekannt. Insbesondere der Wirkbefund zur Verbesserung des biologiespezifischen Fachwissens durch Remap RT bleibt hinsichtlich seiner Aussagekraft wenig robust, da bei der einzigen Belegstudie hierzu sieben von 13 Items der Qualitätsbewertung aufgrund fehlender Informationen nicht einschätzbar sind (Abb. 3).
Die Bewertung der externen Validität zeigt eine vergleichsweise große Ergebnisreichweite der RT-Befunde, v. a. in Hinblick auf populations- und settingbezogene Aspekte. Die Effekte des Unterrichtsmodells sind für Schülerinnen und Schüler mit unterschiedlichen sozioökonomischen Hintergründen im Alter zwischen 8 und 16 Jahren untersucht, die in den USA, aber auch in Europa und Asien innerhalb eines breiten Fächerkanons unterrichtet wurden (Tab. 4).
3.2.3 Scaffolding nach Gibbons
Scaffolding nach Gibbons (2002) – der einzige sprachsensible Scaffolding-Ansatz, zu dem mehrere Interventionsstudien (n = 5) vorliegen – verbindet eine unterrichtsvorbereitende Lernbedarfs- und Lernstandsanalyse (sog. Makro-Scaffolding) mit der schrittweisen Förderung bildungs- und fachsprachlicher Register im Unterricht (sog. Mikro-Scaffolding). Vier der fünf Belegstudien kombinieren den Ansatz mit anderen fachdidaktischen Konzepten (z. B. Darstellungsvernetzung, vgl. Prediger und Neugebauer 2021), wobei sich das didaktische Vorgehen grundlegend nach Scaffolding ausrichtet.
Quantitative Wirkbefunde
Alle identifizierten Wirkungsstudien weisen im Vergleich zu Fachunterricht ohne sprachsensiblen Ansatz bessere Lern-Effekte durch die getesteten Scaffolding-Interventionen nach (Tab. 5). Agel et al. (2012) finden nach ihrer Intervention zur Erstellung von naturwissenschaftlichen Versuchsprotokollen signifikant bessere Leistungen in der Fachsprache. Die vier anderen Scaffolding-Studien zeigen alle bei fachlich schwächeren Schülerinnen und Schülern Lernvorteile im konzeptuellen Inhaltsverstehen in Mathematik zu Anteilen und Brüchen, dazu gehören die Untersuchungen von Wessel (2015; p < 0,01, η2 = 0,13), von Prediger und Wessel (2018) sowie von Schüler-Meyer et al. (2019)Footnote 4, letztere sowohl für Ein- als auch für Mehrsprachige, mit Effekten bis zu vier Monaten nach Interventionsende. Prediger und Neugebauer (2021) weisen Verbesserungen zu einem weiteren Fachthema in Mathematik nach (zu Prozentrechnung: p < 0,001, η2 = 0,011), wenngleich hier sieben Wochen nach der Intervention keine signifikanten Wirkunterschiede mehr feststellbar sind (p > 0,05, η2 = 0,003).
Interne und externe Validität der Datenlage
Die Scaffolding-Studien erfüllen bis zu fünf von 13 Kriterien der internen Validität vollständig (Abb. 4). Die zwei Experimente mit stratifizierter Randomisierung (Prediger und Wessel 2018; Schüler-Meyer et al. 2019) zeigen im Vergleich die beste interne Validität (u. a. aufgrund IV7). Dagegen ist diese bei den Ergebnissen zur fachsprachlichen Leistung gering, da die Studienqualität in beinahe der Hälfte der Kriterien nicht eingeschätzt werden kann und dieser Outcome-Bereich in lediglich einer Studie gemessen wird (Agel et al. 2012). Dazu zählen die Cutoff-relevanten Items zur Implementationstreue (IV5), zur Test-Qualität (IV6) und zur Passung von diskutiertem und gemessenem Outcome (IV4).
Die externe Validität der Scaffolding-Befunde ist begrenzt. Auch wenn die untersuchten Populationen unterschiedliche sprachliche und sozioökonomische Hintergründe aufweisen (z. B. Ein- und Mehrsprachige mit unterschiedlichem Sprachniveau und sozioökonomischem Status untersuchen, vgl. Prediger und Wessel 2018, S. 372 f.), beziehen sich die Ergebnisse ausschließlich auf Lernende der Sekundarstufe I des deutschen Schulsystems, genauer auf die 5. und 7. Klasse. Die Befunde gelten hier ausschließlich für das Lernen im Bereich Mathematik und in den weiteren Naturwissenschaften.
3.2.4 Translanguaging
Im Review wurden drei Studien ermittelt, die Translanguaging im Fachunterricht testen. Der Unterrichtsansatz (Cummins 1979; weiterentwickelt u. a. durch García und Wei 2014) zielt explizit darauf das mehrsprachige Repertoire (z. B. Familiensprachen) aller Lernenden als Ressource beim Erwerb der Unterrichtsinhalte zu nutzen, z. B. durch Code-Switching und andere Methoden.
Quantitative Wirkbefunde
Die drei Translanguaging-Studien zeigen alle in längsschnittlichen Messungen bessere Effekte des sprachsensiblen Ansatzes im Vergleich zum Kontrollunterricht (Tab. 6). Charamba und Zano (2019) belegen dies in Bezug auf das Fachwissen in Chemie und Clark et al. (2012) in Bezug auf das Fachwissen in Biologie (p = 0,002), insbesondere für in der Zweitsprache schwächere Lernende (S. 1217). Schüler-Meyer et al. (2019) finden bessere Effekte auf das Inhaltsverstehen in Mathematik, v. a. bei Zweitsprachlernenden mit familiensprachlich hohem Kompetenzniveau (Translanguaging wird hier kombiniert mit Scaffolding nach Gibbons). Die Effekte sind bis zu vier Monate nach der Intervention noch nachweisbar (S. 329).
Interne und externe Validität der Datenlage
Alle drei Experimente gewährleisten aufgrund einer Single-Subject-Randomisierung (IV7) die Vergleichbarkeit der Untersuchungsgruppen (Abb. 5). Einschränkungen der methodischen Qualität zeigen sich aber hinsichtlich der Bereitstellung relevanter Informationen, v. a. bei Charamba und Zano (2019), bei denen keine Angaben zur Test-Güte (IV6) und zum Umgang mit fehlenden Daten vorliegen (IV10). Darüber hinaus beziehen alle Studien nur kleine Samples (IV12) in die Gruppenvergleichsanalysen ein (n < 45/Vergleichsgruppe, vgl. Schüler-Meyer et al. 2019, S. 329; n < 27/Vergleichsgruppe, vgl. Clark et al. 2012, S. 1219 f.; Charamba und Zano 2019 unterschreiten mit einem Gesamtsample von n = 30 den verwendeten Richtwert von mind. n = 20/Vergleichsgruppe, vgl. Höfler und Vasylyeva 2023).
Die durchgehend positiven Befunde zu Translanguaging, die alle in randomized controlled trials (RCT)-Designs ermittelt wurden, sind in ihrer externen Validität eingeschränkt; sie gelten ausschließlich für den naturwissenschaftlichen Unterricht und für Lernende im Alter von 12 bis 17 Jahren, weshalb sie nicht unbegründet auf den Primarbereich übertragen werden können. Die regionale Reichweite der Befunde ist breiter, da die Studien neben Deutschland aus den USA und Südafrika stammen und dort in Schulbezirken mit unterschiedlicher sozioökonomischer Stärke Effekte belegen.
3.2.5 Collaborative Strategic Reading
Collaborative Strategic Reading (CSR) nach Klingner et al. (Klingner et al. 1998, 2001) fokussiert als Weiterentwicklung des RT-Ansatzes die Anwendung folgender Lese-Strategien beim Fachlernen: Textvorschau (preview), Umgang mit herausfordernden Textbausteinen (click and clunk), Identifikation von Kernaussagen (get the gist) sowie Zusammenfassen und Fragenstellen zum Text (wrap up) (Klingner et al. 1998, S. 19 f.).
Quantitative Wirkbefunde
Die Wirkbefunde zu CSR sind widersprüchlich (Tab. 7). Klingner et al. (1998) finden nach ihrer 11-tägigen Intervention längsschnittlich besseres Leseverstehen (p = 0,001) bei Lernenden, die sozialwissenschaftlichen Fachunterricht mit CSR erfahren haben (im entsprechenden Fachwissen zeigen sich mit der Kontrollgruppe vergleichbare Effekte). Hitchcock et al. (2011) finden dagegen auch nach einem einjährigen Interventionszeitraum keinen Leistungsunterschied im Leseverstehen durch den sprachsensiblen CSR-Unterricht (p = 0,11, g = 0,05) zwischen den untersuchten Gruppen.
Interne und externe Validität der Datenlage
Während in dem Quasi-Experiment von Klingner et al. (1998) eine Vergleichbarkeit der Rahmenbedingungen von CSR- und Kontroll-Intervention gewährleistet (IV8) und die Implementationstreue (IV5) beider Gruppen sichergestellt wird (S. 7), umfasst jenes von Hitchcock et al. (2011), das keine signifikanten Effekte findet, zwar eine große Stichprobe in der finalen Analyse (siehe IV12, mit IG: n = 606; KG: n = 597, gesamt: 74 Klassen, S. 21 ff.), es werden aber z. T. deutliche Einschränkungen in der Implementationstreue (IV5) des CSR-Unterrichts berichtet (S. 40) und Informationen zur Interventionsintensität und zum konkreten Ablauf (IV3) fehlen (Abb. 6).
Die CSR-Befunde beziehen sich ausschließlich auf die Altersgruppe von 9‑ bis 11-jährigen Schülerinnen und Schülern in den USA, die in sozialwissenschaftlichen Fachgebieten lernen (Tab. 7). Auch wenn die Studien in vielen verschiedenen, sozial diversen Unterrichtskontexten und -klassen durchgeführt wurden (Hitchcock et al. 2011, S. 19; Klingner et al. 1998, S. 3), ist die externe Validität der Ergebnisse v. a. in Hinblick auf Populationen und Lern-Outcomes eingeschränkt.
3.2.6 Weitere sprachsensible Ansätze
Das systematische Review hat 25 weitere sprachsensible Ansätze identifiziert, deren Wirkung empirisch überprüft ist (Tab. 8). Da zu diesen aber jeweils nur eine einzelne Belegstudie ermittelt wurde, ist die empirische Datenlage dazu marginal.
Quantitative Wirkbefunde
In Tab. 8 sind die Wirkbefunde zu diesen Ansätzen dargestellt. Keiner der sprachsensiblen Ansätze zeigt eine schlechtere Wirkung als der Kontrollunterricht. Unter den 10 Ansätzen mit dem Fokus auf Lesen, zu denen jeweils nur eine Belegstudie vorliegt, sind bis auf zwei Modelle (metakognitives Lese-Scaffolding und naturwissenschafts-/technikintegrierte Leseförderung) bei allen Ansätzen bessere Effekte auf einzelne Lernleistungen belegt. Mittlere bis große Effekte wurden z. B. bei einer digitalen Leseförderung von Online-Textressourcen festgestellt (Online-Leseverstehen: p < 0,000, d = 1,58, vgl. Castek 2008) sowie bei Lesen nach Wechselseitigem Lehren und Lernen (WELL) (Biologie-Fachleistung: p < 0,05, η2 = 0,035–0,113, vgl. Huber 2007).
Von den insgesamt nur zwei im Review identifizierten sprachsensiblen Ansätzen, die das Schreiben ins Zentrum stellen, zeigt etwa der Mathematics Reasoning Heuristic (MRH)-Ansatz, der Schreibstrategien als Reflexionsmittel für mathematische Problemlösungen einsetzt (Akkus 2007, S. x, xii), z. T. deutliche Vorteile in den getesteten Gruppenvergleichen (Mathematik-Fachleistung: p < 0,05, d = 0,450–0,916).
Von den insgesamt fünf überprüften sprachsensiblen Ansätzen, die mündliche Aktivitäten ins Zentrum des Fachunterrichts stellen, wurden bei drei Modellen Wirkvorteile nachgewiesen, wie bei der dialogischen Diskursförderung im naturwissenschaftlichen Unterricht von Larrain et al. (2017, S. 13), speziell bei den schriftsprachliche Argumentationsfertigkeiten (p = 0,003, η2 = 0,12; naturwissenschaftliches Fachwissen: p = 0,022, η2 = 0,043).
Alle identifizierten Fördermodelle mit dem Schwerpunkt der Wortschatzarbeit (n = 4) zeigen in Längsschnittmessungen bessere (Teil‑)Ergebnisse als der Kontrollunterricht, darunter eine deutliche Verbesserung des Fach- und Bildungswortschatzes der Schülerinnen und Schüler (u. a. das strategiebasierte Wortschatztraining: p < 0,03, d = 1,59, vgl. Booth 2014; oder Fachunterricht mit begriffsveranschaulichenden Objektboxen: d = 1,83, vgl. Rule und Barrera 2008).
Die Primärstudien zu Unterrichtsansätzen, die mehrere sprachliche Kompetenzbereiche fokussieren, weisen ebenfalls auf bestimmte Leistungsvorteile hin. So sind etwa für die Mathematik-Förderung des multiplikativen Denkens (p < 0,001, d = 1,01, vgl. Götze und Baiker 2021) sowie für das Literacy Design Collaborative (LDC) (Lesen: p = 0,05, Modell Koeffizient = 0,058, vgl. Herman et al. 2015) bessere Effekte nachgewiesen.
Interne und externe Validität der Datenlage
Bei den Ansätzen, zu denen jeweils nur eine Belegstudie vorliegt, ist die Belastbarkeit der Wirkbefunde grundsätzlich (noch) gering. Alle Studien zeigen darüber hinaus unterschiedlich stark ausgeprägte methodische Verzerrungsquellen. Bis auf drei Untersuchungen berichten die Studien zu den lesefokussierten Ansätzen z. B. ausschließlich Ergebnisse aus querschnittlichen Gruppenvergleichsmessungen und erfüllen damit das Kriterium der adäquaten Studienlänge (IV11) nicht (Abb. 7). Die beiden Wirkungsstudien zu den schreibfokussierten Ansätzen erfüllen jeweils nur eines bis zwei der insgesamt 13 internen Validitätskriterien vollständig (Abb. 8). Von den Untersuchungen, die sprachsensible Ansätze mit Fokus auf mündliche Aktivitäten überprüfen, belegt die Studie zur verbalen Unterstützung der Schülerinnen und Schüler von van der Graaf et al. (2019) als einzige die Umsetzungstreue (IV5) in allen Vergleichsgruppen (Abb. 9), auch wenn hier u. a. die Qualität der Outcome-Messung Einschränkungen zeigt (z. B. die Reliabilität des Wortschatztests: α = 0,63–0,67, S. 1126). Die Untersuchungen zu den wortschatzbezogenen Ansätzen fallen allesamt durch sehr kleine Samples (IV12) auf (Abb. 10). Bei den restlichen Unterrichtsmodellen finden sich ebenfalls methodische Einschränkungen in den zugehörigen Wirkungsstudien (Abb. 11). Zum Beispiel werden die Effekte zur Förderung des multiplikativen Denkens (Götze und Baiker 2021) ohne Prä-Testung im Post-Follow-Up-Design ermittelt (IV11), und die LDC-Studie erfasst eine der überprüften Lernleistung (Schreiben) mit dem hier eingesetzten Test nur ausschnitthaft (IV4, vgl. Herman et al. 2015, S. 36).
Die Ergebnisreichweite zu diesen Ansätzen ist grundsätzlich auf die Reichweite der jeweiligen Belegstudie begrenzt. Bei Programmen mit dem Ziel der Leseförderung hat die Untersuchung zur Online-Förderung des Leseverstehens von Internet-Ressourcen (Castek 2008) eine erhöhte externe Validität, da hier Leistungsdaten aus unterschiedlichen Fächern einbezogen werden (Tab. 8). Dasselbe trifft auf Untersuchungen zu, die mehrere Outcomes überprüfen (z. B. zur wissenschafts- und technikintegrierten Leseförderung, vgl. van Keulen und Boendermaker 2020). Der regionale Gültigkeitsbereich der Befunde zu den beiden schreibfokussierten Unterrichtsmodellen bezieht sich hier jeweils auf vornehmlich sozioökonomisch schwächere Gebiete in den USA (Akkus 2007, S. 121; Shi et al. 2019, S. 130) und ausschließlich auf die mit Deutschland vergleichbare Sekundarstufe I. Alle empirischen Befunde zu Ansätzen mit Schwerpunkt Wortschatz oder Mündlichkeit gelten ausschließlich für Lernen im naturwissenschaftlichen Regelunterricht (die externe Validität ist besonders gering in den Experimenten, vgl. Booth 2014 oder Härtig und Stosik 2015; Tab. 8). Eine Generalisierung der Befunde auf andere, als in den Studien erfassten Populationen, Settings und Lern-Outcomes (Tab. 8) ist nur in begründeten Fällen möglich.
4 Diskussion der Ergebnisse
4.1 Zentrale Erkenntnisse des Reviews
Das hier berichtete systematische Review mit narrativer Synthese (Synthese ohne Metaanalyse) hat die Evidenz zur Wirkung von sprachsensiblem Fachunterricht erstmals international und die didaktisch-methodischen Ansätze übergreifend ausgewertet. Es wurden Ergebnisse aus 53 Interventionsstudien einbezogen, die Befunde zur Wirkung von 30 verschiedenen sprachsensiblen Unterrichtsansätzen liefern. Die getesteten Ansätze sind vielfältig in den fokussierten Inhalten, Methoden und im Umfang der sprachsensiblen Unterrichtsgestaltung.
Aus der Synthese der empirischen Primärstudien geht hervor, dass sprachsensibler Fachunterricht den schulischen Erfolg bei Schülerinnen und Schülern des Primar- und Sekundarbereichs grundsätzlich besser unterstützen kann als Fachunterricht ohne sprachsensible Ausrichtung. Die meisten Studien (n = 38) zeigen in den finalen Analysen in mindestens einem der untersuchten Lern-Outcomes einen signifikant besseren Effekt zugunsten der untersuchten sprachsensiblen Intervention (z. B. Agel et al. 2012; Dermody und Speaker 1995; Götze und Baiker 2021). 15 von 53 Studien weisen vergleichbare Effekte zum Unterricht ohne sprachsensiblen Ansatz nach (z. B. Echevarria et al. 2011; McIntyre et al. 2010; van Keulen und Boendermaker 2020). Lediglich die Reciprocal Teaching-Studie von Taylor und Frye (1992) zeigt in der finalen Analyse bei einem von vier Gruppenvergleichen eine geringere Wirkung des sprachsensiblen Modells (zwei der Gruppen zeigen sogar bessere Effekte, S. 45 f.). Die Datenlage zu den einzelnen Ansätzen ist jedoch sehr unterschiedlich, insbesondere was die Belastbarkeit der Befunde angeht. Zu Reciprocal Teaching (RT), Collaborative Strategic Reading, (CSR), Sheltered Instruction Observation Protocol (SIOP), Scaffolding nach Gibbons und Translanguaging konnten jeweils mehrere Interventionsstudien identifiziert werden. In der systematischen Bewertung der Evidenz zeigen einige dieser Ansätze aufgrund relativ konsistenter Ergebnisse bei bestimmten Lern-Outcomes vergleichsweise gut belegte Effekte: So wurden für Reciprocal Teaching (RT) in fünf von sieben Untersuchungen zum Lesen bessere Effekte auf das Leseverstehen von Schülerinnen und Schülern im sozial- und im naturwissenschaftlichen Unterricht nachgewiesen. Bei Translanguaging zeigen sich in allen drei der hierzu vorliegenden Wirkungsstudien bessere Effekte im naturwissenschaftlichen Fachwissen bzw. Inhaltsverstehen. Auch in Bezug auf Scaffolding nach Gibbons (2002) sieht die Datenlage auf den ersten Blick einheitlich aus. Alle fünf der hierzu gefundenen Studien (die ausschließlich in Deutschland durchgeführt wurden) weisen bessere schulische Leistungen durch den sprachsensiblen Ansatz nach, davon vier im Verstehen mathematischer Fachinhalte (eine weitere in der naturwissenschaftlichen Fachsprache, Abschn. 3.2). Einschränkungen in der internen Validität der Studien oder in der Vergleichbarkeit der durchgeführten Interventionen können aber diese Befunde zumindest teilweise relativieren. Die Studien zu Scaffolding nach Gibbons (2002) integrieren z. B. trotz der vergleichsweise guten Studienqualität in Hinblick auf längsschnittlich durchgeführten experimentellen und quasi-experimentellen Untersuchungen mit (zumindest z. T.) wünschenswerten drei Messzeitpunkten und ausreichend großen Stichproben (vgl. Prediger und Wessel 2018) auch andere sprachsensible (Teil‑)Konzepte (Abschn. 3.2) und aus der Datenlage ist nicht trennscharf nachvollziehbar, welches Gewicht speziell dem Scaffolding-Anteil an den besseren Lernergebnissen zukommt. Insbesondere in Bezug auf das in den USA verbreitete SIOP-Modell, zu dem die meisten Wirkungsstudien vorliegen (n = 11), sind die Befunde kaum belastbar. Trotz der sich andeutenden Vorteile im Schreiben und der fehlenden Effekte auf die Leseleistung (Kap. 3) ist die Datenlage hier aufgrund der häufig (n = 5) angewendeten nicht-experimentellen Studiendesigns und Querschnittanalysen (n = 4) bislang noch wenig aussagekräftig, was sich auch in den inkonsistenten Befunden spiegelt.
Zu den sprachsensiblen Ansätzen (n = 25), zu denen jeweils nur eine einzelne Wirkungsstudie mit inferenzstatistischer Gruppenvergleichsmessung identifiziert werden konnte, werden häufig positive Effekte auf Teil-Indikatoren des Lernens berichtet. Demnach unterstützt die Förderung von Online-Lesestrategien von Castek (2008) das Erfassen von Informationen aus Internettexten, der schreibfokussierte MRH-Ansatz die Mathematikleistung (Akkus 2007); das mündlich-diskursive Thinking Together Leistungen im Fachwissen (Mercer et al. 2004; Mercer und Sams 2006) oder das semantische Scaffolding den Erwerb von fachlich relevantem Wortwissen (Best et al. 2006). Da die Aussagekraft von empirischen Befunden aus einzelnen Interventionsstudien aber grundsätzlich begrenzt ist (u. a. aufgrund möglicher nicht berichteter Verzerrungspotenziale, vgl. Bewertungskategorie „unklar“ in Abb. 7, 8, 9, 10 und 11), bedürfen diese empirischen Befunde in besonderem Maße weiterer Überprüfung (dasselbe trifft prinzipiell auch auf alle Ergebnisse aus Querschnittanalysen zu).
Grundsätzlich können die Wirkbefunde immer nur zusammen mit der Bewertung der internen (und externen) Validität der Studien richtig interpretiert werden. Die Darstellung der methodischen Verzerrungspotenziale (Abschn. 3.2) macht die Studienqualität transparent und die Belastbarkeit der Befunde einschätzbar. Jedoch zeigen alle Studien Einschränkungen in der internen Validität (Abschn. 3.2) – v. a. in der Berichtsqualität und durch fehlende Nachweise der Implementationstreue des untersuchten Unterrichts (vgl. Höfler und Vasylyeva 2023; zur ausführlichen Diskussion der Qualitätsbewertung der ermittelten Wirkungsstudien insgesamt sowie zu daraus resultierenden Forschungsimplikationen, vgl. Vasylyeva et al. in Vorbereitung). Trotz der zahlreichen Qualitätseinschränkungen können die empirischen Befunde trotzdem Hinweise auf Wirkeffekte sprachsensibler Ansätze liefern. Die Ergebnisse des Reviews zeigen z. B. deutlich, dass sprachsensibler Fachunterricht letztlich über die Förderung von Sprachkompetenzen in allen sprachlichen Bereichen – egal ob im Lesen, Schreiben, in der Mündlichkeit oder im Wortschatz – schulische Leistungen verbessern kann.
Die Ergebnisse aus der Qualitätsbewertung der ermittelten Interventionsstudien haben auch Implikationen für die weitere Wirkungsforschung im Bereich des sprachsensiblen Unterrichts. Dazu gehören z. B. die Notwendigkeit der Einschätzung der Implementationstreue in allen Vergleichsgruppen, aber auch die Anwendung von Prä-Post-Follow-up-Designs, um längerfristige Lern-Effekte zu messen (ausführlicher zu den resultierenden Implikationen für die Primärforschung, vgl. Vasylyeva et al. in Vorbereitung).
4.2 Limitationen
Da Studien mit statistisch signifikanten Resultaten mit höherer Wahrscheinlichkeit konventionell publiziert werden als Studien, die keine signifikant positiven Effekte der Intervention nachweisen, sind systematische Reviews zu Interventionsstudien grundsätzlich mit dem Risiko verbunden, die Wirkung von Interventionen zu überschätzen (Petticrew und Roberts 2006, S. 233 f.). Die vorliegende Übersichtsstudie hat, u. a. über die Datenbankabfrage in Open Grey, die Expert:innen-Abfrage und den Call for Preprints (Kap. 2), gezielt nach grauer Literatur gesucht (d. h. nach nicht oder nicht konventionell veröffentlichen Forschungsergebnissen), um diesem Publikationsbias entgegenzuwirken.
Es ist davon auszugehen, dass über die Suchsyntax des Reviews nicht alle Studien identifiziert werden konnten (in der Tat wurde eine Untersuchung von Prediger und Wessel 2013 nicht über die Suchstrategie ermittelt). Eine Herausforderung bestand darin, sprachsensible Interventionen begrifflich zu operationalisieren, da entsprechende Konzepte und Termini nicht disziplinübergreifend einheitlich verwendet werden und Datenbanken keine einheitlich kontrollierten Vokabularien zur Verfügung stellen. Um begriffsinduzierte Verzerrungen zu reduzieren, wurde die Suchbegriffsentwicklung aber durch ein Text-Mining-Verfahren unterstützt (Twente und Woerfel 2020) und die Begriffe in der Suchsyntax so kombiniert, dass nicht nur Studien zu bekannten, sondern auch zu unbekannten sprachsensiblen Ansätzen gefunden werden konnten (z. B. über die Kombination von Begriffen des Fach- und Sprachlernens).
Neben der Auswahl der Datenbanken kann auch der ausschließliche Einbezug von englisch- und deutschsprachigen Dokumenten die Identifikation von Studien und damit verbunden die regionale Verteilung der ermittelten Untersuchungen beeinflusst haben, die sich besonders auf die USA und Deutschland (bzw. USA und Europa) konzentriert (Abschn. 3.1). Die ermittelten Studien bilden aber auch existierende Forschungsschwerpunkte in den Regionen ab, z. B. wurden ausschließlich SIOP-Studien aus den USA identifiziert, wo das Modell entwickelt wurde. Es konnten keine Interventionsstudien (mit inferenzstatistischem Gruppenvergleich) aus der Schweiz, aus Kanada oder – mit Ausnahme von Südafrika – aus den englischsprachigen Ländern der südlichen Hemisphäre identifiziert werden. In Bezug auf letztere ist denkbar, dass aufgrund der Forschungstraditionen dort andere (verwandte) Programme im Fokus stehen (in Kanada z. B. CLIL und CBI, die nicht Gegenstand des Reviews sind, vgl. Kap. 2).
Eine weitere Limitierung ist durch das angewendete Single-Coding (Kap. 2) im Screening, in der Datenextraktion und Qualitätsbewertung der Studien zu sehen, auch wenn die Gewährleistung eines einheitlichen Vorgehens der beteiligten Wissenschaftler:innen durch die IRR-Testungen, durch Trainings sowie durch fortlaufende Kolloquien und Kontrollmechanismen unterstützt wurde.
Da passend zur Untersuchungsfrage nur inferenzstatistische Wirkvergleiche zwischen sprachsensiblen Ansätzen und nicht gezielt sprachsensibel gestaltetem Fachunterricht einbezogen wurden und keine Erkenntnisse aus qualitativen Analysen, kann die Übersichtsstudie keine Aussagen zu zugrundeliegenden Prozessen des Sprach- und Fachlernens treffen, die im Rahmen sprachsensibler Unterrichtsmodelle stattfinden und Wirkeffekte empirisch erklären.
Da das Review im Sinne der angestrebten Best Evidence Synthesis (vgl. Slavin 1995) die gesamte verfügbare Evidenz zur Wirkung sprachsensibler Unterrichtsansätze ausgewertet hat, ohne Beschränkung auf RCT-Designs, ist insbesondere die Aussagekraft der Ergebnisse aus den nicht-experimentellen Studien wegen fehlender statistischer Kontrollmöglichkeiten begrenzt (siehe die Ergebnisse zum SIOP-Ansatz, Abschn. 3.2). Entsprechende Verzerrungspotenziale wurden im Rahmen der methodischen Qualitätsbewertung der Studien aber transparent gemacht (zu Limitationen der angewendeten Bewertungskriterien, vgl. Höfler und Vasylyeva 2023).
4.3 Fazit und Ausblick auf den Ergebnistransfer
Trotz der Limitationen zeigt das systematische Review einen Überblick über international vorliegende empirische Befunde zu einer Vielzahl an weltweit existierenden sprachsensiblen Ansätzen und die Evidenzbewertung und -synthese liefert begründete Hinweise auf die Wirkungen dieser Unterrichtsformen. Die gewonnenen Erkenntnisse bieten eine (Wissens‑)Grundlage für die Gestaltung einer evidenzorientierten Bildungspraxis. So geht etwa aus den ermittelten Studien hervor, dass sich kurz angelegte Lehrkräfte-Trainings (z. B. 2 Tage SIOP-Training) nicht nachweisbar auf Lernleistungen auswirken (vgl. Echevarria et al. 2011, S. 347 f.), was Implikationen für die Ausbildung von Lehrkräften hat. Daneben weisen Ergebnisse von Takala (2006), Adamson et al. (2014) sowie Klingner et al. (1998) darauf hin, dass eine sehr kurze Interventionsdauer sprachsensibler Maßnahmen keine besseren schulischen Leistungen hervorbringt. Um jedoch konkrete, praxisrelevante Empfehlungen aus den Ergebnissen abzuleiten, ist ein ko-konstruktives Vorgehen nötig, dass Beteiligte aus allen Referenzsystemen des Bildungsbereichs integriert, d. h. neben Bildungswissenschaft und -praxis auch aus Bildungsadministration und -politik. In diesem Verständnis und mit Blick auf die relevanten Teilbereiche eines Transfers – Dissemination, Professionalisierung und Implementation (vgl. Becker-Mrotzek et al. 2019, S. 336) – sollte den Bildungsinstitutionen sowie der Bildungsverwaltung beim Transfer der Ergebnisse dann auch nicht nur eine „umsetzende Rolle“ (Gräsel 2010, S. 15) zukommen. Entscheidend für den Erfolg ist letztlich das ko-konstruktive Handeln der beteiligten Gruppen und dass diese ihre jeweiligen Perspektiven bzw. Systemlogiken sinnvoll einbringen (Woerfel et al. 2021; Meyer-Siever et al. 2019, S. 215). Zu den konkreten Aufgaben für die Gestaltung einer evidenzorientierten Bildungspraxis, die auf Erkenntnisse des vorliegenden Reviews rekurrieren kann (die Aufgaben sind durch die verschiedenen o. a. Akteursgruppen zu bewältigen), zählen künftig insbesondere:
-
die Definition von Benchmarks, die festlegen, ab welcher Robustheit bzw. welchem Evidenzlevel die empirischen Befunde zur Wirkung sprachsensibler Ansätze für den Transfer herangezogen werden,
-
die Explorationen der Übertragbarkeit der Erkenntnisse aus anderen Ländern, z. B. auf den deutschsprachigen Raum sowie
-
eine Bestandsaufnahme der bisherigen Professionalisierungs- und Unterrichtsmaßnahmen in den Ländern, um festzustellen, wo bestehende Fortbildungen und Unterrichtspraktiken verändert werden können/müssen und wo es sinnvoll ist, Modellprojekte zu sprachsensiblem Unterricht zu implementieren.
Notes
Kodiert wurden Informationen zu administrativen Studiendetails, zu Population, Intervention, Kontrollmaßnahme, Outcome, Studiendesign und -ergebnis, mit insgesamt 28 Items und je differenzierenden Unterkategorien (z. B. wurde das Alter der Population über Informationen zu Altersspanne, Mittelwert und Standardabweichung je Gruppe erfasst).
Fehlende Informationen konnten mit einer Frist bei den Autoren angefragt und nachträglich in die Beurteilung der Studien einbezogen werden.
Die erste ANOVA-Berechnung von Ardisana (2007, S. 144) zeigt zwar schlechtere Schreib-Leistungen durch SIOP; nach Bereinigung der Datensätze ergibt das finale Berechnungsmodell aber keine Gruppenunterschiede.
Die Studie testet zwei sprachsensible Interventionen; hier wird die monolinguale Intervention berichtet und unter dem Abschnitt zu „Translanguaging“ die bilinguale.
Literatur
Adamson, D., Dyke, G., Jang, H., & Penstein Rosé, C. (2014). Towards an agile approach to adapting dynamic collaboration support to student needs. International Journal of Artificial Intelligence in Education, 24(1), 92–124. https://doi.org/10.1007/s40593-013-0012-6.
Agel, C., Beese, M., & Krämer, S. (2012). Naturwissenschaftliche Sprachförderung. Ergebnisse einer empirischen Studie. Der mathematische und naturwissenschaftliche Unterricht [MNU], 65(1), 36–44.
Akkus, R. (2007). Investigating the changes in teachers’ pedagogical practices through the use of the mathematics reasoning heuristic (MRH) approach. Ames: Iowa State University. https://lib.dr.iastate.edu/rtd/15512?utm_source=lib.dr.iastate.edu%2Frtd%2F15512&utm_medium=PDF&utm_campaign=PDFCoverPages. Zugegriffen: 24. Jan. 2023.
Ardisana, V. L. (2007). Standards-based mathematics strategies for the improvement of academic language: A quasi-experimental study. Flagstaff: Northern Arizona University.
Becker-Mrotzek, M., & Woerfel, T. (2020). Sprachsensibler Unterricht und Deutsch als Zweitsprache als Gegenstand der Lehrerinnen- und Lehrerbildung. In C. Kramer, J. König, M. Rothland & S. Blömeke (Hrsg.), Handbuch Lehrerinnen- und Lehrerbildung (S. 98–104). Bad Heilbrunn: Julius Klinkhardt.
Becker-Mrotzek, M., Roth, H.-J., & Schöneberger, C. (2019). Wirksame Konzepte der sprachlichen Bildung aus dem Versuch in die Fläche transferieren. Konzepte und Erfahrungen aus der Bund-Länder-Initiative „Bildung durch Sprache und Schrift“ (BiSS). Die Deutsche Schule, 3(111), 334–339. https://doi.org/10.31244/dds.2019.03.09.
ter Beek, M., Opdenakker, M.-C., Spijkerboer, A. W., Brummer, L., Ozinga, H. W., & Strijbos, J.-W. (2019). Scaffolding expository history text reading: Effects on adolescents’ comprehension, self-regulation, and motivation. Learning and Individual Differences. https://doi.org/10.1016/j.lindif.2019.06.003.
Best, R. M., Dockrell, J. E., & Braisby, N. (2006). Lexical acquisition in elementary science classes. Journal of Educational Psychology, 98(4), 824–838. https://doi.org/10.1037/0022-0663.98.4.824.
Booth, D. W. (2014). Scaffolding content-area vocabulary instruction for english learners. Middle Tennessee State University. https://jewlscholar.mtsu.edu/bitstream/handle/mtsu/3702/Booth_mtsu_0170E_10265.pdf?sequence=1&isAllowed=y. Zugegriffen: 24. Jan. 2023.
Busse, V. (2019). Umgang mit Mehrsprachigkeit und sprachsensibler Unterricht aus pädagogischer Sicht: Ein einführender Überblick. In M. Butler & J. Goschler (Hrsg.), Sprachsensibler Fachunterricht: Chancen und Herausforderungen aus interdisziplinärer Perspektive (S. 1–34). Wiesbaden: Springer.
Campbell, M., McKenzie, J. E., Sowden, A., Katikireddi, S. V., Brennan, S. E., Ellis, S., Hartmann-Boyce, J., Ryan, R., Shepperd, S., Thomas, J., Welch, V., & Thomson, H. (2020). Synthesis without meta-analysis (SWiM) in systematic reviews: reporting guideline. BMJ. https://doi.org/10.1136/bmj.l6890.
Castek, J. M. (2008). How do 4th and 5th grade students acquire the new literacies of online reading comprehension? exploring the contexts that facilitate learning. Storrs: University of Connecticut.
Castells, N., Solé, I., Luna, C., Lordán, E., Nadal, E., Miras, M., & Espino, S. (2013). Training a primary education teacher to teach expository text comprehension strategies. In J. Arnau (Hrsg.), Reviving Catalan at school: challenges and instructional approaches (S. 72–95). Toronto: Multilingual Matters.
Charamba, E., & Zano, K. (2019). Effects of translanguaging as an intervention strategy in a South African chemistry classroom. Bilingual Research Journal, 42(3), 291–307. https://doi.org/10.1080/15235882.2019.1631229.
Clark, D. B., Touchman, S., Martinez-Garza, M., Ramirez-Marin, F., & Drews, S. T. (2012). Bilingual language supports in online science inquiry environments. Computers & Education, 58(4), 1207–1224. https://doi.org/10.1016/j.compedu.2011.11.019.
Cohen J. (1988). Statistical power analysis for the behavioral sciences. New York: Routledge Academic.
Collen, M. H. (2011). Fifth grade children’s use of Reciprocal Teaching to solve word problems in mathematics. ProQuest LLC. Albany: State University of New York at Albany.
Connolly, T. (2019). Die Förderung vertiefter Lernprozesse durch Sachfachliteralität: Eine vergleichende Studie zum expliziten Scaffolding kognitiver Diskursfunktionen im bilingualen Chemieunterricht am Beispiel des Erklärens</i>. Mainz: Johannes-Gutenberg-Universität Mainz. https://nbn-resolving.org/urn:nbn:de:hebis:77-diss-1000027710. Zugegriffen: 24. Jan. 2023.
Cummins, J. (1979). Linguistic interdependence and the educational development of bilingual children. Review of Educational Research, 49(2), 222–251. https://doi.org/10.3102/00346543049002222.
Dandeles, D. J. (1996). A comparative investigation of Reciprocal Teaching and teacher directed strategies designed to enhance social skills. Chicago: Loyola University Chicago.
Darsono (2015). The application of Reciprocal Teaching on the subject of straight-line equation in second grade of junior high school. Journal of Education and Practice, 6(5), 73–78.
Decristan, J., Hondrich, L. A., Büttner, G., Hertel, S., Klieme, E., Kunter, M., Lühken, A., Adl-Amini, K., Djakovic, S., Mannel, S., Naumann, A., & Hardy, I. (2015). Impact of additional guidance in science education on primary students’ conceptual understanding. The Journal of Educational Research, 108(5), 358–370. https://doi.org/10.1080/00220671.2014.899957.
Dermody, M. M., & Speaker, R. B. (1995). Effects of reciprocal strategy training in prediction, clarification, question generating, and summarization on fourth graders’ reading comprehension. In K. A. Hinchman, D. J. Leu & C. K. Kinzer (Hrsg.), Perspectives on literacy research and practice: Forty-fourth yearbook of the National Reading Conference (S. 190–196). Chicago: National Reading Conference.
Dougherty Stahl, S. K. (2008). The effects of three instructional methods on the reading comprehension and content acquisition of novice readers. Journal of Literacy Research, 40(3), 359–393. https://doi.org/10.1080/10862960802520594.
Dröse, J., & Prediger, S. (2021). Identifying obstacles is not enough for everybody—Differential efficacy of an intervention fostering fifth graders’ comprehension for word problems. Studies in Educational Evaluation. https://doi.org/10.1016/j.stueduc.2020.100953.
Echevarria, J. Effective practices for increasing the achievement of English Learners, www.cal.org/create, http://www.cal.org/create/publications/briefs/pdfs/effective-practices-for-increasing-the-achievement-of-english-learners.pdf (2012).
Echevarria, J., Richards-Tutor, C., Canges, R., & Francis, D. (2011). Using the SIOP model to promote the acquisition of language and science concepts with english learners. Bilingual Research Journal, 34(3), 334–351. https://doi.org/10.1080/15235882.2011.623600.
Echevarria, J. & Short, D. The SIOP Model: A professional development framework for a comprehensive school-wide intervention, www.cal.org/create, http://www.cal.org/create/publications/briefs/pdfs/professional-development-framework.pdf (2011).
Echevarria, J., Short, D., & Powers, K. (2006). School reform and standards-based education: A model for english-language learners. The Journal of Educational Research, 99(4), 195–211. https://doi.org/10.3200/JOER.99.4.195-211.
Echevarria, J., Vogt, M. E., & Short, D. J. (2000). Making content comprehensible for English learners: the SIOP Model. Boston: Pearson Studium.
García, O., & Wei, L. (2014). Translanguaging: Language, bilingualism and education. Basingstoke: Palgrave Macmillan UK.
Gibbons, P. (2002). Scaffolding language, scaffolding learning: Teaching English language learners in the mainstream classroom. Portsmouth: Heinemann.
Gogolin, I., Lange, I., Hawighorst, B., Bainski, C., Heintze, A., Rutten, S., & Saalmann, W. (2011). Durchgängige Sprachbildung: Qualitätsmerkmale für den Unterricht. Münster: Waxmann.
Götze, D., & Baiker, A. (2021). Language-responsive support for multiplicative thinking as unitizing: results of an intervention study in the second grade. ZDM—Mathematics Education, 53(2), 263–275.
van der Graaf, J., van de Sande, E., Gijsel, M., & Segers, E. (2019). A combined approach to strengthen children’s scientific thinking: Direct instruction on scientific reasoning and training of teacher’s verbal support. International Journal of Science Education, 41(9), 1119–1138. https://doi.org/10.1080/09500693.2019.1594442.
Gräsel, C. (2010). Stichwort: Transfer und Transferforschung im Bildungsbereich. Zeitschrift für Erziehungswissenschaft, 13(1), 7–20. https://doi.org/10.1007/s11618-010-0109-8.
Griese, A. E. (2018). Emergent bilingual classroom instruction, teacher preparation, and teachers’ perceptions of instructional support. Vermillion: University of South Dakota.
Hancock, J. W. (2012). The effect of Reciprocal Teaching Plus across three content areas on reading comprehension in seventh and eighth grade students. ProQuest LLC. Minneapolis: Walden University.
Härtig, H., & Stosik, T. (2015). Wortschatztraining im Physikunterricht. Der mathematische und naturwissenschaftliche Unterricht, 68(3), 155–158.
Herman, J. L., Epstein, S., Leon, S., Dai, Y., Matrundola, D. L. T., Reber, S., & Choi, K. (2015). The implementation and effects of the Literacy Design Collaborative (LDC): Early findings in eighth-grade history/social studies and science courses (CRESST Report No. 848). National Center for Research on Evaluation, Standards, and Student Testing. http://cresst.org/publications/cresst-publication-3217/e. Zugegriffen: 24. Jan. 2023.
Hitchcock, J., Dimino, J., Kurki, A., Wilkins, C., & Gersten, R. (2011). The impact of Collaborative Strategic Reading on the reading comprehension of grade 5 students in linguistically diverse schools. Washington, DC: U. S. Department of Education. https://ies.ed.gov/ncee/. Zugegriffen: 24. Jan. 2023.
Höfler, M., & Vasylyeva, T. (2023). Studienbewertung in systematischen Reviews der Bildungsforschung – Kriterien zur Einschätzung der internen Validität von Interventionsstudien. Zeitschrift für Erziehungswissenschaft. https://doi.org/10.1007/s11618-023-01160-0.
Höfler, M., Woerfel, T., Vasylyeva, T., & Twente, L. Systematisches Review zur Wirkung von didaktisch-methodischen Ansätzen des sprachsensiblen Unterrichts (Langfassung des Projektberichts). Köln: Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache. in Vorbereitung
Huber, A. A. (2007). How to add qualitative profundity to quantitative findings in a study on cooperative learning. In P. Mayring, G. L. Huber, L. Gürtler & M. Kiegelmann (Hrsg.), Mixed methodology in psychological research (S. 179–190). Rotterdam: Sense Publishers.
Ingram, S. W. (2017). Analysis of the sheltered instruction observation protocol model on academic performance of English language learners. Minneapolis: Capella University.
Kempert, S., Edele, A., Rauch, D., Wolf, K. M., Paetsch, J., Darsow, A., Maluch, J., & Stanat, P. (2016). Die Rolle der Sprache für zuwanderungsbezogene Ungleichheiten im Bildungserfolg. In C. Diehl, C. Hunkler & C. Kristen (Hrsg.), Ethnische Ungleichheiten im Bildungsverlauf: Mechanismen, Befunde, Debatten (S. 157–241). Wiesbaden: Springer.
van Keulen, H., & Boendermaker, C. (2020). Contributing to reading comprehension through Science and Technology education. Design and Technology Education, 25(2), 117–142.
King, C. M., & Parent Johnson, P. L. M. (1999). Constructing meaning via reciprocal teaching. Reading Research and Instruction, 38(3), 169–186.
Klingner, J., Vaughn, S., & Schumm, J. S. (1998). Collaborative strategic reading during social studies in heterogeneous fourth-grade classrooms. The Elementary School Journal, 99(1), 3–22. https://doi.org/10.1086/461914.
Klingner, J. K., Vaughn, S., Dimino, J., Schumm, J. S., & Bryant, D. P. (2001). From clunk to click. Collaborative strategic reading. Longmont: Sopris West.
Kniffka, G. (2012). Scaffolding – Möglichkeiten, im Fachunterricht sprachliche Kompetenzen zu vermitteln. In M. Michalak & M. Kuchenreuther (Hrsg.), Grundlagen der Sprachdidaktik Deutsch als Zweitsprache (S. 208–225). Baltmannsweiler: Schneider Verlag Hohengehren.
Kultusministerkonferenz (KMK) (2001). 296. Plenarsitzung der Kultusministerkonferenz am 05./06. Dezember 2001 in Bonn. https://www.kmk.org/aktuelles/artikelansicht/296-plenarsitzung-der-kultusministerkonferenz-am-0506dezember-2001-in-bonn.html. Zugegriffen: 24. Jan. 2023.
Larrain, A., Howe, C., & Freire, P. (2017). “More is not necessarily better”: Curriculum materials support the impact of classroom argumentative dialogue in science teaching on content knowledge. Research in Science & Technological Education, 36(3), 282–301. https://doi.org/10.1080/02635143.2017.1408581.
Lederer, J. M. (1997). Reciprocal Teaching of social studies in inclusive elementary classrooms. Annual Meeting of the American Educational Research Association, Chicago. https://files.eric.ed.gov/fulltext/ED418047.pdf. Zugegriffen: 24. Jan. 2023
Leisen, J. (2013). Handbuch Sprachförderung im Fach. Sprachsensibler Fachunterricht in der Praxis. Stuttgart: Klett.
Lindauer, T., Schmellentin, C., Beerenwinkel, A., Hefti, C., & Furger, J. (2013). Sprachbewusst unterrichten: Eine Unterrichtshilfe für den Fachunterricht – Zentrum Lesen. Aarau: Bildungsraum Nordwestschweiz. https://web0.fhnw.ch/plattformen/zl/sprachbewusst-unterrichten/. Zugegriffen: 24 Jan. 2023
McIntyre, E., Kyle, D., Chen, C.-T., Muñoz, M., & Beldon, S. (2010). Teacher learning and ELL reading achievement in sheltered instruction classrooms: Linking professional development to student development. Literacy Research and Instruction, 49(4), 334–351. https://doi.org/10.1080/19388070903229412.
Mercer, N., & Sams, C. (2006). Teaching children how to use language to solve maths problems. Language and Education, 20(6), 507–528.
Mercer, N., Dawes, L., Wegerif, R., & Sams, C. (2004). Reasoning as a scientist: Ways of helping children to use language to learn science. British Educational Research Journal, 3, 359–378.
Meyer-Siever, K., Schorcht, S., & Buchholtz, N. (2019). Zwischen Wissenschaft und Schulpraxis vermitteln – die ‚TranSphere‘ als Innovationspool und Vermittler von Transferwissen. In N. N. Buchholtz, M. Barnat, E. Bosse, T. Heemsoth, K. Vorhölter & J. Wibowo (Hrsg.), Praxistransfer in der tertiären Bildungsforschung. Modelle, Gelingensbedingungen und Nachhaltigkeit (S. 211–222). Hamburg: Hamburg University Press.
Mücke, S. (2007). Einfluss personeller Eingangsvoraussetzungen auf Schülerleistungen im Verlauf der Grundschulzeit. In K. Möller, P. Hanke, C. Beinbrech, A. K. Hein, T. Kleickmann & R. Schages (Hrsg.), Qualität von Grundschulunterricht: entwickeln, erfassen und bewerten (S. 277–280). Wiesbaden: VS.
Özcan, N. (2012). Zum Einfluss der Fachsprache auf die Leistung im Fach Chemie. Eine Förderstudie zur Fachsprache im Chemieunterricht. Duisburg: Universität Duisburg-Essen. https://duepublico2.uni-due.de/servlets/MCRFileNodeServlet/duepublico_derivate_00032668/Dissertation_Oezcan_2012_Publikation.pdf. Zugegriffen: 24. Jan. 2023.
Paeplow, C. (2011). District improvement outcomes: 2010–11. Cary: Wake County Public School.
Paetsch, J., Wolf, K. M., Stanat, P., & Darsow, A. (2014). Sprachförderung von Kindern und Jugendlichen aus Zuwandererfamilien. Zeitschrift für Erziehungswissenschaft, 17(2), 315–347. https://doi.org/10.1007/s11618-013-0474-1.
Palinscar, A. S., & Brown, A. L. (1984). Reciprocal Teaching of comprehension-fostering and monitoring activities. Cognition and Instruction, 1(2), 117–175. https://doi.org/10.1207/s1532690xci0102_1.
Petticrew, M., & Roberts, H. (2006). Systematic reviews in the social sciences: a practical guide. Oxford: Wiley-Blackwell.
van de Pol, J., Volman, M., & Beishuizen, J. (2010). Scaffolding in teacher–student interaction: A decade of research. Educational Psychology Review, 22(3), 271–296. https://doi.org/10.1007/s10648-010-9127-6.
Prediger, S., & Neugebauer, P. (2021). Can students with different language backgrounds profit equally from a language-responsive instructional approach for percentages? Differential effectiveness in a field trial. Mathematical Thinking and Learning, 21, 2–22. https://doi.org/10.1080/10986065.2021.1919817.
Prediger, S., & Wessel, L. (2013). Fostering German language learners’ constructions of meanings for fractions – Design and effects of a language- and mathematics-integrated intervention. Mathematics Education Research Journal, 25 (3), 435–456.
Prediger, S., & Wessel, L. (2018). Brauchen mehrsprachige Jugendliche eine andere fach- und sprachintegrierte Förderung als einsprachige? Differentielle Analysen zur Wirksamkeit zweier Interventionen in Mathematik. Zeitschrift für Erziehungswissenschaft, 21(2), 361–382. https://doi.org/10.1007/s11618-017-0785-8.
Qohar, A., & Sumarmo, U. (2013). Improving mathematical communication ability and self regulation learning of Junior High students by using Reciprocal Teaching. Indonesian Mathematical Society Journal on Mathematics Education, 4(1), 59–74.
Read, F. D. (2009). The impact of the Sheltered Instruction Observation Protocol (SIOP) on the instructional practices of elementary school teachers and on the reading achievement of English language learners. New Castle: Wilmington University Delaware.
Reiss, K., Weis, M., Klieme, E., & Köller, O. (2019). PISA 2018: Grundbildung im internationalen Vergleich. Münster: Waxmann.
Rous, M. (2016). Fachsprache im Biologieunterricht: Förderung von konzeptuellem Lernen und Textverstehen durch fachspezifisch-sprachsensible Aufgaben. Berlin: Logos.
Rule, A. C., & Barrera, M. T. III (2008). Three authentic curriculum-integration approaches to bird adaptations that incorporate technology and thinking skills. https://www.researchgate.net/publication/234758916_Three_Authentic_Curriculum-Integration_Approaches_to_Bird_Adaptations_That_Incorporate_Technology_and_Thinking_Skills/stats. Zugegriffen: 24. Jan. 2023.
Schneider, W., Baumert, J., Becker-Mrotzek, M., Hasselhorn, M., Kammermeyer, G., Rauschenbach, T., Roßbach, H.-G., Roth, H.-J., Rothweiler, M., & Stanat, P. (2012). Expertise: Bildung durch Sprache und Schrift (BISS). https://www.bildungsserver.de/onlineressource.html?onlineressourcen_id=49601. Zugegriffen: 24. Jan. 2023.
Schüler-Meyer, A., Prediger, S., Kuzu, T., Wessel, L., & Redder, A. (2019). Is formal language proficiency in the home language required to profit from a bilingual teaching intervention in mathematics? A mixed methods study on fostering multilingual students’ conceptual understanding. International Journal of Science and Mathematics Education, 17(2), 317–339. https://doi.org/10.1007/s10763-017-9857-8.
Shi, Y., Matos, F., & Kuhn, D. (2019). Dialog as a bridge to argumentative writing. Journal of Writing Research, 11(1), 107–129.
Short, D., Echevarria, J., & Richards-Tutor, C. (2011). Research on academic literacy development in sheltered instruction classrooms. Language Teaching Research, 15(3), 363–380. https://doi.org/10.1177/1362168811401155.
Short, D. J., Fidelman, C. G., & Louguit, M. (2012). Developing academic language in English language learners through sheltered instruction. TESOL Quarterly, 46(2), 334–361. https://doi.org/10.1002/tesq.20.
Skujins, M. (2014). The sheltered instruction observation protocol (SIOP) and the English language and academic development of elementary school English learners. Stanislaus: California State University.
Slavin, R. E. (1995). Best evidence synthesis: an intelligent alternative to meta-analysis. Journal of Clinical Epidemiology, 48(1), 9–18.
Swanson H. L., & Lussier, C. M. (2001). A selective synthesis of the experimental literature on dynamic assessment. Review of Educational Research, 71(2), 321–363. https://doi.org/10.3102/00346543071002321.
Takala, M. (2006). The effects of Reciprocal Teaching on reading comprehension in mainstream and special (SLI) education. Scandinavian Journal of Educational Research, 50(5), 559–576. https://doi.org/10.1080/00313830600953824.
Taylor, B. M., & Frye, B. J. (1992). Comprehension strategy instruction in the intermediate grades. Reading Research and Instruction, 32(1), 39–48. https://doi.org/10.1080/19388079209558104.
Taylor, J., & Cox, B. D. (1997). Microgenic analysis of group-based solution of complex two-step mathematical word problems by fourth graders. Journal of the Learning Sciences, 6(2), 183–226. https://doi.org/10.1207/s15327809jls0602_2.
Twente, L., & Woerfel, T. (2020). Implementing Text Mining to Optimize Search Strategies in Systematic Reviews [Poster zur LERN-Jahrestagung 2020, Tagung abgesagt]. Frankfurt a. M. https://www.researchgate.net/publication/340061079_Implementing_Text_Mining_to_Optimize_Search_Strategies_in_Systematic_Reviews_Der_Einsatz_von_Text_Mining-Verfahren_zur_Optimierung_von_Suchanweisungen_in_systematischen_Reviews. Zugegriffen: 20. Juni 2023.
Vasylyeva, T., Woerfel, T., Twente, L., & Höfler, M. Effectiveness of language-sensitive subject teaching: heterogeneity and quality of the evidence and implications for future research (in Vorbereitung).
Vidot, J. L. (2011). The Efficacy of Sheltered Instruction Observation Protocol (SIOP) in Mathematics Instruction on English Language Learner Students. ProQuest LLC. Walden University. https://scholarworks.waldenu.edu/dissertations/943. Zugegriffen: 24. Jan. 2024.
Vygotsky, L. S. (1964). Thought and language. Bulletin of the Orton Society, 14(1), 97–98.
Wessel, L. (2015). Fach- und sprachintegrierte Förderung durch Darstellungsvernetzung und Scaffolding. Wiesbaden: Springer.
What Works Clearinghouse (2009). Sheltered instruction observation protocol (SIOP). What Works Clearinghouse Intervention Report. Institute of Education Sciences. https://files.eric.ed.gov/fulltext/ED505688.pdf. Zugegriffen: 24. Jan. 2023.
What Works Clearinghouse (2013). Sheltered instruction observation protocol (SIOP). What Works Clearinghouse Intervention Report. Institute of Education Sciences. https://ies.ed.gov/ncee/wwc/Docs/InterventionReports/wwc_siop_022013.pdf. Zugegriffen: 24. Jan. 2023.
Wirtz, M., & Caspar, F. (2002). Beurteilerübereinstimmungen und Beurteilerreliabilität. Methoden zur Bestimmung und Verbesserung der Zuverlässigkeit von Einschätzungen mittels Kategoriensystemen und Ratingskalen. Göttingen: Hogrefe.
Woerfel, T., Höfler, M., Witte, A., Knaus, A., Twente, L., Wanka, R., & Becker-Mrotzek, M. (2020). Protokoll: Systematisches Review zur Wirkung von didaktisch-methodischen Ansätzen des sprachsensiblen Unterrichts. Universität zu Köln: Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache. https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&cad=rja&uact=8&ved=2ahUKEwioifiqr-D8AhVM3KQKHX6hDcwQFnoECA0QAQ&url=https%3A%2F%2Fwww.mercator-institut-sprachfoerderung.de%2Ffileadmin%2FRedaktion%2FPDF%2FForschung%2FProtokoll_WisU_29-04-2020.pdf&usg=AOvVaw2GROl-pjxQHmFAFLRmS9hy. Zugegriffen: 20. Juni 2023.
Woerfel, T., Zimmer, K., & Witte, A. (2021). Evidenzinformierte Bildungspolitik und Bildungspraxis: Das Potenzial von Forschungssynthesen. In D. Kemethofer, J. Reitinger & K. Soukup-Altrichter (Hrsg.), Vermessen? Zum Verhältnis von Bildungsforschung, Bildungspolitik und Bildungspraxis (S. 161–176). Münster: Waxmann.
Zubaidah, S., Mahanal, S., Sholihah, M., Rosyida, F., & Kurniawati, Z. L. (2020). Using Remap RT (reading—concept mapping—Reciprocal Teaching) learning model to improve low-ability students’ achievement in biology. Center for Educational Policy Studies Journal, 10(3), 117–144. https://doi.org/10.26529/cepsj.777.
Förderung
Das berichtete Forschungsprojekt, an dem die Autor:innen mitgewirkt haben, wurde am Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache der Universität zu Köln durchgeführt und von diesem Institut finanziert.
Funding
Open Access funding enabled and organized by Projekt DEAL.
Author information
Authors and Affiliations
Corresponding author
Ethics declarations
Interessenkonflikt
M. Höfler, T. Woerfel, T. Vasylyeva und L. Twente geben an, dass kein Interessenkonflikt besteht.
Additional information
Hinweis des Verlags
Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.
Rights and permissions
Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.
Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.
Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/licenses/by/4.0/deed.de.
About this article
Cite this article
Höfler, M., Woerfel, T., Vasylyeva, T. et al. Wirkung sprachsensibler Unterrichtsansätze – Ergebnisse eines systematischen Reviews. Z Erziehungswiss 27, 449–495 (2024). https://doi.org/10.1007/s11618-023-01214-3
Received:
Revised:
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1007/s11618-023-01214-3
Schlüsselwörter
- Sprachsensible Unterrichtsansätze
- Systematisches Review
- Wirkung
- Forschungssynthese
- Primar- und Sekundarbereich