1 Theoretischer Hintergrund

Um eine Grundlage für die theoretischen Aspekte der in diesem Artikel beschriebenen Studie zu schaffen, wird im Folgenden zunächst die Rolle von Sprache allgemein für den Fachunterricht (Abschn. 1.1) und daran anschließend den Mathematikunterricht (Abschn. 1.2) mit textbasierten Aufgabenbearbeitungsprozessen als zentrale Sprachhandlungen dargelegt. Hieran anschließend erfolgt die Darlegung des Konzepts eines sprachsensiblen Fachunterrichts (Abschn. 1.3), der sich der Interdependenzen von sprachlichen und fachlichen Leistungen bewusst ist, indem aktuell diskutierte wenn auch nur bedingt empirisch erprobte Prinzipien für einen solchen Unterricht erläutert werden. Abschließend werden für den Bereich des Mathematikunterrichts, in dem erst wenige Studien zu sprachsensiblen Ansätzen bezüglich ihrer Wirksamkeit evaluiert und publiziert worden sind, diesbezügliche Forschungsdesiderata herausgearbeitet (Abschn. 1.4). Aus diesen werden dann die Ziele des BISS-Programmes bzw. die Forschungsfragen der in diesem Beitrag vorgestellten Teilstudie des EvaFa-Projekts abgeleitet.

1.1 Sprache und Fachunterricht

Seit einigen Jahren erhält die Berücksichtigung von Sprachsensibilität in allen Unterrichtsfächern erhöhte Aufmerksamkeit (vgl. u. a. Schmölzer-Eibinger et al. 2013), sei es in der universitären Aus- und Fortbildung von Lehrkräften oder im Rahmen wissenschaftlicher Forschung (Becker-Mrotzek et al. 2013; Leiss et al. 2017; Koch-Priewe und Krüger-Potratz 2016; Michalak 2014). Dies hängt insbesondere mit den Ergebnissen (inter-)national vergleichender Schulleistungsstudien wie PISA oder DESI zusammen. Hierbei zeigten sich für bestimmte Gruppen deutlich geringere sprachliche Kompetenzen, die wiederum Bildungsbenachteiligung in den Fachleistungen bedingen. Auffallend waren die geringen sprachlichen Leistungen von Schülerinnen und Schülern mit Migrationshintergrund (z. B. Stanat et al. 2010), aber auch die diesbezüglichen Defizite einer relativ großen Gruppe von Schülerinnen und Schülern mit Deutsch als Muttersprache (Naumann et al. 2010). Diese unterschiedlichen Sprachkompetenzen gehen mit Heterogenitätsmerkmalen wie z. B. dem sozioökonomischen Hintergrund (SES) einher, der maßgeblich für die Sprachkompetenz bei Eintritt in die Schule verantwortlich ist und damit einen wichtigen Einflussfaktor für die Bewältigung der sprachlichen Anforderungen in der Schule und den damit verbundenen Bildungserfolg darstellt (Ahrenholz 2017; Walzeburg 2014).

Darüber hinaus weisen zahlreiche andere Forschungsergebnisse darauf hin, dass der Erwerb von fachlichen Kompetenzen und schulischer Erfolg eng mit sprachlichen Fähigkeiten verknüpft sind und Sprachförderung zur Ermöglichung bildungssprachlich gestützten Lernens als Schlüssel zum Erwerb solcher Kompetenzen dienen kann (Becker-Mrotzek et al. 2013). Entsprechend wurde zum Beispiel in einem Erlass Nordrhein-Westfalens, wo der in diesem Artikel analysierte Sprachverbund liegt, die Förderung der deutschen Sprache als Aufgabe des Unterrichts in allen Fächern bezeichnet (Ministerium für Schule und Weiterbildung et al. 1999). In den letzten Jahren sind zwar mittels Konzepten durchgängiger Sprachbildung (z. B. Gogolin und Lange 2011) oder sprachsensiblen Fachunterrichts (z. B. Michalak et al. 2015) erste Ansätze entstanden, um den reflexiven und produktiven Umgang mit Texten, aber auch die Entwicklung und Übung von Lesestrategien im Fachunterricht zu konkretisieren, diese werden jedoch erst in Grundzügen in den Schulen umgesetzt (Becker-Mrotzek et al. 2012). Insbesondere zur Förderung von Kindern und Jugendlichen mit Migrationshintergrund existieren bereits eine Vielzahl an Unterstützungsmaßnahmen in den Schulen (siehe Überblick bei Redder et al. 2010), diese basieren jedoch selten auf theoretisch fundierten und empirisch evaluierten Förderkonzepten (Limbird und Stanat 2006).

1.2 Sprache und Mathematikunterricht

Für den Mathematikunterricht liegen vielfältige empirische Befunde dafür vor, dass Fachleistungen signifikant mit der allgemeinen Sprachkompetenz und der Textverstehensleistung zusammenhängen (Duarte et al. 2011; Paetsch et al. 2016; Plath und Leiss 2018; Prediger et al. 2015; Vukovic und Lesaux 2013). Gründe hierfür liegen in den bildungs- und fachsprachlichen Anforderungen des Fachs Mathematik, etwa mit Blick auf das Lesen und Verstehen von Aufgabentexten im Mathematikunterricht (Leiss et al. 2010). Sprachliche Fähigkeiten sind aber auch für den diskursiven Aufbau von Mathematikkompetenz von zentraler Bedeutung. Die Komplexität an zu bewältigenden sprachlichen Anforderungen wird durch die Betrachtung der bivalenten Funktion von Sprache im Mathematikunterricht deutlich: Einerseits dient Sprache in ihrer kommunikativen Funktion als zentrales mündliches und schriftliches Lernmedium und andererseits in ihrer kognitiven Funktion als Werkzeug des Verstehens und Denkens (Maier und Schweiger 1999; Morek und Heller 2012). Zusätzlich ist Sprache im Mathematikunterricht nicht nur Lernmedium, sondern auch Lerngegenstand, da eine Vielzahl an fachspezifischen Wörtern und Redemitteln die Voraussetzung zum Aufbau mathematischen Wissens und mathematischer Fertigkeiten bildet (Pimm 1987).

Längsschnittstudien deuten außerdem auf die kausalen Wirkungen von Sprachkompetenzen hin, wie beispielsweise die Studie von Mücke (2007), die gezeigt hat, dass die allgemeine mündliche Sprachkompetenz von Schülerinnen und Schülern bei Schuleintritt einen signifikanten Einfluss auf die mathematische Kompetenz am Ende der Grundschule hat. Insbesondere für die Bearbeitung von realitätsbezogenen Textaufgaben haben sich sprachliche Kompetenzen als wichtiger Prädiktor für eine korrekte Lösung der Aufgabe erwiesen (Abedi 2006; Heinze et al. 2011; Prediger et al. 2015).

1.2.1 Sprachkompetenz als potentielle Hürde beim Verstehen mathematischer Textaufgaben

Die Bearbeitung von realitätsbezogenen Textaufgaben wird als mathematisches Modellieren bezeichnet und ist weltweit als Kompetenz in den Bildungsstandards der Sekundarstufe I zahlreicher Länder verankert (z. B. Leiss und Blum 2006; NCTM 2000; Niss 2003). Im Vergleich zu spracharmen innermathematischen Aufgaben weisen realitätsbezogene Aufgaben in der Regel deutlich geringere Lösungshäufigkeiten und ein größeres Schwierigkeitspotential auf (Abedi und Leon 1999; für einen Überblick siehe Verschaffel et al. 2000), u. a. weil sie neben mathematischen Fähigkeiten insbesondere auch das Verstehen des sprachlichen Aufgabentextes sowie der beschriebenen Aufgabensituation erfordern (Leiss et al. 2010, 2019; Paetsch et al. 2016; Prediger et al. 2015). Ein Modell für die Beschreibung der Bearbeitung solcher realitätsbezogenen Aufgaben stellen Modellierungskreisläufe dar, die zentrale kognitive Elemente des Lösungsprozesses beinhalten. Ein Beispiel für einen solchen ist der siebenschrittige Kreislauf von Blum und Leiss (2005):

  1. 1.

    Bildung eines Situationsmodells durch das Verstehen des Aufgabentextes

  2. 2.

    Bildung eines Realmodells durch das Vereinfachen und Strukturieren der Textinformationen

  3. 3.

    Bildung eines mathematischen Modells durch einen Mathematisierungsprozess

  4. 4.

    Errechnung von mathematischen Resultaten

  5. 5.

    Bildung von realen Resultaten durch die Interpretation der mathematischen Resultate

  6. 6.

    Validierung der Ergebnisse

  7. 7.

    Darlegung der Ergebnisse

Aus zahlreichen Studien ist bekannt, dass diese Bearbeitungsschritte, auch wenn sie nur bedingt in dieser Reihenfolge in realen Modellierungsprozessen durchlaufen werden, wesentliche kognitive Anforderungen enthalten und entsprechend für Schülerinnen und Schüler potentielle Hürden darstellen können (Galbraith und Stillman 2006). Insbesondere der erste Schritt, das Lesen und Verstehen des Aufgabentextes, bereitet vielen Schülerinnen und Schülern Probleme und kann zu Schwierigkeiten und Fehlern in der restlichen Aufgabenbearbeitung führen (Clarkson 1991; Mayer und Hegarty 1996; Wijaya et al. 2014).

1.2.2 Sprachkompetenzen, Sprachsozialisation und mathematische Leistungen

In diesem Kontext wird besonders relevant, dass Publikationen im Rahmen international vergleichender Schulleistungsstudien vermehrt beschrieben haben, dass Schülerinnen und Schüler mit Migrationshintergrund niedrigere Leistungen im mathematischen Bereich erzielen und somit auch geringere Bildungserfolge erreichen als Schülerinnen und Schüler ohne Migrationshintergrund (z. B. Gebhardt et al. 2013; Wendt et al. 2016). Dabei zeigen verschiedene Studien, dass die geringeren Leistungen im Fach Mathematik von Schülerinnen und Schülern durch die Merkmale Nationalität, Migrationshintergrund, Nichtpassung von Familien- und Schulsprache, sozioökonomischer Hintergrund sowie Lesekompetenz erklärt werden können (siehe für einen Literaturüberblick Prediger et al. 2015). Insbesondere bei der Bearbeitung mathematischer Textaufgaben existieren signifikante Differenzen in den Lösungsraten zwischen Schülerinnen und Schülern mit und ohne Migrationshintergrund, welche sich jedoch nicht auf z. B. unterschiedliche kulturelle Erfahrungen zurückführen lassen, sondern vielmehr mit den sprachlichen Fähigkeiten der Schülerinnen und Schüler zusammenhängen (Heinze et al. 2007). Ergänzend hierzu konnte sowohl in Untersuchungen von Prediger et al. (2015) als auch von Plath und Leiss (2018) gezeigt werden, dass für alle Schülerinnen und Schüler neben dem fachlichen Vorwissen die allgemeine Sprachkompetenz unter einer Vielzahl anderer soziodemographischer und sprachlich-biographischer Faktoren den wichtigsten Prädiktor für die korrekte Lösung von Textaufgaben darstellt und die Merkmale sozioökonomischer Hintergrund sowie Migrationshintergrund keine guten Prädiktoren für die Kompetenzen in der deutschen Sprache darstellen. Mit einer Längsschnittuntersuchung arbeiteten Paetsch und Felbrich (2016) neben dem Zusammenhang zwischen Sprach- und mathematischer Modellierungskompetenz weiterhin heraus, dass diejenigen Schülerinnen und Schüler mit niedriger Lesekompetenz durch eine Verbesserung ihrer Lese- und Grammatikfähigkeiten auch ihre Modellierungsleistung steigern konnten.

1.3 Sprachsensibler Fachunterricht

Damit auch den Schülerinnen und Schülern mit geringen sprachlichen Ausgangsvoraussetzungen der Zugang zu bildungssprachlichen Ressourcen und fachliches Lernen ohne sprachliche Schwierigkeiten ermöglicht werden, ist es entsprechend den obigen Ausführungen notwendig, in jedem Fachunterricht Sprachsensibilität zu fokussieren. Bei der Frage, wie diese Sprachsensibilität im Fachunterricht konzeptualisiert werden kann, sind insbesondere zwei Ansätze zentral.

1.3.1 Das LRT-Framework

Im US-amerikanischen Raum bietet das Framework for Preparing Linguistically Responsive Teachers (LRT-Framework) von Lucas und Villegas (2011) einen theoretischen Rahmen für die Ausbildung von Lehrkräften mit Blick auf die Förderung im Umgang mit sprachlicher Heterogenität und die Unterstützung von mehrsprachigen Schülerinnen und Schülern. Im Rahmenkonzept werden dabei die Einstellungen der Lehrkräfte (soziolinguistische Bewusstheit, Wertschätzung sprachlicher Vielfalt, Bereitschaft zum Einsatz für Zweitsprachlernende) sowie ihr Wissen und ihre Fähigkeiten (z. B. Wissen bezüglich des Zweitspracherwerbs, Fähigkeit, sprachliche Hürden im Unterricht zu erkennen oder Scaffolding-Maßnahmen) als relevante Faktoren herausgestellt (Lucas und Villegas 2011). Dieses Konzept verbleibt jedoch bisher auf einer normativ-theoretischen Ebene und bedarf erst noch der empirischen Evaluation.

1.3.2 Prinzipien eines sprachsensiblen Fachunterrichts

Im deutschsprachigen Raum wird die Forderung nach einer Sprachsensibilisierung in allen Unterrichtsfächern durch Konzepte der durchgängigen Sprachbildung (z. B. Gogolin und Lange 2011) umgesetzt. Diese greifen Aspekte des LRT-Modells auf, sind aber insbesondere dadurch gekennzeichnet, dass eine systematische Auseinandersetzung mit den sprachlichen Anforderungen der fachlichen Lerngegenstände mit den Voraussetzungen, die die Schülerinnen und Schüler zur Bewältigung benötigen und bereits mitbringen, einhergeht. Auch wenn es bisher noch wenige empirisch erprobte Erkenntnisse im Bereich des sprachsensiblen Unterrichts gibt, können zumindest theoretisch plausible Leitlinien formuliert werden, die beschreiben, wie Fachunterricht dazu beitragen kann, sprachliche Kompetenzen der Schülerinnen und Schüler mehr in den Blick zu nehmen und (fach-)spezifisch zu fördern. So schlagen z. B. Schmölzer-Eibinger et al. (2013) sieben Prinzipien vor, die dazu beitragen sollen, Sprache als Medium des Lernens bei der Planung und Umsetzung von Fachunterricht bewusst zu berücksichtigen:

  1. 1.

    Integriertes Sprach- und Fachlernen (Sprachverwendung der Schülerinnen und Schüler beobachten und Unterstützungen anbieten; inhaltliche Verstehens- und Lernprozesse durch gezielte Spracharbeit unterstützen)

  2. 2.

    Sprachaufmerksamkeit und Sprachbewusstheit (präzises und bewusst gestaltetes sprachliches Handeln, Bewusstmachen und Reflektieren von sprachlichen Phänomenen, Begriffen oder Strukturen)

  3. 3.

    Aktives Sprachhandeln und Interaktion (Anregungen zum aktiven sprachlichen Handeln schaffen; authentische Sprachanlässe schaffen)

  4. 4.

    Transparenz von sprachlichen Anforderungen (neben fachlichen werden auch sprachliche Lernziele expliziert)

  5. 5.

    Systematische sprachliche Unterstützung (zum Beispiel durch die Lehrmethode des Scaffoldings)

  6. 6.

    Fokus auf Schriftsprachlichkeit (Förderung der Produktion längerer, kohärenter mündlicher Äußerungen und schriftlicher Texte)

  7. 7.

    Fokus auf Textarbeit (Vermittlung von Schreib- und Lesestrategien und Förderung der Auseinandersetzung mit längeren Texten)

Diese Prinzipien finden sich in ähnlicher Form in verschiedenen Veröffentlichungen (z. B auch Leisen 2010; Michalak et al. 2015), wurden bisher jedoch empirisch dahingehend nicht überprüft, in welcher Form sich ein solcher sprachsensibler Fachunterricht auf die Wahrnehmung des Fachunterrichts durch Schülerinnen und Schüler oder ihre fachlichen Leistungen auswirkt.

1.4 Sprachsensibler Mathematikunterricht

Um das Überwinden sprachlicher Barrieren zu ermöglichen und Schülerinnen und Schülern weitestgehend unabhängig von ihren familiären und sozialen Hintergründen langfristig gleiche Bildungsperspektiven eröffnen zu können, muss auch der Mathematikunterricht derartig sprachsensibel (siehe Abschn. 1.3.2) gestaltet werden und um Konzepte zur fachspezifischen Förderung von Sprach- und Textkompetenz erweitert werden (Leiss et al. 2017). Die Planung von mathematischen Förderprozessen, die sprachliche Facetten (z. B. epistemisches Schreiben, Explizierung fachsprachlicher Spezifika, sprachliche Verständlichkeit, Umgang mit Sprachfehlern etc.) berücksichtigen sowie die (Weiter‑)Entwicklung von sprachförderlichen Materialien für den Mathematikunterricht wurde jedoch bisher kaum systematisch dokumentiert und in einen empirischen Zusammenhang mit fachlichen Leistungen von Schülerinnen und Schülern gesetzt. Allerdings lassen sich die bisher bestehenden Ansätze, die als Zielsetzung die Verringerung von sprachlichen Barrieren im Mathematikunterricht (der Sekundarstufe I) verfolgen, grundsätzlich in defensive und offensive Ansätze differenzieren.

1.4.1 Defensive Ansätze der Sprachförderung im Mathematikunterricht

Unter defensiven Ansätzen werden diejenigen Ansätze zusammengefasst, die sprachliche Hürden reduzieren oder vermeiden, sodass die Schülerinnen und Schüler Textaufgaben in einer vereinfachten Sprache bearbeiten. Verschiedene Studien deuten zwar an, dass Textaufgaben mit vielen sprachlich komplexen Anforderungen für Schülerinnen und Schülern mit Migrationshintergrund deutlich schwerer zu lösen sind und zu niedrigeren Lösungsraten führen (Abedi et al. 2008; Haag et al. 2013; Martiniello 2009; Shaftel et al. 2006; Wolf und Leon 2009), aktuelle Untersuchungen zeigen jedoch auch, dass die sprachliche Vereinfachung von Aufgaben nicht zwingend zu höheren Lösungsraten führen muss bzw. dass die Differenzen zwischen intendiert sprachlich komplexen und sprachlich einfacheren Aufgaben deutlich geringer sind als angenommen (Plath und Leiss 2018; Prediger et al. 2015).

1.4.2 Offensive Ansätze der Sprachförderung im Mathematikunterricht

Bei offensiven Ansätzen hingegen steht nicht die Reduktion von sprachlichen Herausforderungen im Mittelunkt. Vielmehr werden diese bewusst zu Lerngegenständen gemacht und Unterstützungsmaßnahmen oder Strategietrainings diesbezüglich entwickelt (Rösch und Paetsch 2011). Während sich defensive Ansätze kurzfristig für schriftliche Testsituationen eignen mögen, fokussieren offensive Ansätze eher den langfristigen Kompetenzerwerb. Bezüglich der in Abschn. 1.3.2 genannten Prinzipien für einen sprachsensiblen Unterricht lassen sich für den Mathematikunterricht Arbeiten im Bereich der Grundlagenforschung (zu Lese- und Schreibprozessen im Fachunterricht sowie zur Spezifik der mathematischen Fachsprache) sowie erste systematische Trainings und Einzelmaßnahmen zur Sprachförderung finden, es fehlen jedoch größere Studien, die zeigen, ob diese Maßnahmen zu einer nachhaltigen Kompetenzsteigerung führen (Schilcher et al. 2017).

Eine Ausnahme stellen hier die beiden Studien von Hagena et al. (2017) sowie von Prediger und Wessel (2018) dar. So untersuchten Hagena et al. (2017) mithilfe eines viermonatigen Lesestrategietrainings, welche Auswirkungen ein fachlich integriertes Strategietraining im Vergleich zu einem separierten Strategietraining, also einem Training, das ausschließlich auf die allgemeine Strategievermittlung fokussiert und nicht in die spezifischen Fachkontexte eingebettet wird, auf die Bearbeitungsleistung bei mathematischen Textaufgaben hat. Hierbei zeigte sich zwar eine Verbesserung der Modellierungskompetenz der Schülerinnen und Schüler in beiden Gruppen, allerdings konnte diese Verbesserung auch bei der Vergleichsgruppe nachgewiesen werden, weshalb Erkenntnisse zu fachbezogenem Strategietraining nach wie vor ein Desiderat darstellen. Prediger und Wessel (2018) vergleichen diskursive und lexikalisch-diskursive Interventionsmaßnahmen für die fachlichen Leistungen von Schülerinnen und Schülern im Bereich Brüche. Hierbei können sie für beide Maßnahmen einen signifikant höheren Lernzuwachs als in der Kontrollgruppe aufzeigen und stellen somit die Relevanz von sprach- und fachintegrierter Förderung heraus. Die Lernzuwächse verlaufen bei einsprachigen und zweisprachigen Lernenden sehr ähnlich, was nahelegt, den Forschungsfokus nicht wie häufig in der Vergangenheit auf zweisprachige Lernende zu legen, sondern Förderungen für alle und insbesondere auch für die einsprachig sprachlich schwachen Schülerinnen und Schüler einzusetzen (Prediger und Wessel 2018).

Zusammenfassend konstatieren die Autorinnen und Autoren, dass noch immer ein großes Forschungsdefizit bezüglich der Effektivität von Maßnahmen und Materialien zur fach- und sprachintegrierten Förderung existiert.

2 Hintergrund und Ziele des BiSS bzw. EvaFa-Projektes

2.1 Das Sprachförderprojekt BiSS

Basierend auf dieser theoretisch-empirischen Befundlage setzt das Entwicklungs- und Forschungsprogramm Bildung durch Sprache und Schrift (BiSS) an, bei welchem seit 2013 an circa 400 Schulen Maßnahmen zur Diagnostik und Förderung sprachlicher Kompetenzen von Schülerinnen und Schüler in den verschiedenen Unterrichtsfächern begleitet und weiterentwickelt werden (Henschel et al. 2018). Dabei zielt das fünfjährige Forschungs- und Entwicklungsprogramm auf die (Weiter‑)Entwicklung von Maßnahmen der Sprachförderung, Sprachdiagnostik und Leseförderung im Elementarbereich, in der Primarstufe und in der Sekundarstufe I sowie auf deren Überprüfung hinsichtlich Effizienz und Wirksamkeit (Henschel et al. 2018). In allen beteiligten Domänen wird die alltags- oder unterrichtsintegrierte Förderung als Schwerpunkt gesetzt. Innerhalb der BiSS-Initiative haben sich zwischen drei und zehn Schulen oder Kindertagesstätten zu regionalen Verbünden zusammengeschlossen, um gemeinsam an Sprachförderkonzepten und -maßnahmen zu arbeiten. Um die Förderkonzepte der sich zu regionalen Verbünden zusammengeschlossenen Schulen zu dokumentieren und bezüglich ihrer Wirksamkeit zu evaluieren sowie den Verbünden die Möglichkeit zur prozessbegleitenden Optimierung zu bieten, wurden ausgewählte Verbünde durch externe Evaluationsprojekte begleitet. Eines dieser Evaluationsprojekte ist das EvaFa-Projekt.

2.2 Das Evaluationsprojekt EvaFa

Das interdisziplinäre Forschungsprojekt „Evaluation der Sprachförderung im Fachunterricht der Sekundarstufe I“ (EvaFa)Footnote 1 begleitet und evaluiert wissenschaftlich Sprachfördermaßnahmen von sieben Sprachförderverbünden insbesondere für den Mathematikunterricht der Sekundarstufe I aus den Bundesländern Bayern, Berlin und Nordrhein-Westfalen und dokumentiert hierbei fachliche und fachdidaktische Sprachfördermaßnahmen und -materialien, um implizites Handlungswissen der fördernden Akteure explizit zu machen und deren Wirkungen zu analysieren. Die zentrale Gemeinsamkeit der Verbünde besteht darin, dass sie keinen defensiven Ansatz zur Vermeidung von sprachlichen Anforderungen verfolgen, sondern im Sinne eines offensiven Ansatzes einen sprachsensiblen Fachunterricht implementieren wollen. Hierbei werden jeweils verschiedene der unter Abschn. 1.3.2 genannten Prinzipien in den einzelnen Verbünden in den Mittelpunkt der fachlichen Sprachförderung gestellt. Dabei muss jedoch betont werden, dass selbst bei einer Fokussierung auf identische Prinzipien in den einzelnen Verbünden diese sehr unterschiedlich umgesetzt werden und verschiedene Fokussierungen auf die Entwicklung sprachförderlicher Materialien, die Vermittlung adäquater Lese- und Schreibstrategien sowie auf eine Professionalisierung der beteiligten Lehrpersonen vorgenommen werden (z. B. Wortschatzarbeit mit Sprachvorbildern oder Wortspeichern, Schaffung von Sprechanlässen, Schreibkonferenzen, Arbeit mit Operatorenlisten).

Hinzukommt, dass die evaluierten Verbünde ihre Sprachbildungsprozesse individuell auf die Bedürfnisse und Schwierigkeiten ihrer Schülerinnen und Schüler abstimmen, sodass Vergleiche z. B. hinsichtlich des Einflusses auf die sprachförderliche Unterrichtswahrnehmung oder Leistungszuwächse zwischen den Verbünden trotz größtmöglicher Flexibilität im formativen Evaluationsprozess nicht zu gewährleisten und auch inhaltlich nur bedingt anzustreben waren. Entsprechend handelt es sich bei dem Evaluationsprojekt – und dies stellt gleichermaßen die größte Stärke und Schwäche der vorliegenden Untersuchung dar – um eine echte Feldstudie einer Vielzahl an Förderkonzepten, die dementsprechend nicht durchgängig den Kriterien für die Durchführung einer standardisierten Intervention unter Laborbedingungen genügen kann. Zudem gilt es zu betonen, dass aufgrund der nur schwer zu kontrollierenden Einflussfaktoren eine entsprechend vorsichtige Interpretation der im Rahmen des Projekts erzielten Ergebnisse geboten ist. Daher fokussiert der vorliegende Artikel auf die Analyse eines prototypischen Verbundes und beschränkt sich entsprechend auf die exemplarische Analyse der Daten eines inhaltlich konsistent arbeitenden Sprachverbundes mit 133 Schülerinnen und Schülern aus acht Klassen des 5. und 6. Jahrgangs. Für die Auswertungen wurden neben mathematischen Leistungen und dem Textaufgabenverständnis auch sprachliche Fähigkeiten, relevante Hintergrundmerkmale sowie die Einschätzungen der Schülerinnen und Schüler in Bezug auf unterrichtliche Aspekte längsschnittlich über den Verlauf eines Sprachförderjahres erhoben. Dies ermöglicht anhand der folgenden Forschungsfragen sowohl eine Analyse der Leistungsveränderung als auch der unterschiedlichen Einschätzung von unterrichtlichen Aspekten durch die Schülerinnen und Schüler im Verlauf einer authentischen Sprachfördermaßnahme.

3 Forschungsfragen

Aufgrund der oben beschriebenen empirischen Befundlage untersucht der folgende Beitrag, wie sich exemplarisch in den Klassen eines Sprachförderverbundes die unterrichtliche Wahrnehmung der Schülerinnen und Schüler bezüglich sprachförderlicher Aspekte sowie sprachbasierte Leistungsvariablen im Verlauf der Sprachförderung verändern bzw. welche Einflussfaktoren sich identifizieren lassen. Entsprechend ergeben sich folgende Forschungsfragen, die in drei Bereiche eingeteilt werden können:

Bereich I

Veränderung der Unterrichtswahrnehmung der SuS im Rahmen der BiSS-Sprachförderung

Wie verändert sich in der Wahrnehmung der Lernenden nach einem Jahr sprachförderlichem Mathematikunterricht …

  • … die sprachliche Verständlichkeit des Mathematikunterrichts?

  • … die generelle Bedeutung, die Lehrpersonen Sprache beimessen?

  • … der produktive Umgang der Lehrpersonen mit Sprachfehlern im Unterricht?

  • … der Einsatz von Textverstehensstrategien bei der Bearbeitung von Textaufgaben?

  • … die schülerbezogene Einstellung gegenüber Sprachhandlungen im Mathematikunterricht?

  • … die schülerbezogene Freude an Textaufgaben?

Bereich II

Veränderung der Fachleistungen der SuS im Rahmen der BiSS-Sprachförderung

  1. a)

    Wie verändert sich die Fähigkeit des Verstehens mathematischer Textaufgaben bei Schülerinnen und Schülern nach einem Jahr sprachförderlichem Mathematikunterricht?

  2. b)

    Inwiefern können nach einer einjährigen spezifischen Fördermaßnahme in einem Verbund auch verbundspezifische Veränderungen bezüglich sprachbasierter Fachleistungen (z. B. im Bereich des verfügbaren Fach-Wortschatzes; siehe Abschn. 4.2) festgestellt werden?

Bereich III

Einflussfaktoren sprachbasierter Leistung(sveränderung)en

Inwiefern hängt die sprachbasierte Fachleistung am Ende der Förderung (FF IIa/b) mit der Bewertung der unterrichtlichen Aspekte 1–5 (FF I) bzw. personenbezogenen Hintergrundvariablen der Schülerinnen und Schüler (wie z. B. Migrationshintergrund, Erstsprache, SES etc.) zusammen?

4 Methode

4.1 Evaluationsdesign

Dem Evaluationsvorhaben nähert sich das EvaFa-Teilprojekt mit verschiedenen methodischen Zugängen (siehe Abb. 1). Der vorliegende Artikel fokussiert auf die standardisierten Erhebungen zentraler Leistungs- und Fragebogendaten (siehe Abb. 1a). Dabei wurden die zwei Kohorten I und II im Rahmen eines Pre-Post-Testdesgin evaluiert. Zum Messzeitpunkt 1 (MZP 1) befanden sich Kohorte I in der 5. Jahrgangsstufe und Kohorte II in der 6. Jahrgangsstufe. Beide Kohorten hatten zu diesem Zeitpunkt bereits seit über einem Jahr an Sprachfördermaßnahmen im Matheamtikunterricht teilgenommen.Footnote 2 Die Testung zum zweiten Messzeitpunkt (MZP 2) erfolgte nach einem weiteren Jahr Sprachförderung in Jahrgang 6 bzw. 7, wobei ein Großteil der in den unterschiedlichen Kohorten bzw. Jahrgängen eingesetzten Erhebungsinstrumente identisch war bzw. über Ankeritems verfügte (siehe Abschn. 4.3).Footnote 3 In diesem Rahmen wurden die sprachlichen und mathematischen Fähigkeiten der Schülerinnen und Schüler getestet und die Einschätzung verschiedener unterrichtlicher Aspekte sowie relevante Hintergrundmerkmale mit Fragebögen erhoben. Diese wiederholte Testung zum ersten Messzeitpunkt und nach mehr als einem Jahr sprachförderlichem Unterricht zum zweiten Messzeitpunkt ermöglicht eine Untersuchung der Veränderung ausgewählter Aspekte im Verlauf der Förderung.

Abb. 1
figure 1

Design der Evaluation im Rahmen des Projektes EvaFa auf Schulebene

Ergänzt wurden diese standardisierten Erhebungen (siehe Abb. 1b) durch zwei Schulbesuche mit standardisierten Unterrichtsbeobachtungen, vier leitfadengestützte Gespräche mit den Lehrkräften sowie die organisatorische Unterstützung bei der Verwendung von Förder- bzw. Lernendenportfolios auf Seiten der Lehrpersonen bzw. der Schülerinnen und Schüler. Die Auswertungen dieser Daten werden im Fokus zukünftiger Publikationen stehen.

4.2 Stichprobe

Die ursprüngliche Planung des EvaFa-Projekts sah vor mit insgesamt sieben Verbünden bestehend aus 34 Schulen die Evaluation durchzuführen. Da aber für die an BISS teilnehmenden Schulen seitens des BISS-Trägerkonsortiums keine Verpflichtung zur Teilnahme an der Begleitforschung bestand, teilweise eigene Evaluationsmaßnahmen parallel liefen und verschiedene organisatorische Hindernisse auftraten (Schulschließungen, Ausstieg aus BiSS, fehlende zeitlichen Ressourcen, Personalwechsel) konnten nicht in allen Verbünden und Schulen entsprechende Erhebungen durchgeführt werden. Dies führte zu einer selbst für Forschungsprojekte im pädagogischen Feld ungewöhnlich hohen drop-out Rate von 29 % der Schulen zum ersten und 50 % der Schulen zum zweiten Messzeitpunkt.

Entsprechend wird im vorliegenden Beitrag, um einen inhaltlich und statistisch belastbaren Datensatz mit ausreichend Schülerinnen und Schülern, die an einem einheitlichen Sprachförderkonzept teilgenommen haben und deren Daten für beide Messzeitpunkten vorliegen, zu erhalten, auf die Auswertung des Verbundes 19_K fokussiert. Dieser Verbund bestand aus insgesamt fünf Gesamtschulen einer Großstadt und fokussierte auf sprachsensiblen Unterricht in acht Klassen der Jahrgänge 5 und 6. Gemeinsam mit der ortsansässigen Universität, welche die Koordination sowie den Großteil der Materialentwicklung übernommen hat, wurden im Rahmen eines iterativen Prozesses mit monatlichen Treffen der Projektbeteiligten Materialien entwickelt, erprobt, überarbeitet und final für Dritte zugänglich gemacht (siehe https://biss-sprachbildung.de).

Für die im Rahmen des Artikels vorgenommene Auswahl dieses Verbundes sprach neben der großen Probandenanzahl insbesondere auch, dass die eigesetzten EvaFa-Evaluationsinstrumente sehr gut mit den zwei im Folgenden näher beschriebenen spezifischen Sprachfördermaßnahmen des Verbundes – wie sie von den teilnehmenden Lehrpersonen in den Interviews formuliert wurden – harmonieren; ein Umstand, der aufgrund der hohen Freiheitsgrade in der Gestaltung der Fördermaßnahmen nicht in jedem Verbund realisiert werden konnte:

  1. 1.

    Als ersten Schwerpunkt legt dieser Verbund einen Fokus auf die Wortschatzarbeit und integriert diese auf vielfältige Weise in den Mathematikunterricht. Hierzu gehören z. B. ein Wortspeicher zu den im Unterricht verwendeten Fachwörtern, einheitliche Symbole zu den kommunikativen Anforderungen der einzelnen Aufgaben (z. B. Austausch in Partnerarbeit) sowie Sprachvorbilder in Form von Sprechblasen, die den Schülerinnen und Schülern als Orientierungshilfe für das Bilden von Sätzen oder das Erstellen von Texten dienen können. Um den erarbeiteten Wortschatz auch kontinuierlich im Unterrichtsgeschehen präsent zu halten, werden die Wortspeicher an festen Stellen der Tafel sowie Fachwörterplakate im Klassenraum eingeführt. Die Erklärung mathematischer Fachbegriffe wurde zudem als fester Bestandteil in Klassenarbeiten aufgegriffen.

  2. 2.

    Der zweite Schwerpunkt dieses Verbundes besteht in der Schaffung von möglichst vielen angeleiteten Sprachhandlungen im Mathematikunterricht. Hierfür werden viele mündliche Phasen im Plenum, in Partner- oder in Gruppenarbeit eingeplant. Bei diesen Sprachanlässen geht es nicht nur um die Verwendung des gelernten Fachwortschatzes, sondern auch um die morphologisch-syntaktische Sprachebene. Die Schülerinnen und Schüler werden dazu u. a. angeleitet, mathematische Zusammenhänge mit eigenen Worten zu erklären oder ihre eigenen Lösungswege zu begründen. Hierbei werden als Unterstützungsmaßnahme auch Scaffolds, beispielsweise in Form von vorgegebenen Satzbausteinen, eingesetzt. Zur sprachlich genauen Formulierung von mathematischen Zusammenhängen werden zusätzlich eigene Merksätze von den Schülerinnen und Schüler ins hierfür eingeführte Regelheft geschrieben.

Die umgesetzten Ideen, Konzepte und erstellten Materialien wurden auf gemeinsamen Treffen mit den beteiligten Schulen gegenseitig vorgestellt und besprochen. Zur Dissemination wurde zudem das entwickelte Material auf schulinternen digitalen Plattformen hinterlegt, sodass auch nicht unmittelbar an der Förderung beteiligte Kolleginnen und Kollegen Zugriff auf die Sprachfördermaterialien hatten.

Entsprechend setzt sich die Datengrundlage für den vorliegenden Artikel aus fünf zu einem Verbund zusammengeschlossenen Gesamtschulen in Nordrhein-Westfalen zusammen. In den Verbundklassen fanden die Erhebungen des ersten Messzeitpunktes zwischen Dezember 2016 und März 2017 und die Erhebungen des zweiten Messzeitpunktes zwischen April 2018 und Juni 2018 statt, sodass zwischen den Erhebungen etwas mehr als ein Schuljahr lag (M = 69 Wochen, SD = 12)Footnote 4. Entsprechend ist für die unten dargestellten Analysen zu bedenken, dass der MZP 2 des 5. Jahrgangs in der zweiten Schuljahreshälfte des 6. Jahrgangs und der MZP 2 des 6. Jahrgangs in der zweiten Schuljahreshälfte des 7. Jahrgangs lag.

Die in Tab. 1 dargestellten Charakteristika des Verbundes zeigen, dass es sich bei der Stichprobe weder um eine spezifische Positiv- noch um eine Negativselektion handelt. Von den 133 Lernenden der Gesamtstichprobe sind 44,0 % weiblich. Als Indikator für den sozioökonomischen Status wurde der fünfstufige Book-at-Home-Index verwendet (siehe Abschn. 4.3.2). Die gesamte Stichprobe erreicht hier einen Mittelwert von 2,87 (SD = 1,34), wobei der Vergleich der Stichprobenverteilung mit der Verteilung bei IGLU zeigt, dass die Verteilung zwar geringfügig nach unten verschoben ist, allerdings lag bei IGLU in Jahrgang 4 noch keine Trennung nach Schulformen vor (vgl. Schulz-Heidorf 2016). Betrachtet man die Lesegeschwindigkeit und das Leseverständnis, so liegen die Schülerinnen und Schüler des Jahrgangs 6 auf einem mittleren Prozentrang (für Jahrgang 5 liegen keinen normierten Daten vor) und auch die Analyse der Muttersprachler sowie der zuhause gesprochenen Sprache zeigt, dass es sich bzgl. dieser Kriterien um durchschnittliche Gesamtschulklassen handelt (Bodenburg et al. 2018). Entsprechend kann zumindest aufgrund der statistischen Daten davon ausgegangen werden, dass die Bearbeitung der verschiedenen Testinstrumente und Fragebögen durch die Schülerinnen und Schüler nicht durch grundlegende sprachliche Verstehensprobleme gänzlich verhindert wird. Im Einzelfall ist dies nicht auszuschließen, sollte allerdings statistisch nicht relevant werden.

Tab. 1 Überblick zu zentralen Verbundcharakteristika zu MZP 1

4.3 Beschreibung der eingesetzten Instrumente

Die standardisierten Testungen dauerten insgesamt 90 min, wobei in den ersten 30 min das Testheft Sprache (Erhebung der sprachlichen Fähigkeiten und der Schreibkompetenz) bearbeitet wurde, bevor die Schülerinnen und Schüler sich 30 min mit dem Testheft Mathematik (Erhebung der fachmathematischen Kompetenz und der Verstehensfähigkeit beim Lösen von Textaufgaben) beschäftigten (siehe Abschn. 4.3.1). Abgeschlossen wurde die Testung durch den Einsatz eines Schülerfragebogens zur Erfassung von relevanten Hintergrundmerkmalen (siehe Abschn. 4.3.2) sowie von Einschätzungen der Schülerinnen und Schüler zu ausgewählten sprachsensiblen Aspekten ihres Mathematikunterrichts (siehe Abschn. 4.3.3).

4.3.1 Erfassung sprachlicher und mathematischer Kompetenzen

Zur Erfassung von sprachlichen und fachlichen Kompetenzen wurden folgende Instrumente verwendet:

  • Sprachliche Fähigkeiten: Zur Erhebung der sprachlichen Fäigkeiten wurde ein C‑Test verwendet (vgl. Grotjahn 2014). Beim C‑Test werden den Probanden in der Regel fünf Kurztexte mit einer Wortanzahl von 50–70 Wörtern vorgelegt, in denen ab dem zweiten bis zum vorletzten Satz bei jedem dritten Wort systematisch die zweite Worthälfte getilgt wurde und durch die Testpersonen zu ergänzen ist. Da die entstehenden 20–25 Lücken pro Text als weitestgehend unabhängige Testitems skaliert werden können (vgl. Harsch und Hartig 2010), wurde aus testökonomischen Gründen lediglich ein Text mit insgesamt 25 Lücken aus einem erprobten C‑Test des Hamburger Instituts für Bildungsmonitoring und Qualitätsentwicklung (IfbQ) verwendet. Die hohe EAP/PV-Testreliabilität von 0,90 scheint dieses Vorgehen zu legitimieren.

  • Fachsprache: Im Rahmen eines selbst entwickelten Tests bestehend aus fünf Multiple-Choice-Items wurde in den Jahrgängen 5 und 6 die Bedeutungen der Begriffe Addition, Zehnerstelle, Differenz, Quersumme und Quadrat dergestalt abgetestet, dass die Schülerinnen und Schüler aus zu den Begriffen vorgegebenen Beschreibungen die richtige Charakterisierung auswählen mussten (siehe im Anhang die Items zur Messung des Sprachwortschatzes). Bei diesen Begriffen handelt es sich um solche, die teilweise bereits zu Beginn des 5. Jahrgangs vorliegen müssten bzw. um solche, die in den beiden Klassen 5 und 6 eine starke Rolle im Mathematikcurriculum spielen. Aufgrund des spezifischen EvaFa-Designs erhielten die Schülerinnen und Schüler der 6. Jahrgangsstufe beim MZP 2 eine andere Testversion, so dass hier keine längsschnittliche Messung erfolgen konnte. Auch wenn die Reliabilität des Tests (EAP/PV Reliabilität 0,44) sehr niedrig ist, werden – aufgrund der besonderen Bedeutung für die spezifische Förderung im ausgewählten Verbund – sowohl aggregierte als auch auf einzelne Items bezogene Leistungsdaten berichtet.

  • Fachmathematische Kompetenz: Zur Messung der mathematischen Kompetenz wurden drei verschiedene Testheftversionen DEMATA, DEMATB und DEMATC eingesetzt, die sich aus verschiedenen Items des Deutschen Mathematiktests (DEMAT) 4, 5+ und 6+ zusammensetzten: Der Test DEMATA bestand aus zehn Items zu Grundrechenarten (Jahrgang 5, Messzeitpunkt 1), der Test DEMATB beinhaltete vier Items zu Grundrechenarten des Tests DEMATA und fünf weitere Items zum Dreisatz (Jahrgang 5, Messzeitpunkt 2 bzw. Jahrgang 6, Messzeitpunkt 1) und DEMATC beinhaltete zwei Aufgaben zu Grundrechenarten aus DEMATA, drei Items zum Dreisatz aus DEMATB, drei Items zu proportionalen Zusammenhängen und drei Items zu (Dezimal‑)Bruchrechnung (Jahrgang 6, Messzeitpunkt 2). Aufgrund der Ankeritems konnten die verschiedenen Testhefte gemeinsam mit dem Programm ConQuest raschskaliert werden. Hierbei wurden die Daten der mathematischen Leistungsstärke (DEMAT) aller Schülerinnen und Schüler im eindimensionalen dichotomen Rasch-Modell skaliert und auf einer Metrik abgetragen, sodass trotz unterschiedlicher Testhefte direkte Vergleiche der geschätzten Personenfähigkeiten (WLE) zwischen den Jahrgängen möglich sind. Der Test zeigt eine EAP/PV Reliabilität von 0,68. In Abb. 2 werden auf der x‑Achse die Logit-Werte für die 15 Einzelitems (Zahlen 1–15) abgetragen sowie die Häufigkeit der Schülerinnen und Schüler im jeweiligen Leistungsbereich (x steht für 0,2 Fälle). Dabei wird ersichtlich, dass die Fähigkeitswerte der Schülerinnen und Schüler zumeist im negativen Bereich liegen. Da die mittlere Schwierigkeit der Testaufgaben auf 0 gesetzt wurde (ConQuest-Befehl: constraints=items) wird daran ersichtlich, dass die verwendeten Items geringfügig zu schwer für die getestete Population waren.

  • Textaufgabenverständnis: Um die Fähigkeit zu testen, inwiefern die Schülerinnen und Schüler in der Lage sind, eine mathematische Textaufgabe zu verstehen und die relevanten Informationen zu identifizieren, wurden sowohl im Prä- als auch im Posttest vier identische Items eines in dem Projekt „Fach an Sprache an Fach“ (FaSaF) entwickelten Instrumentes eingesetzt (Hagena et al. 2017). Jedes Item besteht aus einem Text mit einem Bild (das aber kein Träger wesentlicher Informationen war) sowie einer mathematischen Aufgabenstellung (siehe Abb. 3). Der Text beinhaltet sowohl notwendige als auch überflüssige Informationen zur Beantwortung der Aufgabenstellung. Die Aufgabe der Schülerinnen und Schüler bestand darin, nur diejenigen Zahlenangaben zu unterstreichen, die zur Beantwortung der Aufgabenstellung bzw. zur Durchführung der diesbezüglichen mathematischen Rechnung zwingend erforderlich sind.

    Der aus vier Items bestehende Test zum Textaufgabenverstehen wurde unter Verwendung von partial credit Kodierungen im eindimensionalen Rasch-Modell skaliert. Dabei wurde als full credit (2) gewertet, wenn ausschließlich die richtigen Zahlangaben unterstrichen wurden, als partial credit (1), wenn neben allen erforderlichen auch eine überflüssige Angabe unterstrichen wurde und als no credit (0) alle übrigen Bearbeitungen. Dabei zeigte sich, dass die vorgenommene partial credit Kodierung eine gute Modellpassung aufwies, was die Item Characteristic CurveFootnote 5 exemplarisch in Abb. 4 sowie die EAP/PV Reliabilität mit 0,70 verdeutlicht.

Abb. 2
figure 2

Verteilung der Probanden des Verbundes 19_K (x − 0,2 cases) und der Items (1–15) auf der Logit-Skala beim schulischen Kompetenztest DEMAT zum MZP 1

Abb. 3
figure 3

Beispielaufgabe „Containerschiff“ aus dem Projekt „Fach an Sprache an Fach“. (Hagena et al. 2017, S. 12)

Abb. 4
figure 4

Item Characteristic Curve für das Item „Containerschiff“ zur Überprüfung des Textaufgabenverständnisses

4.3.2 Erfassung von Hintergrundmerkmalen

Neben Alter und Geschlecht wurden mithilfe eines Schülerfragebogens u. a. folgende Hintergrundmerkmale erhoben:

  • Sozioökonomischer Status: Als bewährter Indikator für den Sozioökonomischen Status wurde der fünfstufige Book-at-Home-Index verwendet (Bos et al. 2003). Es standen dazu folgende Antwortkategorien zu Auswahl: 1 = 0–10 Bücher, 2 = 11–25 Bücher, 3 = 26–100 Bücher, 4 = 101–200 Bücher, 5 = mehr als 500 Bücher.

  • Familiensprache: Die Familiensprache wurde operationalisiert (vgl. Bos et al. 2010) durch die Häufigkeit der Verwendung der deutschen Sprache zuhause (Ausprägungen: Ich spreche immer Deutsch – Ich spreche manchmal Deutsch und manchmal eine andere Sprache – Ich spreche niemals Deutsch).

  • Muttersprache: Die Muttersprache wurde adaptiert aus DIPF (2009) dichotom erfasst, indem die Schülerinnen und Schüler angaben, ob sie die deutsche oder eine andere Sprache zuerst gelernt haben.

  • Noten: Sowohl für das Fach Mathematik als auch für das Fach Deutsch wurden an jedem Messzeitpunkt jeweils die letzten Zeugnisnoten erhoben.

4.3.3 Einschätzungen der Schülerinnen und Schüler bezüglich unterrichtlicher Aspekte

Mithilfe des Schülerfragebogens wurden außerdem die Einschätzungen der Schülerinnen und Schüler zur sprachlichen Verständlichkeit des Unterrichts, zur Bedeutung von Sprache für die Lehrkraft, zum produktiven Umgang der Lehrkraft mit sprachlichen Fehlern, dem Einsatz von Verstehensstrategien sowie die Haltung der Schülerinnen und Schüler gegenüber Textaufgaben erhoben. Diese fünf Aspekte wurden aus den in der Literatur benannten Prinzipien eines sprachsensiblen Fachunterrichts (Abschn. 1.3.2) abgeleitet. Auch wenn eine empirische Überprüfung der Bedeutung dieser Aspekte noch aussteht, ist davon auszugehen, dass sie wesentliche Merkmale eines sprachsensiblen Mathematikunterrichts abdecken. Zur näheren Untersuchung dieser Aspekte wurden folgende fünf Skalen gebildet (siehe im Anhang die Skalen der Schüler*innen-Fragebögen):

  • Skala 1: Sprachliche Verständlichkeit des Mathematikunterrichts: Genau wie für die zweite und dritte Skala wurden Items aus der DESI-Studie (Wagner et al. 2009) adaptiert und auf den Mathematikunterricht (statt auf den Deutschunterricht) bezogen. Die Aussagen der Items wurden ebenso wie für die Skalen 2 und 3 von den Schülerinnen und Schülern mithilfe einer 4‑Punkt-Likert-Skala (1 = stimmt gar nicht, 2 = stimmt eher nicht, 3 = stimmt eher, 4 = stimmt ganz genau) eingeschätzt.

    Die Skala (3 Items, Cronbach’s Alpha Testzeitpunkt 1: αt1 = 0,54; Cronbach’s Alpha Testzeitpunkt 2: αt2 = 0,70) erfragt, ob die Aufgabenstellungen im Mathematikunterricht klar und verständlich sind, die Lehrkraft anschauliche Beispiele gibt und sich klar und deutlich ausdrückt.

  • Skala 2: Allgemeine Bedeutung von Sprache für die Lehrkraft: Die Skala (3 Items, αt1 = 0,80; αt2 = 0,90) erfragt zum Beispiel, ob die Mathematiklehrkraft auf die Bedeutsamkeit von gutem Deutsch im Alltag oder für das Berufsleben hinweist.

  • Skala 3: Produktiver Umgang der Lehrpersonen mit Sprachfehlern im Unterricht: Die Skala (7 Items, αt1 = 0,60; αt2 = 0,71) enthält beispielsweise Fragen dazu, ob die Lehrkraft sprachliche Fehler als Lerngelegenheiten begreift bzw. die Schülerinnen und Schüler an solchen Stellen produktiv unterstützt.

  • Skala 4: Einsatz von Textverstehensstrategien bei der Bildung eines Situationsmodells: Zur Erhebung dieser Skala wurden Items eines Befragungsinstrumentes von Klieme et al. (2005) übernommen. Die Skala (5 Items, αt1 = 0,72; αt2 = 0,71) erfragt über vier Stufen (1 = nie, 2 = selten, 3 = oft, 4 = fast immer) u. a. wie häufig bei der Bearbeitung von Textaufgaben gegebene und gesuchte Informationen festgehalten werden oder ein mehrfaches Lesen des Textes erfolgt.

  • Skala 5: Einstellungen gegenüber Sprachhandlungen im Mathematikunterricht: Diese Skala (αt1 = 0,62; αt2 = 0,72) wurde aus TIMSS (Bos et al. 2009) adaptiert. Sie erfragt anhand von drei Items und über fünf Stufen (1 = stimmt überhaupt nicht, 2 = stimmt eher nicht, 3 = stimmt teils, teils, 4 = stimmt überwiegend, 5 = stimmt genau) die schülerbezogenen Haltungen bezüglich der aktiven Kommunikation über mathematische Sachverhalte im Unterricht (z. B. „Ich spreche gern mit Mitschülern über meine eigenen Lösungswege.“).

  • Weiterhin wurde von den Schülerinnen und Schülern ihre Haltung gegenüber Textaufgaben mithilfe des Items aus TIMSS (Bos et al. 2009) anhand der Aussage „Ich mache gerne Textaufgaben“ und einer Einschätzung über fünf Stufen (1 = stimmt überhaupt nicht, 2 = stimmt eher nicht, 3 = stimmt teil, teils, 4 = stimmt überwiegend, 5 = stimmt genau) erhoben. Analog zum Book-at-Home-Index, der über eine Frage eine grobe, aber empirische erprobte Annäherung an den SES darstellt, dient dieses Einzelitem dazu, die emotionale Haltung mathematischen Textaufgaben gegenüber zu erfassen.

4.4 Datenauswertung

Die Dateneingabe sowie die insbesondere auf die Betrachtung von Unterschieden fokussierte Auswertung der Häufigkeiten und Zusammenhänge erfolgten in SPSS (Version 25). Für die Analyse der globalen Lehr-Lernveränderungen durch Sprachförderung (FF I) wurden in Abschn. 5.1 in einem ersten Schritt mithilfe von Faktorenanalysen diejenigen Items der fünf Skalen sprachliche Verständlichkeit, Bedeutung von Sprache, Umgang mit sprachlichen Fehlern, Einsatz von Textverstehensstrategien und Einstellungen gegenüber Sprachhandlungen im Mathematikunterricht identifiziert, die zu möglichst reliablen Skalen führen. Auf dieser Basis wurden anschließend auf Indivudual- und Klassenebene Mittelwerte für die einzelnen Skalen errechnet. Mit diesem Vorgehen können die Einschätzungen zwischen den beiden Messzeitpunkten verglichen werden. Weiterhin wurden für die einzelnen Skalen Streudiagramme erstellt, um die Verteilung der Klassendaten zu den beiden Messzeitpunkten detaillierter darstellen und auch bezüglich ihrer absoluten Werte besser analysieren zu können. Letzteres ist insofern von besonderer Bedeutung, da die Sprachförderung schon zu MZP 1 lief und ggfs. die Einschätzungen der Schülerinnen und Schüler auf einem erhöhten Niveau lagen und nur bedingt mit weiteren Zuwächsen zu rechnen war.

Für die Untersuchung der Leistungen beim Textaufgabenverständnis (FF IIa) in Abschn. 5.2 wurden t‑Tests gerechnet, um mögliche Unterschiede zwischen den beiden Messzeitpunkten auf Signifikanz zu überprüfen. Die Untersuchung verbundspezifischer Veränderungen im Leistungsbereich (FF IIb) fokussierte auf die Verfügbarkeit von Fachwörtern, sodass in diesem Bereich einerseits ein t‑Test zu einer möglichen globalen Leistungsveränderng gerechnet und andererseits die Lösungsraten der Einzelitems zu den unterschiedlichen Messzeitpunkten betrachtet wurden. Ergänzend zu den Analysen für die gesamte Stichprobe von 133 Schülerinnen und Schülern wurden analoge Auswertungen auch für die unterschiedlichen Jahrgangsstufen durchgeführt.

Für die Analyse von Einflussfaktoren auf das Textaufgabenverständnis zum Ende der Förderung (FF IIIa) bzw. zur Untersuchung von Fachwortschatz und relevanten Zusammenhangsvariablen (FF IIIb) wurden verschiedene Regressionsmodelle gerechnet und in Abschn. 5.3 dargestellt. Hierbei wurden die Leistung im Textaufgabenverstehen am zweiten Messzeitpunkt als abhängige Variable sowie mögliche Einflussfaktoren als Kovariaten betrachtet bzw. aufgrund der ausschließlichen Verfügbarkeit von parallelen Messdaten zum Fachwortschatz am MZP 1 für die Jahrgänge 5 und 6 wurde bzgl. Forschungsfrage 3b die Daten des ersten Messzeitpunktes verwendet.

5 Ergebnisse

Bevor im Folgenden die in Abschn. 3 angeführten Forschungsfragen beantwortet werden, wird zunächst die in Abschn. 4.2 vorgenommene inhaltlich-formale Stichprobenbeschreibung um die Entwicklung der Fachleistungen im Verlauf der Sprachförderung erweitert. Hierdurch soll eine leistungsbezogene Einschätzung der Probanden parallel zu den Forschungsfragen ermöglicht werden.

Erwartungskonform zeigt sich dabei, dass die mathematischen Fachleistungen der Schülerinnen und Schüler, gemessen durch den DEMAT (siehe Abschn. 4.3.1), sich gemäß der Jahrgangsstufen anordnen lassen (Tab. 2). So geht im Vergleich der Jahrgangsstufen eine spätere Testung innerhalb der Schullaufbahn mit jeweils höheren Leistung im DEMAT einher. Allerdings liegen die Lösungsraten deutlich unter den Normwerten des DEMAT, die jedoch nicht nach Schulformen getrennt vorliegen. Entsprechend kann davon ausgegangen werden, dass es sich im mathematischen Bereich eher um unterdurchschnittlich leistungsstarke Gesamtschülerinnen und Gesamtschüler handelt.

Tab. 2 Mittelwerte und Standardabweichungen der mathematischen Fachleistungen (DEMAT) der beiden Kohorten am ersten und zweiten Messzeitpunkt

Als Problem des Messinstrumentes muss jedoch angesehen werden, dass im Verlauf des Sprachförderjahres in Jahrgang 5 scheinbar kein signifikanter fachlicher Leistungszuwachs erfolgt. Eine genauere Betrachtung der vier Ankeritems zeigt, dass die Lösungsraten bei den beiden Aufgaben zur schriftlichen Multiplikation und Division stagnieren, obwohl in diesem Jahrgang curricular viele Wiederholungen im Bereich der Grundrechenarten aus dem Primarstufenbereich und wenige neue Themen behandelt werden. Lediglich bei den beiden Aufgaben zu komplexeren Termumformungen sind auf der Aufgabenebene signifikante Leistungszuwächse feststellbar (t (150) = −2,653; p < 0,000; Effektstärke Cohens d = 0,40 bzw. t (150) = −2,437; p < 0,000; Effektstärke Cohens d = 0,43).

Erst das deutlicher auf die curricularen Inhalte der Jahrgangsstufe angepasste Testinstrumentarium für den 6. Jahrgang zeigt einen signifikanten Zuwachs der mathematischen Fachleistung von MZP 1 zu MZP 2 (t (113) = −16,445; p = 0,04; Effektstärke Cohens d = 0,34), allerdings nur bei einer einseitigen Testung, die aber aufgrund der theoretisch gut begründbaren gerichteten Hypothese zulässig erscheint.

5.1 Veränderung der Unterrichtswahrnehmung der Schülerinnen und Schüler im Verlauf der BISS-Sprachförderung (Forschungsfrage I)

Um die Frage zu beantworten, inwiefern sich die Wahrnehmung der Schülerinnen und Schüler bezüglich der in Tab. 3 und 4 dargestellten Skalen als relevante Merkmale eines sprachsensiblen Fachunterrichts innerhalb eines Sprachförderjahres verändert, können die Mittelwerte der Skalen für die acht Klassen sowie für die einzelnen Individuen zwischen dem ersten und dem zweiten Messzeitpunkt verglichen werden, wobei jeweils nur diejenigen Schülerinnen und Schüler einbezogen wurden, die an beiden Messzeitpunkten teilgenommen haben.Footnote 6

Tab. 3 Mittelwerte und Standardabweichungen, theoretische und empirische Minima und Maxima der Schülerinnen und Schüler sowie signifikante Differenzen (2-seitig) der fünf Skalen zum ersten und zweiten Messzeitpunkt auf Klassenebene (gepaarte Stichprobe)
Tab. 4 Mittelwerte und Standardabweichungen, theoretische und empirische Minima und Maxima der Schülerinnen und Schüler sowie signifikante Differenzen (2-seitig) der fünf Skalen zum ersten und zweiten Messzeitpunkt auf Schüler*innenebene (gepaarte Stichprobe)

Hierbei zeigen sich auf Klassenebene für die Skalen der sprachlichen Verständlichkeit des Unterrichts, der Bedeutung von Sprache im Unterricht, dem produktiven Umgang mit sprachlichen Fehlern sowie für die Haltung der Schülerinnen und Schülern gegenüber Textaufgaben keine signifikanten Unterschiede zwischen MZP 1 und MZP 2. Allerdings besteht bezüglich der Haltung gegenüber mathematischen Sprachhandlungen, also einem der zwei Schwerpunkte der Sprachförderung im Verbund 19_K, ein signifikanter Rückgang von 3,40 auf 3,03 (t (7) = 3,661; p = 0,008), was nach Bühner und Ziegler (2017) einem kleinen bis mittleren Effekt von Cohen’s d = 0,37 entspricht. Die Wertschätzung derartiger Handlungen nimmt demnach bei gleichzeitiger quantitativer Zunahme derartiger Handlungen im Mathematikunterricht im Verlauf der Sprachförderung signifikant ab.

Auch wenn bei den in Tab. 3 dargestellten Analysen die t‑Tests aufgrund der sehr starken Datenaggregation mit N = 8 nur eine sehr geringe Power haben, zeigen die im Folgenden abgebildeten Ergebnisse, bei denen für die maximale Power die Schachtelung der Daten – also die zweite Analyseebene Klasse – bewusst vernachlässigt wurde, dass die Ergebnisse auf Klassenebene bestätigt werden.Footnote 7

Demgemäß werden zur weiteren Analyse der (qualitativen) Einschätzungen die absoluten Mittelwerte der acht Klassen zu den fünf Skalen sowie zur Frage der Haltung gegenüber Textaufgaben in Abb. 56789 und 10 als Streudiagramme abgebildet. Diese Analysen tragen auch dem Umstand Rechnung, dass die untersuchten Klassen zum ersten Messzeitpunkt bereits längere Zeit an Sprachfördermaßnahmen teilgenommen haben und damit die absoluten Werte berücksichtigt werden müssen. Zur besseren Einschätzung der Leistungsveränderung wurde eine Winkelhalbierende sowie zur Orientierung an einer mittleren Antwortkategorie eine Konstante bei 2,5 in die Darstellung eingezogen.

Abb. 5
figure 5

Streudiagramm: Zusammenhang zwischen der Einschätzung der sprachlichen Verständlichkeit des Mathematikunterrichts im ersten und zweiten Messzeitpunkt

Abb. 6
figure 6

Streudiagramm: Zusammenhang zwischen der Einschätzung der allgemeinen Bedeutung von Sprache im ersten und zweiten Messzeitpunkt

Abb. 7
figure 7

Streudiagramm: Zusammenhang zwischen der Einschätzung des produktiven Umgangs mit sprachlichen Fehlern im ersten und zweiten Messzeitpunkt

Abb. 8
figure 8

Streudiagramm: Zusammenhang zwischen der Einschätzung des Einsatzes von Verstehensstrategien bei der Bearbeitung von Textaufgaben im ersten und zweiten Messzeitpunkt

Abb. 9
figure 9

Streudiagramm: Zusammenhang zwischen der Haltung gegenüber mathematischen Sprachhandlungen im ersten und zweiten Messzeitpunkt

Abb. 10
figure 10

Streudiagramm: Zusammenhang zwischen der Haltung gegenüber Textaufgaben im ersten und zweiten Messzeitpunkt

Bei der Einschätzung der sprachlichen Verständlichkeit (Abb. 5) zeigt sich eine grundsätzlich sehr positive Bewertung des Mathematikunterrichts. Bereits beim ersten Messzeitpunkt bewerten alle Klassen die sprachliche Verständlichkeit über dem Skalen-Mittelwert 2,5, wobei die Items der Skala (siehe im Anhang die Items der Skala Sprachliche Verständlichkeit) auf mathematische Aufgabenstellungen und die Ausdrucksweise der Lehrperson fokussieren. Die sprachlich-inhaltliche Verständlichkeit z. B. von Erklärungen zu komplexeren Sachverhalten wird hierbei nicht erfasst.

Die allgemeine Bedeutung, die Lehrkräfte der Sprache Deutsch beimessen, wird durch die Schülerinnen und Schüler tendenziell auf einem mittleren Niveau eingeschätzt (Abb. 6). Auch wenn es in einzelnen Klassen durchaus positive und negative Veränderungen gibt, so fallen diese durchweg moderat aus und liegen unter einer halben Standardabweichung. Hierbei gilt jedoch zu betonen, dass in den Items nicht die spezifische Rolle der Sprache im Mathematikunterricht, also der Bereich der Sprachförderung, sondern eine eher gesellschaftliche Wertigkeit thematisiert wurde.

In Abb. 7 ist zu erkennen, dass die Schülerinnen und Schüler den produktiven Umgang ihrer Lehrpersonen mit sprachlichen Fehlern tendenziell als positiv und lernförderlich einschätzen. Dabei kann die Einschätzung trotz geringfügiger Abweichung bei einzelnen Klassen als stabil angesehen werden. Eine ähnliche Beobachtung lässt sich für den Einsatz von Verstehensstrategien bei der Bearbeitung mathematischer Textaufgaben (siehe Abb. 8) wiederfinden. Obwohl bezüglich des Strategieeinsatzes von den Schülerinnen und Schülern mit einem Mittelwert von 2,74 (MZP 1) bzw. 2,82 (MZP 2) noch Potential nach oben gesehen wird, scheint im Rahmen der hier betrachteten Phase der Sprachförderung keine (signifikante) Steigerung erfolgt zu sein. Betrachtet man die fünf verschiedenen in den Einzelitems getesteten Verstehensstrategien (siehe im Anhang die Items der Skala Einsatz von Textverstehensstrategien), so zeigt sich zumindest für die Strategie gegebene und gesuchte Informationen identifizieren ein signifikanter Zuwachs (t (91) = −2,025; p = 0,046).

Abb. 9 zeigt erneut den oben erwähnten signifikanten Rückgang in der Werthaltung gegenüber sprachlichem Handeln im Mathematikunterricht, macht aber auch deutlich, dass dies auf einem hohen Niveau erfolgt. Darüber hinaus ist auffallend, dass es Klassen gibt, bei denen dieser Rückgang bis zu einer dreiviertel Standardabweichung beträgt und dass für alle drei Bereiche Sprechen, Schreiben und Hören, die jeweils durch ein Item getestet werden, ein signifikanter Rückgang zu verzeichnen ist (Sprechen t (100) = 2,447; p = 0,016/Schreiben t (104) = 2,028; p = 0,045/Hören t (101) = 2,070; p = 0,041).

Dass ein Großteil der Schülerinnen und Schüler mathematische Textaufgaben eher ablehnt, lässt sich in Abb. 10 erkennen. Obwohl in allen Klassen im evaluierten Förderzeitraum Strategien und Methoden anhand von Textaufgaben eingesetzt wurden, verändert sich die Einschätzung der Schülerinnen und Schüler derartig textlastigen Aufgaben gegenüber auch nach der Förderung nicht. In den Klassen Nr. 3 und Nr. 7, die im fachlichen (DEMAT) bzw. im sprachlichen Leistungsbereich (C-Test) auf Rangplatz 2 und 3 bzw. 2 und 5 stehen, ist sogar ein deutlicher Rückgang – ebenso wie bei der Haltung mathematischen Sprachhandlungen gegenüber – um eine halbe Standardabweichung festzustellen.

5.2 Veränderung der sprachbasierten Fachleistungen im Verlauf der BISS-Sprachförderung (Forschungsfrage II)

5.2.1 Mathematisches Textaufgabenverständnis

Die Fähigkeit der Schülerinnen und Schüler, mathematische Textaufgaben zu verstehen (siehe Abschn. 4.3.1), zeigt erwartungskonform einen signifikanten Zuwachs zwischen den beiden Messzeitpunkten (t (132) = −5,10; p  < 0,001). Haben die Schülerinnen und Schüler am ersten Messzeitpunkt durchschnittlich einen Leistungswert von M = −0,82 (SD = 1,32), erreichen sie am zweiten Messzeitpunkt einen Mittelwert von M = −0,26 (SD = 1,50). Der t‑Test zeigt (siehe Tab. 5), dass diese Differenz signifikant ist und damit die Schülerinnen und Schüler ihre Verstehensleistungen im Verlauf der Förderung verbessern. Dies entspricht einer Effektstärke von Cohen’s d = 0,37 und damit einem kleinen bis mittleren Effekt.

Tab. 5 t‑Test für gepaarte Stichproben (2-seitig) auf Differenzen der Verstehensfähigkeiten der Schülerinnen und Schüler bei Textaufgaben zwischen MZP 1 und 2

Zusätzlich wurden diese Differenzen getrennt für die beiden Kohorten analysiert. Dabei zeigt sich zwar, dass erwartungskonform die in Jahrgang 6 beginnende Kohorte II im Vergleich der beiden Messzeitpunkte jeweils signifikant bessere Leistungen erbringt als als die in Jahrgang 5 beginnende Kohorte I (MZP 1: t (108,01) = −4,44; p < 0,001/MZP 2: t (124,29) = −3,62; p < 0,001). t‑Tests konnten dagegen lediglich innerhalb der Förderperiode der ersten Kohorte I statistisch signifikante Fortschritte in der Fähigkeit, eine Textaufgabe zu verstehen, mit einem kleinen bis mittleren Effekt belegen (siehe Tab. 6).

Tab. 6 Mittelwerte, Standardabweichungen, Signifikanzniveau (2-seitig) und Effektstärke für die Verstehensfähigkeiten im ersten und zweiten Messzeitpunkt, vergleichend für die Kohorten I und II

Betrachtet man die Entwicklung der Fähigkeit, mathematische Textaufgaben zu verstehen bzw. sich die für die Beantwortung der Fragestellung benötigten Informationen aus dem Text zu entnehmen auf Klassenebene (siehe für die Klassennummern – Tab. 1), so sind insbesondere drei Aspekte von besonderem Interesse (siehe Abb. 11).

  • Die Leistungsstreuung der Klassenmittelwerte innerhalb der beiden Jahrgänge ist jeweils größer als eine Standardabweichung.

  • Diese Streuung ist so groß, dass Klasse Nr. 2 der Kohorte II bezüglich der Kompetenz, Textaufgaben zu verstehen eher in Kohorte I zu verorten wäre.

  • Die mit Abstand leistungsschwächste Klasse im Verbund erzielt innerhalb eines Jahres Sprachförderung keine messbaren Fortschritte bezüglich ihrer Kompetenz Textaufgaben zu verstehen.

Abb. 11
figure 11

Streudiagramm der Klassenmittelwerte zur Fähigkeit mathematische Textaufgaben zu verstehen im ersten und zweiten Messzeitpunkt

5.2.2 Mathematischer Fachwortschatz

Insgesamt zeigt sich, dass bei den Schülerinnen und Schülern der Kohorte IFootnote 8 innerhalb der analysierten Förderperiode ein signifikanter Zuwachs ihres Fachwortschatzes zu verzeichnen ist (t (75) = −2,822; P = 0,006). Dieser Zuwachs entspricht mit Cohen’s d = 0,32 einem kleinen bis mittleren Effekt. Analysiert man das für die Untersuchungszeit geltende Kerncurriculum des Bundeslandes (Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen 2004), so wird dort explizit (Addition, S. 20 & Quadrat, S. 18) bzw. aufgrund der Inhaltsbeschreibungen implizit (Zehnerstelle, Differenz und Quersumme, S. 20) erwähnt, dass die Schülerinnen und Schüler alle fünf getesteten Begriffe bis zum Ende der Jahrgangsstufe 6 sachangemessen verwenden können müssen. Die Abb. 12 verdeutlicht einerseits den signifikanten Leistungszuwachs, aber andererseits auch, dass in Jahrgang 6 sowohl die Schülerinnen und Schüler der zweiten Kohorte zum MZP 1 (II-6-1), der in der ersten Hälfte des 6. Jahrgangs lag, als auch die Schülerinnen und Schüler der ersten Kohorte zum MZP 2 (I-5-2), der in der zweiten Hälfte des 6. Jahrgangs lag, dieses Lernziel nur bedingt erfüllen. Je nach Fachwort können zwischen 28,9 und 75 % derjenigen Schülerinnen und Schüler, die in der 5. und 6. Jahrgangsstufe eine Förderung, die explizit auf die Vermittlung von Fachwörtern abzielt, erhalten haben, keine adäquaten Beschreibungen für die Fachwörter auswählen (siehe Abschn. 4.3.1).

Abb. 12
figure 12

Lösungshäufigkeiten der fünf getesteten Fachwörter

5.3 Einflussfaktoren sprachbasierter Leistung(sveränderung)en (Forschungsfrage III)

5.3.1 Einflussfaktoren auf das Textaufgabenverständnis am Ende der Förderung

Zur Klärung der Frage (FF III), inwieweit die Fähigkeit, Textaufgaben zu verstehen, am Ende der Förderung mit der Einschätzung unterrichtlicher Sprachförderaspekte (siehe FF I) und spezifischer personenbezogener Merkmale zusammenhängt, wurden verschiedene Regressionsmodelle gerechnet. Die Analysen belegen, dass sich für die fünf unterrichtlichen Aspekte aus FF1 sprachliche Verständlichkeit, Bedeutung von Sprache, Umgang mit sprachlichen Fehlern, Einsatz von Textverstehensstrategien und Haltung gegenüber fachlichen Sprachhandlungen sowie für die verschiedenen Hintergrundmerkmale auf Personenebene (Lesekompetenz, mathematische Fachleistung, Geschlecht, Muttersprache, gesprochene Sprache zuhause, Jahrgangsstufe, Mathematik- sowie Deutschnote) keine Zusammenhänge zum Textaufgabenverständnis am Ende der Förderung zeigen. Das Regressionsmodell in Tab. 7, bei dem wie bei allen hier präsentierten Regressionsmodellen die Prädiktoren nach Einfluss inkludiert wurden, zeigt mit der mathematischen Textverstehenskompetenz zum zweiten Messzeitpunkt als abhängige Variable, dass die einzigen Variablen mit einem signifikanten Betakoeffizienten das diesbezügliche Vorwissen zum Messzeitpunkt 1 (β = 0,424) sowie die über den C‑Test gemessene Sprachfähigkeit zum Messzeitpunkt 1 (β = 268) sind. Insgesamt kann mit dem Modell dieser Regressionsanalysen 40 % Varianz des Textaufgabenverständnisses zum zweiten Messzeitpunkt erklärt werden.

Tab. 7 Effekte von unterrichtlichen Aspekten und Personenmerkmalen auf das Textaufgabenverständnis am zweiten Messzeitpunkt

5.3.2 Zusammenhänge zwischen Fachwortschatz, personenbezogenen Fähigkeitsmaßen und Einstellungen

Analysiert man zunächst, welche Einflussfaktoren mit dem Vorhandensein eines hohen mathematischen Fachwortschatzes zum ersten Messzeitpunkt zusammenhängen, so zeigen zunächst bivariate Korrelationen multiple Zusammenhänge ausschließlich mit Leistungsindikatoren (siehe Tab. 8) – allerdings keinerlei Zusammenhang mit der sprachbezogenen Wahrnehmung des Mathematikunterrichts oder spezifischen Personenmerkmalen wie z. B. Geschlecht, Muttersprache oder SES.

Tab. 8 Bivariate Korrelation zwischen Fachwortschatz zum MZP 1 und zentralen Leistungsvariablen

Bei der Betrachtung, inwiefern welche Variablen mit einem hohen Fachwortschatz zum zweiten Messzeitpunkt einhergehen, gilt es zu berücksichtigen, dass lediglich Daten für MZP 1 & 2 derjenigen Probanden vorliegen, die zu Beginn des Projekts in der 5. Jahrgangsstufe waren. Entsprechend basieren die folgenden Regressionsanalysen lediglich auf diesen 76 Schülerinnen und Schülern. Dabei zeigen die Berechnungen, dass erwartungsgemäß das Vorwissen einen maßgeblichen Einfluss hat, aber lediglich 26 % der Varianz alleine aufklärt (siehe Tab. 9 – Modell 1). Ein entsprechend erweitertes Modell, das zwar deutlich mehr Varianz aufklärt, aber dessen Signifikanzniveaus nicht durchgängig zufriedenstellend sind, verdeutlicht, dass anscheinend die Jungen bzw. die Leistungsstärkeren Zuwächse erzielen und insbesondere diejenigen, die zu Beginn der Sprachförderung mathematischen Sprachhandlungen skeptisch gegenüberstanden, am Ende einen höheren Fachwortschatz aufweisen (siehe Tab. 9 – Modell 2).

Tab. 9 Regressionsanalysen zum Fachwortschatz MZP 2 und (signifikanten) Kovariaten

Keine statistisch bedeutsame Rolle spielen in diesen Modellen u. a. die Faktoren: Sprachkompetenz (C-Test), Fachwissen (DEMAT), SES, Migrationshintergrund, Muttersprache sowie die Einschätzung bezüglich der sprachlichen Verständlichkeit des Mathematikunterrichts, der unterrichtlichen Bedeutsamkeit von Sprache, dem unterrichtlichen Umgang mit Fehlern und der Verwendung von Strategien auf Schülerseite.

6 Diskussion

In der dargestellten Evaluationsstudie wurde untersucht, inwiefern ein am BiSS-Forschungsvorhaben teilnehmender Verbund bestehend aus acht Klassen von einer über ein Jahr laufenden Sprachförderung profitiert. Dadurch sollte

  • ein bestehendes Forschungsdesiderat im Bereich der evidenzbasierten Sprachförderung im Fach angegangen werden (Wissenschaft),

  • stellvertretend für die verschiedenen Maßnahmen in den Bundesländern exemplarisch aufgezeigt werden, inwiefern aktuelle Fördermaßnahmen auch entsprechend messbare Effekte erzielen und damit ihre durchaus ressourcenintensiven Implementationen legitimieren (Bildungspolitik)

  • und letztlich galt es, zumindest Impulse – wenn auch keine empirisch überprüften Handlungsanweisungen – für die Optimierung bzw. Gestaltung praktischer Sprachfördermaßnahmen im Fach abzuleiten (schulische Praxis).

Hierfür wurden ergänzend zu qualitativ-prozessbegleitenden Verfahren, über die an anderer Stelle berichtet wird, im Rahmen einer quantitativen Erhebung im Pre-Post-Design verschiedene Tests und Befragungen zu Beginn und am Ende der ungefähr einjährigen Sprachförderphase im Fach Mathematik durchgeführt. Neben Standardverfahren zur Erfassung der mathematischen Leistungsstärke, der sprachliche Fähigkeiten und der sprachbezogenen Einschätzungen des Unterrichts wurden – aufgrund der verbundspezifischen Ausrichtung der Sprachförderung – der Fachwortschatz sowie sprachbezogene Verstehensleistungen als zentrale sprachbezogene Leistungskonstrukte analysiert.

Zunächst zeigen jedoch die Ergebnisse der Befragungen, dass Schülerinnen und Schüler ihren Unterricht differenziert wahrnehmen und für Veränderungen durchaus sensibel sind, wobei bei der Interpretation dieser Daten bedacht werden muss, dass zu MZP 1 die Sprachförderung bereits begonnen hatte und gerade die eher im Mittelfeld zu verortenden Skalenwerte möglicherweise vor der Sprachförderung sich auf einem anderen Niveau befanden. Dies berücksichtigend kann zunächst deskriptiv festgehalten werden, dass zwar bezüglich vier der fünf eingesetzten Skalen zur Unterrichtswahrnehmung keine Veränderungen zwischen den beiden Messzeitpunkten festgestellt werden können, allerdings geht der vermehrte Einsatz von angeleiteten Sprachhandlungen im Mathematikunterricht, als einem der beiden Sprachförderschwerpunkte des Verbundes, damit einher, dass die Schülerinnen und Schüler diesen signifikant weniger positiv gegenüber stehen als noch in der ersten Phase der Förderung. Gerade vor dem Hintergrund der Diskussion um Motivation und Volition als Teil mathematischer (Kommunikations‑)Kompetenzen (vgl. Weinert 2001) wäre hier in Folgeuntersuchungen zu analysieren, inwiefern dies mit der qualitativen und quantitativen Umsetzung derartiger Sprachhandlungen im Förderunterricht zusammenhängt.

Dass die beiden Skalenwerte zur wahrgenommenen Verständlichkeit und zum Umgang mit Fehlern nicht signifikant zugenommen haben, mag an der positiv zu wertenden bereits hohen Zustimmung zu Beginn der Sprachförderung liegen. Anders verhält es sich bei der im Rahmen von fachbezogener Sprachförderung als zentral angesehenen Strategieförderung (siehe Abschn. 1.3.2). Hier sind nicht nur keine Zuwächse im Verlauf der Förderung festzustellen, sondern die Schülerinnen und Schüler machen bei der Bearbeitung der Fragebögen auch deutlich, dass für sie ein verstärkter Strategieeinsatz denkbar wäre.

Besonders bedenkenswert bei den Fragebogenanalysen erscheinen zudem die Haltungen der Schülerinnen und Schüler gegenüber mathematischen Textaufgaben. Nicht nur, dass zu Beginn der Sprachförderung Schülerinnen und Schülern derartigen Aufgaben eher ablehnend gegenüberstehen, auch nach einem Jahr der intensiven Auseinandersetzung gibt es hier keine signifikanten Zuwächse. Gerade die in den beiden Klassen Nr. 3 und Nr. 4 sogar deutlich gesteigerten Ressentiments belegen, dass neben den Sprachhandlungen auch in diesem Bereich der vermehrte Einsatz von vermeintlich sprachförderlichen Textaufgaben teilweise zu negativen Einstellungsveränderungen bei den Schülerinnen und Schülern geführt hat, obwohl gerade diese Klassen aufgrund der sprachlichen und mathematischen Fähigkeiten als so leistungsstark angesehen werden können, dass die empirisch eher schwierigeren Textaufgaben auf der Performanzebene keine größeren Probleme verursachen sollten. Dies erscheint nicht nur für einen sprachsensiblen Fachunterricht, sondern selbst im Rahmen eines ausschließlich mathematisch-inhaltlich bezogenen Fachunterrichts als unbefriedigende Kompetenzentwicklung.

So ambivalent wie die Ergebnisse der Befragungen erscheinen, so deutlich zeigen sich im Bereich der Leistungsentwicklung, dass die Schülerinnen und Schüler nicht nur bei spezifischen fachmathematischen Aufgabenstellungen (siehe Abschn. 4.2) im Verlauf des Schuljahres signifikante Zuwächse erzielen, sondern auch durchgängig höhere Leistungen beim Verstehen von Textaufgaben sowie bei der Verwendung des mathematischen Fachwortschatzes. Dass dabei die leistungsschwächste Klasse beim Textverständnis keinerlei Zuwächse verzeichnen kann, mag als Einzelfall gelten. Hingegen offenbaren die absoluten Lösungsraten bei den Fachwörtern am zweiten Messzeitpunkt, dass auch die explizit darauf abzielende Sprachförderung die normativen Ziele der Lehrpläne nicht zu erfüllen vermag. Hierbei gilt es zu beachten, dass diese Zuwächse beim Textverständnis bzw. dem Wortschatz neben dem diesbezüglichen Vorwissen insbesondere bei sprachstärkeren Schülerinnen und Schülern bzw. bei Jungen und fachlich Leistungsstärkeren zu verzeichnen sind.

Dass insbesondere die sprachlichen Fähigkeiten, aber nicht die sprachlich-biographischen Personenmerkmale, wie Muttersprache oder gesprochene Sprache zuhause, einen Einfluss auf das Textaufgabenverständnis zum Ende der Förderung haben, zeigt, dass keine spezifische Sprachförderung, im Sinne von Mathematikförderung für DaZ-Schülerinnen und -Schüler, sondern vielmehr eine Förderung für alle, insbesondere aber für die sprachlich schwächeren Schülerinnen und Schüler stattfinden sollte. Ergänzend hierzu zeigen auch Prediger und Wessel (2018), dass sprachlich schwache ein- und mehrsprachige Schülerinnen und Schüler dieselben Schwierigkeiten haben und somit dieselbe fachspezifische Sprachförderung benötigen.

Für die praktische Gestaltung von Sprachfördermaßnahmen lassen sich aus den hier vorgestellten Ergebnissen zumindest folgende tentative Gestaltungsprinzipien ableiten:

  1. 1.

    Neben eher kognitiven Elementen der fachspezifischen Sprachförderung sollte insbesondere in Unterrichtsfächern, die bisher vermeintlich eine eher geringe Nähe zu Texten bzw. Sprache aufwiesen, darauf Wert gelegt werden, dass Schülerinnen und Schüler gegenüber diesen Lernelementen eine grundsätzlich positive(re) Haltung einnehmen; gerade wenn hiermit Veränderungen in den Einstellungen bzw. beliefs verbunden sind.

  2. 2.

    Insbesondere der vermehrte Einsatz neuer unterrichtlicher Elemente wie z. B. angeleitete Sprachhandlungen oder umfangreichere Textaufgaben sollte stets mit einer reflexiven Grundhaltung in den bisherigen Normalunterricht integriert werden, um nicht als künstliche oder gar störende Fremdkörper aufgefasst und entsprechend von den Schülerinnen und Schülern abgelehnt zu werden.

  3. 3.

    Im Rahmen der stärkeren Auseinandersetzung mit (Fach‑)Sprache und eines damit evtl. einhergehenden gesteigerten sprachlichen Anspruchs muss in besonderem Maße auf die Adaptivität der Fördermaßnamen geachtet werden, damit der zweite Aspekt des sogenannten Matthäuseffekts vermieden wirdFootnote 9 und auch sprachlich schwächere Schülerinnen und Schüler profitieren.

  4. 4.

    Auch wenn Sprachfördermaßnahmen anscheinend einen umfangreicheren Einsatz von strategischen Handlungsweisen bewirken, so besteht in dieser Allgemeinheit kein – zumindest messbarer – Zusammenhang mit evtl. Leistungsveränderungen. Entsprechend vorsichtig sollten Fördermaßnahmen bei der Vermittlung von nur bedingt evidenzbasierten Förderkatalogen (z. B. Leisen 2010) sein und evtl. eher auf die wenigen bisher empirisch abgesicherten fachspezifischen Verstehensstrategien (Leiss et al. 2019; Prediger und Krögeloh 2015) fokussieren.

  5. 5.

    Um eine Steigerung der Effekte von Sprachfördermaßnahmen bezüglich der Einstellungen der Lehrpersonen bzw. der Schülerinnen und Schüler oder zentraler Leistungsvariabelen zu erzielen, evtl. auch nur in einem fokussierten Bereich, erscheint unter Gewährung entsprechender Ressourcen eine stärkere Integration der Lehrpersonen in die Erstellung der Sprachfördermaterialien zweckdienlich.

Scheinen die Analysen der vorliegenden Studie diese Interpretationen auch nahezulegen, so bedarf es diesbezüglich spezifischer und inhaltlich stärker fokussierter Studien, die im Rahmen eines methodisch kontrollierten Settings einzelne Aspekte untersuchen. Damit muss deutlich auf die Grenzen des vorliegenden Ansatzes hingewiesen werden. Da es sich bei der vorliegenden Studie um wissenschaftliche Begleitforschung handelt, die ein bereits geplantes Fördervorhabens evaluieren sollte, bestand nur in eingeschränktem Maße die Möglichkeit, ein klares Forschungsdesign mit speziell darauf abgestimmten Untersuchungsinstrumenten umzusetzen. Vielmehr gibt es viele Elemente, die den Anforderungen der schulischen (Förder‑)Praxis genügen mussten und entsprechend wissenschaftlich nicht immer die Anforderungen an starke Designs erfüllen (Rost 2013). Als stärkstes Defizit mag hier insbesondere das Fehlen einer Kontrollgruppe erscheinen, da mit den vorliegenden Daten offen bleibt, inwiefern die gemessenen Effekte insbesondere auf das BiSS-Förderprogramm und nicht primär auf andere Variablen zurückzuführen sind. Aber auch das mangelnde Wissen, inwiefern die intendierte Sprachförderung in den einzelnen Klassen auch umgesetzt wurde, zeigt den Bedarf an ergänzenden Unterrichtsbeobachtungen und Lehrkräftebefragungen, welche aufgrund des Projektumfangs nur bedingt realisiert werden konnten. Hier gilt es eine Balance zwischen strengen wissenschaftlichen Gütekriterien und einem praxisrelevanten Erkenntnisgewinn zu wahren. Neben dieser Grundsatzproblematik gibt es allerdings weitere, insbesondere die Instrumente betreffende Aspekte, die auch bei einer nochmaligen Durchführung in einem ähnlichen Setting überarbeitet werden müssten. So sollte u. a.

  • um das Problem der teilweise zu niedrigen Fallzahlen (z. B. durch die extreme drop-out-Rate) bei den Analysen zu verringern, ein Testdesign verwendet werden, dass über alle Jahrgänge hinweg Ankeritems verwendet,

  • die Erfassung der eher negativen Einstellungen Textaufgaben gegenüber durch eine reliable Skala und nicht nur durch ein einzelnes Item erfolgen und

  • das Konstrukt des mathematikaufgabenbezogenen Textverständnisses noch durch weitere inhaltlich differenziertere Operationalisierungen sowie der Fachwortschatz durch ein umfangreicheres Instrument erfasst werden.

Aspekte wie z. B. die zeitliche Verschiebung der Erhebungen im Schulhalbjahr zwischen den Klassen oder eine Kontrolle des realisierten Curriculums müsste bei zukünftigen Evaluationsprojekten unbedingt stärker als bisher in Betracht gezogen werden, auch wenn dadurch ggfs. die Anzahl der beforschten Förderverbünde einzuschränken wäre.

Bilanzierend kann festgestellt werden, dass eine derartige prozessbegleitende Evaluation eines größeren Sprachfördervorhabens wie dem BiSS-Projekt zwar wissenschaftlich mit zahlreichen Herausforderungen verbunden ist und insbesondere im methodischen Bereich der Feldforschung mit inhaltlich und organisatorisch unterschiedlichen, aber parallel ablaufenden Interventionsstudien noch viele offen Fragen bestehen, aber dessen ungeachtet sowohl gegenüber der Bildungspolitik eine gewisse Rechtfertigung derartiger Vorhaben darstellt als auch der schulischen Praxis relevante Impulse oder Warnungen liefern kann.