1 Einleitung

Eine Vielzahl von Interventionsstudien gibt Hinweise darauf, wie evidenzbasierte Leseförderung prinzipiell gestaltet werden kann: Als besonders bewährte Methoden und Prinzipien gelten Lautleseverfahren zur Förderung der Leseflüssigkeit und die explizite Vermittlung von Lesestrategiewissen zur Förderung des Leseverständnisses, wobei sich kooperative Lernarrangements und das Lernen am Modell als wirksame Organisations- und Instruktionsformate erwiesen haben (Hattie 2009; Kamil et al. 2008; NICHD 2000; Slavin et al. 2008). Als theoretisches Rahmenkonzept wird dabei häufig auf das Konzept selbstregulierten Lernens zurückgegriffen (Dignath und Büttner 2008; Zimmerman 2000). Resümierend stellt Schneider (2019) in einem Übersichtsbeitrag fest, dass in den letzten drei bis vier Jahrzehnten eine größere Zahl nachweislich wirksamer Förderprogramme entwickelt wurde, dass allerdings Probleme beim Transfer solcher wirksamen Programme in die schulische Praxis festzustellen sind (vgl. auch Goldenbaum 2013; Gräsel 2010; Hasselhorn et al. 2014; Philipp und Souvignier 2016).

Ziel dieses Beitrags ist es, Bedingungen einer gelingenden Implementation evidenzbasierter Maßnahmen zur Leseförderung in den schulischen Alltag zu untersuchen. Die vorliegende Studie wurde im Rahmen des von Bund und Ländern geförderten Programms „Bildung durch Sprache und Schrift“ (BiSS) durchgeführt. Zwei zentrale Kriterien für die gelungene Implementation einer Maßnahme in die schulische Praxis sind, dass die Maßnahme breite Nutzung erfährt und dass sie zu positiven Effekten führt. Konkret wurden in dem BiSS-Evaluationsprojekt EILe die Nutzung von Lesefördermaßnahmen und die Frage nach Bedingungen für die Nutzung anhand der Befragung von Lehrkräften untersucht und es wurden Effekte auf die Entwicklung von Schüler*innenleistungen über zwei Schuljahre hinweg geprüft.

Während der Begriff der Implementation letztlich auf das Ziel einer hohen Verbreitung und nachhaltigen Nutzung ausgerichtet ist, wird mit dem Begriff des Transfers vor allem der Prozess des Übergangs innovativer Konzepte beschrieben, beispielsweise von der wissenschaftlichen Entwicklung in die (schulische) Anwendungspraxis (Gräsel 2010; Prenzel 2010). In diesem Sinne werden in der Folge die beiden Begriffe der Implementation und des Transfers jeweils verwendet, wenn in höherem Maße ein erwünschter Zielzustand (Implementation) oder der Prozess des Übergangs (Transfer) angesprochen werden.

2 Theorie und Forschungsstand

2.1 Leseförderung in der Sekundarstufe in zwei BiSS-Verbünden

Das BiSS-Programm bietet einen sehr praxisnahen Rahmen zur Evaluation der Implementation evidenzbasierter Konzepte zur Leseförderung. Regionale Verbünde von Schulen, die ein einheitliches Förderkonzept einsetzten, konnten sich an dem BiSS-Programm beteiligen und – optional – einer begleitenden Evaluation zustimmen. Die Evaluation erfolgte entsprechend in bestehenden Verbünden, die mit selbst gewählten Materialien arbeiteten. In dem Evaluationsprojekt BiSS-EILe konnten zwei Verbünde in einem Kontrollgruppendesign begleitet werden, deren inhaltliche Ziele den BiSS-Modulen „Diagnose und Förderung des Leseverständnisses“, „Lese- und Schreibstrategien im Verbund vermitteln“, „Selbstreguliertes Lesen und Schreiben“ sowie „Sprachliche Bildung in fachlichen Kontexten“ zugeordnet waren. In dem Verbund „Niemanden zurücklassen“ (NZL) wurde in Schleswig-Holstein das Programm „Lesen macht stark“ für die Sekundarstufe eingesetzt, während in Oberfranken (OF) ein „Lesestrategiefächer“ zum Einsatz kam.

Eine interessante Konstellation zur Evaluation der Implementation evidenzbasierter Maßnahmen zur Leseförderung ergab sich zwischen diesen beiden Verbünden insofern, als zwei deutlich unterschiedliche Konzepte realisiert wurden. Im Verbund NZL wurde eine umfangreiche Materialsammlung mit Nutzungshinweisen für Lehrkräfte zur Verfügung gestellt. Die Implementation im Verbund NZL war ursprünglich bildungspolitisch initiiert und wurde durch geschulte Lesecoaches begleitet. Die Maßnahme wurde also administrativ unterstützt und top-down implementiert. Im Verbund OF wurde ein kompakter Lesestrategiefächer eingesetzt. Die Arbeit im Verbund OF ging auf die Initiative einzelner Lehrkräfte zurück und wurde durch das freiwillige Engagement von Schulkoordinator*innen getragen (bottom-up). Eine Gegenüberstellung dieser und weiterer charakteristischer Merkmale der beiden Verbünde ist stichpunktartig in Tab. 1 zusammengestellt.

Tab. 1 Die beiden Verbünde und ihre Konzepte im Vergleich. (Aus Zeuch et al. 2018)

Eine theoretische Analyse der beiden Materialsammlungen ergab zusammenfassend, dass sie mit einer Anleitung kognitiver und metakognitiver Strategien den aktuellen Forschungsstand zu einer Vermittlung selbstregulierten Lesens berücksichtigen. Es ist daher angemessen, von evidenzbasierten Konzepten zur Leseförderung zu sprechen. Ausführlichere Beschreibungen und Analysen der Materialien finden sich in Veröffentlichungen von Jost et al. (2018), Karstens et al. (2019) und Schmitz et al. (2021).

2.2 Implementationsmodelle für den schulischen Kontext

In der Implementationsforschung werden häufig die Kriterien der Akzeptanz, Angemessenheit, Machbarkeit, Wiedergabetreue, Implementationskosten, Durchdringung und Nachhaltigkeit als Indikatoren für eine gelungene Implementation betrachtet (Proctor et al. 2009). Im Grunde decken diese Kriterien eine zeitliche Spanne ab, die sich von ersten Begegnungen mit einer Maßnahme (wie akzeptabel erscheint sie) über Erfahrungen mit deren Einsatz (z. B. Wiedergabetreue) bis hin zu der Entscheidung für eine routinemäßige Nutzung im schulischen Alltag erstreckt (vgl. auch Hasselhorn et al. 2014).

Ob der Transfer von Innovationen im schulischen Kontext gelingt, ist von einer Vielzahl an Bedingungen abhängig. Beschreibungen einzelner Fallbeispiele zur Einführung innovativer Maßnahmen an Schulen (z. B. Altrichter und Posch 1996) oder Analysen aus Modellversuchen (z. B. Berkemeyer et al. 2008) illustrieren dabei anschaulich das komplexe Zusammenspiel unterschiedlicher Faktoren. Diese liegen zum einen bei den zu implementierenden Maßnahmen selbst und zum anderen im schulischen Umfeld begründet (Gräsel 2010; Souvignier 2020). Eine Illustration zur Systematisierung für ein solches Bedingungsmodell ist in Abb. 1 dargestellt. Hier finden sich zunächst Merkmale der zu transferierenden Maßnahmen. Materialien können einfach oder sehr umfassend sein, sie beziehen sich auf unterschiedliche Inhalte, die Einführung kann durch Fortbildungsmaßnahmen begleitet sein (oder auch nicht). So zeigte sich beispielsweise, dass Maßnahmen, die als zu komplex und zeitaufwändig wahrgenommen wurden und die nicht in Einklang mit persönlichen Überzeugungen der Lehrkräfte standen, in geringerem Maße Akzeptanz fanden (Elliott 1988; Wickstrom und Witt 1993). Die Frage nach der Passung zwischen der Maßnahme und der konkreten schulischen Anwendungssituation leitet zu dem Komplex des schulischen Umfelds über: zu implementierende Maßnahmen sollten zu den Bedürfnissen von Schüler*innen sowie zu den Lehrkräften passen (Albin et al. 1996; Lindo und Elleman 2010). In Bezug auf das schulische Umfeld werden typischerweise die vier Aspekte der konkret zu unterrichtenden Schüler*innen (z. B. deren Heterogenität, Leistungsfähigkeit), individuelle Eigenschaften auf Seiten der Lehrkraft (Selbstwirksamkeitserleben, Motivation, Kenntnisse), Merkmale der Schule (kollegiale Kooperation, Unterstützung durch die Schulleitung), aber auch die administrative Unterstützung (Entlastung, Fortbildungsangebote) als Bedingungsfaktoren genannt (Gräsel 2010; Hasselhorn et al. 2014; Teerling und Köller 2019).

Abb. 1
figure 1

Bedingungsmodell für den Transferprozess. (Vgl. Meudt 2019; Souvignier 2020)

Wenn die Bedingungsfaktoren sich in einer stimmigen Weise ergänzen, dann sollte sich das in hoher Akzeptanz, hoher wahrgenommener Machbarkeit und der Einschätzung von Angemessenheit seitens der Lehrkräfte niederschlagen (vgl. Clarke und Hollingsworth 2002). Inwieweit einzelne Bedingungsfaktoren eine besonders herausgehobene Bedeutung haben oder ob eher das Zusammenspiel aus konkreten Merkmalen entscheidend ist, ist nicht eindeutig geklärt. Zu erwarten ist, dass günstige Bedingungen und die resultierenden Akzeptanz- und Machbarkeitseinschätzungen längerfristig zu einem entsprechenden Verhalten von Lehrkräften beitragen, beispielsweise im Hinblick auf eine hohe Implementationstreue (O’Donnell 2008) und nachhaltige Nutzung (Hasselhorn et al. 2014).

3 Die vorliegende Studie und Fragestellungen

In dem BiSS-Evaluationsprojekt EILe wurde die Implementation zweier Konzepte zur Leseförderung über einen Zeitraum von zwei Schuljahren begleitet. Insgesamt wurden dabei vier methodische Zugänge miteinander kombiniert: Die Materialien für die Leseförderung wurden im Hinblick auf deren theoretische Fundierung analysiert, es wurden Unterrichtsbeobachtungen durchgeführt, die Lehrkräfte wurden befragt und die Leistungsentwicklung der Schüler*innen wurde im Rahmen eines Kontrollgruppendesigns mit standardisierten Testverfahren erhoben. Die Analyse der Förderkonzepte zeigte, dass in beiden Konzepten zentrale Aspekte zur Förderung selbstregulierten Lesens berücksichtigt wurden und sie sich vorwiegend auf das Fach Deutsch beziehen (s. oben). Die Ergebnisse aus den Unterrichtsbeobachtungen legen allerdings nahe, dass die Materialien in den Verbünden eher selten zum Einsatz kamen (Schmitz et al. 2021). Während die Förderansätze im Deutschunterricht sporadisch genutzt wurden, wurde im Fachunterricht kaum darauf zurückgegriffen. Prinzipien strategieorientierter Leseförderung (u. a. Einsatz kognitiver und metakognitiver Lesestrategien, explizite Strategieinstruktion) kamen in den beiden Verbünden im Rahmen der beobachteten Unterrichtsstunden in vergleichbar geringem Umfang zum Einsatz. Erste Auswertungen der Befragung der Lehrkräfte, in denen ebenfalls von einer zurückhaltenden Nutzung der Materialien berichtet wird, stehen in Einklang mit diesen Beobachtungsdaten (Schmitz et al. 2021). Dieses Befundmuster zeigte sich weitgehend übereinstimmend für die beiden Verbünde und unabhängig von den unterschiedlichen Konzepten, die jeweils realisiert wurden. Ziel des vorliegenden Beitrags ist es, die beiden fortgeschrittenen Befragungs- und Testzeitpunkte des Evaluationsprojekts am Ende des ersten und des zweiten Projektschuljahres in den Blick zu nehmen. Dies erscheint vor allem vor dem Hintergrund der zeitlichen Erstreckung von Implementationsprozessen interessant (Hasselhorn et al. 2014).

Um Hinweise zum Implementationsprozess aus der Perspektive der Lehrkräfte zu analysieren, werden drei Fragestellungen zu jeweils zwei Befragungszeitpunkten behandelt. Konkret werden dazu Variablen auf der Ebene der Lehrkräfte selbst (Einstellungen zu Leseförderung, Motivation bzgl. Leseförderung, Selbstwirksamkeit bzgl. Leseförderung und Wissen über Leseförderung), der Schule (Kooperation innerhalb der und zwischen den Schulen), sowie bezogen auf Einschätzungen und Einstellungen zum Fördermaterial (Akzeptanz, Machbarkeit) und das Verhalten der Lehrkräfte (Wiedergabetreue, Nutzung) herangezogen.

Zunächst wird ein Vergleich zwischen den beiden Verbünden hinsichtlich ausgewählter Variablen des Bedingungsmodells angestellt. Erwartet wird, dass sich die Implementationsbedingungen auf der Ebene der Lehrkräfte selbst und der Schule zwischen den beiden Verbünden nicht unterscheiden. Aufgrund der Unterschiedlichkeit der Maßnahmen, die sich zum einen auf die Implementationsstrategie (top-down vs. bottom-up) und zum anderen auf Umfang und Inhalte der Förderkonzepte bezieht, gehen wir davon aus, dass sich hinsichtlich der resultierenden Implementationsmerkmale der Akzeptanz, der Machbarkeit, der Wiedergabetreue und der Nutzung Unterschiede zwischen den Bedingungen ergeben.

Ergänzend wird geprüft, ob Unterschiede zwischen den Angaben von Deutsch- und Fachlehrkräften vorliegen. Da eine strategieorientierte Leseförderung im Fachunterricht bislang noch eher wenig verbreitet ist und sich die Bedeutung/der Stellenwert von Leseförderung im Dienste des fachlichen Lernens vom Deutschunterricht unterscheidet (Schmellentin 2018) sowie das Lesefördermaterial überwiegend auf das Fach Deutsch ausgerichtet war, wird erwartet, dass Unterschiede sowohl im Hinblick auf die Bedingungsfaktoren (Einstellungen, Selbstwirksamkeit, Wissen zu Leseförderung und kollegiale Kooperation) als auch auf die Implementationsmerkmale vorliegen.

In einem dritten Schritt werden Zusammenhänge zwischen den Bedingungsfaktoren und den Implementationsmerkmalen ausgewertet, um zu prüfen, ob einzelne Variablen sich als zentrale Bedingungen für eine gelingende Implementation erweisen oder ob eher davon auszugehen ist, dass die gesamte Breite der in den Implementationsmodellen aufgeführten Merkmale sich als bedeutsam erweist (vgl. Abschnitt 2.2). Dabei gehen wir davon aus, dass generell alle in den Implementationsmodellen aufgeführten Merkmale zum Gelingen von Implementationsprozessen beitragen. In diesem Sinne erwarten wir Interkorrelationsmuster mit durchgängig hoher Ausprägung der wechselseitigen Zusammenhänge.

Als weiteres zentrales Kriterium für eine wirksame Implementation wurden Effekte hinsichtlich der Veränderung von Lesekompetenzen bei den Schüler*innen untersucht. Als zentrale Merkmale wurden hierzu das Leseverständnis, die Leseflüssigkeit, das Lesestrategiewissen und die Lesefreude der Lernenden einbezogen, die auch durch die Förderkonzepte in den BiSS-Verbünden adressiert werden sollten.

Es wird erwartet, dass die Lesekompetenzen in den BiSS-Verbünden sich positiver entwickeln als in der Kontrollgruppe, in der keine spezifische Leseförderung implementiert wurde. Da sich im Rahmen der Unterrichtsbeobachtungen zeigte, dass das jeweilige Fördermaterial in unterschiedlicher Intensität genutzt wurde, wurde zusätzlich explorativ ausgewertet, ob sich Klassen mit hohem im Vergleich zu geringem Materialeinsatz hinsichtlich der Veränderung der Lesekompetenz voneinander unterscheiden.

4 Methode

4.1 Untersuchungsdesign und Stichprobe: Lehrkräftebefragungen

Zur Beantwortung der Fragestellungen 1 bis 3 wurden Lehrkräftebefragungen mit standardisierten Instruktionen in den BiSS-Verbünden durchgeführt, die neben Deutschlehrkräften auch Fachlehrkräfte (in NZL Mathematik, in OF Biologie) einbezogen. Die hier verwendeten Daten stellen einen Ausschnitt aus den Gesamtbefragungen dar. Wegen hoher Dropout-Raten und wechselnder Beteiligung von Lehrkräften an den Befragungen war eine zuvor geplante längsschnittliche Betrachtung nicht möglich. Da die Beteiligung an der Online-Befragung sehr gering ausfiel, wurden die Fragebögen als Papierversion an die Lehrkräfte versandt und mit Hilfe der Verbundkoordinator*innen gebündelt an das Projektteam zurückgeschickt. Der Rücklauf war dennoch auch in der Paper-Pencil-Version vergleichsweise gering. Da die Befragungen sich auf eine große Zahl potenziell für die Implementation relevanter Variablen wie Eigenschaften der Lehrkräfte, Schulen und Materialien bezogen, wurden einige Skalen nur zu einzelnen Zeitpunkten vorgegeben, während andere Variablen wiederholt abgefragt wurden. Auf diese Weise sollte der zeitliche Umfang der Befragung so gering wie möglich gehalten werden. Die Befragung bestand im Wesentlichen aus geschlossenen Items zu Themenbereichen wie Förderpraxis, Einschätzung des Implementationsprozesses, persönlichen Eigenschaften wie Einstellungen. Die Beantwortung erfolgte im Likert-Format (sieben- bis achtstufige Skalen) oder als Ja-Nein-Antwort. Wurde mehr als die Hälfte der Items einer Skala nicht beantwortet, wurde die entsprechende Skala als fehlend behandelt. Tab. 2 gibt einen Überblick über die hier einbezogenen Skalen mit ihren Merkmalen, Quellen und Messzeitpunkten.

Tab. 2 Übersicht der einbezogenen Skalen und Konstrukte mit Erhebungszeitpunkten, deskriptiven Statistiken und internen Konsistenzen

Die aus den Lehrkräftebefragungen ausgewählten Variablen stammen aus den Befragungen am Ende des ersten Projektschuljahres (MZP 2: Frühjahr/Sommer 2017) und Ende des zweiten Projektschuljahres (MZP 3: Frühjahr/Sommer 2018) und erlauben einen Blick auf die Rahmenbedingungen und Konsequenzen zu einem fortgeschrittenen Zeitpunkt des Projekts und des Implementationsprozesses.

Der Rücklauf lag zum zweiten Messzeitpunkt bei Abgaben von 100 Lehrkräften (Rücklaufquote = 33 %) und zum dritten Messzeitpunkt bei 98 Lehrkräften (Rücklaufquote = 32 %). Nicht von allen Lehrkräften liegen demographische Angaben vor, da die Angaben freiwillig waren.

Zum zweiten Messzeitpunkt waren 57 % der Befragten Deutschlehrkräfte, 78 % der Befragten waren weiblich mit einem mittleren Alter von 40,78 Jahren (SD = 10,23 Jahre; Range 25–63), die im Mittel über eine Berufserfahrung von 14,47 Jahren (SD = 10,86 Jahre; Range 0–42) verfügten. 23,5 % unterrichteten an einer Realschule, 3,7 % an einem Gymnasium und 53,1 % an einer Schule mit mehreren Bildungsgängen. Zum dritten Messzeitpunkt waren 66 % der Befragten Deutschlehrkräfte, 77 % der Befragten waren weiblich mit einem mittleren Alter von 43,65 Jahren (SD = 10,66 Jahre; Range 27–65), die im Mittel über eine Berufserfahrung von 16,72 Jahren (SD = 10,97 Jahre; Range 0,5–42) verfügten. Die Schulform wurde zum dritten Zeitpunkt nicht erhoben.

4.2 Untersuchungsdesign und Stichprobe: Kompetenztestungen der Schüler*innen

Zur Beantwortung der Frage 4 wurden Daten aus den Kompetenztestungen der Schüler*innen ausgewählt. Die Kompetenztestungen waren als Längsschnitt über die beiden Projektschuljahre angelegt und fanden dreimal statt. Es wurde ein Kontrollgruppendesign mit Messwiederholung realisiert, bei dem neben den Schulen der beiden Verbünde Kontrollschulen aus Nordrhein-Westfalen teilnahmen, an denen keine spezifischen Lesefördermaßnahmen umgesetzt wurden. Die Testungen wurden durch geschulte studentische Mitarbeiter*innen des Projektteams unter weitestgehend standardisierten Bedingungen durchgeführt und umfassten jeweils etwa zwei Schulstunden. Dabei wurden neben klassischen Kompetenzfacetten wie Leseflüssigkeit, Leseverständnis und Lesestrategiewissen auch Einstellungen und Wahrnehmungen des Unterrichts auf Seiten der Schüler*innen erfasst. Tab. 3 zeigt die im vorliegenden Beitrag einbezogenen Skalen und ihre Merkmale sowie die Quellen der Instrumente.

Tab. 3 Überblick über die in den Kompetenztestungen erfassten Konstrukte und ihre Kennzeichen

Es erfolgte eine Längsschnitterhebung mit insgesamt 1054 Schüler*innen, von denen 814 an allen drei Messzeitpunkten teilnahmen (im Mittel 10,32 Jahre alt, SD = 0,57 Jahre, Range = 9–13 Jahre). Davon stammten 22 % aus NZL, 49 % aus OF und 29 % aus der KG. 50 % waren weiblich, 78 % gaben als Muttersprache Deutsch an. Als Kontrollvariablen wurden neben dem Geschlecht und der Muttersprache der Wortschatz (M = 18,69, SD = 4,57) sowie als Indikator für den sozioökonomischen Status der Buchbesitz (M = 3,64, SD = 1,16; Paulus 2009) herangezogen. Zusätzlich wurde wegen der unterschiedlich über die Verbünde verteilten Schulformen berücksichtigt, ob es sich um Gymnasien oder Gesamt‑/Realschulen handelte. Für die explorative Fragestellung nach unterschiedlichen Effekten in Klassen mit und ohne Materialeinsatz wurden auf Basis der Unterrichtsbeobachtungen aus dem zweiten Projektjahr zwei Gruppen von Klassen gebildet, in denen Materialeinsatz wie intendiert (d. h. Nutzung des über den Verbund bereitgestellten Materials) stattgefunden hatte bzw. in denen das Material nicht (wie intendiert) eingesetzt wurde. Diese beiden Gruppen wurden wiederum hinsichtlich der Entwicklung der Lesekompetenz miteinander verglichen.

Die Gesamtdatensätze des Evaluationsprojekts und eine entsprechende Dokumentation liegen unter der folgenden Quelle vor: Souvignier et al. (2020).

4.3 Datenanalysen

Alle Analysen erfolgen mit der SPSS Version 26 (IBM Corp. 2019) bzw. für die Entwicklung der Schüler*innenkompetenzen mit Mplus 6.1 (Muthén und Muthén 2010).

Fragestellungen 1 und 2 (Unterschiede auf Ebene der Lehrkräfte zwischen den Verbünden bzw. zwischen Deutsch- und Fachlehrkräften) werden varianzanalytisch geprüft (Post-Hoc-Analysen mit Bonferroni-Korrektur; genaugenommen wurden mehrere t‑Tests unter der Annahme von Varianzgleichheit durchgeführt, da in die Varianzanalyse nur zwei Gruppen (NZL und OF) aufgenommen wurden). Die dritte Fragestellung (Zusammenhänge zwischen den Bedingungsfaktoren und den Implementationsmerkmalen) wird anhand von Korrelationen beantwortet. Dabei ergeben sich zusätzlich zu den Korrelationsmustern in der Gesamtstichprobe insgesamt vier weitere mögliche Muster (zwei Verbünde × zwei Messzeitpunkte). Im vorliegenden Beitrag werden nur die Ergebnisse für die gesamte Stichprobe zu den beiden Zeitpunkten berichtet. Die Ergebnisse getrennt nach Verbünden finden sich im Online-Supplement. Zur Betrachtung von Frage 4 (Entwicklung der Lesekompetenz der Schüler*innen) werden latente Wachstumskurvenmodelle (latent growth curve models, LGCM; Bollen und Curran 2006) mit Regression der slopes auf die Verbundzugehörigkeit unter Kontrolle der herangezogenen Variablen Wortschatz, Geschlecht, Muttersprachlichkeit, Buchbesitz und Schulform und unter Berücksichtigung der Mehrebenenstruktur der Daten (Schüler*innen genested in Schulklassen; vgl. Cohen et al. 2003) betrachtet. Fehlende Werte werden mit Hilfe von Full Information Maximum Likelihood (FIML; Graham 2009) behandelt.

5 Ergebnisse

5.1 Ergebnisse der Lehrkräftebefragungen (Fragestellungen 1 bis 3)

Bezüglich der ersten Fragestellung zu Unterschieden zwischen den beiden Verbünden hinsichtlich der Bedingungsfaktoren und Implementationsvariablen zeigte sich zum Ende des ersten Projektjahres, dass innerhalb einer Schule häufiger in NZL als in OF kooperiert wurde und dass ein höheres Maß an Materialnutzung im Verbund NZL angegeben wurde. Hinsichtlich der Akzeptanz auf Seiten der Lehrkräfte liegen keine Unterschiede zwischen den Verbünden vor. Zum dritten Messzeitpunkt fällt die Selbstwirksamkeit in OF höher aus als in NZL. Die Implementationstreue ist am Ende des zweiten Projektjahres ebenfalls im Verbund OF höher. Die Ergebnisse sind in Tab. 4 dargestellt. Aufgrund der zu geringen Überschneidung der beiden Lehrkräfte-Stichproben zwischen den beiden Messzeitpunkten ist ein direkter Vergleich im Sinne eines Trends über die Zeit hinweg leider nicht möglich.

Tab. 4 Unterschiede in den ausgewählten Variablen aus der Befragung der Lehrkräfte zwischen den Verbünden zum zweiten und zum dritten Messzeitpunkt

Die Ergebnisse zu der zweiten Fragestellung sind in Tab. 5 aufgeführt. Erwartungskonform zeigen sich hier Unterschiede zu Gunsten der Deutschlehrkräfte in allen Skalen zum zweiten und in mehreren Skalen zum dritten Messzeitpunkt. Entgegen der Erwartungen weisen aber Fachlehrkräfte zum dritten Messzeitpunkt keine ungünstigeren förderbezogenen Einstellungen, keine geringere Kooperation auf Verbundebene, keine geringere Akzeptanz oder Einschätzung der Machbarkeit und auch keine geringere Nutzungshäufigkeit (Ausnahme: NZL-spezifisches Material) auf als Deutschlehrkräfte.

Tab. 5 Unterschiede in den ausgewählten Variablen aus der Befragung der Lehrkräfte zwischen Deutsch- und Fachlehrkräften zum zweiten und zum dritten Messzeitpunkt

Im Hinblick auf die Zusammenhänge zwischen den Bedingungsfaktoren und den Implementationsmerkmalen (Fragestellung 3) liegen am Ende des ersten Projektschuljahres wie erwartet moderate bis hohe signifikante positive Korrelationen zwischen allen betrachteten Skalen vor. Dies gilt gleichermaßen für die Gesamtstichprobe wie für die getrennte Betrachtung der beiden Verbünde. In Tab. 6 sind die Interkorrelationsmuster für diesen Messzeitpunkt abgebildet. Zu Messzeitpunkt 3 (Tab. 7) fallen die Korrelationen insgesamt etwas geringer aus, und getrennt nach Verbünden ergibt sich ein differenzierteres Bild. Die Wissensskala weist insgesamt tendenziell niedrigere Zusammenhänge zu den weiteren Variablen auf. Die Kooperation im Verbund steht nicht in nennenswertem Zusammenhang mit der Implementationstreue und der Nutzung der Förderkonzepte. Während die Akzeptanz im Verbund NZL weniger systematische Zusammenhänge mit den weiteren Variablen aufweist, ist es im Verbund OF die Selbstwirksamkeit, die sich im Interkorrelationsmuster als etwas unabhängiger erweist. Mit aller Vorsicht deutet sich hier über die Zeit hinweg an, dass nach einem Jahr alle einbezogenen Variablen von Bedeutung für eine gelingende Implementation sind, während nach zwei Projektjahren einzelne kompensatorische Muster (Möglichkeit des Ausgleichs einer geringeren Variablenausprägung durch höhere Werte in einer anderen Variablen) sichtbar werden.

Tab. 6 Interkorrelationsmuster zwischen Bedingungsfaktoren und Implementationsmerkmalen zum zweiten Messzeitpunkt
Tab. 7 Interkorrelationsmuster zwischen Bedingungsfaktoren und Implementationsmerkmalen zum dritten Messzeitpunkt

In einer Hauptkomponentenanalyse wurde ergänzend geprüft, ob eine Gruppierung von Bedingungsfaktoren möglich ist. Dabei zeigte sich für beide Messzeitpunkte ein einzelner dominanter Faktor, neben dem keine bedeutsamen weiteren Faktoren identifiziert werden konnten. Dieses Ergebnis unterstützt die Annahme, dass alle in die Analysen einbezogenen Variablen Teil eines umfassenden Bedingungsgefüges sind.

5.2 Ergebnisse der Kompetenztestungen (Fragestellung 4)

Für die vierte Fragestellung sind die Ergebnisse zur Kompetenzentwicklung in Tab. 8 zusammengefasst. Die Ergebnisse der latenten Wachstumskurvenmodelle finden sich in Tab. 9. Insgesamt zeigt sich ein guter bis zufriedenstellender Fit für alle Modelle (vgl. Schermelleh-Engel et al. 2003). Es fällt zunächst auf, dass deskriptiv Niveauunterschiede zwischen NZL, OF und der KG vorliegen, die weitgehend über alle drei Messzeitpunkte erhalten bleiben. Bezogen auf die Entwicklung der Leseleistungen, des Lesestrategiewissens und der Lesefreude (Regression Slope auf Verbundzugehörigkeit) zeigen sich keine durchgängigen Vorteile für die beiden Verbünde im Vergleich zur KG. So fällt lediglich die Entwicklung der Leseflüssigkeit in den Verbünden OF und NZL höher aus als in der KG. Unerwartet ist, dass die Entwicklung des Lesestrategiewissens in der KG höher ausfällt als in OF. Anzumerken ist, dass die verschiedenen Kontrollvariablen unterschiedlichen Einfluss auf die Entwicklung der Kompetenzfacetten haben, während der Wortschatz und die Schulform Gymnasium durchgängig den Ausgangswert der Facetten in erwarteter Richtung beeinflussen (Gymnasialschüler*innen und Schüler*innen mit einem größeren Wortschatz erreichen höhere Ausgangswerte). Bis auf die Leseflüssigkeit gilt dies auch für den Buchbesitz (höhere Werte bedeuten höhere Ausgangswerte). Unter Kontrolle dieser Konstrukte zeigt sich nur für den Verbund OF ein höherer Ausgangswert im Leseverständnis verglichen mit der KG.

Tab. 8 Deskriptive Statistiken in den Verbünden und in der KG
Tab. 9 Ergebnisse der latenten Wachstumskurvenmodelle zu Unterschieden in der Entwicklung von Lesekompetenzen zwischen den Gruppen

Explorativ wird im Rahmen der vierten Fragestellung betrachtet, ob in Klassen mit Materialeinsatz (d. h. Einsatz des Verbundmaterials wie im Implementationsdesign vorgesehen) stärkere Zuwächse in den Facetten der Lesekompetenz festzustellen sind als in den Klassen, die das Verbundmaterial nicht wie intendiert oder anderes Material einsetzten (Erfassung im Rahmen der Unterrichtsbeobachtungen). Die entsprechende Gruppenbildung wurde anhand des Materialeinsatzes in den beobachteten Unterrichtsstunden vorgenommen. Die in Tab. 10 zusammengefassten Ergebnisse weisen deskriptiv etwas höhere Differenzen von t1 zu t3 in den Klassen mit höherer Materialnutzung für Leseflüssigkeit und Leseverständnis aus. In der latenten Modellierung (vgl. Tab. 9, „Einfluss von Materialeinsatz auf Slope“) zeigen sich hier aber keine statistisch bedeutsamen Unterschiede für die Entwicklung der Kompetenzfacetten unter Einbezug der Kontrollvariablen.

Tab. 10 Differenzierung: Deskriptive Statistiken in Abhängigkeit des Materialeinsatzes (Verbund-Material) zu t3a

6 Diskussion

6.1 Beantwortung der Forschungsfragen

In der vorliegenden Studie wurde die Implementation zweier konzeptuell unterschiedlicher Maßnahmen zur Leseförderung in der Sekundarstufe miteinander verglichen. Zusammenfassend überwiegt bei weitem der Eindruck, dass – bei aller Unterschiedlichkeit der Transfermaßnahmen – die Implementationsmerkmale in den beiden Verbünden recht ähnlich ausfielen. Unterschiede im Ergebnismuster zeigen sich insofern, als am Ende des ersten Projektjahres die Nutzungshäufigkeit in dem administrativ stärker unterstützten Verbund NZL (Materialien werden bereitgestellt; top-down Implementationsstrategie) aus Sicht der Lehrkräfte höher ausfiel, während am Ende des zweiten Projektjahres die Implementationstreue bei dem weniger umfangreichen Material des Verbunds OF höher lag. Diese letztlich gut erklärbaren Unterschiede finden allerdings keine Entsprechungen bei den Einschätzungen der Lehrkräfte im Hinblick auf Akzeptanz oder Machbarkeit im Vergleich zwischen den Verbünden.

Zu beiden Messzeitpunkten zeigt sich überwiegend, dass sowohl auf der Seite der Bedingungsfaktoren als auch hinsichtlich der Implementationsmerkmale die Deutschlehrkräfte höhere Werte aufweisen als die Fachlehrkräfte. Hier spiegelt sich die Problematik einer allzu einseitigen „Zuständigkeit“ für den Bereich der Leseförderung respektive eine unzureichende Berücksichtigung von fachlicher Ausrichtung des Materials und Involvierung der Fachlehrkräfte wider. Dabei geht es bei einer Leseförderung in den Unterrichtsfächern primär darum, dass eine fachspezifische Leseförderung auch das fachliche Lernen unterstützen kann, beispielsweise durch eine Vermittlung fachbezogener Lesestrategien, die auch die Textmusterspezifik typischer Texte in einem Fach aufgreifen (s. z. B. Schmellentin 2018). Nicht zuletzt die großen Unterschiede im Hinblick auf die Selbstwirksamkeit der Lehrkräfte weisen darauf hin, dass verstärkte empirische Forschung zu sprachlicher Bildung im Fachunterricht sowie zielgerichtete Maßnahmen zur Professionalisierung der Fachlehrkräfte wichtig wären, um hier Veränderungen bewirken zu können.

Das Zusammenhangsgefüge zwischen unterschiedlichen Bedingungsfaktoren und Implementationsmerkmalen aus Transfer- und Anwendungsphase weist am Ende des ersten Projektjahres durchgängig bedeutsame Korrelationen mit r > 0,40 aus. Alle erhobenen Variablen weisen substanzielle Zusammenhänge mit der Nutzung der Materialien auf. Gleichzeitig sind die Interkorrelationsmuster in der Gesamtstichprobe und den beiden einzelnen Verbünden weitestgehend vergleichbar. Das Gesamtbild hoher Interkorrelationen liegt auch am Ende des zweiten Projektjahres und bei einigen neu einbezogenen Variablen vor. An einzelnen Stellen weichen die Zusammenhänge in den beiden Verbünden numerisch voneinander ab, beispielsweise im Hinblick auf den Stellenwert der Akzeptanz für die Implementationstreue. Möglicherweise beeinflussen hier spezifische Rahmenbedingungen (z. B. top-down vs. bottom-up) längerfristig das Zusammenhangsgefüge der einzelnen Variablen. Auch die vereinzelten niedrigen Interkorrelationen weisen darauf hin, dass mitunter kompensatorische Bedingungen vorliegen können, sodass – längerfristig – nicht für alle potenziellen Bedingungsfaktoren gelten muss, dass diese in hohem Maße vorliegen müssen. Die insgesamt niedrigen Zusammenhänge zwischen der Kooperation im Verbund und der Wiedergabetreue sowie der Nutzung deuten darauf hin, dass diese etwas „distalere“ Form der gegenseitigen Unterstützung ein vergleichsweise geringeres Gewicht hat als die konkrete Kooperation innerhalb eines Kollegiums (vgl. Hebbecker et al. 2020).

Fasst man die Befunde aus dem Vergleich zwischen den Verbünden und den Zusammenhangsanalysen zusammen, so wird deutlich, dass Merkmale der Lehrkräfte sowie subjektive Einstellungen und die Wahrnehmung der Förderkonzepte sich nicht zwischen den Verbünden, wohl aber zwischen den Lehrkräften unterscheiden. Dabei zeigt sich, dass Bedingungsfaktoren und Implementationsvariablen wie Einstellung, Selbstwirksamkeit und Akzeptanz wesentliche individuelle Zusammenhänge mit der Nutzung der Tools aufweisen (vgl. Clarke und Hollingsworth 2002).

Die Befunde zu Effekten der beiden Konzepte auf der Ebene der Schüler*innen weisen nur sehr punktuell überlegene Entwicklungen gegenüber einer Kontrollbedingung ohne explizite Maßnahmen zur Leseförderung auf. In beiden Verbünden liegen mit Blick auf die Leseflüssigkeit kleine positive Effekte verglichen mit der KG vor. Gerade das Ergebnis zur Verbesserung der Leseflüssigkeit ist vor dem Hintergrund des strategieorientierten Lesefächers, der konkret auf eine Verbesserung des Leseverständnisses abzielt, zunächst überraschend. Ein Ansatz zur Erklärung dieses Ergebnisses mag in dem insgesamt recht niedrigen Niveau expliziter Lesestrategievermittlung liegen. In diesem Sinne liegt es nahe, in den Verbünden eher von einer allgemeinen Leseförderung auszugehen als von einer spezifischen strategieorientierten Förderung (vgl. Magnusson et al. 2019; Schmitz et al. 2021). Diese Annahme wird auch durch die negativen Effekte auf das Lesestrategiewissen im Verbund OF gestützt. Insgesamt lässt sich festhalten, dass die Ergebnisse für Lesekompetenzen, Lesestrategiewissen und Lesemotivation keinen überzeugenden Nachweis für die Wirksamkeit der beiden Konzepte darstellen. Die vergleichsweise geringe Nutzung der Förderkonzepte legte einen explorativen Vergleich zwischen Projektklassen mit höherer und niedrigerer Nutzung des Fördermaterials (auf der Basis von Unterrichtsbeobachtungen zu einem Messzeitpunkt) nahe. Deskriptiv zeigten sich etwas höhere Differenzwerte für Leseflüssigkeit und Leseverständnis in den Klassen, in denen die Förderkonzepte häufiger eingesetzt wurden. Diese Unterschiede erwiesen sich allerdings in der latenten Modellierung unter Einbezug der Kontrollvariablen nicht als statistisch signifikant.

Aber wie lassen sich ein durchgängig höheres Maß an Nutzung und Implementationstreue erreichen? Mit Blick auf die Befunde dieser Evaluationsstudie ist noch einmal hervorzuheben, dass trotz der großen Unterschiede zwischen den beiden Konzepten (Implementationsstrategien; Umfang des Materials) nur sehr kleine Unterschiede hinsichtlich der Bedingungsfaktoren und Implementationsmerkmale vorlagen. Es fanden sich allenfalls erste Hinweise darauf, dass Unterstützung von außen und einfache Materialien die Nutzung und die Implementationstreue verbessern. Vielmehr weisen aber die hohen Interkorrelationen zwischen den Bedingungsfaktoren und der Nutzung darauf hin, dass die komplexen Implementationsmodelle mit ihrer Vielzahl potenziell relevanter Variablen Gültigkeit besitzen. Die Botschaft hinter diesem Befund ist herausfordernd: Es sind viel weniger einzelne herausgehobene Merkmale, die über das Gelingen von Implementationsmaßnahmen entscheiden, als vielmehr das stimmige Gesamtpaket aus Material, Unterstützungsmaßnahmen, schulischen Rahmenbedingungen und Merkmalen der Lehrkräfte, das letztlich zu einer nachhaltigen Nutzung führen kann (Clarke und Hollingsworth 2002; Hasselhorn et al. 2014). Dass hier längerfristig eine Kompensation einzelner Bedingungsfaktoren möglich erscheint, ist sicherlich eine entlastende Botschaft, die allerdings einen „langen Atem“ erfordert.

6.2 Limitationen der Aussagekraft der vorliegenden Studie

Die Evaluation der Implementationspraxis in den bestehenden BiSS-Verbünden mit den jeweils dort eingesetzten Materialien ermöglicht ein sehr realistisches Bild schulischen Alltags. Da die Konzepte der beiden Verbünde als fertiges „Paket“ vorlagen, ist eine differenzierte Analyse einzelner Wirkfaktoren für eine gelingende Implementation in dem vorliegenden Design jedoch nicht möglich. Zudem liegt eine Konfundierung der unterschiedlichen Bedingungen mit den Bundesländern der Verbünde vor. Einflüsse aufgrund solchermaßen unterschiedlicher Rahmenbedingungen sind nicht auszuschließen. Weiterhin fallen die Stichprobengrößen unterschiedlich groß aus (knapp 50 % der Schüler*innen stammen aus OF, die kleinste Gruppe bilden die Schüler*innen aus dem Verbund NZL). Angesichts des trotz vielfältiger Anstrengungen eher moderaten Rücklaufs ist zudem eine eingeschränkte Repräsentativität der Lehrer*innenstichprobe denkbar. Das Befundmuster weist allerdings darauf hin, dass nicht einzelne besonders herausragende Bedingungsfaktoren entscheidend sind, sondern dass letztlich das in Abb. 1 dargestellte komplexe Bedingungsgefüge als Ganzes über den Erfolg von Implementationsvorhaben entscheidet. Zur Untersuchung eines solchen Bedingungsgefüges wären Strukturgleichungsmodelle ein passenderer methodischer Zugang als einfache Interkorrelationsmatrizen. In der vorliegenden Studie gelang es jedoch leider nur bei zu wenigen Lehrkräften, sie verbindlich für eine längsschnittliche Teilnahme an den Befragungen zu gewinnen. Insofern müssen die beiden Befragungen als unabhängige Erhebungen betrachtet werden. Schlussfolgerungen über die Entwicklungsdynamik in Transferprozessen können daher anhand der vorliegenden Daten nicht gezogen werden. In diesem Sinne konnte auch ein Prädiktionsmodell, das eine zeitliche Staffelung von Bedingungsfaktoren und Implementationsvariablen zulässt, leider nicht geprüft werden. Aufgrund der hohen Interkorrelationen zwischen den einbezogenen Variablen liegt zudem eine starke Multikollinearität vor, an der einfache Regressionsmodelle scheitern. Dies wird auch durch den Nebenbefund gestützt, dass sich lediglich ein dominanter Faktor für die beteiligten Skalen identifizieren lässt.

Die Befunde der vorliegenden Studie erlauben zudem keine Aussage darüber, wie wirksam die eingesetzten Förderkonzepte sind, wenn sie konsequent und mit hoher Implementationstreue eingesetzt würden. Hier setzt die faktisch erfolgte Nutzung der Maßnahmen ihre Grenzen. Wichtig ist entsprechend für alle Schlussfolgerungen bei dieser Studie im Blick zu behalten, dass die hier vorgestellten Ergebnisse bei einem insgesamt relativ niedrigen Umsetzungsniveau der Programme erzielt wurden.

6.3 Fazit

Als zentrale Kriterien für eine gelungene Implementation wurden zu Beginn des Beitrags eine breite Nutzung und positive Effekte im Hinblick auf die Entwicklung von Schüler*innenleistungen genannt. Beide Ziele wurden im Rahmen der hier evaluierten Verbünde nicht in der gewünschten Breite realisiert. Entsprechend rückt die Frage in den Fokus, welche Bedingungen eine höhere Nutzung und Implementationstreue positiv beeinflussen könnten. Aus den Befunden der vorliegenden Studie lässt sich ableiten, dass eine engere Kooperation zwischen Deutsch- und Fachlehrkräften für die Leseförderung hilfreich sein könnte. Es deutet sich auch an, dass möglichst einfache, aber mit Blick auf das Förderziel passgenaue, Materialien und die (externe) Unterstützung durch Fortbildungsmaßnahmen förderlich sind. Darüber hinaus weisen die Ergebnisse darauf hin, dass letztlich die Komplexität des gesamten Implementationsgefüges bedeutsam ist: Die Maßnahmen müssen zu den Schüler*innen und zu den individuellen Voraussetzungen der Lehrkräfte sowie den Unterrichtsfächern passen und es bedarf einer Unterstützung durch entsprechende schulische und überschulische Rahmenbedingungen. Konzepte zur Leseförderung sollten beispielsweise als umfassendes Lesecurriculum Teil schulischer Gesamtstrategien und integraler Bestandteil unterrichtlicher Textarbeit in allen Fächern werden. Erforderlich ist daher eine langfristig angelegte Implementation. Dabei benötigen Lehrkräfte zur Umsetzung von Innovationen eine angemessene Entlastung und Unterstützung in Form von Materialien, Fortbildungen und kontinuierlichem Feedback. In einem Projekt wie dem hier vorgestellten Evaluationsvorhaben wird zudem deutlich, wie wichtig eine enge Kooperation zwischen allen Akteur*innen aus Schule, Bildungsadministration und Wissenschaft wäre, damit der Transfer evidenzbasierter Konzepte in die schulische Praxis gelingen kann.