1 Einleitung

Die Förderung sprachlicher Kompetenzen von Kindern vor dem Schuleintritt ist mittlerweile selbstverständlicher Bestandteil der bildungspolitischen Bemühungen der Bundesländer. Dabei wurden in den letzten Jahren bundesweit additiv-kompensatorische Sprachfördermaßnahmen durch alltagsintegrierte Sprachbildungsansätze abgelöst. Letztere sind durch den Anspruch gekennzeichnet, lernförderliche Sprachangebote an eine Vielzahl von Bildungsaktivitäten (z. B. Buchbetrachtungen) und soziale Kommunikationsanlässe (z. B. Mahlzeiten) anschlussfähig sowie für alle Kinder, auch solche ohne expliziten Förderbedarf, zugänglich zu machen (Kucharz 2018). Die mit dieser Form der Sprachunterstützung einhergehenden Ziele setzen einen hohen sprachbezogenen Anregungsgehalt der zwischen Fachkräften und Kindern stattfindenden Interaktionen voraus. Für den Bezugsrahmen der alltagsintegrierten Sprachbildung können aktuell zwei Grundprinzipien der Realisierung einer solchen Interaktionsqualität identifiziert werden: dialogische Gesprächsführung (kurz: Dialogqualität) und Einsatz von Sprachlehrstrategien (kurz: SLS). In der Forschung ist jedoch weitgehend unklar, (1) welche genuinen Einflüsse beide Interaktionsdimensionen auf die kindliche Sprachentwicklung haben und (2) welche Rolle sie jeweils in der Mediation von Fortbildungsinhalten spielen.

Beide Förderprinzipien sind auch Schlüsselelemente der Fortbildung „Fühlen-Denken-Sprechen“ (kurz: FDS), einer Qualifizierungsmaßnahme für pädagogische Fachkräfte zur alltagsintegrierten Sprachbildung. Mit Hilfe der Projekt-Daten sucht der vorliegende Beitrag beide Fragen zu klären und dadurch Erkenntnislücken bezüglich der Wirksamkeit alltagsintegrierter Sprachbildungsprogramme zu schließen.

2 Theoretischer und empirischer Hintergrund

2.1 Zur Bedeutung der Dialogqualität für die Sprachentwicklung

Dialoge stellen ein Kernelement in aktuellen pädagogischen Konzepten, wie dem Sustained shared thinking (Siraj-Blatchford et al. 2002) oder dialogic teaching (Alexander 2008), dar. Nach dem Verständnis dieser Konzepte profitieren Kinder in ihrer Entwicklung von Interaktionen, in denen sie gemeinsam mit (kompetenten) Anderen ein Problem bearbeiten und ihren individuellen Kenntnisstand durch kritische Würdigung alternativer Sichtweisen erweitern. Lerntheoretisch kann die Bedeutung von Dialogen mit Wegerif (2019) auf den inneren Verweisungszusammenhang der Redebeiträge der Interaktionspartner zurückgeführt werden, auf dessen Grundlage diese ihre subjektiven Wissensbestände synthetisieren und weiterentwickeln können. Die Intensität des reziproken Austauschs mit (kompetenten) Anderen, an dem Kinder partizipieren, ist in dieser Sicht ein Gradmesser hoher Interaktionsqualität.

Auf dem Gebiet der Spracherwerbsforschung wird die spezifische Bedeutung von Dialogen aus sozial-interaktionistischer Perspektive mit dem Begriff der Kontingenz (auch Responsivität) in Verbindung gebracht (u. a. Girolametto und Weitzman 2002; Snow 1996). Nach Snow (1996) kann darunter ein sprachliches Interaktionsmuster verstanden werden, bei dem Äußerungen des Kindes entweder semantisch oder formal-linguistisch, z. B. durch Wiederholungen von Worten, in den Antworten des Gesprächspartners aufgegriffen werden. Je nachdem es sich dabei um semantische oder formal-linguistische Kontingenz handelt, werden zur Begründung der spezifischen Lernwirksamkeit unterschiedliche Mechanismen diskutiert.

Die Rolle semantischer Kontingenz im Spracherwerb wird häufig in Bezug auf Tomasellos Arbeiten zu geteilter Aufmerksamkeit und dem Austausch sozial-pragmatischer Bedeutungshinweise diskutiert (u. a. Tomasello und Farrar 1986), die dieser später zum „usage-based“-Ansatz ausgearbeitet hat (Tomasello 2003). Danach vollzieht sich der kindliche Erwerb sprachlicher Konventionen, einschließlich der lexikalisch-semantischen und morpho-syntaktischen Regeln, im Rahmen ihrer Nutzung zum Zweck der wechselseitigen Aufmerksamkeitssteuerung. Bereits ab dem ersten Lebensjahr begreifen Kinder das (sprachliche) Handeln der Interaktionspartner als intentionalen Versuch, die gemeinsame Wahrnehmung auf bestimmte Objekte auszurichten, und setzen die dabei verwendeten Zeichen später zur Verwirklichung eigener kommunikativer Absichten ein. Im Ergebnis dieses Rollenwechsels entsteht zwischen den Interaktionspartnern ein geteilter Bezugsrahmen für den Austausch von Symbolen (Tomasello 2003, S. 27). Darüber hinaus genügen dem Kind allgemeine kognitive Fähigkeiten der Mustererkennung und -verallgemeinerung, um aus dem semantisch kontingenten Sprachangebot grundlegende grammatische Regeln abzuleiten (Tomasello 2003). Frühe sozial-interaktionistische Theorien des Spracherwerbs (z. B. Bruner 1983), die auf die Bedeutung von Interaktionsroutinen für den Spracherwerb verweisen, stellen ebenfalls die Teilhabe am interdependenten Gebrauch sprachlicher Zeichen als Lernvoraussetzung heraus.

Das Förderpotenzial linguistisch kontingenter Kommunikation lässt sich demgegenüber vorrangig in Bezug auf ihre „datenliefernde Funktion“ (Hoff-Ginsberg 1986, S. 160) erklären. Werden (Teil‑)Äußerungen des Kindes durch den Gesprächspartner wiederholt und dabei in eine erweiterte Satzstruktur eingebettet, erhält dieses die Gelegenheit, bereits erworbene Strukturen mit neuen sprachlichen Informationen zu vergleichen. Diese und weitere Merkmale eines linguistisch kontingenten Inputs (z. B. Kontraste, Variationen) bieten dem Kind eine reichhaltige Datengrundlage für die Induktion sprachlicher Regeln (Ritterfeld 2000). Der hierbei postulierte Mechanismus einer erleichterten Informationsverarbeitung ist, wie in 2.2 ausgeführt werden wird, für zahlreiche Sprachlehrstrategien als grundlegend, und daher für die Dialogqualität als nicht spezifisch anzusehen. Etwas anderes gilt für das Konzept der semantischen Kontingenz, das mit dem eingangs dargelegten lerntheoretischen Verständnis von Dialogen vereinbar ist. Deren förderliches Potenzial wird durch die „Vertikalstruktur“ (Ritterfeld 2000, S. 420) der Kommunikation bestimmt, d. h. durch die Konnektivität aller miteinander verbundenen Redebeiträge.

2.2 Sprachlehrstrategien (SLS)

Wie oben erwähnt, kann die sprachunterstützende Funktion der SLS in Bezug auf ihre datenliefernde Funktion erläutert werden. Verallgemeinert dienen SLS dazu, die Zielformen der Sprache für Kinder in einer Weise erlebbar machen, dass diese zur Induktion des Regelsystems befähigt werden. Die spezifischen Beiträge der SLS hierzu können auf Grundlage der Fachliteratur (u. a. Dannenbauer 1999; Ritterfeld 2000) drei Funktionen zugeordnet werden (vgl. Tab. 1). Die erste Funktion besteht darin, in der Ansprache des Kindes frequenten und in Bezug auf das zu erwerbende Regelwissen hoch-informativen Input zu verwenden. Wörter oder (Teil‑)Äußerungen werden aus Gründen der Fokussierung auf zu erwerbende zielsprachliche Strukturen häufiger bzw. prägnanter, als dies in der alltäglichen Kommunikation üblich ist, benutzt. Zu diesen Input-Strategien zählt die weiter oben angesprochene (partielle) Wiederholung eigener oder kindlicher Äußerungen, sofern diese eine positive Evidenz für die Regeln der Zielsprache darstellt (Ritterfeld 2000). Davon zu unterscheiden sind die Techniken des Parallelsprechens, durch die äußerlich sichtbare Handlungen und Situationsmerkmale sowie innere Prozesse (Absichten, Gefühle) versprachlicht und, durch den nicht-sprachlichen Kontext abgesichert, in den Aufmerksamkeitsfokus des Kindes eingeführt werden (Hormann und Skowronek 2019).

Tab. 1 Übersicht der Sprachlehrstrategien (Quelle: nach Hormann und Skowronek 2019, S. 195)

Sprachelernende Kinder mit modellierenden oder korrigierenden Rückmeldungen zu ihrem eigenen sprachlichen Output zu versorgen, stellt einen zweiten Funktionsbereich der SLS dar. Dabei greifen indirekte Korrekturtechniken den sprachlichen Output des Kindes auf und präsentieren die darin enthaltenen fehlerhaften Strukturen in korrigierter Form (positive Evidenzen), ohne sie als solche zu benennen (Vermeidung negativer Evidenzen). Modellierungstechniken greifen demgegenüber die Äußerungen des Kindes auf und bilden ihre grammatische Form um bzw. vervollständigen sie durch sogenannte Expansionen in Richtung einer aus Sicht des kompetenten Interaktionspartners noch nicht (vollständig) erworbenen Zielstruktur. Korrekturstrategien stellen also Reaktionen auf Fehler, Modellierungsstrategien auf wahrgenommene Lücken in der Zielsprachproduktion des Kindes dar. In beiden Fällen rücken neue, positive Evidenzen der Zielsprache in den bestehenden Aufmerksamkeitsfokus des Kindes, die zu Vergleichen anregen (Dannenbauer 1999; Kucharz 2018).

Kindliche Äußerungen zu elizitieren, ist die Funktion eines dritten Bündels von SLS, der Output-Strategien. Die hierfür eingesetzten Fragetechniken lassen sich danach klassifizieren, ob sie das Antwortspektrum auf vorgegebene Inhalte stärker eingrenzen (geschlossene Fragen) oder es ermöglichen, dass die Kinder über die Inhalte ihrer Antwort sowie deren Formulierung frei(er) entscheiden (offene Fragen) (Ritterfeld 2000). Eine dritte Gruppe, die Ergänzungsfragen, ist dadurch gekennzeichnet, dass sie zu einer Vervollständigung der in der Frage enthaltenen Aussage in einer mehr oder weniger geschlossenen Form auffordern (Kucharz 2018). Das Förderpotenzial der Output-Strategien erschöpft sich jedoch nicht darin, Kinder zum Sprechen zu animieren und dadurch einen für die oben beschriebenen Modellierungs- und Korrekturtechniken geeigneten Output hervorzurufen. Sie liefern einen Input eigener Art, indem sie beispielweise, wie geschlossene Ja-Nein-Fragen, durch die Voranstellung des Hilfsverbs dessen Wahrnehmung und spätere Aneignung durch das Kind unterstützen (Ritterfeld 2000).

Dannenbauer (1999) hat dem Einsatz der SLS im entwicklungsproximalen Ansatz ein sprachtherapeutisches Fundament gegeben, dessen zentrales Wirksamkeitskriterium die Adaptivität des Sprachförderhandelns darstellt. Danach soll das Sprachangebot mit Hilfe der SLS so ausgestaltet werden, dass es spezifisch solche Daten liefert, die das Kind für nächstliegende Erwerbsschritte benötigt. Adaptives Sprachförderhandeln bedeutet aber auch, dass sprachliche Strukturen, über die das Kind bereits verfügt, weniger intensiv angeboten werden. Mit Beginn der Phase, in der die Zielstruktur für das Kind erreichbar ist, bis zu ihrer Aneignung sollten sich die Häufigkeit des Angebots und der Grad ihres Erwerbs in einem entgegengesetzten Verhältnis verändern. Dadurch sollten zu jedem Zeitpunkt die Menge der Kindern angebotenen Zielstrukturen und ihre Lernstände negativ korreliert sein. Analysen zum Spontangebrauch der SLS liefern Hinweise auf die angesprochene Adaption. So zeigen Querschnittsanalysen von Cross (1979) und Beckerle und Mackowiak (2019), dass Eltern bzw. Fachkräfte im Kontakt mit sprachlich weniger kompetenten Kindern mehr Modellierungs- und Korrekturtechniken nutzen als im Austausch mit kompetenten Kindern. Inwieweit die in den Studien beobachteten Fördertechniken tatsächlich jene Strukturen enthielten, für deren Aufnahme die Kinder zum Erhebungszeitpunkt besonders empfänglich waren, ist jedoch unklar. Darüber hinaus verdeutlicht das Prinzip der Adaptivität die Notwendigkeit einer dynamischen Betrachtung des Anpassungsprozesses. In der Tat folgt ja aus diesem Prinzip auch, dass der Aneignungsgrad sprachlicher Strukturen am Ende der Entwicklungsphase mit der Intensität ihrer Förderung davor positiv zusammenhängen sollte. Eine solche Verlaufsperspektive dominiert in den nachfolgend dargestellten Wirksamkeitsstudien.

2.3 Zur Wirksamkeit von Interaktionsmerkmalen

Ausgehend vom oben skizzierten theoretischen Bezugsrahmen, der dialogische Kommunikation und den Einsatz von SLS als Schlüsseldimensionen der sprachbezogenen Interaktionsqualität definiert, konzentriert sich der folgende Forschungsstand auf Studien, in denen der Einfluss beider Dimensionen auf die Sprachentwicklung des Kindes (2.3.1) sowie ihr Erklärungsbeitrag zur Wirksamkeit von Eltern- und Fachkräfte-Trainings (2.3.2) beleuchtet wird.

2.3.1 Zusammenhänge zwischen Interaktionsmerkmalen und kindlicher Sprachentwicklung

Auswirkungen der sprachbezogenen Interaktionsqualität auf die frühkindliche Sprachentwicklung sind im Wesentlichen in zwei methodischen Strängen untersucht worden: im Rahmen von (Grundlagen‑)Forschungen zur Wirksamkeit verschiedener SLS bzw. Aspekte der Dialogqualität und in Untersuchungen zur pädagogischen Prozessqualität in Kindertageseinrichtungen. Die Ergebnisse beider Stränge werden hier getrennt diskutiert.

Das Spektrum an Studien, die den Einfluss von SLS auf den (früh-)kindlichen Spracherwerb untersuchen, umfasst sowohl Korrelationsstudien (u. a. Farrar 1990; Girolametto et al. 1999; Gleitman et al. 1984; Hoff-Ginsberg 1986; Taumoepeau 2016) als auch Interventionsstudien auf der Grundlage einfacher Prä-Post- oder (quasi-)experimenteller Vergleiche (u. a. Camarata et al. 1994; Leonard et al. 2008; Nelson et al. 1996; Yoder et al. 2005). Die Unterschiede im Forschungsdesign gehen mit solchen des Untersuchungsgegenstands einher. In Korrelationsstudien wird untersucht, wie Kinder auf ein spontanes und für sie gewohntes (elterliches) Sprachangebot reagieren. Dafür werden, mit wenigen Ausnahmen (u. a. Farrar 1990), Veränderungen in den allgemeinen sprachproduktiven Fähigkeiten der Kinder (z. B. deren Äußerungslänge) mit den im Spontangebrauch vorkommenden SLS in Beziehung gesetzt. Interventionsstudien prüfen hingegen die Wirkung gezielt manipulierter Lernbedingungen. Hier steht überwiegend der Erwerb bestimmter zielsprachlicher Strukturen, z. B. regulärer Vergangenheitsformen, als Reaktion auf den methodisch kontrollierten Einsatz zielformspezifischer SLS im Vordergrund (Ausnahmen: u. a. Yoder et al. 2005). Unterschiede bestehen auch hinsichtlich der Wirksamkeitsbelege, die in den Korrelationsstudien insgesamt weniger konsistent ausfallen. So können Gleitman et al. (1984) die Wirksamkeit von Expansionen nur für eine jüngere Kohorte von 18–21 Monate alten Kindern, nicht aber für die ältere (24–25 Monate) belegen. Bei Farrar (1990) sind die Lerneffekte indirekter Korrekturen auf die in den Korrekturen aufgegriffenen Zielstrukturen (z. B. Pluralbildung) begrenzt und greifen nur in Einzelfällen auf andere Strukturen über. Und während Gleitman et al. in der älteren Kohorte einen positiven Effekt geschlossener Ja‑/Nein-Fragen, nicht aber der (offenen und geschlossenen) Ergänzungsfragen nachweisen können, verhält es sich bei Hoff-Ginsberg (1986) in einer Gruppe vergleichbar alter Kinder genau umgekehrt. Bei der Bewertung dieser Unterschiede gilt es zu berücksichtigen, dass Beobachtungsdaten, wie sie den Korrelationsstudien zugrunde liegen, die kausale Interpretation der Effekte des Sprachangebots erschweren (s. zur Methodendiskussion u. a. Gleitman et al. 1984). Dies dürfte auf Modellierungs- und Korrekturtechniken, die sowohl Reaktionen auf Fehler bzw. wahrgenommene Erwerbslücken in der Zielsprachproduktion als auch Modelle für sprachliches Lernen darstellen, in besonderem Maße zutreffen. Insgesamt fällt die Befundlage zur Wirksamkeit der SLS aber, trotz einiger methodischer Einschränkungen (kleine Fallzahlen, fehlende Kontrollgruppe), für alle Fördertechniken positiv aus, wie Beckerle (2017) in einer zusammenfassenden Übersicht zeigt.

Eine Reihe von Wirksamkeitsstudien untersuchte darüber hinaus den Einfluss eines dialogisch anregungsreichen Sprachangebots. Farrar (1990) weist etwa nach, dass neben formal kontingenten Fördertechniken (Expansionen und Reformulierungen) auch semantisch kontingente, d. h. themenverlängernde, Äußerungen die Sprachentwicklung des Kindes positiv beeinflussen. Tomasello und Farrar (1986) belegen, dass die aktive Beteiligung von Kindern an gemeinsamen Dialogen mit ihren Eltern, gemessen an der Anzahl ihrer Redebeiträge, innerhalb von Episoden geteilter Aufmerksamkeit signifikant höher ist als außerhalb dieser, und dass die Kinder den darin präsentierten lexikalischen Input effektiver für den Aufbau des aktiven Wortschatzes nutzen. Die Effekte konnten in einer zweiten, experimentell angelegten Studie für den Aufbau des rezeptiven Wortschatzes bestätigt werden (Tomasello und Farrar 1986). Auch in jüngeren Forschungsarbeiten zum Spracherwerb spielt Dialogqualität eine prominente Rolle. So untersuchen Hirsh-Pasek et al. (2015) das Ausmaß geteilter Aufmerksamkeit in Eltern-Kind-Gesprächen sowie deren „fluency and connectedness“ – ein Faktor, der über ein Gesamturteil zur Verbundenheit und partizipativen Ausgeglichenheit der Gespräche operationalisiert wird – und belegen, dass, wie Tomasello und Farrar (1986) bereits feststellten, der Dialogcharakter mit dem Grad geteilter Aufmerksamkeit in Gesprächen positiv assoziiert ist. Des Weiteren untersuchen Hirsh-Pasek et al. (2015), welchen Einfluss beide Größen in einer gemeinsamen Modellierung auf den späteren Wortschatz der Kinder haben. Aus diesen Analysen geht die Konnektivität, nicht aber die geteilte Aufmerksamkeit, als wirksamer Prädiktor hervor. Der kursorische Einblick in die Wirksamkeitsforschung zur Dialogqualität verdeutlicht, dass die aktive Einbindung von Kindern in sprachliche Austauschprozesse den Spracherwerb unterstützt. Es besteht jedoch insgesamt ein Mangel an Studien, in denen die Vertikalstruktur, d. h. die innere Vernetzung der Dialoge, in isolierter Form (ohne Einschätzung des Redeflusses, der geteilten Aufmerksamkeit o. Ä.) erhoben und zur Sprachentwicklung in Beziehung gesetzt wird.

Außerhalb der zuletzt angesprochenen (Grundlagen‑)Forschung wird die Wirksamkeit von Interaktionsmerkmalen vorrangig im Bezugsrahmen des sogenannten Struktur-Prozess-Modells untersucht (vgl. Kluczniok und Roßbach 2014). Eingebettet in Debatten zur Qualität frühkindlicher Betreuungseinrichtungen, werden Bewertungen des Anregungsgehalts pädagogischer Interaktionen als Indikatoren der sogenannten Prozessqualität, neben Merkmalen der sogenannten Strukturqualität (z. B. Fachkraft-Kind-Schlüssel) und Orientierungsqualität (Werte und Überzeugungen der Fachkräfte), zur Vorhersage kindlicher Entwicklung genutzt. Das Modell impliziert, dass Struktur- und Orientierungsqualität nur indirekt, über ihren Einfluss auf die Interaktionsqualität, auf kindliche Entwicklungsverläufe einwirken. Dieser Vorrang von Merkmalen der Prozessqualität in der direkten Beeinflussung kindlicher Bildungs-Outcomes konnte auch für den Spracherwerb bestätigt werden (u. a. Mashburn et al. 2008; Tietze et al. 2013).

Forschung zur Prozessqualität basiert i. d. R. auf standardisierten, hoch-inferenten Beobachtungverfahren. Diese können danach unterschieden werden, ob sie ihren Gegenstand global oder domänenspezifisch abbilden und dabei an der Makro- (bzw. Gruppen-) oder Mikroebene ansetzen (Justice et al. 2018; Kluczniok und Roßbach 2014). Zu den etablierten Verfahren der Makroebene zählen das Classroom Assessment Scoring System (CLASS, Pianta et al. 2008) und die Early Childhood Environment Rating Scale-Revised (ECERS‑R, Harms et al. 1998). Beide Skalen bilden den Anregungsgehalt der Lernumgebung in einer globalen Form ab. Die ECERS‑R misst die Qualität auf Grundlage von 43 siebenstufigen Items in sieben unterschiedlichen Bereichen (u. a. Platz und Ausstattung, Aktivitäten). Sie verfügt über eine domänenspezifische Erweiterungsskala, die den Anregungsgehalt in Bezug auf vier unterschiedliche Inhalte (Lesen, Mathematik, Naturwissenschaft und Diversität) abbildet (ECERS‑E, Sylva et al. 2003). Die ECERS-Skalen erfassen auch Merkmale der materiellen Lernumgebung (z. B. Verfügbarkeit von Büchern) und setzten damit einen breiteren Beobachtungsfokus als CLASS, die ausschließlich Prozessmerkmale, getrennt in den Bereichen emotionaler Unterstützung (emotional support), Organisation der Lernsituation (classroom organization) und Anregungsqualität (instructional support), misst. Die Beurteilungen der, auch als „Domänen“ (Pianta et al. 2008) bezeichneten, Qualitätsbereiche beruhen auf mit siebenstufigen Ratingskalen durchgeführten Einschätzungen der Interaktionsqualität in jeweils drei bis vier Qualitätsdimensionen. Diese werden zu einem Durchschnittswert verrechnet. So setzt sich der Score der Anregungsqualität beispielsweise aus Qualitätseinschätzungen in den Dimensionen Konzeptentwicklung, Feedbackqualität und Sprachbildung zusammen. Die Ergebnisse zweier großer Entwicklungsstudien deuten darauf hin, dass CLASS eine größere Erklärungskraft für die Sprachentwicklung von Vorschulkindern besitzt als die ECERS-Skalen. So zeigen Analysen von Sylva et al. (2006) mit Daten der EPPE-Studie, dass weder die Globalskala noch die Erweiterungsskala der ECERS in der Lage sind, die sprachliche Entwicklung der Kinder (im Unterschied anderen Entwicklungsmaßen) vorherzusagen. In der NCEDL-pre-K-Studie (Mashburn et al. 2008) erweist sich demgegenüber die mittels CLASS erfasste Anregungsqualität im modellinternen Vergleich mit der ECERS-Globalskala als der bessere Prädiktor der sprachproduktiven Fähigkeiten und in der Vorhersage des rezeptiven Wortschatzes sogar als einzige einflussgebende Größe. Die Befunde stehen im Einklang mit denen einer Meta-Analyse (Ulferts et al. 2019), wonach standardisierte Prozessqualitätsskalen mit einem ausschließlichen Interaktionsfokus den (Schrift‑)Spracherwerb von Kindern (3–16 Jahre) signifikant besser erklären als solche, die zusätzliche (materiell-räumliche) Merkmale der Lernumgebung erfassen.

In einer jüngeren Evaluationsstudie (Justice et al. 2018) wurde das Interaktionsverhalten von Fachkräften sowohl mit der CLASS-Skala der Anregungsqualität als auch einem Verfahren der Mikroebene, der Teacher Interaction and Language Rating Scale (TILRS; Girolametto et al. 2000), sowie anhand einiger sprachstruktureller Merkmale abgebildet. Die TILRS-Items erfassen in zwei Unterskalen pädagogische Handlungen, die der Kommunikationsförderung (Beispielindikatoren: Nutzung offener Fragen zur Gesprächsanregung; angemessenes Gesprächstempo) bzw. der Sprachentwicklung (Expansionen und Wiederholungen; Kommentare und Fragen zur Erweiterung von Diskussionen) dienen. Die Skalen bewerten den Fördercharakter von Einzelhandlungen in dyadischen wie auch Kleingruppen-Situationen. Die Autorinnen der Evaluationsstudie ermitteln zunächst eine 3‑Faktoren Struktur der Prozessqualität. Als unabhängige Komponenten ergeben sich (1) die mit den CLASS-Items ermittelte Anregungsqualität der Makro-Ebene sowie die jeweils auf Mikroebene erfassten (2) sprachstrukturellen bzw. -entwickelnden und (3) kommunikationsförderlichen Merkmale des Fachkräftehandelns. Von den drei Faktoren sagen in den anschließenden Analysen nur die kommunikationsförderlichen Mikroprozesse den Wortschatzerwerb der Kinder vorher. Die Wirksamkeit des Faktors „Sprachentwicklung“ wurde hingegen in einer früheren Veröffentlichung (Cabell et al. 2011), ohne Einbezug der Class-Items, belegt.

Der hier nur ausschnitthaft referierte Forschungsstand zum Zusammenhang zwischen Interaktionsmerkmalen und Sprachentwicklung lässt für die eingangs vorgestellte Grundlagenforschung eine Konzentration auf Studien erkennen, in denen die einzelnen Merkmale niedrig-inferent (z.B. anhand der im Sprachangebot vorkommenden SLS) gemessen oder (quasi-)experimentell hergestellt werden. Qualitätsmängel einiger Forschungsdesigns (z. B. fehlende Kontrollgruppen) und Beschränkungen der sprachlichen Entwicklungsmaße auf die situationsgebundene Sprachproduktion (Korrelationsstudien) bzw. spezifisch geförderte Strukturen der Zielsprache (Interventionsstudien) stehen einer einfachen Verallgemeinerung der Effekte auf den Erwerb grundlegender Sprachkompetenzen entgegen, wie sie durch die in der vorliegenden Studie verwendeten Tests (s. 4.3.1) erfasst werden. Die Vertikalstruktur der Fachkraft-Kind-Gespräche als eigenständiges Maß der Dialogqualität spielt in den Wirksamkeitsstudien zudem eine eher untergeordnete Rolle spielt.

Forschung zu pädagogischer Prozessqualität basiert demgegenüber auf komplexen, i. d. R. hoch-inferenten Erhebungsverfahren. Die exemplarisch dargestellte Befundlage deutet insgesamt darauf hin, dass Instrumente mit einem ausschließlichen Fokus auf Prozesse, insbesondere solche der Mikroebene, die Sprachentwicklung von Kindern besser erklären können als Verfahren mit einem Beobachtungsschwerpunkt auf Makroprozessen und/oder materiellen Aspekten der Lernumgebung. An der inhaltlichen Heterogenität der Dimensionen der Anregungsqualitätsskala (CLASS) sowie der Beispielindikatoren der TILRS-Unterskalen (s. oben) lässt sich zudem die Tendenz hoch-inferenter Verfahren erkennen, linguistische und dialogische Aspekte der Interaktionsqualität durchmischt abzubilden. Aus Sicht der Spracherwerbstheorie wird damit ungerechtfertigt ein identischer Fördermechanismus unterstellt, der selbst für die Klasse der SLS mit Blick auf ihre Spracherwerbsfunktionen (s. 2.2) unangemessen erscheint.

2.3.2 Interaktionsmerkmale in der Evaluation von Fachkräfte-Trainings

Pädagogischen Qualifizierungsmaßnahmen liegt, zumindest implizit, ein Kausalmodell zugrunde, nach dem diese Veränderungen im Wissen, den Orientierungen und damit verbundenen Handlungsroutinen der Fachkräfte bewirken, welche wiederum zu Verbesserungen der kindlichen Kompetenzen führen. Interaktionsmerkmale üben in dieser Sicht die Funktion des Transmissionsriemens für die Fortbildungsinhalte aus. Zwei Meta-Analysen zu den Effekten frühpädagogischer Fortbildungen (Egert et al. 2018; Markussen-Brown et al. 2017) weisen dabei einen mittelstarken Effekt auf die Interaktionsqualität (Hedges’ g = 0,59 bzw. 0,68), jedoch nur schwache Effekte (g zwischen 0,12 und 0,31) auf (schrift-)sprachliche Leistungen der Kinder nach. Beide Studien untersuchen darüber hinaus anhand von Meta-Regressionen, wie stark die Höhe des Effekts der Fortbildung auf die Sprache von ihrem Einfluss auf die Interaktionsqualität abhängt. Eine solche Abhängigkeit, welche die Annahme einer Übertragungsfunktion der Interaktionsqualität stützen würde, können jedoch nur Egert et al. (2018) belegen. Danach sind 53 % der Interventionseffekte auf die überwiegend sprachbezogenen „Outcomes“ durch Unterschiede in den Einflüssen der Fortbildungen auf die Interaktionsqualität zu erklären.

Im Folgenden wird ein Überblick aktueller Interventionsstudien zu alltagintegrierten Fördermaßnahmen in Deutschland gegeben. Die Engführung am nationalen Kontext erfolgt vor dem Hintergrund, dass die Interventionen mit der FDS-Fortbildung vergleichbare programmatische Schwerpunkte aufweisen: Vermittlung linguistisch fundierter SLS und dialogförderlicher Handlungsroutinen. Angesichts umfassender Darstellungen (u. a. Egert und Hopf 2016) beschränkt sich die folgende Aufarbeitung auf eine exemplarische Auswahl von Fortbildungen, die den Interventionserfolg sowohl auf Prozess- als auch Kindebene evaluiert haben. Entsprechende Befunde liegen etwa für die systematische sprachliche Anregung im Kindergartenalltag (Beller und Beller 2009), das Heidelberger Trainingsprogramm (Simon und Sachse 2011, 2013) oder das Fellbach-Konzept (Beckerle 2017) vor. Die genannten Fortbildungen bewirken danach eine zum Teil erhebliche Verbesserung der Interaktionsqualität (u. a. Anstieg in der Nutzung von SLS, Rückgang der Redeanteile der Fachkräfte). Allgemeine Effekte auf die Sprachentwicklung der Kinder werden in den Evaluationen zwar nicht dokumentiert, wohl aber eine auf leistungsschwache (Fellbach und Heidelberger Trainingsprogramm) bzw. junge, d. h. entwicklungsoffene, Kinder (Systematische sprachliche Anregung) beschränkte Wirkung. Direkte Zusammenhänge zwischen Interaktionsqualität und Sprachentwicklung werden hingegen nicht untersucht.

Diese werden im Rahmen der Evaluation einer Fortbildungsreihe zur alltagsintegrierten Sprachförderung (Jungmann et al. 2013) beleuchtet. Ein Differenzwert aus sprachanregenden und -hemmenden Verhaltensweisen, welche die Fachkräfte in Vorlesesituationen zeigen, wird darin als prädiktiv für das Satzverständnis und -gedächtnis nachgewiesen. Aufgrund des Fehlens einer Kontrollgruppe können diese Effekte jedoch nicht auf die geschulten Fortbildungsinhalte zurückgeführt werden. Einschränkungen dieser Art betreffen auch die Analysen von Ennemoser und Hartung (2017) bezüglich eines Trainings zum Dialogischen Vorlesens. Der aus Informationen zum Einsatz von SLS und einer Gesamtnote für dialogisches Förderhandeln gebildete Faktor „Durchführungsqualität“ konnte Zuwächse im Wortschatz, in der phonologischen Bewusstheit sowie im Gesamtwert der Sprachtests erklären. Die zur Ermittlung der Übertragungswirkung notwendigen Prozessdaten liegen jedoch nur für das Lesetraining, nicht aber für die hiermit verglichenen Qualifizierungen und die Kontrollgruppe, vor. Die Berechnung der Übertragungswirkung ist somit aus Mangel an Vergleichsdaten nicht möglich. Anders verhält es sich mit den Evaluationen des Modellprojekts KiDZ – Kindergarten der Zukunft in Bayern (Roßbach et al. 2010) und des Bundesprogramms Schwerpunkt-Kitas Sprache und Integration (Anders et al. 2016). Beide Studien zeigen Zusammenhänge zwischen der mittels ECERS-R-Skala (deutsche Fassung, bei Schwerpunkt-Kitas nur eine Auswahl sprachbezogener Indikatoren) gemessenen allgemeinen Interaktionsqualität und dem Sprachstand der Kinder (bei KiDZ beschränkt auf querschnittliche Korrelationen). Während das Schwerpunkt-Kitas-Programm für Einrichtungen mit einer Zusatzqualifikation in alltagsintegrierter Sprachbildung (verbal*-Kitas) einen Einfluss der Maßnahme auf die Sprachentwicklung der Kinder (Wortschatz und Satzverständnis), jedoch keinen Effekt auf die Interaktionsqualität nachweisen kann, sind positive Wirkungen des KiDZ-Projekts weder auf die allgemeinen Sprachkompetenzen (Wortschatz und Grammatik) noch auf die Interaktionsqualität belegt (Ausnahme: bereichsspezifische Interaktionsqualität). Die Übertragungswirkung der Interaktionsqualität für Fortbildungsinhalte wird in beiden Studien in keiner direkten Form überprüft.

Im nationalen Forschungsstand zeigen sich insgesamt schwache Effekte alltagsintegrierter Weiterbildungen auf die Sprachentwicklung im Vorschulalter, die sich überwiegend bei Kindern mit ungünstigen Lernausgangslagen manifestieren. Vor diesem Hintergrund kann der hier untersuchten FDS-Fortbildung ein positives Evaluationsergebnis bescheinigt werden. Für einen Bevölkerungsquerschnitt von Kindern im Alter von 3–5 Jahren (T1) konnten signifikant positive Effekte auf das Satzverständnis, Satzgedächtnis und morphologische Regelwissen sowie tendenziell signifikante Effekte auf den expressiven Wortschatz und das phonologische Arbeitsgedächtnis nachgewiesen werden (Voltmer et al. 2021). Die Effektstärken liegen auf geringem bis mäßigem Niveau (f2 zwischen 0,01 und 0,06) und somit im Bereich der Meta-Analysen (s. oben). Mögliche Ursachen der Wirksamkeitsunterschiede zwischen den hier besprochenen Interventionen werden an anderer Stelle (Markussen-Brown et al. 2017; Egert et al. 2018) empirisch beleuchtet.

Festzustellen ist auch, dass die Fortbildungen das Handeln der Fachkräfte insgesamt stärker als die Sprachentwicklung der Kinder beeinflussen. Diese Diskrepanz steht im Einklang mit den Meta-Analysen und dem oben beschriebenen Kausalmodell, das nur indirekte Einflüsse auf die kindliche Sprachentwicklung vorsieht. Dessen ungeachtet lassen die Studien eine Forschungslücke im Hinblick auf die Rolle der Interaktionsqualität als Bindeglied zwischen Fortbildungsinhalten und kindlicher Entwicklung sichtbar werden. Ein Teil der Evaluationen untersucht den Einfluss der Fortbildung auf das Förderhandeln der Fachkräfte, ohne dieses mit den Sprachleistungen der Kinder in Verbindung zu setzen. Ein anderer Teil erfasst zwar den Einfluss der Interaktionsmerkmale auf die Sprachentwicklung, jedoch abgekoppelt von den, z. T. ebenfalls nachgewiesenen, Wirkungen der Fortbildung. Insofern bleiben die Erkenntnisse zur Übertragungsfunktion der Interaktionsqualität fragmentarisch. Kritisch anzumerken ist auch, dass alle Projekte, die den Einfluss des Fachkräftehandelns untersuchen, Skalen oder Summen- bzw. Differenzmaße einsetzen, in denen verschiedene linguistische und dialogische Aspekte der Interaktionsqualität miteinander verrechnet werden. Deren unterschiedlicher Wirkungsweise wird, wie bereits unter 2.3.1 argumentiert, nicht hinreichend Rechnung getragen.

3 Forschungsfragen

Der Forschungsstand lässt zwei zentrale Desiderate erkennen. Trotz überzeugender Befunde zum förderlichen Einfluss der verschiedenen Interaktionsmerkmale auf die Sprachentwicklung mangelt es an Studien, in denen ihre Beiträge differenziell analysiert werden. Eine zweite Leerstelle ergibt sich für die Frage, inwieweit die Interaktionsmerkmale als Transmissionsriemen für die Inhalte eines Sprachbildungsprogramms (hier: FDS) fungieren. Antworten hierauf könnten Ansatzpunkte für eine inhaltliche Optimierung der Programme bieten. Die angesprochenen Forschungslücken münden in zwei Fragen:

  1. 1.

    Wie wirken sich verschiedene Interaktionsmerkmale auf die Sprachentwicklung 3–5jähriger Kinder in verschiedenen Kompetenzbereichen aus? Ausgehend vom Forschungs- und Theoriestand wird die Hypothese vertreten, dass sich alle Interaktionsmerkmale positiv auf die Entwicklung der Kinder auswirken. Der vorliegende Datensatz (s. 4.2) ermöglicht die Analyse der Einflüsse eines relativ stabilen Zustands der Interaktionsqualität vor der Fortbildung sowie deren Veränderungen im Interventionszeitraum, die sich ihrer inneren Dynamik nach unterscheiden (vgl. Girolametto et al. 1999). Obwohl erwartet wird, dass sich im Förderhandeln der geschulten Fachkräfte am Ende des Interventionszeitraums der Einfluss der Fortbildung widerspiegelt, handelt es sich nach wie vor um Beobachtungsdaten, die nicht derselben methodischen Kontrolle wie in experimentellen Wirksamkeitsstudien unterliegen (vgl. 2.3.1).

  2. 2.

    Welche spezifischen Beiträge leisten die Interaktionsmerkmale zur Mediation der Fortbildungseffekte auf die Sprachentwicklung? Die FDS-Fortbildung integriert den Einsatz der SLS mit der Förderung der Dialogqualität (s. 4.1). In Anlehnung an das oben erläuterte Kausalmodell wird erwartet, dass die Teilnahme an der Intervention einen positiven Effekt auf alle Interaktionsmerkmale hat, welche sich ihrerseits positiv auf die Sprachentwicklung auswirken. Im Unterschied zur ersten Fragestellung bezieht sich diese auf zwei miteinander verbundene Glieder einer Kausalkette, die den indirekten, über Veränderungen im Interaktionsverhalten vermittelten, Effekt der Fortbildung auf die Sprachentwicklung erfasst.

4 Methode

4.1 Die „Fühlen-Denken-Sprechen“-Fortbildung

Es handelt sich um eine In-House-Fortbildung für frühpädagogisches Fachpersonal zur Verbesserung der Interaktionsqualität (vgl. von Salisch et al. 2021). Die Evaluation der Fortbildung wurde auf Basis eines Prä-Post-Follow-up-Designs mit Interventions- (IG) und Kontrollgruppe (KG) an den Standorten Hildesheim, Braunschweig und Hamburg-Harburg durchgeführt. Die Zuteilung der Kindertageseinrichtungen zu IG und KG erfolgte nicht randomisiert. Es wurde jedoch großer Wert auf die Vergleichbarkeit der Gruppen gelegt, was sowohl die strukturellen Merkmale der Einrichtungen als auch die Bereitschaft zur Unterstützung der Studie angeht. Die Wartekontrollgruppe erhielt die FDS-Intervention (oder nach Wunsch nur Teile daraus) zu einem späteren Zeitpunkt. Gemeinsame Auswahlkriterien für die Einrichtungen waren Größe, Anteile von Kindern mit Deutsch als Erstsprache in Höhe von 30 bis 60 % sowie der Umstand, nicht bereits Konzepte zur alltagsintegrierten Sprachförderung zu verwenden.

Zentraler Vermittlungsgegenstand der Fortbildung sind das für alltagsintegrierte Sprachbildung notwendige linguistisch-spracherwerbsbezogene Fach- sowie Handlungswissen (u. a. Grundlagen des Erst- und Zweitspracherwerbs, Förderpotenziale langanhaltender Dialoge, Kenntnisse der SLS, Sprachdiagnostik). Diese Inhalte wurden in zwei je achtstündigen Modulen vermittelt. In zwei weiteren, ebenfalls achtstündigen, Modulen lag ein Fokus auf den praktischen Fähigkeiten der Fachkräfte zur Integration der SLS in Kommunikationen über innere Zustände (z. B. emotion talk) und äußere Beobachtungen (z. B. scientific reasoning). Die Pädagog*innen sollten lernen, inhaltlich anregende Dialoge über das Innenleben und die Außenwelt als Anlässe für den Einsatz der SLS zu nutzen. Für Schulungszwecke wurden zwei typische Handlungssituationen ausgewählt: das Bilderbuchlesen und die gemeinsamen Mahlzeiten. Abgerundet wurde die Fortbildung durch ein vierstündiges Transfermodul, das die Übertragung des Erlernten auf andere KiTa-Kontexte thematisierte, und ein ebenfalls vierstündiges Auffrischungsmodul nach Abschluss der Nachher-Erhebungen. Flankierend zu den Modulen 1–5 wurden Praxisaufgaben und Videocoachings durchgeführt, um die Anwendung der verschiedenen Inhalte zu üben und dadurch die Umsetzungsqualität zu erhöhen.

4.2 Stichprobe

Die Stichprobe weist eine hierarchische Struktur auf. Insgesamt wurden sprachliche Leistungen von 281 Kindern aus 29 KiTa-Gruppen (13 Einrichtungen) in sieben Kompetenzbereichen zu drei Messzeitpunkten (MZPen) erhoben. Diese lagen durchschnittlich 7,09 (Prä-Post) bzw. 5,25 Monate (Post-Follow-Up) auseinander. Für zwei Kinder konnte die Gruppenzugehörigkeit nicht ermittelt werden, bei vier weiteren Kindern fehlten Angaben zum Alter und Geschlecht. Diese Fälle wurden aus dem Datensatz entfernt (n = 275). Fehlende Werte in den Sprachkompetenzen und beim Migrationsstatus der Kinder wurden durch multiple Imputationen (Predictive-Mean-Matching, PMM) ersetztFootnote 1. Die resultierenden 20 Datensätze wurden in den Analysen gemäß der Formel von Rubin (1987) kombiniert. Wie bereits an anderer Stelle veröffentlicht (von Salisch et al. 2021), sind spracherwerbsrelevante Merkmale der Kinder (z. B. ihr Sprachhintergrund) und der soziökonomische Status der Eltern gleichmäßig zwischen Interventions- und Kontrollgruppe verteilt. Darüber hinaus bestehen zwischen den Gruppen keine signifikanten Unterschiede bezüglich ihrer konzeptionellen Ausrichtung (geschlossen, halboffen, offen) und des „eisernen Dreiecks“ der Strukturqualität aus Fachkraft-Kind-Schlüssel, Gruppengröße und Berufsqualifikation. Da die ersten beiden Merkmale der Strukturqualität für „offene“ Gruppen (n = 2) nicht mit derselben Bedeutung gebildet und die Fachkräfte-Angaben zur Berufsqualifikation nicht individuellen Personen bzw. Gruppen zugeordnet werden konnten, wurden sie von der Analyse ausgeschlossen. Nach dem Struktur-Prozess-Modell (s. 2.3) sind jedoch vor allem von der Interaktionsqualität direkte Auswirkungen auf die Entwicklung zu erwarten.

Die Informationen zur Interaktionsqualität beruhen auf Videos von einer ausgewählten Fachkraft je Gruppe, die parallel zu den ersten beiden Sprachstandserhebungen je zweimal in den beiden Schulungskontexten (Buchbetrachtung, Essen) aufgenommen wurden (= vier Videos je Gruppe und MZP). Die Interaktionen wurden somit unter unterschiedlichen strukturellen und pädagogischen Rahmenbedingungen aufgenommen, welche die Diversität des KiTa-Alltags widerspiegeln. Die Einheitlichkeit der Erhebungssituationen wurde durch äußere Vorgaben erhöht. So war die Auswahl der Bücher auf vier Exemplare beschränkt, die nach Durchführung der ersten Videografie wieder mitgenommen wurden, um Übungseffekte zu vermeiden. Zum Zwecke der Herstellung von Kleingruppensituationen wurde die Anzahl der Kinder nach unten auf zwei und nach oben auf sechs begrenzt. Obwohl sich die Gruppenzusammensetzung im Regelfall veränderte, konnten nicht für alle Kinder Aufnahmen produziert werden. Eine Verknüpfung der Video- und Kinderdatensätze war somit nicht auf der Kind-, sondern nur der Gruppenebene möglich. Die Videoaufnahmen verstehen sich als Schnappschüsse der Interaktionsqualität in den Gruppen.

4.3 Messinstrumente

4.3.1 Abhängige Variablen

Der Sprachstand der Kinder wurde mit sieben Testverfahren erhoben. Der „Peabody Picture Vocabulary Test“ (PPVT-4: Lenhard et al. 2015) und die Revision des „Aktiven Wortschatztest für 3‑ bis 5‑jährige Kinder“ (AWST-R: Kiese-Himmel 2005) dienen der Messung des rezeptiven bzw. expressiven Wortschatzes. Das Sprachverständnis und die Pluralbildungsfähigkeiten werden mit den Untertests „Satzverständnis“ (SV) und „Morphologische Regelbildung“ (MR) des „Sprachentwicklungstest für 3‑ bis 5‑jährige Kinder“ (SETK 3–5: Grimm 2015) erfasst. Drei weitere Untertests des SETK erheben die Sprachgedächtnisleistungen. Der Untertest „Phonologisches Arbeitsgedächtnis für Nicht-Wörter“ (PGN) misst dabei die Erinnerungsleistungen im Bereich phonologischer Informationen. Der Test „Gedächtnisspanne für Wortfolgen“ (GW) bildet das sprachbezogene Kurzzeitgedächtnis anhand der Fähigkeit ab, eine Reihe von Wörtern in festgelegter Reihenfolge wiederzugeben. Der Untertest „Satzgedächtnis“ (SG) erhebt die Reproduktionsfähigkeiten für Satzformen mit unterschiedlicher Länge, die sowohl reale als auch irreale Inhalte transportieren.Footnote 2 Die Reliabilität der Tests nach Cronbachs Alpha sind für den PPVT (0,97) und AWST‑R (0,88) als gut bis exzellent, für den SETK 3–5 (0,65–0,92) als befriedigend bis exzellent zu bezeichnen. Die Analysen basieren auf Summenscores der Rohwerte der Items. Der Anteil fehlender Werte lag bei durchschnittlich 17 % (min: 4 % PPVT, T1; max: 27 % SG, T2). Eine für Interventions- und Kontrollgruppe getrennte Darstellung der Sprachstände findet sich in Tab. 2.

Tab. 2 Deskriptive Statistik der Analysevariablen

4.3.2 Indikatoren der Interaktionsqualität

Die Indikatoren der Interaktionsqualität sind die erklärenden Variablen (Fragestellung 1) bzw. Mediatoren (Fragestellung 2) der Studie. Aus jeder der vier, circa zwanzigminütigen, Aufnahmen je MZP wurde eine fünfminütige Sequenz transkribiert. Die Ausschnitte wurden so gewählt, dass sie zusammen ein repräsentatives Abbild der Kommunikation ergeben. Hierzu wurde per Zufall ein Video festgelegt, für das die ersten 5 min transkribiert wurden. In derselben Weise wurden die Videos für die zweiten, dritten und vierten fünf Minuten ausgewählt. Die Transkripte dienten als Grundlage der Identifikation der SLS und Dialogsequenzen.

In jedem Transkript wurden alle vorkommenden SLS auf Grundlage eines umfassenden Kodierschemas gemäß den Unterkategorien aus Tab. 1 identifiziert. Diese Kodierarbeit wurde durch wissenschaftliche Hilfskräfte paarweise ausgeführt (Doppelkodierungen liegen für das gesamte Datenmaterial vor). Die Interrater-Raliabilität wurde mit dem Kappa-Koeffizient nach Cohen auf Basis von 125 min des Datenkorpus in Bezug auf solche Sequenzabschnitte berechnet, in denen beide Personen SLS identifiziert hatten. Bis auf offene Fragen, die einen nur mäßigen Wert von 0,57 erreichten und von den weiteren Analysen – auch aufgrund geringer Fallzahlen – ausgeschlossen wurden, weisen die übrigen SLS mit Werten von 0,75 (Modellierungs- und Korrekturtechniken), 0,83 (Wiederholungen), 0,85 (Ergänzungsfragen), 0,92 (geschlossene Fragen) und 0,98 (Parallelsprechen) sehr gute Kodierübereinstimmungen auf (vgl. Döring und Bortz 2016, S. 346 f.). Im letzten Schritt wurden die Häufigkeiten, mit denen die Einzelstrategien in den Sequenzen vorkamen, innerhalb der drei Funktionsbereiche messzeitpunktbezogen aufsummiert und durch vier geteilt, so dass für beide MZPe je ein Durchschnittwert der Nutzungshäufigkeit der SLS bezogen auf fünfminütige Gespräche resultiert.

Dialoge wurden als Sequenzen definiert, in denen die Redebeiträge der beteiligten Akteure durch thematische, grammatische oder pragmatische Bezüge miteinander verbunden sind (zu den Kodier-Regeln s. Hormann 2020). Anschließend wurde die durchschnittliche Anzahl der Sprecherwechsel je Dialog als Maßstab für ihre Vertikalstruktur i. S. der Dialogqualität ermittelt. Anhand von wiederum 125 min Datenmaterial wurde die Interrater-Reliabilität in Bezug auf die eingeschätzte Länge (Wortanzahl) der kontingenten Sequenzen bestimmt. Die IntraklassenkorrelationFootnote 3 erreichte einen exzellenten Wert von 0,96 (Hormann 2020). Der Gesamtbestand an Videos wurde zu 82 % durch zwei Beurteiler*innen eingeschätzt. Strittige Kodierungen wurden abschließend im Rückgriff auf das jeweilige Manual nach dem Konsensverfahren entschieden.

Alle hier vorgestellten Indikatoren der Interaktionsqualität basieren auf niedrig-inferenten Kodierungen von Mikroprozessen. Eine deskriptive Darstellung findet sich in Tab. 2.

4.3.3 Kontrollvariablen

Die im Forschungsstand referierten Studien bestätigen den Einfluss einer Reihe kindbezogener Determinanten des Spracherwerbs, die in der vorliegenden Studie als Kontrollvariablen fungieren: das Geschlecht des Kinds (0 = Junge, 1 = Mädchen; Anteil Mädchen: IG = 0,54 v. KG = 0,44), sein Alter zum ersten MZP in Monaten (IG: M = 49,80; SD = 6,87 v. KG: M = 49,93; SD = 7,59) und sein Migrationsstatus (0 = beide Elternteile in Deutschland geboren, 1 = mindestens ein Elternteil im Ausland geboren; Anteil Kinder mit Migrationshintergrund: IG = 0,43 v. KG = 0,47). Der Migrationsstatus wurde anstelle der Mehrsprachigkeit in die Analysen einbezogen, weil der Zusammenhang mit der Sprachentwicklung, vermutlich aufgrund der mit sozioökonomischen Hintergrundmerkmalen geteilten Varianz, in den vorliegenden Daten stärker ausgeprägt und der Anteil fehlender Daten (7 gegenüber 32 %) deutlich geringer war.

4.4 Statistisches Vorgehen

4.4.1 Das Modell

Die Analysen beider Fragestellungen beziehen sich auf dasselbe, in Anlehnung an MacKinnon (2008, S. 205) und Hayes (2018, S. 543 ff.) konzipierte, Mediationsmodell (s. Abb. 1). Dieses folgt dem sogenannten Kovarianz-Ansatz, dem grundlegende Vorzüge gegenüber alternativen längsschnittlichen Mediationsverfahren (Difference-Score, Residualized Change Score, Cross-Sectional) im Hinblick auf α‑Fehler-Rate, Verzerrung und statistische Power zugeschrieben werden (u. a. Hayes 2018; Valente und MacKinnon 2017). Im Kovarianz-Ansatz werden die Ausprägungen von Merkmalen zu späteren Zeitpunkten auf frühere Messungen desselben Merkmals zurückgeführt, um die zeitlichen Veränderungen abzubilden. So erfassen die Vorher-Werte (T1) der Interaktionsqualität den Zustand des sprachbezogenen Anregungsgehalts vor der Fortbildung, die für T1 kontrollierten Nachher-Werte (T2) dessen Veränderung im Interventionszeitraum. Für den Einfluss der Interaktionsqualität auf die Sprachentwicklung (Fragestellung 1) werden zwei unterschiedliche Vorhersagezeiträumen betrachtet: die kurzfristigen Veränderungen des Sprachstands zwischen T1 und T2 (Modell 1) und seine langfristigen Veränderungen zwischen T2 und T3 (Modell 2, zusätzlich kontrolliert für T1). Bezogen auf Veränderungen der Interaktionsqualität zwischen T1 und T2 und ihre Effekte auf die Sprachentwicklung bildet Modell 2 die für Kausalaussagen erforderliche zeitliche Ordnung von Ursache und Wirkung eindeutiger ab. Modell 1 würde die kausalen Verhältnisse jedoch im Falle besonders kurzer Wirkzeiträume, durch die sich die Effekte der Interaktionsmerkmale bereits zu T2 manifestieren, besser erfassen (vgl. MacKinnon 2008, S. 204). Die Interaktionsqualität zu T1 wird nicht nur mit den mittelfristigen Veränderungen des Sprachstands zu T2, sondern auch den langfristigen zu T3 in Beziehung gesetzt, was nach MacKinnon ein „two waves apart“-Effekt ist (MacKinnon 2008, S. 202). Die Einflüsse der Interaktionsqualität werden auf Grundlage eines 2‑Ebenen-Regressionsmodells mit variierenden Intercepts nach der Restricted-Maximum-Likelihood-Methode geschätzt (n = 275).

Abb. 1
figure 1

Mediationsmodell

Die Mediationseffekte (Fragestellung 2) werden durch die Pfade a und b repräsentiert, wobei der a‑Pfad den Einfluss der Fortbildung auf die Veränderung der Interaktionsmerkmale erfasst und für Modell 1 und 2 identisch ist. Der b‑Pfad misst die Wirkung der veränderten Interaktionsqualität, kontrolliert für den Einfluss der Fortbildung (Pfad c′), auf die Sprachentwicklung. Als direkter Effekt der Interaktionsqualität ist er ebenfalls Gegenstand von Fragestellung 1 (s. oben). Die Schätzung der a‑ und b‑Pfade erfolgt nach der Zwei-Schritte-Methode (vgl. Krull und MacKinnon 2001) in getrennten RegressionsmodellenFootnote 4. Da im Falle des a‑Pfads sowohl die unabhängige als auch abhängige Variable auf der zweiten Ebene liegen, wird dieser durch ein einfaches OLS-Modell mit den KiTa-Gruppen als Einheiten (n = 29) berechnet. Die auf der ersten Ebene erhobenen Merkmale des Kinds (Geschlecht, Migrationsstatus, Alter und Vorher-Werte des Sprachstands) werden in aggregierter Form in das Modell aufgenommen, um die „Varianz zwischen“ zu kontrollieren. Die b‑Pfade, die den Einfluss der Interaktionsqualität (Ebene 2) auf die Sprachentwicklung der Kinder (Ebene 1) messen, werden durch das oben beschriebene Mehrebenenmodell geschätzt. Da es sich bei den Interaktionsmerkmalen um unabhängige Übertragungswege der Fortbildungsinhalte handelt, werden die Mediationseffekte als parallele Wirkpfade modelliert (vgl. Hayes 2018, S. 149 ff.). Alle vier b‑Pfade werden in einem gemeinsamen Modell geschätzt, das neben dem Prädiktor der Fortbildung (c′-Pfad) die kindbezogenen Merkmale (s. oben) sowie die jeweiligen Vorher-Werte der Mediatoren als Kontrollvariablen verwendet. Letztere werden Hayes (2018) folgend auch zur Adjustierung der a‑Pfade verwendet.

Die Signifikanz der Mediationseffekte wird mit dem „joint significance“- sowie dem „asymmetric distribution of products“-Test geprüft, die im Kontext von Mehrebenen-Mediationen jeweils ein hervorragendes Gleichgewicht aus α‑Fehler-Rate und Test-Power auszeichnet (Pituch et al. 2005). Das „joint significance“-Verfahren basiert auf getrennten Nachweisen für die Pfade a und b und ist dadurch mit den unten beschriebenen Sensitivitätsanalysen vereinbar. Sind beide Pfade signifikant, gilt die Mediation über den indirekten Pfad (a * b) als belegt. Demgegenüber fußt die „asymmetric distribution of products“-Methode auf der Erzeugung eines Konfidenzintervalls für den Produktkoeffizienten, das für den Nachweis eines Mediationseffekts den Null-Wert nicht umschließen darf. In multiplen Mediationsanalysen ist die Wahrscheinlichkeit groß, dass der direkte und die verschiedenen indirekten Pfade konträre Vorzeichen aufweisen und sich im totalen Effekt neutralisieren, dessen Signifikanz somit keine Voraussetzung für den Nachweis der Mediationsbeziehung darstellt (Hayes 2018). Aus demselben Grund empfiehlt MacKinnon (vgl. 2008, S. 83) für die Berechnung der absoluten Stärke eines indirekten Effekts, diesen zur Summe der vorzeichenbereinigten direkten und indirekten Effekte, und nicht zum totalen Effekt, ins Verhältnis zu setzen. Dieses Vorgehen scheint auch deshalb angemessen, weil in Mehrebenen-Mediationen die Äquivalenz des totalen Effekts und der Gesamtheit direkter und indirekter Effekte aufgehoben ist (Krull und MacKinnon 1999). Für den Vergleich der relativen Effektstärke bietet sich der partiell standardisierte Produktkoeffizient der Pfade a und b an (vgl. Miočević et al. 2018). Er drückt den Unterschied in den Leistungen der Kinder in Standardabweichung der jeweiligen Sprachkompetenz aus, den die Fortbildung über Veränderungen der Interaktionsqualität hervorbringt.

Der Kovarianz-Ansatz ist jedoch seinerseits anfällig für Fehlschätzungen, speziell der Fortbildungseffekte auf die Nachher-Werte der Interaktionsqualität und Sprachstände, wenn sich Interventions- und Kontrollgruppe in den Vorher-Werten dieser Merkmale aufgrund des Einflusses einer unbeobachteten Variablen (z. B. Bildungshintergrund der Kinder, pädagogische Orientierungen der Fachkräfte), die sowohl mit den Ausgangswerten der Interaktionsqualität bzw. des Sprachstands als auch mit der Fortbildungsteilnahme korreliert, bedeutsam unterscheiden (u. a. van Breukelen 2013; Lüdtke und Robitzsch 2020; Valente und MacKinnon 2017). Aufgrund einer solchen Konfundierung würden die Fälle der Interventions- und Kontrollgruppe bereits vor der Fortbildung unterschiedlichen Populationen angehören. Im Kovarianz-Ansatz können jedoch die Vorher-Werte der Mediatoren und Sprachmaße als „Proxy“-Variablen für die unbeobachtete Drittvariable verwendet werden und deren Einfluss auf die Nachher-Werte wirksam reduzieren (Kim und Steiner 2021, S. 1358). Sowohl Sprachstände als auch Interaktionsmerkmale können als ausreichend reliabel erfasst angesehen werden (s. 4.3.1 und 4.3.2), um – zusammen mit weiteren auf Kind- (Migrationshintergrund, Alter) bzw. Gruppenebene (übrige Interaktionsmerkmale) erhobenen Indikatoren – als Kontrollvariablen für Drittvariableneinflüsse in diesem Sinne zu fungieren.

Obwohl die Stichprobenbeschreibung (4.2) profunde Hinweise auf die Homogenität von Interventions- und Kontrollgruppe gibt, kann die Existenz unbeobachteter Drittvariablen aufgrund des quasi-experimentellen Designs der Studie nicht ausgeschlossen werden. Das Vorliegen eines daraus resultierenden Unterschieds in den Ausgangswerten wurde, angelehnt an van Breukelen (2013), durch ein lineares Panelmodell mit variierenden Intercepts übergeprüft, das die Entwicklung des Sprachstands bzw. der Interaktionsmerkmale durch die Prädiktoren Fortbildung und MZP (unzentriert) sowie den aus beiden gebildeten Interaktionsterm vorhersagt. Da der Koeffizient der Fortbildung, der Mittelwertdifferenzen zu T1 erfasst, in keinem der Modelle signifikant ist (s. Tab. 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 und 14, Anhang 1), lässt sich die Annahme unterschiedlicher Populationsmittelwerte sowohl der Sprachmaße als auch Interaktionsmerkmale zunächst verwerfen. Bei Letzteren scheint diese Schlussfolgerung wegen der deutlich kleineren Stichprobe (n = 58 vs. N = 825 bei den Sprachständen) und des dadurch erhöhten β‑Risikos jedoch nur unzureichend abgesichert. Deshalb wird im Rahmen der Sensitivitätsanalysen die Robustheit der a‑Pfade (sowie der b‑Pfade), nicht jedoch die der c‑Pfade, geprüft.

4.4.2 Sensitivitätsanalysen

Der von Frank (2000) entwickelte „Impact Threshold for a Confounding Variable“-Ansatz (kurz: ITCV-Ansatz) ist für diesen Zweck geeignet. Wird die zwischen Fortbildung (x) und Interaktionsqualität (y) bestehende Regressionsbeziehung als Partialzusammenhang konzipiert, prüft der Ansatz, wie stark eine Drittvariable sowohl mit x (Fortbildung) als auch y (Interaktionsmerkmal) korreliert sein muss, damit der zwischen beiden bestehende Partialzusammenhang unter die für den Nachweis eines Populationseffekts erforderliche Höhe sinkt. Die Stärke des zur Nicht-Signifikanz führenden Zusammenhangs mit der Drittvariable ist das Robustheitsmaß des ITCV-Ansatzes. In dieser Studie ist der Fortbildungseffekt auf die Nachher-Werte der Interaktionsqualität von vorrangigem Interesse (s. oben). Dessen jeweiliges Robustheitsmaß wird einem „plausiblen“ Referenzwert gegenübergestellt, der aus dem Fortbildungseffekt auf die Vorher-Werte abgeleitet wird. Dieser spiegelt, wie oben ausgeführt wurde, mögliche Drittvariableneinflüsse wider. Für einen solchen Vergleich mit dem Robustheitsmaß müssen die im Panelmodell ermittelten Fortbildungseffekte auf die Vorher-Werte der Interaktionsmerkmale zunächst in Partialkorrelationskoeffizienten umgewandelt werdenFootnote 5. Diese liegen bei r = 0,17 (Dialogqualität), 0,23 (Input-Strategien), −0,04 (Output-Strategien) und 0,19 (Modellierungs- und Korrekturtechniken) (s. Tab. 15, 16, 17 und 18, Anhang 1). Im ITVC-Ansatz ergibt sich der fragliche Drittvariableneinfluss aus der Quadratwurzel der genannten Partialkorrelationen: r = 0,41 (Dialogqualität), 0,48 (Input-Strategien), ±0,20 (Output-Strategien) und 0,44 (Modellierungs- und Korrekturtechniken). Würden diese Koeffizienten auf Drittvariableneinflüsse zurückgehende Populationsunterschiede in den Interaktionsmerkmalen zu T1 repräsentieren, bestünde bei anhaltendem Einfluss der Drittvariable für die Output-Strategien die Gefahr einer Unterschätzung, für alle anderen Merkmale die einer Überschätzung des Fortbildungseffekts auf die jeweiligen Nachher-Werte (T2). Sobald die Robustheit der ermittelten Fortbildungseffekte auf die Nachher-Werte der Interaktionsmerkmale den auf diese Weise abgeschätzten Drittvariableneinfluss übersteigt, wird von der Gültigkeit der Effekte in der Population ausgegangen. Mit Kim und Steiner (2021) kann gleichwohl erwartet werden, dass der faktische Drittvariableneinfluss auf die Nachher-Werte der Interaktionsqualität niedriger als der angenommene Referenzwert ausfällt, weil deren Vorher-Werte – ebenso wie übrigen Kontrollvariablen – Teile dieses Einflusses auf ihre Nachher-Werte „absorbieren“, d. h. statistisch konstant halten (s. oben).

Die Identifizierbarkeit der Mediationspfade hängt darüber hinaus davon ab, dass auch die b‑Pfade, d. h. die Effekte der Nachher-Werte der Interaktionsqualität auf die Sprachentwicklung, frei von konfundierenden Einflüssen (z. B. Häufigkeit des Fachkraft-Kind-Austauschs) sind (MacKinnon 2008). Da Referenzwerte für die Robustheit der b‑Pfade aus den vorliegenden Daten nicht ableitbar sind, werden allgemeine Effektstärke-Maße (vgl. Cohen 1988) zur Beurteilung herangezogen. In derselben Form werden auch die für Fragestellung 1 relevanten Effekte der Vorher-Werte der Interaktionsqualität geprüft. Berichtet werden Mittelwert und Standardabweichung des Robustheitsmaßes aus allen 20 imputierten Datensätzen. Außer der Prüfung der Konfidenzintervalle der Produktkoeffizienten mit RMediation in R wurden alle Berechnungen, einschließlich der mit dem mkonfound-Befehl durchgeführten Sensitivitätsanalysen, in Stata 17 durchgeführt. Aufgrund der gerichteten Hypothesen werden die Effekte auf einseitigem Signifikanzniveau getestet.

5 Ergebnisse

5.1 Einfluss der Interaktionsqualität auf die Sprachentwicklung (Fragestellung 1)

Die im Folgenden besprochenen Effekte der Interaktionsmerkmale wurden gegen moderierende Einflüsse des pädagogischen Konzepts und der Intervention abgesichert. Keiner der getesteten Interaktionsterme ist signifikant (nicht dargestellt). Aus Platzgründen werden die Ergebnisse der Sensitivitätsanalysen nicht tabellarisch dargestellt.

5.1.1 Modell 1

Tab. 3 (Modell 1, Spalte 1) gibt den Einfluss der Interaktionsqualität zu T1 (βMZP1(vs)) auf die Sprachentwicklung zwischen T1 und T2 in vollständig standardisierter Form wieder. Danach wirkt sich der Zustand der Dialogqualität vor der Intervention positiv auf Zuwächse im Satzverständnis (β = 0,22; p < 0,01), morphologischen Regelwissen (β = 0,19; p < 0,05) und Satzgedächtnis (β = 0,34; p < 0,001) aus. Die Robustheit der Effekte gegenüber Drittvariableneffekten reicht von r = 0,29 (MR, SD = 0,25) über r = 0,56 (VS, SD = 0,06) bis zu r = 0,64 (SG, SD = 0,06). Kein weiteres Merkmal der Interaktionsqualität zu T1 hat einen signifikanten Einfluss.

Tab. 3 Vollstandardisierte b‑Pfade, partiell standardisierte Produktkoeffizienten (a * b) „Anteil mediiert“ (\(\frac{\text{indirekter Effekt}}{\left| \upbeta \mathrm{c'}\left(\mathrm{ps}\right)\right| +{\sum }_{i=1}^{4}\left| \left(\upbeta \text{ai * }\upbeta \mathrm{bi}\right)\mathrm{ps}\right| }\)), partiell standardisierte a‑Pfade

Die Effekte der Veränderungen der Interaktionsqualität zwischen T1 und T2 auf parallele Veränderungen im Sprachstand (βb(vs)) werden ebenfalls vollständig standardisiert wiedergegeben (s. Modell 1, Spalte 2). Zuwächse in der Dialogqualität wirken sich danach signifikant positiv auf das phonologische Arbeitsgedächtnis (β = 0,21; p < 0,05) und die Gedächtnisspanne (β = 0,20; p < 0,05) aus. Eine Zunahme der Input-Strategien beeinflusst positiv die Entwicklung des expressiven Wortschatzes (β = 0,10; p < 0,05), morphologischen Regelwissens (β = 0,14; p < 0,05) und Satzgedächtnisses (β = 0,18; p < 0,05). Während Output-Strategien auch im Rahmen ihrer Veränderungsmessung keinen statistisch bedeutsamen Effekt auf die Sprachentwicklung haben, zeigen sich für die Modellierungs- und Korrekturtechniken in Kompetenzbereichen, die zusätzlich durch die Dialogqualität oder Input-Strategien beeinflusst werden, signifikant negative Einflüsse (AWST‑R, β = −0,10; p < 0,05; GW, β = −0,18; p < 0,05; SG, β = −0,19; p < 0,05). Die Robustheit gegenüber Drittvariableneinflüssen liegt im Falle der Dialogqualität bei r = 0,32 (PGN, SD = 0,15) bzw. r = 0,37 (GW, SD = 0,20) und im Falle der Input-Strategien bei r = 0,27 (AWST‑R, SD = 0,28), r = 0,13 (MR, SD = 0,28) bzw. r = 0,33 (SG, SD = 0,16). Die negativen Effekte der Modellierungs- und Korrekturtechniken wären bei gegenläufigen Korrelationen mit einer Drittvariablen in Höhe von r = ±0,37 (AWST‑R, SD = 0,17), r = ±0,20 (GW, SD = 0,30) oder r = ±0,34 (SG, SD = 0,21) als ungültig zu betrachten.

Für den ersten Beobachtungszeitraum kann festgehalten werden, dass sich Unterschiede in der Interaktionsqualität vor der Intervention ausschließlich unter dem Aspekt der Dialogqualität auf die Sprachentwicklung auswirken. Gemessen an Cohens Einteilung (1988) sind die Einflüsse als mäßig (MR) bis äußerst robust (VS und SG) gegenüber Drittvariablen einzuschätzen. Unter den Veränderungsmessungen erweisen sich die der Dialogqualität und Nutzung von Input-Strategien als für die Sprachentwicklung positiv prädiktiv. Die Effekte sind jeweils auf mittlerem Niveau robust. Eine Ausnahme stellt der mit Blick auf den Robustheitswert kaum vorhandene Schutz des Einflusses der Input-Strategien auf das morphologische Regelwissen dar. Die Effekte der Modellierungs- und Korrekturtechniken sind, bei mäßiger bis mittlerer Robustheit, erwartungswidrig negativ ausgeprägt. Um auszuschließen, dass es sich bei diesem Befund um ein Artefakt der wechselseitigen Kontrolle der Interaktionsmerkmale handelt, wurden die Ergebnisse mit einem Single-Mediator-Modell überprüft (nicht dargestellt). Bei unverändertem Vorzeichen ist der Einfluss in zwei Sprachbereichen (AWST‑R und SG) nach wie vor signifikant (p < 0,01), im dritten (GW) immerhin tendenziell signifikant (p = 0,07).

5.1.2 Modell 2

In der Vorhersage der Sprachentwicklung zwischen T2 und T3 liegt ein verändertes Bild vor. Neben dem Zustand der Dialogqualität zu T1, der in gleicher Stärke wie im ersten Beobachtungszeitraum das Satzverständnis (β = 0,23; p < 0,01) beeinflusst, wirken sich Unterschiede im Gebrauch der Modellierungs- und Korrekturtechniken zu T1 auf den rezeptiven Wortschatz (β = −0,10; p < 0,05) aus, und zwar negativ (s. Tab. 3, Modell 2, Spalte 1). Die Robustheit der Effekte gegenüber Drittvariablen ist mit Werten von r = 0,52 (SD = 0,07) bzw. r = ±0,43 (SD = 0,14) jeweils als hoch einzustufen. Weder Output- noch Input-Strategien weisen einen solchen „two waves apart“-Effekt auf.

Veränderungen in der Nutzung von Input-Strategien haben positive Effekte auf die spätere Entwicklung des Satzverständnisses (β = 0,20; p < 0,01) und morphologischen Regelwissens (β = 0,14; p < 0,05) (s. Modell 2, Spalte 2). Die Robustheit der Effekte liegt beim Satzverständnis auf hohem (r = 0,52, SD = 0,13) und beim morphologischen Regelwissen auf mittlerem Niveau (r = 0,31, SD = 0,36). Für die Korrektur- und Modellierungstechniken kann demgegenüber ein negativer Einfluss auf das morphologische Regelwissen (β = −0,15; p < 0,05) festgestellt werden, der moderat gegen Drittvariableneinflüsse (r = ±0,38, SD = 0,23) abgesichert ist. Veränderungen in der Dialogqualität und Nutzung von Output-Strategien haben im zweiten Modell keinen Effekt.

Insgesamt sind die Einflüsse der Dialogqualität im zweiten Vorhersagezeitraum auf ihre Ausgangswerte beschränkt. Im Gegensatz hierzu beeinflussen die Input-Strategien nur im Rahmen ihrer Zuwächse zwischen T1 und T2 die spätere Sprachentwicklung. Die Modellierungs- und Korrekturtechniken sind sowohl über ihre Zustands- als auch Veränderungsmessungen (erwartungswidrig) negativ mit der Sprachentwicklung assoziiert. Diese Effekte konnten erneut hinsichtlich Richtung und Signifikanz (p < 0,05) in einem Single-Mediator-Modell (nicht dargestellt) bestätigt werden. Für alle Effekte gilt zudem, dass sie im mittlerem bis großem Umfang gegenüber Bedrohungen ihrer Validität robust sind.

5.2 Mediation der Fortbildungsteilnahme auf die Sprachentwicklung (Fragestellung 2)

Der „joint significance“-Test sieht für den Nachweis einer Mediationsbeziehung vor, dass neben dem b‑Pfad auch der zugehörige a‑Pfad signifikant ist. Entsprechend sind für die Frage der indirekten Effekte der Fortbildung nun deren Wirkungen auf die Interaktionsmerkmale (βa(ps)) von Interesse (s. Tab. 3, Modell 3). Dabei kann für alle Sprachmaße festgestellt werden, dass die Fortbildungsteilnahme die Entwicklung der Dialogqualität signifikant positiv, die der Input- sowie Output-Strategien sogar hoch- bis höchstsignifikant positiv vorhersagt. Gemessen an den partiell standardisierten Effekten ist der Einfluss der Fortbildung auf die Input-Strategien größer als auf die Output-Strategien, gefolgt von der Dialogqualität. Alle statistisch signifikanten b‑Pfade der Dialogqualität und Input-Strategien sind somit als Bestandteil indirekter Effekte der Fortbildungsteilnahme zu betrachten. Da die Fortbildung auf die Entwicklung der Modellierungs- und Korrekturtechniken keinen Einfluss hatte, kommen sie als Übertragungswege nicht Frage. Die auf diese Weise identifizierten indirekten Effekte werden durch die Konfidenzintervalle der Produktkoeffizienten jeweils bestätigt (s. Modell 1 & 2, Spalte 3).

Die Robustheit der a‑Pfade liegt im Falle der Dialogqualität für die Vorhersage des phonologischen Arbeitsgedächtnisses bei r = 0,36 (SD = 0,04) und für die der Gedächtnisspanne bei r = 0,34 (SD = 0,05), d. h. jeweils auf mittlerem Niveau. Da der Referenzwert für einen die Validität bedrohenden Einfluss durch Drittvariablen bei r = 0,41 liegt (vgl. 4.4.2), ist die Robustheit dieser a‑Pfade als erheblich eingeschränkt zu betrachten. Anders verhält es sich mit den Effekten der Fortbildung auf die Input-Strategien, deren Robustheit mit r = 0,69 (AWST‑R, SD = 0,01), r = 0,62 (MR, SD = 0,03), 0,65 (VS, SD = 0,02) sowie r = 0,69 (SG, SD = 0,01) jeweils deutlich über dem kritischen Referenzwert von r = 0,48 liegt.

Die relative Effektstärke der Mediationen ist an den partiell standardisierten Produktkoeffizienten abzulesen (s. Tab. 3, Modell 1 & 2, Spalte 3). Diese zeigen, dass Input-Strategien den im Vergleich aller Interaktionsmerkmale größten Einfluss auf die Sprachentwicklung haben, und zwar in Höhe von 0,28 auf das Satzgedächtnis (Modell 1) und 0,32 auf das Satzverständnis (Modell 2). Bei diesen Kompetenzen löst die Fortbildung über die Nutzung der Input-Strategien Verbesserungen um mehr als eine viertel Standardabweichung aus. Die übrigen Effektstärken liegen im Bereich von einem fünftel bis siebtel Standardabweichung. Der Anteil des mediierten Effekts (s. Modell 1 & 2, 4. Spalte) an der Gesamtheit aller (vorzeichenbereinigten) indirekten und direkten Effekte reicht von 23 %, für den über die Dialogqualität vermittelten Einfluss auf die Gedächtnisspanne in Modell 1, bis 66 bzw. 67 %, für die durch Input-Strategien übertragenen Einflüsse auf das Satzverständnis und morphologische Regelwissen in Modell 2.

Zusammengefasst kommt die Dialogqualität als Mediator der Fortbildung nur in Betracht, wenn der Referenzwert für die Bedrohung der a‑Pfade den tatsächlichen Drittvariableneinfluss überschätzt. Dass dieser Referenzwert tatsächlich zu hoch angesetzt ist, lassen die Belege für die Homogenität von Interventions- und Kontrollgruppe (s. 4.2.) sowie die im Kovarianz-Ansatz gegebene Kontrolle konfundierender Größen (s. 4.4.1) stark vermuten. Im Unterschied hierzu weisen die a‑Pfade der Input-Strategien auch nach Abzug eines plausiblen Drittvariableneinflusses eine noch akzeptable Robustheit von r = 0,14 bis 0,20 auf. Diese trägt bei allen durch die Input-Strategien (T2) beeinflussten Sprachkompetenzen – mit Ausnahme des morphologischen Regelwissens in Modell 1, dessen Robustheit gegen Drittvariableneinflüsse sehr gering ist – zu einer belastbaren Wirkkette bei.

6 Diskussion der Befunde

Die vorliegende Studie untersuchte den Einfluss verschiedener Interaktionsmerkmale auf die (früh-)kindliche Sprachentwicklung (Fragestellung 1) sowie die Beiträge, die diese Merkmale zur Transmission der Effekte eines alltagsintegrierten Sprachbildungsprogramms leisten (Fragestellung 2). Die erste Frage kann dahingehend beantwortet werden, dass zwei der untersuchten vier Merkmale (Dialogqualität und Input-Strategien) einen positiven Einfluss von niedriger bis moderater Stärke auf die Sprachentwicklung haben. Das dritte Merkmal (Modellierungs- und Korrekturtechniken) weist negative, das vierte (Output-Strategien) gar keine Effekte auf. Die nachgewiesenen Wirkungen variieren hinsichtlich der Beständigkeit des Einflusses (Zustand v. Veränderung) sowie der Zeitspanne bis zu seiner Manifestation (T1-T2 v. T2-T3). Von einer stabil hohen Dialogqualität in den Fachkraft-Kind-Interaktionen, wie sie durch die Vorher-Werte erfasst wird, profitieren Kinder sowohl in ihrer mittelfristigen (MR, SG und VS) als auch langfristigen (VS) Sprachentwicklung. Darüber hinaus sind Prä-Post-Veränderungen im dialogischen Anregungsgehalt positiv mit zeitgleich beobachteten Lernzuwächsen im auditiven Gedächtnis (PGN und GW) verbunden. Angesichts der für Kausalaussagen erforderlichen Reihenfolge von Ursache und Wirkung stellt sich hier jedoch die Frage einer möglichen Wechselwirkung zwischen den Sprachkompetenzen der Kinder und ihrer Teilhabe an langanhaltenden Dialogen (Tomasello und Farrar 1986). Ein Blick auf die bivariaten Korrelationen (s. Tab. 19, Anhang 2) zeigt, dass beide auditiven Gedächtnisleistungen zu T1 und T2 weder mit zeitgleich noch später erhobenen Werten der Dialogqualität statistisch zusammenhängen. Da die Vorher-Werte der Dialogqualität aber ihrerseits mit den Nachher-Werten eines der beiden Gedächtnismaße (PGN) korrelieren, scheint die Annahme eines einseitig kausalen Einflusses für diesen Sprachbereich vertretbar.

Demgegenüber wirken sich Input-Strategien sowie Modellierungs- und Korrekturtechniken – mit Ausnahme des Einflusses der zu T1 erhobenen Modellierungs- und Korrekturtechniken auf den rezeptiven Wortschatz zu T3 – nur im Rahmen ihrer Prä-Post-Veränderungen auf die Sprachentwicklung aus, dies jedoch in einer Vielzahl von Bereichen (AWST‑R, VS, MR, GW, SG, VS). Die bivariaten Korrelationen (Tab. 19) stützen im Falle der Input-Strategien, deren Ausgangswerte in der Tendenz schwache Zusammenhänge mit zeitgleich erhobenen und steigende Assoziationen mit späteren Sprachständen zeigen (Sprachstände zu T1 beeinflussen jedoch nicht umgekehrt Input-Strategien zu T2), eher das generelle Bild einer kausalen Beeinflussung der Sprachentwicklung.

Demgegenüber zeigt die Korrelationstabelle für die Modellierungs- und Korrekturtechniken ein zur Dialogqualität und den Input-Strategien konträres Muster. Die Ausgangswerte der Modellierungs- und Korrekturstrategien weisen hier keinen Zusammenhang mit den Vorher‑, Nachher- und Follow-Up-Messungen des Sprachstands auf. Dieser Befund untermauert die Ergebnisse der Mediationsmodelle (s. Tab. 3), nach denen von stabilen Unterschieden in der Nutzung dieser Strategien im Allgemeinen kein Effekt auf die Sprachentwicklung der Kinder ausgeht. Darüber hinaus sind die Nachher-Messungen der Modellierungs- und Korrekturstrategien (negativ) mit allen Sprachmaßen zu allen MZPen assoziiert. Werden die Sprachstände der jeweils anderen MZPe in diesen Zusammenhängen kontrolliert und damit die gemeinsamen Varianzanteile eliminiert, erweisen sich die resultierenden Partialkorrelationen zwischen den Modellierungs- und Korrekturtechniken und den verschiedenen Sprachmaßen, mit Ausnahme des Satzgedächtnisses zu T2, jedoch als nicht signifikant (nicht dargestellt). Demnach beruhen die Korrelationen nullter Ordnung im Wesentlichen auf derselben gemeinsamen Varianzquelle. D. h. diejenigen Gruppen von Kindern, die zu T2 mehr Unterstützung erhalten, haben nicht nur zum selben Zeitpunkt (T2), sondern der Tendenz nach bereits zu T1 (und später auch zu T3), einen höheren Unterstützungsbedarf in Form unterdurchschnittlicher Sprachkompetenzen. Insgesamt deuten die Daten somit auf einen Selektionsmechanismus hin, den u. a. Cross (1979) und Beckerle und Mackowiak (2019) in querschnittlichen Daten gefunden haben (vgl. 2.2): Gruppen von Kindern mit (konstant) unterdurchschnittlichen Kompetenzen erhalten am Ende des ersten Erhebungszeitraums (T2) mehr, Gruppen mit (konstant) überdurchschnittlichen Kompetenzen hingegen weniger Modellierungs- und Korrekturtechniken. Im Anschluss an die genannten Autor*innen sieht der Verfasser in diesen Zusammenhängen eher Indizien für eine Adaption des Sprachangebots an die Sprachstände der Kinder als für einen negativen Effekt der Fördertechniken. In der Verlängerung dieser Perspektive können die in den längsschnittlichen Mediationsmodellen ermittelten negativen Effekte der Veränderungsmessungen der Modellierungs- und Korrekturstrategien auf parallele Veränderungen der Sprachstände ebenfalls als Anpassungsverhalten gedeutet werden. Vor dem Hintergrund, dass die Nutzung der Modellierungs- und Korrekturtechniken in der Gesamtstichprobe nur wenig angestiegen ist (s. Tab. 2), bietet sich folgende Lesart an: die Fachkräfte haben im Zeitverlauf auf unterdurchschnittliche Entwicklungen der Kinder mit intensiverer Nutzung der Techniken „reagiert“, während überdurchschnittliche Entwicklungen sie dazu bewegt haben, gleich viele oder weniger Techniken zu verwenden.

Wenn diese Deutung zutrifft, ist weiter zu fragen, warum das Gros der Fachkräfte (erst) im Verlaufe des ersten Beobachtungszeitraums gelernt hat, die Nutzung der Modellierungs- und Korrekturtechniken am Kompetenzstand der Kinder zu orientieren. Zu Beginn der Erhebung war beides entkoppelt, wie die Korrelationsanalysen belegen. Nach den Ergebnissen der Moderatoranalyse (s. 5.1), welche die Parallelität der Effekte der SLS in Interventions- und Kontrollgruppe prüft, kann die Fortbildung als Ursache des Lernprozesses nahezu ausgeschlossen werden. Fachkräfte beider Gruppen setzen die Strategien vergleichbar (effektiv) ein. Alternativ kann jedoch vermutet werden, dass viele Fachkräfte (interventionsunabhängig) durch den täglichen Kontakt die Sprachkompetenzen der Kinder am Ende des Beobachtungszeitraums genauer einschätzen und ihr Förderhandeln entsprechend anpassen konnten. Diese Annahme kann mit den vorliegenden Daten jedoch nicht weiter geprüft werden.

Ungeklärt sind weiterhin die beiden negativen Effekte der Modellierungs- und Korrekturtechniken im zweiten Modell, die ihre Ausgangswerte im Verhältnis zur Entwicklung des rezeptiven Wortschatzes und ihre Veränderungsmessungen im Verhältnis zum morphologischen Regelwissen betreffen. Der letztgenannte Effekt könnte eine zeitversetzt auftretende Folge des oben beschriebenen Anpassungsprozesses darstellen, falls dieselben Kinder, die zwischen T1 und T2 eine ungünstige Entwicklung ihrer Sprachkompetenzen in einem bestimmten Bereich (z. B. Satzgedächtnis) aufweisen, der mit den Veränderungsmessungen der Fördertechniken negativ assoziiert ist, sich im nachfolgenden Beobachtungszeitraum in einem anderen Bereich, dem des morphologischen Regelwissens, ungünstiger entwickeln. Im Einklang mit dieser These belegen Zusatzanalysen (nicht dargestellt), dass der Einfluss der Modellierungs- und Korrekturtechniken auf das morphologische Regelwissen in Modell 2 nicht-signifikant wird, wenn für Veränderungen im Satzgedächtnis (T1-T2) kontrolliert wird. In diesem Zusammenhang müssen einige grundlegende Besonderheiten der vorliegenden Untersuchung hervorgehoben werden, die einen direkten Vergleich mit der überwiegend positiven Befundlage zur Wirksamkeit der Fördertechniken (s. 2.3.1) erschweren. Wie den Arbeiten von Cross (1979) und Beckerle und Mackowiak (2019) auch, liegen den Analysen Beobachtungs- und keine Experimentaldaten zugrunde. Fehlende Kontrolle über das Verhalten der Fachkräfte, auch der fortgebildeten, erschwert die Interpretation kausaler Effekte des Förderhandelns, insbesondere der Modellierungs- und Korrekturtechniken, deren Verwendung sowohl eine Reaktion auf als auch ein Impulsgeber für Spracherwerbprozesse darstellen kann. Ferner wird in der vorliegenden Studie die Entwicklung allgemeiner Sprachkompetenzen und nicht der Erwerb der durch die Modellierungs- und Korrekturtechniken konkret aufgegriffenen Zielstrukturen untersucht. Wenn, wie u. a. Farrar (1990) zeigt, die Wirkung dieser Fördertechniken auf korrespondierende Strukturen (z. B. Pluralbildung) begrenzt sein sollte (vgl. 2.3.1), kann vermutet werden, dass die hier eingesetzten standardisierten Sprachtests für den Nachweis der Effekte letztlich ungeeignet, da zu unspezifisch, sind. Darüber hinaus haben sich die methodisch am ehesten vergleichbaren Korrelationsanalysen in ihren bisherigen Vorhersagen der Sprachentwicklung auf den Einfluss von Zuständen der Interaktionsqualität konzentriert, wie sie zu Beginn der jeweiligen Messperiode (u. a. Farrar 1990; Gleitman et al. 1984; Hoff-Ginsberg), deren Ende (Girolametto et al. 1999) oder im gesamten Beobachtungszeitraum (Taumoepeau 2016) vorherrschen, und nicht auf die Wirkungen paralleler Veränderungen. Insofern bieten sich für einen direkten Vergleich mit dem Forschungsstand vor allem die für die Mediation irrelevanten Einflüsse der Interaktionsqualität zu T1 an. Diesbezüglich weisen 13 von 14 Einzelanalysen keinen Effekt der Modellierungs- und Korrekturtechniken aus.

Abschließend sei auf die fehlenden Effekte der Output-Strategien sowohl ihrer Zustands- als auch Veränderungsmessungen eingegangen. Diese könnten speziell damit zusammenhängen, dass – wie im Methodenteil (4.3.2) erläutert – offene Fragen nicht in die Analysen einbezogen wurden, sich die Effekte der Output-Strategien also auf die Gruppe der geschlossenen und Ergänzungsfragen beschränken. Somit wäre es vorstellbar, dass geschlossene Fragen und sprachlich wenig komplexe Ergänzungsfragen, z. B. Benennfragen, für die hier untersuchte Altersgruppe von Kindern (3–5 Jahre) nicht mehr entwicklungsangemessen gewesen sind (vgl. hierzu Kucharz 2018; Ritterfeld 2000). Möglicherweise ist die kategoriale Zusammenfassung verschiedener Frageformen ein weiterer Grund für die fehlenden Effekte. Wie im Forschungsstand (2.3.1) angedeutet, fällt die Befundlage aus Korrelationsstudien bezüglich der hier untersuchten Fragetechniken vergleichsweise uneinheitlich aus.

Insgesamt belegt die vorliegende Untersuchung jedoch überzeugend die Relevanz von Fachkraft-Kind-Interaktionen für den Spracherwerb. Im Lichte der oben referierten Spracherwerbstheorien scheinen sowohl Merkmale eines semantisch (Dialogqualität) wie auch linguistisch (Input-Strategien) angereicherten Sprachangebots den Lernprozess zu unterstützen. Die Studie ergänzt die unter 2.3.1 referierten Wirksamkeitsbefunde zur Interaktionsqualität, in denen mit wenigen Ausnahmen (u. a. Farrar 1990) nur einzelne Merkmale (z. B. eine einzelne Fördertechnik) untersucht oder, wie in Analysen zur Prozessqualität, Maße der Interaktionsqualität verwendet wurden, die semantische und linguistische Aspekte kombinieren. Dabei eröffnet die wechselseitige Auspartialisierung der Varianzanteile im Rahmen der multiplen Mediation einerseits den Blick auf die singulären Beiträge der Interaktionsmerkmale zum Spracherwerb. Sie verdeckt andererseits die Beziehungen der Dimensionen untereinander. Hier können die positiven Korrelationen zwischen Input-Strategien und Dialogqualität zum ersten MZP (s. Tab. 20, Anhang 3) als erster Hinweis auf die in den Zielen von FDS verankerte Vereinbarkeit eines dialogischen und linguistischen Sprachangebots gedeutet werden.

Im Hinblick auf die zweite Forschungsfrage ist festzustellen, dass die Nutzung von Strategien zur Anreicherung der Dialogqualität und des sprachlichen Inputs durch die Fortbildung in einem Maße stimuliert werden konnte, dass sie nicht nur als direkte Determinanten der Sprachentwicklung, sondern auch als Übertragungsriemen für die Fortbildungsinhalte angesehen werden können. Demgegenüber ist die Anzahl der Modellierungs- und Korrekturtechniken in der Interventionsgruppe, sowohl absolut als auch im Verhältnis zur Kontrollgruppe, nicht angestiegen. Dieser Befund ist insofern überraschend, als es thematisch verwandten Fortbildungen (Beckerle 2017; Simon und Sachse 2011) gelungen ist, die Nutzung dieser Techniken stärker anzuregen. Dabei gilt es zu berücksichtigen, dass die FDS-Fortbildung die Fachkräfte ausdrücklich instruiert, alle SLS dialogförderlich zu verwenden (vgl. 4.1). Möglicherweise hat die Interventionsgruppe anderen Fördertechniken – z. B. den Output-Strategien, deren Hauptfunktion es ist, Kinder zum Sprechen zu bewegen – einen höheren Nutzwert für diese Zielerreichung zugeschrieben und Modellierungs- und Korrekturtechniken deshalb nicht häufiger als vor der Fortbildung eingesetzt. Eine solche Lesart fügt sich in die bisherige Interpretation der paradoxen Effekte der Modellierungs- und Korrekturtechniken ein. Danach haben die fortgebildeten Fachkräfte den Einsatz dieser Fördertechniken im Zeitverlauf – in der gleichen Weise wie die Kontrollgruppe – an die Eigendynamik der kindlichen Sprachentwicklung angepasst anstatt diese, wie von der Fortbildung beabsichtigt, durch eine intensivere Nutzung positiv zu beeinflussen. Aus der Tatsache, dass die Fortbildung den Gebrauch der Modellierungs- und Korrekturtechniken nicht beeinflussen konnte, folgt des Weiteren, dass der entsprechende Mediationseffekt nicht signifikant wird. Auch der Übertragungsweg über die Output-Strategien erweist sich als „blockiert“, dies allerdings aufgrund des fehlenden Zusammenhangs der Techniken mit der Sprachentwicklung.

Welche Beiträge die Interaktionsqualität zum Netto-Erfolg der Fortbildung leistet, kann nicht abschließend geklärt werden. Im Unterschied zur Projektevaluation (Voltmer et al. 2021), die den Einfluss der Fortbildung auf die Sprachentwicklung über alle drei MZPe ermittelt, wird dieser in den vorliegenden Mediationsmodellen messzeitpunktbezogen erfasst. Darüber hinaus werden die indirekten Effekte aus methodischen Gründen nicht dem Netto-Erfolg der Fortbildung, sondern der Summe der Brutto-Wirkungen gegenübergestellt. Gemessen daran fällt der Beitrag, den die Input-Strategien im zweiten Messzeitraum zur Verbesserung des Satzverständnisses und morphologischen Regelwissens leisten, am höchsten aus. Da das morphologische Regelwissen auch im ersten Messzeitraum durch die Input-Strategien beeinflusst wird und es sich darüber hinaus um diejenige Kompetenz handelt, für die in der Evaluation der stärkste Netto-Effekt der Fortbildung nachgewiesen wurde (Voltmer et al. 2021), wird den Input-Strategien insbesondere in diesem Sprachbereich eine hohe Gesamtrelevanz für den Fortbildungserfolg zugeschrieben.

Mit Blick auf die Limitationen der Arbeit müssen sechs (weitere) Tatsachen besonders erwähnt werden. Erstens erlauben die Video- und Sprachdaten keine einzelfallbezogene Verknüpfung, so dass die Effekte der Interaktionsmerkmale nur bedingt inhaltlich ergründet werden können. Damit zusammenhängend konnte, zweitens, die u. a. von Dannenbauer (1999) als zentrale Wirksamkeitsvoraussetzung identifizierte individuelle Entwicklungsangemessenheit der SLS nicht in die Analyse einbezogen werden (siehe hierzu Geyer und Müller 2021). Die Ergebnisse spiegeln folglich nicht den maximalen Ertrag der Techniken wider, sondern ihre von dem Migrationshintergrund, Geschlecht und vergangenen Sprachständen der Kinder unabhängige Wirkung auf die mittlere Kompetenz der Gruppen. Drittens schränkt der potenzielle Einfluss unbeobachteter Drittvariablen, der aus dem Erhebungsdesign resultiert, die Verallgemeinerbarkeit der Modelleffekte ein. Die Sensitivitätsanalysen zum Effekt der Fortbildung auf die Interaktionsqualität beruhen auf plausiblen und eher konservativen, aber letztlich nicht prüfbaren, Annahmen über die unbeobachteten Einflussgrößen. Für die Effekte der Interaktionsmerkmale kann ein solcher Referenzwert zudem nicht hergeleitet werden. Viertens ist die Diversität der Stichprobe und damit zusammenhängend die Generalisierbarkeit der Befunde für eine größere Population von Einrichtungen angesichts der verhältnismäßig geringen Anzahl untersuchter Gruppen als begrenzt anzusehen. Fünftens wurden die Videos der Fachkraft-Kind-Interaktionen in nur zwei exemplarischen Kontexten des KiTa-Alltags erhoben. Insofern geben die gemessenen Effekte keinen Aufschluss darüber, ob die Fortbildungsinhalte auch in anderen Alltagssituationen umgesetzt und tatsächlich „alltagsintegriert“ wirksam geworden sind, wie es das Ziel der Fortbildung ist. In diesem Zusammenhang muss auch die Konstruktion der Indikatoren der Interaktionsqualität als über beide Erhebungskontexte hinweg gebildete Durchschnittswerte des Fachkräftehandelns kritisch hinterfragt werden. Denn solche Aggregatmaße stehen einer differenziellen Analyse kontextspezifischer Wirkungen der Interaktionsqualität, die freilich nicht Gegenstand dieser Untersuchung sind, entgegen. Weiterführende Studien sollten ferner den moderierenden Einfluss zusätzlicher Individualmerkmale der Kinder auf die Mediationsprozesse beleuchten. Sechstens konnte aus erhebungsökonomischen Gründen ein dritter videografischer Messzeitpunkt nicht realisiert werden. Insofern stehen die Effekte der Interaktionsqualität auf den Sprachstand zu T3 unter dem Vorbehalt, dass sie auf nicht-beobachteten Zusammenhängen mit der Interaktionsqualität zu T3 beruhen.

Mit diesen Einschränkungen konnte die vorliegende Studie das Kernkonzept der FDS-Fortbildung, das darauf gerichtet ist, die Sprachentwicklung von Kindern durch die Schulung von Fachkräften im Gebrauch von linguistisch fundierten SLS und dialogförderlichen Handlungsroutinen zu verbessern, insgesamt empirisch validieren. So wurde gezeigt, dass die FDS-Fortbildung das Förderhandeln der Fachkräfte mit Ausnahme der Nutzung von Modellierungs- und Korrekturtechniken verbessert hat und dass zwei der geförderten Aspekte (Input-Strategien und Dialogqualität) den Spracherwerb der Kinder positiv beeinflusst haben. Die nachwirkenden Effekte der Vorher-Werte der Dialogqualität könnten zudem ein Hinweis darauf sein, dass langfristige „Investitionen“ in die Stabilität dieses Interaktionsmerkmals weitere (Sprach‑)Bildungsrendite erzeugen. Der fehlende Einfluss der Fortbildung auf die Nutzung von Modellierungs- und Korrekturtechniken wirft aus Sicht des Verfassers, wie oben erläutert, Fragen der Vereinbarkeit von auf kindliche Äußerungen „reagierenden“ und Dialogmuster fördernden Strategien auf, die in künftigen Fortbildungskonzepten stärker bedacht werden sollten.