1 Einleitung

In den vergangenen Jahren war ein massiver Bedeutungszuwachs der Kindertageseinrichtung (Kita), insbesondere in Bezug auf die erhöhte Notwendigkeit von Betreuungsplätzen und damit einhergehend ein erhöhter Personalbedarf zu beobachten (Autorengruppe Bildungsberichterstattung 2018; Autorengruppe Fachkräftebarometer 2019). Die damit verbundene Aufmerksamkeit auf das System der Kitas wird flankiert von einer Diskussion um Professionalisierung pädagogischer Fachkräfte im Arbeitsfeld der frühen Kindheit. Durch Professionalisierungsmaßnahmen in Aus‑, Fort- und Weiterbildung soll neben dem quantitativen Ausbau der Kitas auch die Professionalität der Fachkräfte gewährleistet werden.

In der wissenschaftlichen Diskussion wird in diesem Zusammenhang die Frage debattiert, welche Ansatzpunkte in Professionalisierungsmaßnahmen den spezifischen Handlungsanforderungen in Kitas gerecht werden. Dieser Beitrag knüpft an den professionalisierungstheoretischen Ansatz nach Fröhlich-Gildhoff et al. (2014) an, der von einem Zusammenspiel von Einstellungen und Wissen für die Situationen und Handlungsanforderungen in kindheitspädagogischen Handlungsfeldern sowie deren Reflexion ausgeht. Anhand einer klassischen Interventionsstudie wird geprüft, ob sich die pädagogische Praxis durch eine intensive, am aktuellen Forschungsstand orientierte In-House-Weiterbildungsmaßnahme verändern lässt. Von Interesse ist hierbei, inwieweit Einstellungen und fachspezifisches Wissen pädagogischer Fachkräfte eine Rolle spielen und entsprechend professionalisierungstheoretisch berücksichtigt werden müssten. Nachgegangen wird dieser Frage in Form einer Längsschnittstudie zur Integration mehrsprachiger Lernumgebungen in Kitas.

2 Theoretischer Hintergrund

2.1 Professionalisierung in der frühen Bildung

Die wissenschaftliche Auseinandersetzung mit der Frage der Professionalisierung von Kitas ist noch verhältnismäßig jung. Eine verstärkte Aufmerksamkeit auf das Arbeitsfeld der frühen Bildung wird vor allem seit den 1990er- und 2000er-Jahren gelegt. Neben Fragen der Professions- und Systementwicklung der frühen Bildung werden in dem Forschungsfeld auch Fragen zum professionellen Handeln der Fachkräfte bearbeitet. Die zum professionellen Handeln von Fachkräften vorliegenden Untersuchungen knüpfen dabei häufig an allgemeinen Theorien pädagogischen Handelns an, die sich sowohl mit dem Dualismus zwischen Klienten und Professionellem als auch der Dreistelligkeit des Verhältnisses zwischen Klienten, Professionellem und Sachthematik befassen (vgl. Combe und Helsper 1996). Für das kindheitspädagogische Handeln lässt sich die Frage nach der Gestaltung des didaktischen Dreiecks aus Fachkraft, Kind und Sachthematik unterschiedlich beantworten. Wird die Rolle der Fachkraft dabei als lernhelfend, lernbegleitend oder lernunterstützend betrachtet, so ergibt sich die Eröffnung von adäquaten Lerngelegenheiten als eine zentrale Anforderung pädagogischen Handelns. So schlägt Giesecke (2013) vor, professionelle Pädagogen als Lernhelfer zu verstehen, deren Handeln durch allgemeine und besondere Erwartungen (Recht, Träger, …) begrenzt wird. Diesem Vorschlag folgend besteht die zentrale Anforderung an Pädagogen dann darin, dass sie angemessene Lern- und Entwicklungsgelegenheiten verfügbar machen sollen. In der Kita gehören etwa Fachkraft-Kind-Interaktionsmöglichkeiten, Unterstützung von Peer-Interaktionen, Raumgestaltung, die Bereitstellung von Lern- und Entwicklungsmaterial aber auch Beobachtung und Dokumentation hierzu.

Insbesondere in der frühen Bildung unterliegt das Verfügbarmachen von Lern- und Entwicklungsgelegenheiten spezifischen Anforderungen. Dies liegt im spezifischen Anforderungsprofil dieses Arbeitsfeldes begründet. Nentwig-Gesemann et al. (2011) zufolge lassen sich die Situationen und Handlungsanforderungen in kindheitspädagogischen Handlungsfeldern nicht standardisieren, da Interaktionssituationen hochkomplex, mehrdeutig, schwer vorhersehbar und daher nur begrenzt planbar sind. Beschrieben wird ein forschender Habitus als zentrale Schlüsselkompetenz kindheitspädagogischer Profession. Zentral ist hierbei die Auffassung der Realität als eine perspektivische Konstruktion, die einen Perspektivenwechsel erforderlich macht. Hierfür benötige die pädagogische Fachkraft Inspiration durch theoretisches Wissen, den Vergleich mit Erfahrungen sowie die Fähigkeit, sich selbst in ein kritisches und reflexives Verhältnis zur Situation zu setzen. Anknüpfend daran haben Fröhlich-Gildhoff et al. (2014) ein breit rezipiertes Modell zur Professionalisierung pädagogischer Fachkräfte in Kitas vorgelegt, das die Grundlage für die vorliegende Fragestellung bildet. Pädagogisches Handeln in der Situation wird darin als das Ergebnis von Dispositionen gefasst, die von den Komponenten Wissen (wissenschaftlich-theoretisches Wissen und implizites Erfahrungswissen), Situationswahrnehmung und -analyse, Motivation und Handlungspotentialen bestimmt sind. Diese Komponenten bilden die Grundlage für die Handlungsplanung und -bereitschaft, die dann wiederum in das Handeln in der Situation mündet. Einstellungen werden in diesem Modell als Dimensionen gefasst, die das Denken und Handeln von Menschen wesentlich prägen und in einem individuell-biographischen Prozess entstehen. Sie wirken damit im Hintergrund der Ebene der Dispositionen auf die pädagogische Performanz ein. Entsprechend sehen die Autoren kompetenzorientierte Feedbackverfahren für die Aus- und Weiterbildung pädagogischer Fachkräfte als hilfreich an, die einen Fokus auf die Einbindung der eigenen Lebensgeschichte und deren Reflexion legen (Nentwig-Gesemann und Fröhlich-Gildhoff 2015).

2.2 Einstellungen, fachspezifisches Wissen und die Effektivität von Weiterbildung

In der Forschung zur Professionalisierung pädagogischer Fachkräfte in Kitas werden Einstellungen der Fachkräfte zu verschiedenen pädagogischen Aspekten in den Blick genommen. Ein Einfluss von Einstellungen und fachspezifischem Wissen auf das Handeln in der Praxis wird von verschiedenen Modellen übereinstimmend angenommen und lässt sich empirisch in querschnittlichen Betrachtungen zeigen. So stellen Kluczniok et al. (2011) auf Basis des strukturell-prozessualen Qualitätsmodells einen Zusammenhang von grundlegenden Fördereinstellungen (Persönlichkeitsförderung, Förderung sozialer Fähigkeiten u. a.) sowie auf Schule gerichteten Fördereinstellungen mit der Prozessqualität fest. Die Korrelation betrug hier r = 0,22 bzw. r = 0,21. Kratzmann et al. (2017a) berichten auf Grundlage des Professionalisierungsmodells nach Fröhlich-Gildhoff et al. (2014) in Regressionsanalysen zur Erklärung mehrsprachigkeitsintegrierenden Handelns der Fachkräfte auf den Ebenen von Materialauswahl, Raumgestaltung und Ermöglichung von Peer-Interaktionen standardisierte Regressionskoeffizienten von Einstellungsmerkmalen gegenüber Mehrsprachigkeit in Höhe von β = 0,15–0,69, die sich jedoch nicht auf allen Ebenen zeigen. Weiter zeigen sich dort auf manchen Ebenen Zusammenhänge des fachbezogenen Wissens mit der Performanz der Fachkräfte (β = 0,12 bzw. β = 0,16). Ebenso zeigen Fachkräfte mit höherem linguistischem Wissen in einer Studie von Ofner und Thoma (2014) auf Grundlage des Sprachförderkompetenzmodells nach Hopp et al. (2010) bei der Planung sprachförderrelevanter Lernumgebungen eine systematischere und zielorientiertere Vorgehensweise. Es wird eine Korrelation in Höhe von r = 0,55 berichtet. Auf Grundlage des o. g. Sprachförderkompetenzmodells berichtet Ofner (2014) Zusammenhänge zwischen dem durch einen computerbasierten Test erfassten Wissen (linguistisch, Spracherwerb und Sprachförderung) und der videographisch erfassten Qualität der Sprachförderung. Sie stellt Korrelationen zu allgemeinen Qualitätsmerkmalen (r = 0,41), allgemeinem Kommunikationsverhalten (r = 0,40) und Motivation (r = 0,56) fest. Keine nennenswerten Zusammenhänge finden sich dagegen zum sprachförderlichen Verhalten und der Zielsetzung.

In Frage steht, ob eine rein wissensbezogene Weiterbildungsmaßnahme für einen Transfer von Wissen in Handeln genügt. In der o. g. Studie findet Ofner (2014) keine nennenswerten Zusammenhänge zwischen Weiterbildungsmaßnahmen und der Qualität der Sprachförderung. Die Erfassung von Weiterbildungsmaßnahmen erfolgte hier allerdings nur undifferenziert. In einer Interventionsstudie von Sachse et al. (2016) zum sprachförderlichen Handeln mit mehrsprachigen Kindern in Kitas zeigt sich eine Weiterbildungsmaßnahme nur dann als effektiv, wenn der Wissenserwerb mit einer übungsbasierten und mit Videofeedback begleiteten Maßnahme verknüpft ist, in der die Fachkräfte Handlungsstrategien (hier sprachliches Interaktionsverhalten) einübten und ihr eigenes Handeln reflektierten.

Zur Veränderbarkeit von Einstellungen und Wissen durch Weiterbildungsmaßnahmen liegen nur wenige Studien vor, die zudem widersprüchliche Ergebnisse liefern. Eichen und Bruns (2017) zeigen an einer einjährigen erfahrungsbasierten Weiterbildungsmaßnahme im Bereich Mathematik auf Grundlage des Kompetenzmodells nach Fröhlich-Gildhoff et al. (2014) eine Veränderung von Einstellungen der Fachkräfte zum mathematischen Lernen auf. Die Einstellungen der Fachkräfte veränderten sich im Laufe der Intervention weg von einer statischen Sichtweise mathematischen Lernens hin zu einer anwendungsbezogenen Sichtweise und hatten positive Auswirkungen auf affektiver Ebene der Fachkräfte. Es werden Effektstärken in Höhe von r = 0,45–0,62 berichtet. Auf Grundlage des gleichen Kompetenzmodells konnten Kratzmann und Sachse (2018) in Bezug auf die Integration von Mehrsprachigkeit dagegen in einer Längsschnittstudie über einen Zeitraum von zwei Jahren Veränderungen lediglich auf Ebene des fachspezifischen Wissens der Fachkräfte nachweisen (β = 0,29), Einstellungen veränderten sich im gleichen Zeitraum kaum. Eine Metaanalyse von Markussen-Brown et al. (2017) zeigt demgegenüber keine Effekte von Weiterbildungen auf das Wissen der Fachkräfte. Ein Blick auf die einbezogenen Studien zeigt dabei eine sehr eingeschränkte Dauer der durchgeführten Weiterbildungsmaßnahmen, die sich in einem Zeitraum von einem bis neun Monaten bewegen, der möglicherweise nicht ausreichend war.

Erkenntnisse über Bedingungsfaktoren einer effektiven Weiterbildungsmaßnahme im frühpädagogischen Bereich finden sich in Metaanalysen. Die Analyse von Fukkink und Lont (2007) prüft auf Grundlage des strukturell-prozessualen Qualitätsmodells Einflussfaktoren auf die Effektivität von Weiterbildungsmaßnahmen hinsichtlich einer Verbesserung der Kompetenzen pädagogischer Fachkräfte in Bezug auf Wissen, Einstellungen und praktische Umsetzungsfähigkeiten. Die hinzugezogenen Studien weisen Effektstärken von bis zu d = 0,43 (Wissen), d = 0,65 (Einstellungen) und d = 0,40 (Umsetzungsfähigkeit) aus. Als Einflussfaktoren für den Erfolg der Weiterbildungsmaßnahmen wurden ein feststehendes Curriculum und die Durchführung an einem festen Standort identifiziert. Zaslow et al. (2010) heben auf Grundlage eines Literaturreviews weiter die Bedeutung eines Wissenstransfers in die Praxis in Form von Modellierungs- oder Feedback-Strategien hervor, die jedoch erst nach einer längeren Weiterbildung wirksam werden. Weiter stellen Egert et al. (2017) in einem narrativen Review insbesondere eine hohe Bedeutung individualisierter Unterstützungsmaßnahmen vor Ort heraus, beispielweise in Form von Videofeedbackverfahren oder performanzbezogenen Handlungsanweisungen. Darüber hinaus sei auch eine finanzielle Unterstützung, z. B. für die Anschaffung von Büchern, hilfreich für die Qualitätsverbesserung.

2.3 Professionalisierung mehrsprachiger Bildung in Kitas

In den vergangenen Jahren hat sich der Blick der Bildungsforschung und der Bildungspolitik auf mehrsprachig aufwachsende Kinder in Kitas weg von einer Defizitorientierung hin zu einer Stärkenorientierung gewandelt. Der Einbezug der bestehenden Sprachenvielfalt in die alltägliche Arbeit in Kitas und eine damit einhergehende gelingende mehrsprachige Entwicklung von Kindern sind identifizierte und bestehende Aufgaben und Herausforderungen im Kontext der frühen Bildung (Viernickel und Schwarz 2009). Entsprechend wurden Konzepte zur Integration von Mehrsprachigkeit in Kitas vorgeschlagen, die auf die Stärkung von kindlicher Mehrsprachigkeit abzielen (z. B. García und Wei 2014; Oliveira et al. 2016). Die Konzepte reichen dabei von einer wertschätzenden Begegnung bis hin zu einer expliziten Förderung der Erstsprachen der Kinder, z. B. in Form von bilingualen Konzepten oder der expliziten Erstsprachförderung durch Programme.

Die Umsetzung bilingualer Modelle, die zur Unterstützung der Entwicklung zu kompetenter Zweisprachigkeit sinnvoll sind (Collins 2014), erscheinen in Gruppen mit vielen Familiensprachen wenig zielführend. Aufgrund der hohen sprachlichen Vielfalt beschränkt sich die Möglichkeit eines Einbezugs von Familiensprachen in sprachlich heterogenen Gruppen auf die Schaffung einer mehrsprachigkeitsunterstützenden Lernumgebung, die beispielsweise in der Sichtbarmachung von Mehrsprachigkeit im Raum, mehrsprachigem Arbeitsmaterial (Bücher, Hörspiele, Einsatz von Tablets) und der generellen Erlaubnis, die Erstsprache in der Einrichtung zu verwenden, erfahrbar wird (vgl. Hüsler 2009; Apeltauer et al. 2015; Bereznai 2017). Anforderung an ein professionelles Handeln der Fachkräfte ist es daher, die (mehr-)sprachliche Lebenssituation der Kinder zu erkennen und diese in der Gestaltung von Lernumgebung in Form von Materialauswahl, Raumgestaltung und Dokumentation des alltäglichen Geschehens in der Kita zu integrieren sowie Peer-Interaktionen in den Herkunftssprachen zu ermöglichen und anzuregen. Eine zentrale Rolle kommt daneben einer intensiven Zusammenarbeit mit den Eltern zu. Nach wie vor ist eine positive und wertschätzende Integration von Mehrsprachigkeit in Kitas überwiegend jedoch nicht gegeben (Panagiotopoulou 2016; Jahreiß et al. 2017). Insofern besteht eine Diskrepanz zwischen der fachlichen Anforderung einer Integration von Mehrsprachigkeit in Kitas und der beobachteten Praxis. Die Schaffung mehrsprachiger Lernumgebungen ist daher Gegenstand der Professionalisierung pädagogischer Fachkräfte in Kitas, sowohl in der Ausbildung als auch in der Fort- und Weiterbildung. Der hier zugrunde gelegte Professionalisierungsansatz impliziert hierzu den Erwerb von Wissen über Mehrsprachigkeit und die Reflexion von Einstellungen gegenüber Mehrsprachigkeit sowie die Erprobung von Handlungsstrategien und deren Reflexion.

3 Fragestellung und Hypothesen

Insgesamt betrachtet sind nach der aktuellen Literaturlage bei der Beurteilung von Weiterbildungsmaßnahmen sowohl die Dispositionen als auch die Performanz der Fachkräfte in den Blick zu nehmen. Wissen und Einstellungen der Fachkräfte als Kriteriumsvariablen heranzuziehen greift dabei zu kurz. Vielmehr wird die Notwendigkeit einer Verknüpfung mit der eigenen Praxis gesehen. Hierbei geht es zum einen um den Transfer des Wissens in die systematische Planung, zum anderen aber auch um die Umsetzung in die Praxis und deren Reflexion. Dazu werden Modellierungs- aber auch Feedback-Strategien diskutiert. Dies steht im Einklang mit dem Professionalisierungsmodell nach Fröhlich-Gildhoff et al. (2014), das Dispositionen der Fachkräfte als Grundlage für die Handlungsplanung und das darauf folgende Handeln betrachtet. Anliegen dieses Beitrags ist es daher zum einen die Effektivität einer an diesem Modell ausgerichteten Professionalisierungsmaßnahme und zum anderen die postulierten Wirkmechanismen zu prüfen. Am Beispiel der Berücksichtigung von sprachlicher Vielfalt in Kitas wird gefragt, ob Einstellungen zum pädagogischen Umgang mit sprachlicher Vielfalt im Laufe einer Weiterbildungsmaßnahme in einer Beziehung zum Wissenserwerb und zu einer Veränderung der pädagogischen Performanz der Fachkräfte stehen.

Nach aktuellem Forschungsstand sind Weiterbildungsmaßnahmen dann effektiv, wenn sie ein feststehendes Curriculum aufweisen und über einen längeren Zeitraum an einem festen Standort durchgeführt werden. Weiter wird die Bedeutung der Begleitung bei der Umsetzung hervorgehoben, die in Form von Modellierungs- und Feedbackstrategien oder in Form von Handlungsanweisungen erfolgen kann. Entsprechend sollte eine an Dispositionen und Performanz ausgerichtete strukturierte In-House-Weiterbildung mit dem Fokus auf der Schaffung mehrsprachigkeitsunterstützender Lernumgebungen im zeitlichen Verlauf zu einer erhöhten Berücksichtigung der sprachlichen Vielfalt im pädagogischen Alltag führen (Hypothese 1).

Für die Erklärung möglicher Wirkungszusammenhänge werden in der Literatur widersprüchliche Ergebnisse berichtet. Übereinstimmend finden sich Zusammenhänge zwischen Wissen und Einstellungen der Fachkräfte mit deren Handeln in der Praxis. Zur Veränderbarkeit von Wissen und Einstellungen durch Weiterbildungsmaßnahmen zeigen sich differierende Ergebnisse, die möglicherweise auf unterschiedliches Vorgehen in der Weiterbildung zurückzuführen sind. Das hier zugrunde gelegte theoretische Modell beschreibt Einstellungen als im Hintergrund wirksame Größe und postuliert damit einen direkten Effekt der Einstellungen auf das Wissen der Fachkräfte zum einen und die Performanz der Fachkräfte zum anderen. Positivere Einstellungen zur Mehrsprachigkeit sollten demnach die Wissenserweiterung der Fachkräfte zur Mehrsprachigkeit sowie die Veränderung in eine mehrsprachigkeitsintegrierende Lernumgebung begünstigen (Hypothese 2).

4 Methode

4.1 Stichprobe

Datengrundlage bilden 199 Fachkräfte aus 19 Kitas mit insgesamt 54 Gruppen für Kinder im Alter von drei bis sechs Jahren mit einem Anteil von mindestens 50 % mehrsprachig aufwachsenden Kindern. Aufgrund hoher Personalfluktuationen waren zu den 151 Fachkräften zu Beginn der Studie bis zum Messzeitpunkt 2018 weitere 48 Personen neu in die Stichprobe aufgenommen worden. Die Kitas wurden per Zufall einer Interventions- (IG, 10 Kitas) oder Kontrollgruppe (KG, 9 Kitas) zugewiesen (vgl. ausführlich Frank et al. 2016). Auf Gruppenebene liegen zum Messzeitpunkt 2015 Angaben aus 54 Gruppen (28 in IG 1 und 26 in IG 2), zum Messzeitpunkt 2018 aus 45 Gruppen (24 in IG 1 und 21 in IG 2) vor. Auf Ebene der Fachkräfte stammen 85 Personen aus der IG und 66 Personen aus der KG zum Messzeitpunkt 2015 sowie 71 Personen aus der IG und 46 Personen aus der KG zum Messzeitpunkt 2018.

Die Fachkräfte wurden eigenen Angaben zufolge zum größten Teil an Fachschulen/Fachakademien ausgebildet (55 % bzw. 61 % in der IG und 58 % bzw. 70 % in der KG, siehe Tab. 1). Weitere 20–27 % der Personen gaben als höchsten beruflichen Bildungsabschluss eine Berufsbezeichnung an, die von Berufsschulen vergeben wird (KinderpflegerIn, FamilienpflegerIn oder AssistentIn im Sozialwesen). Wenige Fachkräfte gaben an, eine Ausbildung an einer Fachhochschule, pädagogischen Hochschule oder Universität abgeschlossen zu haben (6 % zum Messzeitpunkt 2015 und 11 % zum Messzeitpunkt 2018 in der IG sowie 2 % in der KG zum Messzeitpunkt 2018). Eine Person (IG zum Messzeitpunkt 2018) gab an, einen anderen sozialen Bildungsabschluss zu haben. Die übrigen Fachkräfte machten keine Angaben zu ihrem höchsten beruflichen Abschluss (12 % bzw. 1 % in der IG sowie 23 % bzw. 7 % in der KG). Die meisten Fachkräfte (rund 60–70 %, siehe Tab. 1) gaben Deutsch als Muttersprache an. Der Anteil von Fachkräften mit einer anderen Muttersprache als Deutsch oder mehreren Muttersprachen liegt zwischen 6 und 17 % (siehe Tab. 1 für weitere Details). Tab. 2 zeigt darüber hinaus die Verteilung des Alters laut Angaben des befragten pädagogischen Personals. Hierbei ist festzuhalten, dass sich das Alter der Fachkräfte für die beiden Gruppen zu beiden Messzeitpunkten leicht (um rund vier Jahre zum Messzeitpunkt 2015, d = 0,3) bis moderat (um rund sechs Jahre zum Messzeitpunkt 2018, d = 0,45) unterscheidet. Trotz punktueller Unterschiede zwischen den Interventionsgruppen (etwa der höhere Anteil von an Hochschulen ausgebildeten Fachkräften zum Messzeitpunkt 2018 in der IG oder der höhere Anteil von fehlenden Angaben in der KG zum Messzeitpunkt 2015) lassen sich diese als relativ ähnlich hinsichtlich der dargestellten demografischen Merkmale beurteilen.

Tab. 1 Deskriptive Statistiken für die Muttersprachen und die höchsten beruflichen Abschlüsse der Fachkräfte
Tab. 2 Deskriptive Statistiken für das Alter der Fachkräfte

4.2 Intervention

Die Intervention wurde im Rahmen des vom Bundesministerium für Bildung und Forschung geförderten Projekts „Effekte einer aktiven Integration von Mehrsprachigkeit“ durchgeführt. Die Interventions- und Kontrollgruppe erhielten eine Weiterbildung im Umfang von jeweils 84 h, die durch erfahrene externe Referentinnen und Referenten mit Hochschulabschluss sowie Kenntnissen in der Pädagogik der frühen Kindheit, insbesondere zu mehrsprachiger Bildung in Kitas, durchgeführt wurden. Insgesamt vier Referentinnen und Referenten führten die Weiterbildung in den Kitas der IG und drei Referentinnen und Referenten in den Kitas der KG durch. Im ersten Kita-Jahr 2015/16 wurden in beiden Gruppen vier In-House-Weiterbildungen und vier weitere prozessbegleitende Termine umgesetzt. Im zweiten Kita-Jahr 2016/17 wurden nochmals zwei In-House-Weiterbildungen und zwei weitere prozessbegleitende Termine durchgeführt. Im dritte Kita-Jahr 2017/18 standen ein Feedback an die Einrichtung sowie der Transfer in die Praxis im Mittelpunkt.

Die Intervention zielte auf die Schaffung einer mehrsprachigkeitsunterstützenden Lernumgebung, die sich in erster Linie in einem positiven, wertschätzenden Umgang mit den Sprachen der Kinder zeigen soll. Sichtbar soll dies in der Raumgestaltung, dem verwendeten Arbeitsmaterial, den alltäglichen in der Einrichtung ablaufenden Interaktionen sowie der Kooperation mit Eltern werden. Die IG erhielt eine strukturierte dreijährige In-House-Weiterqualifizierungsmaßnahme zur Integration von Mehrsprachigkeit. Die theoretische und fachliche Grundlage für die Intervention liefert das von der „Weiterbildungsinitiative Frühpädagogische Fachkräfte“ (WiFF) erarbeitete Kompetenzprofil „Sprachliche Bildung unter Bedingungen von Mehrsprachigkeit gestalten“ (DJI 2013, S. 142 f). Die darin beschriebenen Handlungsanforderungen für eine kompetenzorientierte Weiterbildung wurden in vier Module gegliedert:

  1. 1.

    Sprachliche Entwicklung von mehrsprachigen Kindern verstehen;

  2. 2.

    Kooperation mit Eltern von mehrsprachigen Kindern;

  3. 3.

    Sprachsensiblen Umgang mit mehrsprachigen Kindern gestalten;

  4. 4.

    Unterstützung der kindlichen Mehrsprachigkeit im Kita-Alltag.

Die Module 2 und 4 wurden im zweiten Jahr der Intervention in zwei weiteren Modulen vertieft. Beinhaltet war zusätzlich ein Eltern-Workshop (Buschmann 2016), welcher in Kooperation mit einer Referentin vom Zentrum für Entwicklung und Lernen (ZEL) in Heidelberg in den Einrichtungen realisiert wurde. Die didaktische Konzeption der Weiterbildung ist in einem Weiterbildungsmanual für die Referentinnen und Referenten verschriftlicht. Sie beinhaltet sowohl Methoden des Wissenstransfers und der Reflexion von Einstellungen als auch konkrete Umsetzungsmöglichkeiten in die Praxis (eine ausführlichere Beschreibung findet sich bei Jahreiß 2018, S. 99 ff.). Die Referentinnen und Referenten der IG wurden zentral in die Module eingewiesen und im Laufe der Weiterbildungsmaßnahmen betreut. Weiterhin erhielt die IG im dritten Studien-Jahr eine zweckgebundene finanzielle Zuwendung in Höhe von 300,– € für die Anschaffung von mehrsprachigem Material.

Die Referentinnen und Referenten der KG arbeiteten mit dem aus der Qualitäts- und Organisationsentwicklung bekannten Plan-Do-Check-Act-Zyklus (Deming 1986). Hier wurden mit den Referentinnen und Referenten unterschiedliche Inhalte aufgegriffen und umgesetzt. Hierzu gehörte die Weiterentwicklung der Bildungs- und Erziehungspartnerschaft mit den Eltern, die Reflexion der pädagogischen Haltungen im Umgang mit zugewanderten Eltern, die Beobachtung und Dokumentation von Bildungsprozessen u. a. m. Aufgrund des nicht vorgegebenen Weiterbildungskonzeptes in der KG wurden sehr vielfältige Themen bearbeitet. Somit ist davon auszugehen, dass die zweite vergleichende Gruppe als Kontrollgruppe in Bezug auf die Schaffung mehrsprachigkeitsunterstützender Lernumgebungen gelten kann.

4.3 Untersuchungsvariablen

Auf Basis des theoretischen Modells werden Einstellungen zur Mehrsprachigkeit als Hintergrundkomponente, das Wissen über die kindliche Mehrsprachigkeit als ein Aspekt der Disposition und der Einbezug der Mehrsprachigkeit in den Kitaalltag entsprechend der Erläuterungen zur Professionalität in Bezug auf mehrsprachige Bildung in Kitas (Abschn. 2.3) als Performanz verstanden.

4.3.1 Einstellungen

Die Einstellungen der pädagogischen Fachkräfte zur Mehrsprachigkeit in Kitas wurden in einer modifizierten Form der von Reich (2007) entwickelten Skala erfasst (Kratzmann et al. 2017b). Die Fachkräfte konnten den darin formulierten Aussagen auf einer 5‑stufigen Likert-Skala völlig, im großen Ganzen, zum Teil, wenig oder gar nicht zustimmen. Die modifizierte Version besteht aus drei Einstellungsdimensionen, die mit multilingual-pädagogische, assimilatorische und kompensatorische Einstellung bezeichnet werden. Für die vorliegende Analyse wurden die Mittelwerte der Items zur multilingual-pädagogischen und assimilatorischen Einstellung herangezogen, da sie die Stärkenorientierung einerseits und die Defizitorientierung andererseits im Hinblick auf kindliche Mehrsprachigkeit wiedergeben. Die Subskala multilingual-pädagogische Einstellung (Cronbach α = 0,49 bzw. α = 0,64; Tab. 3) repräsentiert die Auffassung der Fachkräfte, Zweisprachigkeit als besondere Kompetenz, von der auch einsprachig deutsche Kinder profitieren, als positiv bzw. als Normalfall, anzusehen (Beispielitem: „Die Zweisprachigkeit der zweisprachigen Kinder sollte als eine besondere Kompetenz anerkannt werden.“). Die Subskala assimilatorische Einstellung (Cronbach α = 0,22 bzw. α = 0,43; Tab. 3) repräsentiert, inwieweit die Fachkräfte für eine Anpassung der mehrsprachig aufwachsenden Kinder an die deutsche Sprache plädieren (Beispielitem: „Auf lange Sicht sollte die Zweisprachigkeit zu Gunsten der Kommunikation in der gemeinsamen Sprache Deutsch überwunden werden.“). Da das Cronbach α eine perfekte lineare Abhängigkeit der wahren Werte der Konstruktvariablen voraussetzt (τ-Äquivalenz) und bei nicht-perfekter linearer Abhängigkeit (τ-Kongenerität) zu deutlichen Unterschätzungen der Reliabilität führt (z. B. Sijtsma 2009; oder Eid et al. 2017), werden die niedrigen Werte für die Subskalen akzeptiert. Zudem erreichte eine konfirmatorische Fakorenanalyse mit kategorialen Merkmalen sehr gute Modellgütewerte für die hier verwendeten Einstellungsskalen (Kratzmann et al. 2017b).

Tab. 3 Deskriptive Statistiken für die Einstellungen und das Wissen über die Mehrsprachigkeit der Fachkräfte

4.3.2 Wissen

Zur Erhebung des Wissens über Mehrsprachigkeit erhielten die pädagogischen Fachkräfte Wissensfragen zur Sprachentwicklung und zum fachdidaktischen Wissen in Bezug auf den Umgang mit mehrsprachigen Kindern. Hierin sind Aussagen formuliert, die die Fachkräfte auf ihre Korrektheit hin einschätzen mussten. Die Aussagen sind aus dem derzeit in der Wissenschaft allgemein akzeptierten Stand des Wissens in Bezug auf Mehrsprachigkeit und Umgang mit Mehrsprachigkeit formuliert und werden in Verfahren mit ähnlicher Zielstellung ähnlich verwendet. Enthalten sind zwölf Aussagen zur sprachlich-kognitiven Entwicklung mehrsprachiger Kinder (Beispielaussage: „Wenn mehrsprachige Kinder beim Sprechen die verschiedenen Sprachen mischen, ist das völlig normal.“). Weiter enthält das Screening sechs fachdidaktische Aussagen zum Erwerb der Struktur der deutschen Sprache, aus denen die zwei richtigen Aussagen ausgewählt werden müssen (Beispielaussage: „Es [das sprachliche Angebot, d. Verf.] sollte viele unterschiedliche Satzstrukturen enthalten.“). Es wird ein Summenwert korrekter Antworten aus allen Fragen gebildet, der als Indikator für das Wissen der Fachkräfte in die Analyse eingeht. Im Wissensscreening können maximal 14 Punkte erreicht werden. Da es sich bei der Wissensabfrage um eine kriteriums- bzw. lehrzielorientierte und damit theoretisch (ko-)varianzeingeschränkte bzw. (ko-)varianzleere Skala handelt, sind die üblichen testtheoretischen Ansätze nur sehr eingeschränkt zur Quantifizierung von Reliabilität und Validität geeignet (Hambleton et al. 1978; Klauer 1987). Das für kriteriums- bzw. lehrzielorientierte Skalen entscheidende Kriterium der Inhaltsvalidität ist als erfüllt zu betrachten, da die abgefragten Inhalte in der Weiterbildung explizit behandelt wurden (Klauer 1987).

4.3.3 Performanz

Die Performanz zur Integration der sprachlichen Vielfalt in den Einrichtungen wurde auf drei Ebenen erfasst: die Berücksichtigung von Sprachenvielfalt in den Materialien der Gruppe, die mehrsprachigen Peer-Interaktionen und die Sichtbarkeit der sprachlichen Vielfalt in der Raumgestaltung. Erfasst wurde dies durch geschulte Beobachterinnen und Beobachter.

Die Sprachenvielfalt in den Materialien der Gruppe wurde durch das Zählen der vor Ort vorhandenen mehrsprachigen Materialien insgesamt erfasst. Für die Analysen wird die Gesamtzahl der vorhandenen anders- und mehrsprachigen Medien (Bücher in anderen Sprachen, mehrsprachige Bücher und mehrsprachige auditive Medien) in den Gruppen der Kita verwendet. In Einrichtungen, die Funktionsräume, wie z. B. ein Lesezimmer haben, werden die für alle Kinder der Kita zugänglichen mehrsprachigen Medien jeder Gruppe zugeordnet und damit mehrfach gezählt.

Zur Erfassung der mehrsprachigen Peer-Interaktionen wurde der Language Interaction Snapshot (LISn, Atkins-Burnett et al. 2011) eingesetzt. Die Interraterreliabilität des Verfahrens wird mit 89 % Übereinstimmung in Feldstudien angegeben (Halle et al. 2010). Beobachtet werden mit diesem Verfahren die Interaktionspartner und die jeweils gewählte Sprache des Zielkindes in einem festgelegten Zeitraum. Per Zufallsverfahren wurden pro Einrichtung zwei mehrsprachig aufwachsende Kinder in zwei unterschiedlichen Gruppen für diese Beobachtungen ausgewählt. Der Snapshot wird zu fünf definierten Zeitpunkten am Vormittag in jeweils fünfminütigen Sequenzen eingesetzt. Die Sequenzen setzen sich zusammen aus 20 s Beobachtung und 10 s Einschätzung der Interaktionspartner (Gruppenleitung, Zweitkraft, anderes Kind) und der dominanten gewählten Sprache (Deutsch, andere, mehrere) des beobachteten Kindes in der Situation. Dieses Vorgehen wird immer wiederholt, so dass schließlich 10 Einschätzungen pro Sequenz vorliegen, was zu einer Gesamtzahl von 50 Einschätzungen pro Kind führt. Der Language Interaction Snapshot gibt damit Auskunft über die Sprache, die Kinder in der alltäglichen Kommunikation mit verschiedenen Interaktionspartnern verwenden. Für die Analysen wird ein Wert gebildet, der den Anteil nicht-deutschsprachiger Kommunikation an den gesamten sprachlichen Interaktionen des beobachteten Kindes mit einem Peer abbildet.

Die Sichtbarkeit der sprachlichen Vielfalt in der Raumgestaltung wurde mit fünf Items erfasst (Jahreiß et al. 2017). Beurteilt wird die Sichtbarkeit der sprachlichen Vielfalt im Eingangsbereich der Einrichtung, in der gesamten Einrichtung sowie bei schriftlichen Mitteilungen, Informationstafeln und Informationen für Eltern jeweils auf einer vierstufigen Antwortskala von „wird gar nicht berücksichtigt“ bis „wird überall berücksichtigt“. Eine Überprüfung der Interraterreliabilität ergab eine Übereinstimmung von 80 %. Anhand des Ratingverfahrens zur Erfassung der Sprachenvielfalt in Kitas (REVK) auf Einrichtungsebene wird durch Berechnung des Mittelwertes der fünf Items (Cronbach α = 0,66) ein Indikator zur Sichtbarkeit von Mehrsprachigkeit berechnet.

Zur Prüfung der Validität der drei Performanzindikatoren wird das Item „Teachers promote the maintenance and development of children’s native language“ des Supports for Early Literacy Assessment (SELA) (vgl. Smith et al. 2001) eingesetzt. In einer 5‑stufigen Likert-Skala wird damit unabhängig von den anderen Ratings von einer zweiten Person der Einbezug von Mehrsprachigkeit auf der Ebene einer Fachkraft erfasst. Weiterhin wird eine Selbstauskunft aus der Erhebung im Jahr 2018 herangezogen. Die Fachkräfte sollten hierfür auf einer 4‑stufigen Likert-Skalierung einschätzen, inwieweit sie zweisprachige Bilderbücher und Elterninformationen verwenden und inwieweit Schriftzeichen verschiedener Sprachen bei ihnen sichtbar sind. Die Selbsteinschätzungen dieser drei Aspekte wurden durch Mittelwertbildung zu einem Indikator zusammengefasst (Cronbach α = 0,62). In Tab. 4 sind Korrelationen der Performanzindikatoren mit den Validitätsmaßen dargestellt. Die Korrelationen der Indikatoren mit den Validitätsmaßen liegen erwartungsgemäß positiv im moderaten bis hohen Bereich (Materialien: r zwischen 0,28 und 0,54; Sichtbarkeit: r zwischen 0,30 bis 0,68; Peer-Interaktionen: r zwischen 0,20 und 0,32).

Tab. 4 Validität der Performanzindikatoren (Produkt-Moment-Korrelationen)

4.4 Auswertungsverfahren

Die oben beschriebenen Untersuchungsvariablen wurden bzw. werden insgesamt zu sechs Messzeitpunkten jeweils im Frühjahr 2015 bis 2020 erfasst. Aus Gründen der höheren Übersichtlichkeit werden die bisher vorliegenden Daten aus den beiden Jahren 2015 (erster Messzeitpunkt) und 2018 (aktuellster Messzeitpunkt, für den die Daten bereits vorliegen) für die Analysen herangezogen.

Im ersten Schritt wird geprüft, ob durch die Interventionsmaßnahme ein Effekt auf die Lernumgebungen der Kinder erzielt wurde. Anhand von t-Tests zu jedem Messzeitpunkt wird jeweils auf Gruppenebene geprüft, ob ein signifikanter Unterschied bei dem Gesamtindikator für den Grad der Berücksichtigung der sprachlichen Vielfalt in der Kitagruppe zwischen Interventions- und Kontrollgruppe auftritt (H1). Zusätzlich werden unstandardisierte und standardisierte Effekte in Form von Mittelwertdifferenzen sowie Mediandifferenzen für alle untersuchten Variablen (Einstellungen, Wissen, Anzahl mehrsprachiger Materialien in der Gruppe, Sichtbarkeit der Mehrsprachigkeit in der Kita und den Anteil mehrsprachiger Interaktionen) zwischen der IG und der KG berichtet. Darüber hinaus wird das Odds Ratio für zwei der drei Performanzvariablen (Anzahl mehrsprachiger Materialien in der Gruppe und Anteil mehrsprachiger Interaktionen) angegeben.

Im zweiten Schritt werden zur Prüfung der Hypothese 2 Strukturgleichungsmodelle berechnet, die die Zusammenhänge zwischen den Merkmalen über die Zeit prüfen. Die drei beobachteten Performanzmerkmale werden hierzu jeweils zunächst z‑standardisiert und anschließend durch Mittelwertbildung zu einem Gesamtindikator zusammengefasst, der den Grad der Berücksichtigung der sprachlichen Vielfalt in der Kitagruppe angibt (für Zusammenhänge zu Validitätsmaßen siehe Tab. 4). Als Vergleichsmodell wird ein Modell gerechnet, in dem Korrelationen zwischen Wissen, Einstellungen und Performanz zum Messzeitpunkt 2015 sowie Korrelationen der Fehlervariablen zum Messzeitpunkt 2018 berücksichtigt werden, jedoch keine Querverbindungen von Wissen, Einstellungen und Performanz über die Zeit. Es wird lediglich ein Effekt der Intervention auf Wissen und Performanz zum Messzeitpunkt 2018, entsprechend der Hypothese 1, berechnet (H1-Modell). Diesem Modell wird ein Modell gegenübergestellt, in dem Einstellungen als im Hintergrund wirksame Merkmale betrachtet und entsprechend Einflüsse der Einstellungen aus dem Messzeitpunkt 2015 auf das Wissen und die Performanz zum Messzeitpunkt 2018 modelliert werden (H2-Modell).

Als Kriterien für die Beurteilung der Modelle wird auf den χ2-Test zurückgegriffen, der die Hypothese testet, dass das Modell von der Datenstruktur abweicht. Ist dieser Test signifikant, wird die Hypothese angenommen und das Modell entsprechend als unzureichend bewertet. Allerdings ist dieser Test abhängig von der Stichprobengröße. Daher werden weitere Maße zur Bestimmung der Güte der Modellanpassung verwendet, die von der Stichprobengröße unabhängig sind. Dies sind der Comparative Fit Index (CFI), der die Passung des Modells an die Daten mit der eines unkorrelierten Modells vergleicht und der Root Mean Square Error of Approximation (RMSEA), der die Passungsungenauigkeit (oder den Approximationsfehler) des Modells zu den Daten angibt. Gute Modelle erreichen einen CFI Wert >0,95 und einen RMSEA <0,05 (Geiser 2010, S. 60 ff.). Um möglichst viele Informationen der vorliegenden Daten zu nutzen werden die Parameter in den Analysen anhand des Full-Information-Maximum-Likelihood- (FIML-)Schätzverfahren (vgl. Enders 2010) geschätzt.

5 Ergebnisse

5.1 Effekte der Fortbildung

Beim querschnittlichen Vergleich der Einstellungs‑, Dispositions- und Performanzvariablen für jeden der zwei Messzeitpunkte lassen sich unterschiedliche Effekte der Intervention beobachten. Für die multilingual-pädagogischen Einstellungen (siehe Tab. 3 für Mittelwerte, Standardabweichungen und Mittelwertdifferenzen und Abb. 1 für Verteilungen, Mediane und Quantile) zeigen sich kleine Effekte zugunsten der IG zu beiden Messzeitpunkten. Hier betragen die standardisierten Mittelwertdifferenzen d = 0,12 (M = 4,17; SD = 0,54 für die IG und M = 4,10; SD = 0,55 für die KG) für den Messzeitpunkt in 2015 und d = 0,31 (M = 4,21; SD = 0,48 für die IG und M = 4,05; SD = 0,59 für die KG) für den Messzeitpunkt in 2018. Die Einstellungen zum Messzeitpunkt 2015 wurden vor den ersten Weiterbildungsmaßnahmen erhoben, so dass die höheren Ausprägungen in der IG nicht im Sinne der Interventionswirkung interpretiert werden können. Der größere Effekt in die gleiche Richtung zum Messzeitpunkt in 2018 ist zwar eher geringFootnote 1, jedoch im Sinne der Interventionswirkung interpretierbar. Medianvergleiche zeigen lediglich für den Messzeitpunkt in 2018 einen geringfügigen Vorteil für die IG an (Md = 4,20 für IG sowie Md = 4,10 für KG). Im Sinne diskriminanter Validität zeigen sich demgegenüber praktisch keine Effekte der Intervention auf assimilatorische Einstellungen (siehe Tab. 3 und Abb. 1). Hier betragen die standardisierten Mittelwertdifferenzen d = 0,04 (M = 3,41; SD = 0,84 für die IG und M = 3,38; SD = 0,85 für die KG) für den Messzeitpunkt in 2015 und d = 0,01 (M = 3,29; SD = 0,80 für die IG und M = 3,28; SD = 0,67 für die KG) für den Messzeitpunkt in 2018. Auch die Mediandifferenzen bestätigen das Bild (Md = 3,33 sowohl für IG als auch KG zum Messzeitpunkt in 2018). Da die Interventionsmaßnahme Elemente enthielt, die eine größere inhaltliche Nähe zu multilingual-pädagogischen Einstellungen aufwiesen als zu den assimilatorischen Einstellungen, sind gleich hohe oder aber niedrigere assimilatorische Einstellungen für die IG zu erwarten. Die querschnittlichen Analysen der beiden Einstellungsmaße zeigen daher insgesamt erwartungskonforme Ergebnisse, wenn auch mit recht geringen Effekten. Bei der Interpretation der Differenzen für beide Einstellungsmaße muss allerdings die eingeschränkte interne Konsistenz der Skalen berücksichtigt werden. Auch wenn Messfehler mit größerer Wahrscheinlichkeit zu einer Unterschätzung des tatsächlichen ZusammenhangsFootnote 2 führen (bekannt unter dem Begriff attenuation, Herleitung bei Spearman 1904), ist nicht auszuschließen, dass Untersuchungen mit anderen Einstellungsmaßen zu abweichenden, ggf. kleineren Effektschätzungen führen würden. Die hier berichteten Mittelwertdifferenzen dienen somit als erste Abschätzungen von spezifisch mehrsprachigkeitsorientierten Interventionseffekten auf spezifisch mehrsprachigkeitsbezogene Einstellungen.

Abb. 1
figure 1

Verteilung der Einstellungen, der Dispositions- sowie Performanzvariablen nach den Untersuchungsgruppen und Messzeitpunkten anhand von Tukey-Boxplots (Die Tukey-Boxplots haben die folgenden Bestandteile: der dicke horizontale Strich repräsentiert den Median, das untere Ende des Kastens zeigt das 25 %-Quantil, das obere Ende des Kastens das 75 %-Quantil an, die Punkte außerhalb des vertikalen Strichs stellen Ausreißer dar. Werte einzelner Kindertagesstätten sind durch Punkte repräsentiert. Die Stichprobengrößen sind Tab. 3 und 5 zu entnehmen)

Für das Ausmaß des Wissens über Mehrsprachigkeit als Dispositionsvariable lässt sich ein recht deutlicher Trend zugunsten der IG erkennen (siehe Tab. 3 und Abb. 1). Die standardisierten Mittelwertunterschiede steigen vom Messzeitpunkt 2015 bis zum Messzeitpunkt 2018 von einem Effekt nahe null (d = 0,05, mit M = 8,25; SD = 2,31 für die IG und M = 8,14; SD = 2,52 für die KG) auf einen Effekt mittlerer Größe zugunsten der IG an (d = 0,53; mit M = 8,75; SD = 2,46 für die IG und M = 7,45; SD = 2,44 für die KG). Die Struktur der Unterschiede findet sich ebenso in den Mediandifferenzen wieder (0 Wissenspunkte für den Messzeitpunkt 2015 und 1,5 Punkte für den Messzeitpunkt 2018) und lässt sich damit als robust einschätzen. Auch dieses Ergebnis entspricht den Erwartungen.

Tab. 5 Deskriptive Statistiken für die Performanzindikatoren

Der Vergleich der Performanzvariablen ergibt ein eher heterogenes Bild der Verteilungen für die beiden Interventionsgruppen in den beiden Messzeitpunkten (Tab. 5 und Abb. 1). Zwar zeigt der Vergleich der Mittelwerte einen Anstieg der anders- und mehrsprachigen Materialien in den Kita-Gruppen der IG im Vergleich zur KG zum Messzeitpunkt 2018 gegenüber dem Messzeitpunkt 2015 (für 2015 d = −0,15 und für 2018 d = 0,32; siehe Tab. 5 für Mittelwerte und Standardabweichungen sowie Abb. 1 für Mediane), jedoch ist an der Abb. 1d erkennbar, dass die Verteilung der Datenpunkte sehr schief ist und damit eine Aussage über einen Trend der Interventionsgruppenunterschiede anhand mittelwertbasierter Analyseverfahren nur in eingeschränktem Sinne möglich ist. Da die Materialien zu beiden Zeitpunkten deutlich linkssteile Verteilungen aufweisen und daher kleine Unterschiede durch Vergleiche der üblichen Maße zentraler Tendenz möglicherweise nicht aufgedeckt werden, wird zusätzlich das Odds-Ratio berichtet.

$$OR=\frac{\frac{n_{{\geq 1_{IG}}}}{n_{{=0_{IG}}}}}{\frac{n_{{\geq 1_{KG}}}}{n_{={0_{KG}}}}}$$

Das Verhältnis des Verhältnisses von Gruppen mit mehrsprachigen Materialien (mindestens ein Materialstück) zu Gruppen, in denen keine mehrsprachigen Materialien beobachtet wurden in der IG zu dem in der KG beträgt OR = 0,40 für den Messzeitpunkt 2015 und OR = 2,67 für den Messzeitpunkt 2018.

Das Verhältnis von Gruppen mit und ohne mehrsprachige Materialien fällt damit zum Messzeitpunkt 2015 zuungunsten und zum Messzeitpunkt 2018 sehr deutlich zugunsten der IG aus. Analysen der OR zu den Messzeitpunkten in 2016 (OR = 0,52) und 2017 (OR = 0,70) zeigen einen sprunghaften Anstieg des Anteils der Kita-Gruppen mit mindestens einem mehrsprachigen Artefakt im Gruppenraum in der IG gegenüber der KG im Messzeitpunkt 2018 an. Dieser Anstieg kann auch als Folge der finanziellen Zuwendung im Rahmen der Intervention im Jahr 2017 interpretiert werden.

Ein deutlicheres Bild ergibt sich für die Sichtbarkeit der Mehrsprachigkeit in den Kitas. Vom Messzeitpunkt 2015 bis zum Messzeitpunkt 2018 steigt der Unterschied in der Sichtbarkeit zugunsten der IG recht klar an, wie sowohl an der standardisierten Mittelwertdifferenz zum Messzeitpunkt 2018 (Tab. 5) mit einem großen Effekt von d = 0,95 (M = 1,67; SD = 0,58 für die IG und M = 1,25; SD = 0,18 für die KG) als auch an den Mediandifferenzen (−0,6 Skalenpunkte zuungunsten der IG für den Messzeitpunkt 2015 und 0,2 Skalenpunkte zugunsten der IG für den Messzeitpunkt 2018) erkennbar ist (siehe Abb. 1). Da die finanzielle Zuwendung als Teil der Intervention ausschließlich an mehrsprachige Artefakte gebunden war (Bücher, audio-/visuelle Medien usw.), ist der große Effekt zugunsten der Intervention in diesem Performanzindikator nicht auf finanzielle Anreize zurückzuführen. Aus diesen Ergebnissen könnte ggf. geschlussfolgert werden, dass durch die Intervention herbeigeführte Veränderungen in der Berücksichtigung von Mehrsprachigkeit lediglich aufgrund fehlender finanzieller Ressourcen nicht sichtbar werden.

Für den Anteil anders- und mehrsprachiger Interaktionen zwischen Kindern lassen sich kaum Unterschiede erkennen. Hier sind die Mittelwertdifferenzen zu beiden Messzeitpunkten sehr gering (siehe Tab. 5) mit d = −0,11 (M = 0,14; SD = 0,29 für die IG und M = 0,18; SD = 0,35 für die KG) zum Messzeitpunkt in 2015 und d = −0,03 (M = 0,02; SD = 0,05 für die IG und M = 0,05; SD = 0,12 für die KG) zum Messzeitpunkt in 2018. Die Mediandifferenzen betragen zu beiden Messzeitpunkten (sowie für die Messzeitpunkte in 2016 und 2017) genau 0 (siehe Abb. 1). Da auch dieser Performanzindikator in allen Erhebungen einen sehr hohen Anteil von Nullwerten an den Gesamtwerten aufweist, wurde hier ebenfalls das OR zusätzlich bestimmt. Die Analyse der OR zeigt ein erwartungskonträres Bild. Das OR zeigt zum Messzeitpunkt 2015 ein relativ gleiches Verhältnis von Kindern, die sich während der Beobachtung mindestens einmal mehrsprachig geäußert haben zu denen, die sich nicht mehrsprachig geäußert haben für die IG gegenüber der KG an (OR = 1,03). Zum Messzeitpunkt 2018 sinkt das Verhältnis zwischen der Interventions- und der Kontrollgruppe auf OR = 0,68 und zeigt damit ein niedrigeres Verhältnis von getätigten vs. nicht-getätigten mehrsprachigen Äußerungen für Kinder in der IG verglichen zu der KG.

Recht deutlich zeigt sich ein einheitlicher Trend bei der Betrachtung des Gesamtindikators, der aus den drei z‑standardisierten Merkmalen zur Berücksichtigung der sprachlichen Vielfalt in den Einrichtungen gebildet wurde (Tab. 6). Während bei der Ausgangserhebung im Jahr 2015 noch ein Vorteil zugunsten der KG besteht (d = −0,30), verändert sich dieser in einen Unterschied zugunsten der IG im Jahr 2018. Der Unterschied erreicht eine Effektstärke von d = 0,75.

Tab. 6 Unterschiede in der Berücksichtigung sprachlicher Vielfalt zwischen den Interventionsgruppen (Mittelwert der z‑standardisierten Performanzvariablen Materialen, Sichtbarkeit und Peer-Interaktionen als Gesamtindikator)

5.2 Wirkungszusammenhänge

Bezüglich der Wirkungszusammenhänge zwischen Wissen, Einstellungen und Performanz wurde eine Hypothese formuliert, die anhand von Strukturgleichungsmodellen geprüft wird. Da sich das Alter der Fachkräfte zwischen Interventions- und Kontrollgruppe systematisch unterscheidet, wird das Alter in den Modellen berücksichtigt, um Verzerrungen auszuschließen.

Im H1-Modell (Abb. 2) werden Einstellungen, Wissen und Performanz im Jahr 2018 in Verbindung zum Messzeitpunkt im Jahr 2015 gebracht. Querverbindungen zwischen den Merkmalen werden ausgeschlossen. Weiter wird eine Wirkung der Intervention auf Wissen und Performanz geprüft. Die Modellgütemaße (χ2 (Zielmodell) = 26,68 (df = 14) mit p = 0,02; χ2 (Baselinemodell) = 164,28 (df = 34) mit p < 0,001; RMSEA = 0,07; CFI = 0,91) dienen als Referenzwert zur Prüfung der Hypothese 2. Es zeigt sich, dass das Modell zu den Daten passt, jedoch sind die Modellgütewerte grenzwertig. Der hohe χ2-Wert für das Baslinemodell ist hochsignifikant, weshalb die Annahme einer Unabhängigkeit der Variablen nicht haltbar ist. Der χ2-Wert für das Zielmodell ist deutlich niedriger, aber dennoch signifikant. Die Werte des RMSEA und CFI liegen außerhalb des akzeptablen Bereiches. Dies legt insgesamt die Vermutung nahe, dass das Modell nicht gut zu den vorliegenden Daten passt.

Abb. 2
figure 2

Strukturgleichungsmodell ohne Querverbindungen (H1-Modell) (standardisierte Koeffizienten, Standardfehler in Klammern) (Bei der Berechnung wurde die Kovarianz des Alters der Fachkräfte mit Wissen, Einstellungen, Performanz und der Intervention berücksichtigt. Aus Gründen der Übersichtlichkeit wird hier auf eine Darstellung der Ergebnisse verzichtet)

Das Modell H2 (Abb. 3) prüft Hypothese 2. Gegenüber dem H1-Modell werden die multilingual-pädagogische und die assimilatorische Einstellungsdimensionen hier als im Hintergrund wirksame Merkmale betrachtet, die jeweils auf das Wissen und die Performanz zum Messzeitpunkt im Jahr 2018 einen Einfluss haben. Die Modellgütemaße (χ2 (Zielmodell) = 12,40 (df = 10) mit p = 0,26; χ2 (Baselinemodell) = 164,28 (df = 30) mit p < 0,001; RMSEA = 0,04; CFI = 0,98) zeigen eine Überlegenheit des Modells gegenüber dem H1-Modell an. Alle Werte deuten darauf hin, dass das Modell sehr gut zu den Daten passt. Da die gleichen Variablen verwendet wurden, unterscheidet sich der χ2-Wert für das Baselinemodell nicht. Der χ2-Wert für das Zielmodell ist nun nicht mehr signifikant. Die Hypothese, dass das Modell von den Daten abweicht lässt sich daher nicht bestätigen. Ebenso zeigen die Werte von RMSEA und CFI eine gute Modellpassung an.

Abb. 3
figure 3

Strukturgleichungsmodell mit Einstellungen als Hintergrundmerkmale (H2-Modell) (standardisierte Koeffizienten, Standardfehler in Klammern) (Bei der Berechnung wurde die Kovarianz des Alters der Fachkräfte mit Wissen, Einstellungen, Performanz und der Intervention berücksichtigt. Aus Gründen der Übersichtlichkeit wird hier auf eine Darstellung der Ergebnisse verzichtet)

In Abb. 3 sind die standardisierten Koeffizienten mit Standardfehlern in Klammern ausgegeben. Die Korrelationen zum Messzeitpunkt der Prä-Erhebung im Jahr 2015 zeigen signifikante positive Zusammenhänge zwischen Wissen sowie multilingual-pädagogischer Einstellung mit der Performanz. Weiterhin zeigen sich signifikante Korrelationen zwischen Wissen und Einstellungen. Wissen ist mit der assimilatorischen Einstellung negativ und mit der multilingual-pädagogischen Einstellung positiv korreliert. Zwischen den beiden Einstellungsdimensionen besteht dagegen keine signifikante Korrelation.

Die Ergebnisse über die Zeit weisen in die zu erwartende Richtung. Zunächst zeigen sich die erhobenen Konstrukte als unterschiedlich stabil über die Zeit. Zwischen den Messzeitpunkten bewegen sich die standardisierten Koeffizienten zwischen 0,16 und 0,51. Bei der multilingual-pädagogischen Einstellung zeigt sich die größte Stabilität, die geringste Stabilität bei der Performanz. Die Wirkung der Intervention auf Wissen und Performanz ist positiv, wobei die Wirkung auf das Wissen der Fachkräfte (β = 0,20) etwas schwächer ausfällt als auf die Performanz (β = 0,44). Einflüsse der dahinter liegenden assimilatorischen und multilingual-pädagogischen Einstellung auf Wissen und Performanz gehen überwiegend in die erwartete Richtung. Assimilatorische Einstellungen wirken tendenziell signifikant negativ, multilingual-pädagogische wirken signifikant positiv auf die Berücksichtigung der sprachlichen Vielfalt. In Bezug auf das Wissen der Fachkräfte werden für beide Einstellungsmerkmale positive Koeffizienten geschätzt. Allerdings sind die geschätzten Koeffizienten der Einstellungen zum Messzeitpunkt im Jahr 2015 auf das Wissen zum Messzeitpunkt im Jahr 2018 nicht signifikant.

6 Diskussion

Dieser Beitrag prüfte die Effekte einer an Disposition und Performanz der Fachkräfte orientierten Weiterbildungsmaßnahme, mit Fokus auf dem Zusammenwirken von Wissen und Einstellungen. Die Ergebnisse zeigen nach einer über drei Jahre andauernden Intervention heterogene Effekte der Intervention auf die Einstellungen und stabile Effekte auf das Wissen der Fachkräfte. Dies bestätigt die Ergebnisse von Kratzmann und Sachse (2018). Die Interventionseffekte von Eichen und Bruns (2017) im Bereich Mathematik lassen sich anhand der vorliegenden Untersuchung nicht replizieren. Die multilingual-pädagogischen Einstellungen unterscheiden sich lediglich moderat, die assimilatorischen Einstellungen praktisch gar nicht für die beiden Interventionsgruppen. Interpretiert man die vorliegenden Ergebnisse zu den Einstellungen der Fachkräfte insgesamt als im Großen und Ganzen fehlenden Effekt, ließe sich dies mit der Positionierung der Einstellungen im Rahmen des Professionalisierungsmodells vereinbaren, demnach Einstellungen als Hintergrundvariablen wirksam sind und zumindest nicht in erster Linie als durch Interventionen veränderbar angesehen werden. Mit dem Effekt auf das Wissen der Fachkräfte ist ein Beleg über die Wirksamkeit mittleren Ausmaßes für die Interventionsmaßnahme auf der Dispositionsebene erbracht.

Auf Ebene der Performanz zeigt sich ein heterogenes Bild der Verteilungen der betrachteten Merkmale für die beiden Interventionsgruppen. Während sich sowohl die Anzahl mehrsprachiger Medien (als Effekt der Intervention inklusive finanzieller Zuwendung) als auch die Sichtbarkeit sprachlicher Vielfalt (als Effekt der Intervention exklusive finanzieller Zuwendung) zugunsten der Interventionsgruppe zunimmt, lässt sich kein solcher Effekt für den Anteil mehrsprachiger Interaktion beobachten. Eine mögliche Erklärung für die erwartungskonträren Ergebnisse für den Anteil mehrsprachiger Peer-Interaktionen ist die recht kleine Stichprobe der untersuchten Kinder (n = 20 bzw. 18 in der Interventionsgruppe in 2015 bzw. 2018 sowie n = 18 bzw. 16 in der Kontrollgruppe in 2015 bzw. 2018). Mit sinkender Stichprobengröße steigt die Wahrscheinlichkeit für größere Abweichungen zwischen Stichprobenkennwerten und Parametern der Stichprobenkennwerte. Eine mögliche Strategie wäre es, die Beziehung zwischen der Intervention und dem Anteil mehrsprachiger Äußerungen um Kindesmerkmale, wie Sprachkompetenz oder Sozialverhalten zu kontrollieren. Diese spezifische Fragestellung würde jedoch einer eigenen umfangreicheren Darstellung bedürfen. Fasst man die drei Indikatoren Anzahl mehrsprachiger Materialien, Sichtbarkeit der sprachlichen Vielfalt und Anteil mehrsprachiger Peer-Interaktionen zu einem Gesamtindex zusammen, zeigt sich ein recht klarer Effekt zugunsten der Intervention.

Die Analysen zum Zusammenwirken von Einstellung, Wissen und Performanz bestätigen das Modell von Fröhlich-Gildhoff et al. (2014) in Teilen. Nach den Ergebnissen der Strukturgleichungsmodelle hat die an Dispositionen und Reflexion der Fachkräfte ansetzende Intervention eine Wirkung auf das Wissen der Fachkräfte sowie deren Performanz. Einstellungen erweisen sich dabei als im Hintergrund wirksame Komponenten, die sowohl den Wissensaufbau als auch die Veränderung von Praxis beeinflussen.

Das durch die Intervention aufgebaute Wissen der Fachkräfte bleibt ohne Einfluss auf die Entwicklung der Performanz. Dieses Ergebnis steht im Einklang mit den Analysen von Simon und Sachse (2013), Ofner (2014) sowie Sachse et al. (2016), wonach Weiterbildungsmaßnahmen zwar einen Effekt auf das Wissen der Fachkräfte haben, diese ihr Wissen jedoch nicht in die pädagogische Praxis umsetzen können. Die Effekte auf die Praxis sind, anknüpfend an die Schlussfolgerungen nach Zaslow et al. (2010), Egert (2015) und Egert et al. (2017) vermutlich eher in den eingesetzten individualisierten Unterstützungsstrategien bei der Umsetzung, wie z. B. der Anwendung von Feedbackstrategien oder monetärer Unterstützungsleistung zu suchen. Da nicht differenziert werden kann, welche Aspekte der Weiterbildungsmaßnahme die Effekte hervorgerufen haben, bleibt dies jedoch eine Vermutung. Tiefergehende Analysen sind hierzu notwendig.

Grenzen der Untersuchung sind auf unterschiedlichen Ebenen zu sehen. Inhaltlich konnten in diesem Zusammenhang nur Teilaspekte einer mehrsprachigkeitsunterstützenden Lernumgebung in den Blick genommen werden. Andere Aspekte, wie der Einbezug der Eltern oder konkrete Fachkraft-Kind Interaktionen blieben in dieser Fragestellung unberücksichtigt, könnten jedoch im Rahmen komplexerer Modelle neue Perspektiven auf die Daten zeigen. Weiterhin ist die Stichprobe auf Kitas mit einem Anteil an mehrsprachig aufwachsenden Kindern von mindestens 50 % begrenzt. Auf methodischer Ebene muss einschränkend erwähnt werden, dass eine Berücksichtigung der Mehrebenenstruktur der Daten bei den gewählten Modellen nicht möglich war. Die Ergebnisse könnten daher verzerrt sein. Analysen mit robusten Standardfehlern hätten der Mehrebenenstruktur Rechnung getragen, allerdings wären dann die berichteten Modellgütemaße nicht kalkulierbar gewesen. Zudem wurden wünschenswerte Werte der internen Konsistenz bei den Einstellungsskalen nur teilweise erreicht. Weiterhin erfasst das Wissensscreening das Professionswissen möglicherweise unzureichend. Ein differenzierter und nach Gütekriterien geprüfter Wissenstest für die spezifischen Professionalitätsanforderungen in der Kita liegt bisher allerdings nicht vor. Eine weitere Differenzierung des Professionswissens pädagogischer Fachkräfte in Kitas wäre sinnvoll. Die Entwicklung der hier betrachteten Aspekte können weiter von zeitveränderlichen strukturellen Aspekten, wie der Zusammensetzung der Gruppe und der Sprachen abhängen. Diese konnten in den Modellen nicht berücksichtigt werden, da strukturelle Aspekte aus organisatorischen Gründen lediglich zum Messzeitpunkt 2015 erfasst wurden. Schließlich ist auf gesellschaftlicher Ebene der verstärkte Zuzug von Menschen mit Fluchterfahrung in Europa im Jahr 2015 und eine allgemeine Tendenz zum Nationalismus als externe Einflussgröße zu bedenken, die insbesondere die Veränderung zu einer mehrsprachigkeitsintegrierenden Lernumgebung behindern könnte.

Nicht geklärt werden konnte, wie Fachkräfte dabei unterstützt werden können, ihr in Weiterbildungsmaßnahmen erworbenes Fachwissen in die eigene pädagogische Praxis umzusetzen. Zudem bleibt die Frage nach der Nachhaltigkeit der Maßnahme nach Beendigung der Weiterbildungsmaßnahme offen.

Insgesamt betrachtet zeigen sich Veränderungen der Praxis zu einer mehrsprachigkeitsintegrierenden Lernumgebung als ein langwieriger Prozess, der sich selbst bei exklusiver Begleitung als sehr mühsam erweist und lediglich bescheidene Effekte erreicht. Der Erfolg einer an Disposition und Performanz ansetzenden Weiterbildungsmaßnahme scheint von Einstellungen mit beeinflusst zu sein, nicht jedoch von der Wissenserweiterung der Fachkräfte. Für weitere Professionalisierungsmaßnahmen der Praxis bedeutet dies die Notwendigkeit, an der Performanz der Fachkräfte zu arbeiten und mit Blick auf die bei Kratzmann et al. (2017a) berichteten Zusammenhänge zwischen Einstellungen und Qualifikationsniveau möglicherweise auch ein deutlich früheres Ansetzen an Einstellungen im Rahmen der beruflichen Qualifikation.