1 Einleitung

Der Chemieunterricht an allgemeinbildenden Schulen soll Schülerinnen und Schüler in die Lage versetzen, Phänomene in ihrer Lebenswelt auf der Grundlage ihrer Kenntnisse über chemische Zusammenhänge zu erklären, zu bewerten und darauf aufbauend persönlich und gesellschaftlich relevante Entscheidungen treffen zu können. Vor diesem Hintergrund werden, unter anderem, die Vermittlung von Wissen über chemische Phänomene und eines Verständnisses grundlegender Begriffe, Gesetzmäßigkeiten und Prinzipien der Chemie als zentrale Ziele des Fachunterrichts ausgewiesen (KMK 2004a, S. 8). Diese Ziele sind in den ländergemeinsamen Bildungsstandards für den mittleren Schulabschluss (KMK 2004a) bzw. den einheitlichen Prüfungsanforderungen für das Abitur (EPA) festgelegt (KMK 2004b). Die bildungsadministrativen Vorgaben beschränken sich dabei auf die Benennung zentraler Ziele und Konzepte sowie der grundlegenden Kompetenzen des Fachs und folgen damit einer Perspektive, aus der es im Fachunterricht primär nicht um das Erlernen eines möglichst breiten Spektrums an isolierten Kenntnissen gehen soll, sondern um ein Verständnis der für die jeweilige Disziplin grundlegenden Konzepte (Bernholt et al. 2012; Bransford et al. 2000; National Research Council [NRC] 2013).

Die Fokussierung auf Basiskonzepte trägt damit einer langjährig geäußerten Kritik Rechnung, dass die detaillierte Auflistung von Fachinhalten in klassischen Lehrplänen eher zu einer separaten Vermittlung von eigenständigen Themen oder Einheiten und damit wiederum zu einem eher kompartimentalisierten und wenig vernetzten Wissensaufbau führen würde (Duschl et al. 2007; Oelkers und Reusser 2008; Osborne und Collins 2000; Osborne und Dillon 2008).

Obwohl die Relevanz zentraler Konzepte für die Strukturierung von Lerngelegenheiten seit vielen Jahren betont wird, zeigen Untersuchungen fortlaufend, dass es Schülerinnen und Schülern eher schwerfällt, ein elaboriertes Verständnis dieser Konzepte zu erreichen. Mit Blick auf den Chemieunterricht betrifft dies das Verständnis aller in den ländergemeinsamen Bildungsstandards ausgewiesenen Basiskonzepte: das Stoff-Teilchen-Konzept und das Konzept der Struktur-Eigenschaftsbeziehungen, bezogen auf den atomaren Aufbau und die Zusammensetzung der Materie (Hadenfeldt et al. 2016; Löfgren und Helldén 2009; Scheffel et al. 2009), das Konzept der chemischen Reaktion (Stains und Talanquer 2008; Taskin et al. 2017) und das Konzept der Energie (Herrmann-Abell und DeBoer 2017; Neumann et al. 2012; Opitz et al. 2019). Es gibt allerdings nur wenige Studien, die die Entwicklung eines Verständnisses dieser Konzepte auf Seiten der Schülerinnen und Schüler längsschnittlich betrachten und Einblicke in Zusammenhänge zwischen den Entwicklungsverläufen des Verständnisses unterschiedlicher Konzepte innerhalb eines Faches liefern. Diesen Fokus setzt der vorliegende Beitrag im Rahmen einer explorativ angelegten Studie.

2 Theoretischer Hintergrund

2.1 Kompetenzentwicklung und kumulatives Lernen

Kompetenzen, insbesondere im Sinne der Bildungsstandards (KMK 2004a), werden nach Weinert (2001b, S. 27) definiert als „die bei Individuen verfügbaren oder durch sie erlernbaren kognitiven Fähigkeiten und Fertigkeiten, um bestimmte Probleme zu lösen, sowie die damit verbundenen motivationalen, volitionalen und sozialen Bereitschaften und Fähigkeiten, um die Problemlösungen in variablen Situationen erfolgreich und verantwortungsvoll nutzen zu können“. Gemäß des in den Bildungsstandards Chemie ausgewiesenen Kompetenzbereichs Fachwissen lassen sich die „in der Schule relevanten chemischen Fachinhalte mit den zugehörigen naturwissenschaftlichen Fachbegriffen […] auf wenige Basiskonzepte zurückführen [, … mittels derer] die Schülerinnen und Schüler fachwissenschaftliche Inhalte [beschreiben und strukturieren]“ (KMK 2004a, S. 8). Vor diesem Hintergrund lassen sich konzeptbezogene Kompetenzen als diejenigen kognitiven Fähigkeiten und Fertigkeiten beschreiben, die sich auf die Nutzung des Wissens zu zentralen Konzepten eines Faches beziehen (vgl. Ropohl et al. 2015; Schecker und Parchmann 2006).

Bereits seit den 1970er Jahren wurden, oftmals aufbauend auf allgemeine lernpsychologische Modelle (Bruner 1980; Gagné 1970), Sequenzierungen fachlicher Inhalte vorgeschlagen, die einen kumulativen Wissensaufbau in den naturwissenschaftlichen Fächern über mehrere Schuljahre hinweg unterstützen sollen (Duit 1973). Für den Chemieunterricht hat sich die Anlage eines Spiralcurriculums in vielen Lehrplänen etabliert, in dem zentrale Themen wie Säure-Base- oder Redoxreaktionen in verschiedenen Jahrgängen auf jeweils höheren Niveaustufen wieder aufgegriffen werden (Parchmann und Sommer 2018). Die heute in den Bildungsstandards ausgewiesenen Basiskonzepte fordern eine weitergehende Aggregierung solcher Fachthemen zu den benannten Basiskonzepten. Zahlreiche Untersuchungen zeigten bereits, dass die tatsächlichen Lernprozesse jedoch nicht unbedingt mit diesen curricularen Sequenzierungen korrespondieren. Das Lernen fachlicher Inhalte erweist sich in den naturwissenschaftlichen Fächern als sehr stark abhängig von bereits vorhandenen Vorstellungen der Schülerinnen und Schüler (Duit und Treagust 1998; Eaton et al. 1984); und diese Vorstellungen erweisen sich als äußerst robust gegenüber unterrichtlichen Interventionen (Allen 2010; Duit und Treagust 1998; Garnett et al. 1995; Watson et al. 1997). In der Folge rückten die Entwicklung und Evaluation sogenannter Lernpfade (learning pathways; vgl. Niedderer et al. 1992), die gezielt die Veränderung von Schülervorstellungen herbeiführen sollten, in den Fokus. Diese Arbeiten waren zunächst auf einzelne Unterrichtseinheiten fokussiert, wenige auf die Vermittlung ganzer Konzepte (Stavrou et al. 2005).

Weitere Befunde empirischer Untersuchungen, die dem naturwissenschaftlichen Unterricht auch weiterhin eine mangelnde Kohärenz attestierten (Baumert und Lehmann 1997), führten zu einer Renaissance der Theorien zum kumulativen Lernen, bspw. unter dem Stichwort Vertikale Vernetzung (Neumann et al. 2008). Auch hier wurde jedoch nur bedingt die spezifische Rolle des Unterrichts berücksichtigt (Bernholt et al. 2018). Eben dieses Wechselspiel zwischen Schülervorstellungen, unterrichtlichen Lerngelegenheiten und dem korrespondierendem Erlernen fachlicher Konzepte wird aktuell unter dem Konstrukt der learning progressions diskutiert (Bernholt und Sevian 2018; Duschl et al. 2007; Ford 2015), vergleichbar mit Arbeiten zum Modell der Didaktischen Rekonstruktion (Duit et al. 2012). Learning progressions beschreiben Modelle des Lehrens und Lernens in einer bestimmten Domäne über einen längeren Zeitraum – im Idealfall über mehrere Schuljahre (Bernholt et al. 2018). Sie sind dabei eng mit den o. g. Theorien des (fachbezogenen) Lehrens und Lernens verknüpft (Duncan und Gotwals 2015) und zielen darauf ab, zunehmend komplexere Stufen von Kompetenz(en) in einer Domäne zu beschreiben (Duncan und Hmelo-Silver 2009; Duschl et al. 2007).

2.2 Bildungsstandards und Lehrpläne

Die Bildungsstandards und EPA formulieren in übergeordneten Zielen, welche Kompetenzen Schülerinnen und Schüler am Ende bestimmter Bildungsabschnitte erworben haben sollen. Die Konkretisierung dieser Vorgaben erfolgt durch die Lehrpläne der einzelnen Bundesländer, die die Lehrkräfte dabei unterstützen sollen, die Implikationen einer Standards- und Kompetenzorientierung für ihren Unterricht durchdringen und diese Neuerungen in ihre Unterrichtspraxis integrieren zu können. Curriculare Lehrpläne zeigen dabei im Allgemeinen eine Abfolge von Standards zur Kompetenzentwicklung über die einzelnen Schuljahre hinweg auf, die mit spezifischen Inhalten (Begriffe, Beispiele) und ggf. mit empfohlenen Unterrichtsverfahren verbunden werden, um die abstrakten Basiskonzepte weiter zu konkretisieren (Messner 2006; Parchmann und Sommer 2018). Lehrpläne lassen sich durch die Nennung von notwendigen Kenntnissen, Fähigkeiten und Fertigkeiten als „Umsetzungsinstrument“ der Bildungsstandards auf Länderebene begreifen. „In ihnen wird der ‚unentbehrliche‘ Kern des Faches abgebildet“ (MNU 2006, IV). Die Lehrpläne der Bundesländer dienen also dazu, die durch die Standards und EPA vorgegebenen Lerninhalte systematisch und in ihrer zeitlichen Abfolge zu beschreiben, so dass das Erreichen der bildungsadministrativen Zielvorgaben ermöglicht wird.

Ein gut gesicherter Befund der vergleichenden Bildungsforschung geht dahin, dass „Lehrpläne mit Zunahme ihres Umfangs an praktischer Bedeutung abnehmen. Ich könnte auch sagen, je genauer und je detaillierter sie festgelegt wurden, desto weniger waren sie imstande, Unterricht zu steuern“ (Oelkers 2006, S. 243). Ob im Umkehrschluss stärker fokussierte und ausgedünnte Lehrpläne eine höhere Steuerungswirkung entfalten, ist schwer zu beantworten. In der Literatur werden Lehrpläne oftmals auf unterschiedlichen Ebenen verortet (Lehrpläne/Standards, Lehrbücher, umgesetzte Unterrichtsinhalte, Lernergebnisse der Schülerinnen und Schüler; Schmidt et al. 2001) und auf dieser Basis zwischen intendiertem (Lehrpläne, Lehrbücher), implementiertem (Unterrichtliche Umsetzung) und erreichtem (Schülerleistungen) Curriculum differenziert (Cai 2014; Schmidt et al. 2001; Wang und McDougall 2019). Auch wenn es kaum empirische Befunde für einen unmittelbaren Effekt des Lehrplans auf die Leistungen der Schülerinnen und Schüler gibt (Cai 2014), wird dem intendierten Curriculum im Allgemeinen ein grundlegender Einfluss auf das Lehren und Lernen zugewiesen, entweder direkt (Schmidt et al. 2001; Talanquer und Sevian 2014) oder auch mediiert als Einfluss auf Lehrbuchautorinnen und -autoren sowie Lehrkräfte (Hirsch und Reys 2009; Wang und McDougall 2019) und damit auf Entscheidungen, welche Inhalte wann unterrichtet werden sollen. Mit Blick auf das Abitur konstatiert Kühn (2011) auf Basis eines Vergleichs zentraler Prüfungsaufgaben der Jahre 1993 bis 2008 allerdings, dass im Zuge der Einführung der Bildungsstandards keine bedeutsamen Veränderungen bzgl. der Aufgabengestaltung festgestellt werden konnten und somit eine Steuerungswirkung der EPA zumindest kritisch hinterfragt werden muss.

2.3 Curriculare Kohärenz

Neben einer generellen Steuerungswirkung bildungsadministrativer Vorgaben durch Bildungsstandards und Lehrpläne stellt sich ebenfalls die Frage nach Merkmalen dieser Vorgaben, die bestenfalls eine lernförderliche Wirkung auf die Kompetenzentwicklung der Schülerinnen und Schüler entfalten. Generell ist der Anspruch von Lehrplänen, dass die vorgeschlagene Strukturierung fachlicher Inhalte es begünstigt, dass Ideen und Prinzipien aus verschiedenen Unterrichtsjahrgängen und -einheiten aufeinander aufbauen und eindeutige Verbindungen zwischen den erworbenen Ideen und Prinzipien aufgebaut werden können (BIMI 2016; NKM 2009). Auf dieser Grundlage soll ein kumulativer Kompetenzerwerb auf Seiten der Schülerinnen und Schüler ermöglicht werden, der auch eine zunehmende Vernetzung zwischen verschiedenen fachlichen Konzepten unterstützt (Bruner 1980; Schmidt et al. 2005). Diese Vertiefung und Vernetzung konzeptbezogener Kompetenzen sollte insbesondere solche Prinzipien und Konzepte eines Faches betreffen, die über mehrere Unterrichtseinheiten und Schuljahren wiederholt in verschiedenen Themen und Kontexten aufgegriffen werden (Fortus et al. 2015; KMK 2004a; Neumann et al. 2008, 2012; Niedderer et al. 1992).

Dieser Ansatz eines strukturierten und im Hinblick auf eine bestmögliche Unterstützung der Lernenden konzipierten Curriculums wird unter dem Begriff Kohärenz in der Literatur diskutiert. „A ‚coherent‘ curriculum is one that holds together, that makes sense as a whole; and its parts, whatever they are, are unified and connected by that sense of the whole. […] It is not simply a collection of disparate parts or pieces that accumulate in student experiences and on transcripts. […] Parts or pieces are connected or integrated in ways that are visible and explicit.“ (Beane 1995, S. 5). Im Rahmen der TIMS-Studie wurde curriculare Kohärenz als der wichtigste Prädiktor für die Leistung der Schülerinnen und Schüler hervorgehoben (Schmidt et al. 2005). Dieser Befund wird auch durch neuere Studien gestützt (Fortus und Krajcik 2012; Linn et al. 2004; Shin et al. 2019) und konnte bezogen auf die Kohärenz von Inhaltsstandards (vgl. Roseman und Koppal 2008), die Kohärenz von Lernzielen (vgl. Krajcik et al. 2008) oder die Kohärenz innerhalb einzelner Unterrichtseinheiten (vgl. Shwartz et al. 2008) bestätigt werden.

Die Umsetzung curricularer Kohärenz wird jedoch als äußerst herausfordernd eingeschätzt, da traditionelle Lehrpläne und auch Schulbücher (zu) viele Themen auf einer zu oberflächlichen Ebene behandeln (Schmidt et al. 2002), ohne dass Verbindungen zwischen den Themen und den zentralen Konzepten hergestellt werden (Schmidt et al. 2005). Die Folge ist, dass naturwissenschaftlicher Unterricht durch die Schülerinnen und Schüler als eine Abfolge von ‚Fakten‘ wahrgenommen wird, die schlichtweg auswendig gelernt, aber nicht zwangsläufig verstanden werden müssen (Millar und Osborne 1998).

Die Annahme, dass eine hohe Kohärenz zwischen nachfolgenden Lerngelegenheiten zu einem höheren Lernzuwachs führen sollte, ist aus lerntheoretischer Sicht gut zu begründen. Dabei spielt insbesondere die hohe prädiktive Kraft des Vorwissens für den Erwerb neuen Wissens eine zentrale Rolle (Bransford et al. 2000). Entsprechend sollten eine schrittweise Erweiterung und eine wiederholte Anwendung der zentralen fachlichen Erklärungskonzepte und -modelle über mehrere Anwendungskontexte hinweg am produktivsten hinsichtlich eines kumulativen Kompetenzerwerbs sein (Kesidou und Roseman 2002; Lehrer und Schauble 2015). Allerdings wird auch betont, dass Bezüge zu den zentralen fachlichen Konzepten für die Lernenden explizit hergestellt (Erickson 2008) oder sie durch den Vergleich multipler Kontexte implizit zur Herstellung dieser Bezüge angeregt werden müssen (Kehne 2019).

2.4 Die Fachanforderungen Chemie in Schleswig-Holstein

Die Fachanforderungen Chemie (BIMI 2016) sind der Lehrplan des Landes Schleswig-Holstein, in dem die vorliegende Studie durchgeführt wurde. Die Fachanforderungen entsprechen dabei den oben skizzierten Annahmen und Zielen von Lehrplänen. So konkretisieren die Fachanforderungen die Kompetenzerwartungen der Bildungsstandards bzw. der EPA für spezifische Jahrgangsstufen (Jg. 5/6, 7–9 sowie die Einführungsphase, Jg. 10, und Qualifikationsphase, Jg. 11–12, der Sekundarstufe II im Rahmen von G8; BIMI 2016, S. 12 bzw. S. 36), indem sie die Strukturierung in Kompetenzbereiche und Basiskonzepte aufnehmen und mit chemischen Fachinhalten verknüpfen. Die Basiskonzepte sollen der Intention nach dabei „die Aneignung eines grundlegenden, vernetzten Wissens erleichtern, den systematischen und kumulativen Aufbau von fachlichen Kompetenzen begünstigen [und] die Basis für die interdisziplinäre Vernetzung des Wissens bilden“ (ebd., S. 14) sowie jahrgangsübergreifend „in unterschiedlichen Zusammenhängen erkenntniswirksam immer wieder aufgegriffen, thematisiert und ausdifferenziert [werden] und damit die übergeordneten Strukturen im Aufbau eines vielseitig verknüpften Wissensnetzes [bilden]“ (ebd., S. 14). Auch die Notwendigkeit der Etablierung einer fachsystematischen Struktur entlang der Basiskonzepte durch steten Wechsel zwischen Realsituationen und wissenschaftlicher Beschreibung wird hervorgehoben (ebd., S. 15).

Im Kompetenzbereich Fachwissen soll die Anordnung der Teilkompetenzen und Fachinhalte dabei explizit als Orientierungshilfe verstanden werden, um aus dieser Anordnung ansteigende Niveaus im Aufbau der vier Basiskonzepte über den Verlauf der Sekundarstufe abzuleiten und somit die Progression des Kompetenzerwerbs im Umgang mit Fachwissen abzubilden (ebd., S. 39). Betrachtet man die den einzelnen Jahrgangsstufen zugeordneten Fachinhalte genauer unter der Perspektive, welche vertikale Vernetzungen zwischen aufeinander folgenden Jahrgängen aus fachlicher Sicht sinnvoll erscheinen, so zeigen sich zahlreiche Ansatzpunkte (vgl. Abb. 1). Insbesondere im Übergang von Jahrgansstufe 9 zu 10 spielt dabei die Deutung des Aufbaus von Materie und der chemischen Reaktion auf Basis eines differenzierten Teilchenmodells eine zentrale Rolle, da von diesen Fachinhalten zahlreiche inhaltliche Vernetzungsmöglichkeiten innerhalb der 9. Jahrgangsstufe (in Abb. 1 nicht dargestellt) und zu Inhalten der Jahrgangsstufe 10 (in Abb. 1 durch Linien dargestellt) zu ziehen sind. Auch im Übergang von Jahrgang 10 zur Qualifikationsphase finden sich zahlreiche potenzielle Verknüpfungslinien, jedoch nicht derart konzentriert auf einzelne Aspekte wie im Übergang zwischen Jahrgang 9 und 10.

Abb. 1
figure 1

Grundlegende inhaltliche Zusammenhänge zwischen den Basiskonzepten der Fachanforderungen Chemie (Die Basiskonzepte Stoff-Teilchen und Struktur-Eigenschaftsbeziehungen wurden im Rahmen der vorliegenden Studie zu einem Konzept „Materie“ subsummiert; BIMI 2016); Die Zahlen (und die korrespondierende Linienstärke) entsprechen der Anzahl inhaltlicher Verknüpfungsmöglichkeiten zwischen den Jahrgangsstufen (qualitativ zugeordnet durch den Erstautor auf Basis identischer oder inhaltlich korrespondierender Begrifflichkeiten in den Formulierungen der anzustrebenden inhaltlichen Kompetenzen, die im Rahmen der Fachanforderungen ausgewiesenen werden)

In allen Übergängen (und auch innerhalb der ausgewiesenen Jahrgangsstufen) zeigen sich demnach vielfältige Möglichkeiten der inhaltlichen Vernetzung konzeptbezogener Kompetenzen, sowohl innerhalb der einzelnen Basiskonzepte aber insbesondere auch zwischen den Basiskonzepten. Dies unterstreicht die Intention der Fachanforderungen, durch die Auswahl und Anordnung der Inhalte das kumulative Lernen zu unterstützen.

Allerdings ist die „Oberflächenstruktur“ der Fachanforderungen zunächst nur eine Auflistung mehr oder weniger stark zusammenhängender Fachinhalte, deren Beziehungsgefüge sowohl innerhalb der einzelnen Basiskonzepte als auch zwischen den vier getrennt ausgewiesenen Basiskonzepten (wie es subjektiv in Abb. 1 exemplifiziert wurde) nicht expliziert wird. Damit stellt sich umso mehr die Frage, wie Lehrkräfte die Grundidee eines anhand von Basiskonzepten strukturierten Curriculums (i.S. des intendierten Curriculums) aufnehmen, in ihrem Unterricht umsetzen (i.S. des umgesetzten Curriculums) und welche Lernergebnisse dies letztlich mit Blick auf den Aufbau von flexiblen und anwendbaren konzeptbezogenen Kompetenzen auf Seiten der Schülerinnen und Schüler (i.S. des erreichten Curriculums) mit sich bringt. Während eine Betrachtung aller drei Ebenen des Curriculums bei einer Frage nach der Steuerungswirkung der Bildungsstandards bzw. der Lehrpläne notwendig erscheint, soll im Rahmen des vorliegenden Beitrags zunächst die Ebene der Schülerleistungen in den Blick genommen werden, um die Ausgangslage für weiterführende Interventionen und Entwicklungen zu charakterisieren. Auch hier liegen systematische Ergebnisse zur Kompetenzentwicklung bzgl. der Basiskonzepte im Fach Chemie nur begrenzt vor (Emden et al. 2018; Ferber et al. 2015; Weber et al. 2015). Daher soll im Rahmen dieser explorativ angelegten Untersuchung den Fragen nachgegangen werden, welcher Kompetenzzuwachs über die Jahrgangsstufen 9 bis 12 festzustellen ist und welche Zusammenhänge in der Kompetenzentwicklung zwischen den einzelnen Basiskonzepten bestehen.

Die Untersuchung folgt der Grundannahme, dass eine ausreichend hohe curriculare Kohärenz im Sinne des intendierten Curriculums dazu führen sollte, dass (empirisch) konzeptbezogene Kompetenzen in späteren Schuljahren hochgradig von Kompetenzen in früheren Jahren abhängen, sich also innerhalb der einzelnen Basiskonzepte eine hohe Abhängigkeit des zeitlich vorhergehenden Kompetenzstandes zeigt (Autoregression bzw. Stabilität; Fortus et al. 2015). Da die Basiskonzepte keine disjunkten Inhaltsbereiche darstellen, sondern vielmehr unterschiedliche, aber komplementäre Perspektiven auf ein spezifisches (chemisches) Phänomen eröffnen (vgl. National Research Council [NRC] 2012), sollte eine systematische und kumulative Kompetenzentwicklung bzgl. der Basiskonzepte zudem mit ansteigenden Zusammenhängen zwischen den Konzepten über Schuljahre hinweg einhergehen. In diesem Sinne sollte ein zunehmend stärkerer Effekt des Kompetenzstands eines Konzepts in vorhergehenden Jahrgangsstufen auf den Kompetenzstand der beiden anderen Konzepte in späteren Jahren festzustellen sein. Wie oben diskutiert sollte aus inhaltlicher Sicht zudem das Verständnis des Konzepts Materie jahrgangsübergreifend das Verständnis des Konzepts Chemische Reaktion positiv beeinflussen (vgl. Abb. 1; Emden et al. 2018). Abweichungen von einer solchen intendierten Entwicklung können weiterführend als Indikatoren dafür gewertet werden, dass entweder das realisierte Curriculum nicht ausreichend mit dem intendierten korrespondiert oder/und die Lerngelegenheiten nicht ausreichend zu einem Erreichen des Curriculums führen.

3 Methode

In der vorliegenden Studie werden konzeptbezogene Kompetenzen als erfolgreiche Anwendung chemischer Theorien und Prinzipien in unterschiedlichen Anwendungskontexten betrachtet. Diese Auffassung entspricht dem Begriff der Kompetenz, wie er im Rahmen der länderübergreifenden Bildungsstandards genutzt wird (KMK 2004a; Weinert 2001a, b). Die Anwendbarkeit in unterschiedlichen Kontexten folgt dabei der Annahme, dass sich leistungsstärkere Schülerinnen und Schüler von leistungsschwächeren dadurch unterscheiden, dass sie ein differenzierteres Verständnis eines bestimmten Konzepts besitzen, aber auch eine höhere Erfolgsquote dabei haben, ein bestimmtes Konzept in einem bestimmten Problemkontext erfolgreich zu erkennen und anwenden zu können (diSessa 1988; Pellegrino et al. 2001).

Basierend auf den länderübergreifenden Bildungsstandards für das Fach Chemie (KMK 2004a), den EPA (KMK 2004b) und den Fachanforderungen Chemie (BIMI 2016) wurden drei Konzepte (als Basiskonzepte bezeichnet) für die Erstellung des Konzepttests ausgewählt: Struktur und Zusammensetzung der Materie (unter dem die Basiskonzepte Stoff-Teilchen und Struktur-Eigenschaftsbeziehungen subsummiert werden), Chemische Reaktion und Energie. Die im Rahmen dieser bildungsadministrativen Vorgaben aufgeführten inhaltlichen Kompetenzen im Kompetenzbereich (Umgang mit) Fachwissen wurden als Grundlage genommen, um für die genannten Konzepte Aufgabenstellungen neu zu entwickeln bzw. aus vorhergehenden Studien (Hadenfeldt et al. 2016; Opitz et al. 2019) auszuwählen. Dabei erfolgte eine Fokussierung auf den Kern der Kompetenzbeschreibungen zu den einzelnen Konzepten, aber mit der Maßgabe, dabei nicht die Bandbreite der aufgeführten Kompetenzerwartungen zu verlieren. So wurden inhaltsnahe Kompetenzen (bspw. „Die Schülerinnen und Schüler deuten die Bindungsarten Ionenbindung, Elektronenpaarbindung und Metallbindung mithilfe des Konzepts der Elektronegativität.“ und „… erklären die spezifischen Eigenschaften von Salzen mithilfe von Ionen, Ionengittern und elektrostatischen Kräften“) mit nur einer Aufgabe zur Ionenbindung abgedeckt. Mit Blick auf das Aufgabenformat wurden zum einen klassische Multiple-Choice-Aufgaben und zum anderen so genannte Ordered-Multiple-Choice Aufgaben (OMC; Briggs et al. 2006) als Aufgabenformat verwendet. OMC-Aufgaben sind ähnlich wie klassische Multiple-Choice-Aufgaben aufgebaut und bieten mehrere Antwortoptionen. Eine dieser Antwortoption wird als korrekt aufgefasst (d. h. als eine wissenschaftlich akzeptierte Erklärung) und entspricht dem höchsten Verständnisniveau, das mit dieser Aufgabe erfasst werden kann. Die verbleibenden Antwortoptionen stellen entweder ein aus wissenschaftlicher Sicht unangemessenes Verständnis dar (bspw. in Form üblicher Schülervorstellungen) oder sie sind unvollständig. Diese Antwortoptionen werden unterschiedlichen Verständnisniveaus zugeordnet, basierend auf theoretischen oder empirisch validierten Modellen zum Verständnis eines bestimmten Konzepts. Die Niveaus differenzieren dabei zwischen den Abstufungen (0) Alltagsvorstellungen, (1) Hybridvorstellungen (Teilchen im Kontinuum etc.), (2) einfache, Daltonsche Teilchenvorstellungen, (3) differenzierte Teilchenvorstellungen und (4) systemische Teilchenvorstellungen (inner- und intermolekulare Wechselwirkungen) (im Fall der Konzepte Materie und Chemische Reaktion; vgl. Hadenfeldt et al. 2014b) bzw. (0) Alltagsvorstellungen, (1) Energieformen und -quellen, (2) Energietransfer, (3) Energieentwertung und (4) Energieerhaltung (im Fall des Konzepts Energie; vgl. Neumann et al. 2012). Die Aufgabenkonstruktion zielt somit auf die Erfassung der in den bildungsadministrativen Vorgaben aufgeführten inhaltlichen Kompetenzen (Hadenfeldt et al. 2016, vgl.; Opitz et al. 2017).

Die Testkonstruktion folgte einem Ankeritem-Design, so dass für jedes der drei Konzepte sechs Aufgaben in aufeinanderfolgenden Jahrgängen eingesetzt wurden, jeweils ergänzt um vier jahrgangsspezifische Aufgaben. Folglich erhielt jede Schülerin und jeder Schüler 30 Aufgaben pro Testzeitpunkt (3 Konzepte × (6 Ankeraufgaben + 4 Jahrgangsaufgaben)). Alle Aufgaben wurden vorab von vier Chemiedidaktikerinnen bzw. -didaktikern sowie drei Chemielehrkräften auf inhaltliche Passung, Richtigkeit, Eindeutigkeit, Zielklarheit und alternative plausible Interpretationen evaluiert, um im Sinne einer Experteneinschätzung Evidenz für die Inhaltsvalidität der Aufgaben zu sammeln. Zudem wurden think-aloud-Interviews durchgeführt, um die Verständlichkeit und die Bearbeitungsprozesse in der Zielgruppe zu überprüfen (vgl. Hadenfeldt et al. 2014a). In diesen Interviews wurden Probanden unterschiedlicher Jahrgangsstufen gebeten, eine Serie von OMC-Aufgaben unter Verwendung der Methode des Lauten Denkens zu bearbeiten, um Rückschlüsse auf (intendierte) inhaltsbezogene (Schülerinnen und Schüler entscheiden sich aufgrund ihrer konzeptbezogenen Vorstellungen und ihres Vorwissens für oder gegen Antwortoptionen) oder nicht-inhaltsbezogenen Strategien (Schülerinnen und Schüler entscheiden sich durch Raten, Vergleich von Satzlängen, Signalwörter etc.) bei der Aufgabenbearbeitung zu gewinnen. Dies wurde als Evidenz für die kognitive Validität (als Teil der Konstruktvalidität; Messick 1995) der Aufgaben interpretiert. Neben den Testaufgaben enthielt der abschließende Fragebogen Fragen zu demografischen Variablen (Geschlecht, Alter, Muttersprache, SES) und zu verschiedenen anderen Konstrukten (Interesse, Selbstkonzept, Motivation, erkenntnistheoretische Überzeugungen), die jedoch im Rahmen dieses Beitrags nicht berücksichtigt werden.

3.1 Sample

Die aktuelle Studie basiert auf Längsschnittdaten von fünf Gymnasien in Schleswig-Holstein, die freiwillig an der Studie teilgenommen haben. Aufbauend auf eine Querschnittserhebung im Jahr 2015, an der die Jahrgänge 5 bis 12 teilgenommen haben, wurden die Schülerinnen und Schüler der 9. Jahrgangsstufe für drei weitere Jahre begleitet und jährlich (jeweils zwischen den Oster- und den Sommerferien) befragt. Zum ersten Messzeitpunkt nahmen 508 Schülerinnen und Schüler der 9. Jahrgangsstufe teil (MAlter = 14,6 Jahre). In den nachfolgenden Jahren wurden alle Schülerinnen und Schüler der beteiligten Schulen wiederholt befragt, d. h. sowohl die, die bereits teilgenommen hatten, als auch die, die auf Grund von Krankheit oder anderen individuellen Gründen noch nicht teilgenommen hatten. Insgesamt nahmen somit 756 Schülerinnen und Schüler an der Studie teil.

Der naturwissenschaftliche Unterricht beginnt in Deutschland normalerweise in der fünften Klasse, wobei entweder zunächst nur die Biologie startet, eine Kombination verschiedener naturwissenschaftlicher Fächer (z. B. Physik und Biologie) oder integrierter naturwissenschaftlicher Unterricht in den Klassen 5 und 6 unterrichtet werden (Möller 2014). Der Chemieunterricht setzt in vielen Bundesländern als letzte der drei Naturwissenschaften ein. Ab Jahrgang 7 werden Biologie, Physik und Chemie an Gymnasien i. d. R. als separate Fächer unterrichtet. Ab der 10. Klasse haben die Schülerinnen und Schüler die Möglichkeit, Chemie als Unterrichtsfach abzuwählen. In unserer Stichprobe besuchten 78 % der Schüler der 10. Klasse und 68 % der Schüler der 11. Klasse den Chemieunterricht. Testbearbeitungen von Schülerinnen und Schülern, die nicht mehr am Chemieunterricht teilgenommen haben, wurden aus der Auswertung ausgeschlossen, da für diese Schülerinnen und Schüler davon auszugehen ist, dass keine systematischen Lerngelegenheiten mehr vorliegen, die eine Kompetenzentwicklung befördern könnten.

3.2 Durchführung

Die Studie wurde während des regulären Unterrichts auf der Grundlage eines standardisierten Protokolls von geschultem Personal durchgeführt, d. h. nicht von den Lehrkräften der Schule. Nachdem die Schülerinnen und Schüler eine kurze Einführung in die Studie erhalten hatten, wurden die Tests und Fragebögen ausgeteilt und es konnten Fragen zur Klärung gestellt werden. Die Schülerinnen und Schüler hatten ausreichend Zeit, um den Test und den Fragebogen auszufüllen, wofür insgesamt etwa 90 min veranschlagt waren. Die Schülerinnen und Schüler nahmen freiwillig und mit schriftlicher Zustimmung der Eltern teil und wurden darüber informiert, dass sie die Teilnahme an der Studie jederzeit abbrechen können. Die durchschnittliche Teilnahmequote pro Schule lag bei 81 % und reichte von 55 bis 90 %. Alle erhobenen Daten wurden anonymisiert und weder den Teilnehmenden noch ihren Lehrkräften oder den Schulen wurden individuelle Ergebnisse zur Verfügung gestellt, so dass weder eine Teilnahme noch eine Nichtteilnahme unmittelbare Konsequenzen für die Schülerinnen und Schüler hatte.

3.3 Auswertung

Um das Multi-Matrixdesign des Tests zu berücksichtigen (d. h. nicht alle Aufgaben wurden allen Schülerinnen und Schüler vorgelegt), wurde für die Datenauswertung auf Modelle der Item-Response-Theory (IRT) zurückgegriffen. Antworten zu Multiple-Choice-Aufgaben wurden als falsch (0) oder richtig (1) kodiert. Bei OMC-Aufgaben wurden den Antworten entsprechend dem theoretischen Modell Teilpunkte von 0 bis 3 zugeordnet. Beispielsweise wurden Antwortoptionen, die der untersten Ebene des Modells zugewiesen wurden, mit 0, die nächste Ebene mit 1 usw. codiert.Footnote 1

Ein dreidimensionalesFootnote 2Partial-Credit-Modell (PCM, implementiert im R‑Paket TAM; Testanalysemodule; Robitzsch et al. 2019) wurde zur Analyse der codierten Ergebnisse verwendet. Dabei wurde jeder Messzeitpunkt einzeln ausgewertet, wobei die Item-Parameter auf einen Mittelwert von 0 zentriert werden. Die Skalierungen der einzelnen Messzeitpunkte wurde anschließend auf Basis einer Verallgemeinerung des sog. log-mean-mean-linking nach Haberman (2009) über Messzeitpunkte hinweg verknüpft und dadurch auf eine einheitliche Metrik transformiert, so dass die im Folgenden vorgenommenen Trendschätzungen als auch die Zusammenhänge sinnvoll interpretierbar sind.. Die EAP/PV-Reliabilität liegt pro Konzeptbereich und Messzeitpunkt zwischen 0,71 und 0,89 (vgl. Tab. 1), was auf eine ausreichende Reliabilität des Tests hinweist (Field et al. 2013). Die auf Basis des dreidimensionalen Modells geschätzten Korrelationen zwischen den drei Konzeptdimensionen liegen zwischen 0,77 (Energie und Chemische Reaktion zum ersten Messzeitpunkt) und 0,95 (Materie und Chemische Reaktion zum vierten Messzeitpunkt).

Tab. 1 Mittelwerte, EAP/PV-Reliabilitäten sowie Korrelationskoeffizienten zwischen den drei Konzeptbereichen (CR – Chemische Reaktion; EN – Energie; MA – Materie) zu den vier Messzeitpunkten T1 (Jahrgang 9) bis T4 (Jahrgang 12) mit Standardfehlern

In Bezug auf die Itempassung wurden gewichtete Mean-Squares (WMNSQ) berechnet, wobei alle Items zu allen Messzeitpunkten gängige Kriterien erfüllten (WMNSQ zwischen 0,8 bis 1,2; Wright und Linacre 1994), so dass keine Aufgaben von den weiteren Analysen ausgeschlossen wurden.

Zur Schätzung von korrelativen und kreuzverzörgerten Zusammenhängen zwischen Konzeptbereichen wurden sog. Cross-Lagged-Panel-Modelle herangezogen (umgesetzt in der Software Mplus 7.11; Muthén und Muthén 2013). Um einen ggf. vorhandenen Bias bei der Schätzung der korrelativen Zusammenhänge auf Basis von WLE-Scores (Single-Indicator Ansatz) weiter zu minimieren, wurde eine Korrektur der modellbasierten korrelativen Zusammenhänge durch eine Berücksichtigung der (Un)Reliabilität des WLE-Schätzers vorgenommen (in Anlehnung an Monseur und Adams 2009).

4 Ergebnisse

Mit Blick auf die mittleren Personenparameter pro Konzept und Messzeitpunkt, zeigt sich deskriptiv ein recht unterschiedlicher Verlauf (vgl. Abb. 2 und Tab. 1). So nehmen die Kompetenzen der Schülerinnen und Schüler im Konzeptbereich Materie offenbar stetig zu, während sie beim Konzept der Chemischen Reaktion zunächst scheinbar stagnieren und erst im Übergang von Jahrgang 11 zu 12 ansteigen. Umgekehrt steigen die Kompetenzen im Umgang mit dem Energiekonzept nur im Übergang von Jahrgang 10 zu 11 an.

Abb. 2
figure 2

Mittelwert und Standardabweichung der Personenparameter pro Konzept (rot – Chemische Reaktion; grün – Energie; blau – Materie) und Jahrgang im Längsschnitt und korrespondierende Effektstärken (Cohens d) der Zuwächse zwischen aufeinanderfolgenden Jahrgängen mit Signifikanzniveau (. nicht signifikant; *p < 0,05; **p < 0,01; ***p < 0,001)

Betrachtet man die Zuwachsraten genauer, zeigt sich, dass ein signifikanter Zuwachs in den konzeptbezogenen Kompetenzen nur vereinzelt vorliegt. So steigen die Kompetenzen im Umgang mit dem Konzept der Chemischen Reaktion signifikant nur von Jahrgang 11 zu 12 an, während die Kompetenzen im Umgang mit dem Materiekonzept signifikant in allen drei betrachteten Jahrgangsübergängen ansteigen. Beim Energiekonzept lässt sich ein signifikanter Zuwachs nur im Übergang zwischen Jahrgang 10 und 11 feststellen. Die Effektstärken der Zuwächse sind allesamt als klein zu klassifizieren (Cohen 2013).

Auf Basis von Cross-Lagged-Panel-Modellen wurde anschließend untersucht, inwieweit die Kompetenzen im Umgang mit den drei Konzepten auf Seiten der Schülerinnen und Schüler von zeitlich vorhergehenden Kompetenzständen bzgl. der drei Konzepte abhängen. Dabei wurde zunächst ein saturiertes Modell gerechnet, das Korrelationen zwischen allen latenten Variablen (d. h. alle drei Konzeptbereiche zu allen vier Messzeitpunkten) zulässt (CFI = 1, TLI = 1, RMSEA = 0, SRMR = 0; vgl. Tab. 1).

Die Korrelationskoeffizienten zwischen aufeinanderfolgenden Messzeitpunkten werden innerhalb eines Konzeptbereichs als Stabilitäten interpretiert. Die Werte liegen insgesamt in der Größenordnung von 0,24 bis 0,77, womit hinsichtlich der Stabilität der Konstrukte eher mittlere Effekte vorliegen. Während die Koeffizienten in der Höhe bei den beiden Konzeptbereichen Energie und Chemische Reaktion vergleichbar sind, liegen die Koeffizienten beim Materiekonzept mit Ausnahme des Übergangs zwischen Jahrgang 9 und 10 etwas höher.

In einem zweiten Modell wurden neben den autoregressiven Pfaden auch sog. kreuzverzögerte Effekte zwischen den Konzeptbereichen (bspw. Effekte des Kompetenzstands im Umgang mit dem Konzept Energie in Jahrgang 9 auf den Kompetenzstand im Umgang mit dem Konzept Materie in Jahrgang 10) berücksichtigt. Im Sinne des explorativen Ansatzes der vorliegenden Studie wurden keine Querpfade unterdrückt, um das Vorliegen von Querpfaden zu testen, auch wenn die Kompetenzerwartungen keine unmittelbaren inhaltlichen Bezüge zwischen einzelnen Konzeptbereichen nahelegen. Die Querpfade könnten ggfs. durch das Herstellen von Zusammenhänge zwischen den Kernideen innerhalb einer Jahrgangsstufe ebenfalls bedeutsam werden. Das Cross-Lagged-Panel-Modell zeigt eine gute Passung zu den Daten (CFI = 0,983, TLI = 0,971, RMSEA = 0,030, SRMR = 0,068; vgl. Abb. 3; Hu und Bentler 1999).

Abb. 3
figure 3

Cross-Lagged-Panel Modell der drei Konzeptbereiche Chemische Reaktion (CR), Energie (EN) und Materie (MA) über vier Messzeitpunkte T1 (Jahrgang 9) bis T4 (Jahrgang 12). Latente Variablen wurden als Single-Indicator Variablen auf Basis des Personenparameters des Partial-Credit-Modells geschätzt. Dargestellt sind signifikante standardisierte Pfadkoeffizienten (nicht-signifikante Koeffizienten in grau). Fehlerterme und Korrelationen zwischen den Variablen eines Messzeitpunkts sind der Übersichtlichkeit halber nicht dargestellt (vgl. Tab. 2)

Zwischen den ersten beiden Messzeitpunkten fällt auf, dass Kompetenzen im Konzeptbereich Materie in Jahrgang 9 (T1) den größten Einfluss auf Kompetenzen in allen drei Konzeptbereichen in Jahrgang 10 (T2) ausüben. Bei den Kompetenzen im Umgang mit dem Konzepts der Chemischen Reaktion in Jahrgang 10 ist dieser Effekt sogar größer (β = 0,38) als der autoregressive Effekt auf den Kompetenzstand des Konzepts der Chemischen Reaktion in Jahrgang 9 (β = 0,14) (χ2(1) = 6,90, p < 0,01).

Beim Übergang von Jahrgang 10 (T2) zu Jahrgang 11 (T3) verschiebt sich das Muster leicht. Während der Effekt der konzeptbezogenen Kompetenzen im Bereich Materie in Jahrgang 10 auf Kompetenzen im Bereich Chemischen Reaktion in Jahrgang 11 geringer ausfällt (β = 0,14), steigt der Einfluss dieser Kompetenzen auf Kompetenzen im Bereich Energie (β = 0,27). Beim Energiekonzept sinkt der Koeffizient des autoregressiven Pfades (von β = 0,38 zwischen T1 und T2 auf β = 0,26 zwischen T2 und T3), während die Einflüsse der beiden anderen Konzeptbereiche zunehmen. Beim Konzeptbereich Materie lässt sich wiederum eine weiterhin hohe Stabilität (β = 0,43) festhalten; der Effekt durch Kompetenzen im Bereich Chemische Reaktion (β = 0,16) ist hier deutlich geringer (χ2(1) = 6,90, p < 0,01), der Effekt durch Kompetenzen im Bereich Energie (β = 0,09) verfehlt das Signifikanzniveau.

Abgesehen von den autoregressiven Pfaden in den Konzeptbereichen Materie und Energie lassen sich beim Übergang von Jahrgang 11 (T3) zu Jahrgang 12 (T4) keine signifikanten Querpfade zwischen den Konzeptbereichen mehr feststellen. Auch der Koeffizient des autoregressiven Pfads im Konzeptbereich Chemische Reaktion verfehlt das Signifikanzniveau. Die Stabilitäten in den Konzeptbereichen Materie und Energie sind zwar signifikant, weisen in diesem letzten Übergang jedoch auch die geringsten Koeffizienten im Vergleich aller drei Jahrgangsübergänge auf.

Betrachtet man die modellbasierten, messfehlerkorrigierten Korrelationen (Monseur und Adams 2009) zwischen den Konzeptbereichen innerhalb jedes Messzeitpunkts, so fallen diese zunächst im Vergleich zwischen Jahrgang 9 (T1) und Jahrgang 10 (T2) ab, steigen jedoch dann wieder an und weisen in Jahrgang 12 (T4) die höchsten Koeffizienten auf (vgl. Tab. 2).

Tab. 2 Latente Korrelationen, korrigiert um die Reliabilität der Skalen (Monseur und Adams 2009), zwischen den drei Konzeptbereichen innerhalb jedes der vier Messzeitpunkte auf Basis des Cross-Lagged-Panel-Models

5 Diskussion

Jahrgangsübergreifende Lerngelegenheiten mit einer übergreifenden Kohärenz sollten es Schülerinnen und Schülern ermöglichen, sich über Jahre (und nicht nur über wenige Wochen oder Monate) hinweg wiederholt und koordiniert mit den zentralen Basiskonzepten auseinandersetzen. Spätere Unterrichtseinheiten sollten es aus dieser Perspektive ermöglichen, bereits erworbene konzeptbezogene Kompetenzen in einem breiten Spektrum von Kontexten, in denen diese Konzepte angewendet werden können, zu vertiefen und zu erweitern (Fortus und Krajcik 2012; Parchmann et al. 2006).

Die im Rahmen dieser Studie dargestellten Ergebnisse bestätigen nationale und insbesondere auch internationale Befunde, nach denen es Schülerinnen und Schüler eher schwer fällt, ein elaboriertes Verständnis zentraler fachlicher Konzepte aufzubauen (Herrmann-Abell und DeBoer 2017; Löfgren und Helldén 2009; Stains und Talanquer 2008). So zeigte sich auch hier, dass die Zuwächse hinsichtlich der konzeptbezogenen Kompetenzen als eher gering einzuschätzen sind. Bei den Konzepten Energie und Chemische Reaktion lassen sich zwischen Jahrgang 9 und 12 nur bei einzelnen Übergängen signifikante Zuwächse feststellen (vgl. Opitz et al. 2019), beim Materiekonzept immerhin durchgehend geringe Zuwächse zwischen den drei Übergängen (Emden et al. 2018; Hadenfeldt et al. 2016). Allein die Entwicklung eines intendierten Curriculums stellt daher erwartungsgemäß noch keine ausreichende Grundlage für dessen Umsetzung und den tatsächlichen Nachweis eines erreichten Curriculums dar.

Diese Befunde wurden ergänzt um die Analyse autoregressiver und kreuzverzögerter Effekte zwischen den drei Konzeptbereichen über die vier Messzeitpunkte. Dabei sind die autoregressiven Effekte innerhalb der drei Konzeptbereiche vergleichsweise klein (0,11 < β < 0,43; vgl. Abb. 3) und deuten in der vorliegenden Stichprobe auf eine mittlere Abhängigkeit der konzeptbezogenen Kompetenzen vom jeweilig vorhergehenden Kompetenzstand hin. Dabei gibt es zwei Auffälligkeiten: Zum einen wirkt sich der Kompetenzstand bzgl. des Materiekonzepts in Jahrgang 9 vergleichsweise stark auf den Kompetenzstand bzgl. des Konzepts der Chemischen Reaktion aus. Dies ist aus inhaltlicher Sicht gut erklärbar, da ein Verständnis des Aufbaus und der Struktur von Stoffen (und damit einhergehender Modelle und Erklärungsansätze) grundlegend ist für eine Deutung von Stoffumwandlungen (vgl. Abb. 1; Emden et al. 2018). Auch wenn die Kompetenzen im Umgang mit dem Materiekonzept im Übergang zu Jahrgang 11 dann offenbar noch einmal erweitert werden, scheint dies jedoch nicht zu einem weiteren positiven Effekt auf den Kompetenzstand bzgl. der Chemischen Reaktion in nachfolgenden Jahrgängen zu führen bzw. nur in deutlich geringerem Maße.

Die zweite Auffälligkeit ist, dass im deskriptiven Trend der Kompetenzentwicklung der Konzepte Materie und Chemische Reaktion signifikante Lernzuwächse von Jahrgang 11 zu 12 festgestellt werden konnten, die autoregressiven Effekte von Jahrgang 11 zu 12 jedoch im Längsschnittpanel (Abb. 3) hier am geringsten ausfallen (Chemische Reaktion β = 0,11; Materie β = 0,21). Für den Koeffizienten im Konzeptbereich Chemische Reaktion kann dabei nicht einmal abgesichert werden, dass sich dieser signifikant von 0 unterscheidet. Dies ließe sich dahingehend deuten, dass an dieser Stelle eher kaum eine kumulative Kompetenzentwicklung stattfindet, sondern ein „neues“ Konzept eingeführt wird, welches nur bedingt mit dem vorhergehenden Konzeptverständnis verknüpft wird. Dieser Wechsel kann verschiedene Ursachen haben. Zum einen ist dieser Übergang zwischen zwei konzeptionellen Betrachtungsweisen der chemischen Reaktion häufig der Wechsel von einer Deutung chemischer Reaktionen als Teilchenübertragung (bspw. die Protonenübertragung bei Säure-Base-Reaktionen und somit die Klassifikation von Säuren als Protonendonatoren nach Brönsted) zu einer Deutung als Elektronenübertragung zwischen den Reaktionspartnern (Säuren als Elektronenpaarakzeptoren in der Klassifikation nach Lewis) und damit der Übergang von einer funktionalen zu einer strukturellen Grundlage. Dies wird jedoch nicht mehr flächendeckend unterrichtet. Zum anderen findet eine stärkere Quantifizierung der Betrachtung chemischer Reaktionen statt und die Erweiterung um das Chemische Gleichgewicht bei Säuren und Basen. Aus rein qualitativ-anschaulichen Konzepten werden dabei mathematisierbare Konzepte. Empirische Befunde deuten an, dass dieser Übergang vielen Schülerinnen und Schülern schwer fällt (Cooper et al. 2016), wodurch letztlich eher parallele konzeptionelle Deutungen auf Seiten der Schülerinnen und Schüler entstehen und keine Kompetenzentwicklung im eigentlichen Sinne (diSessa und Sherin 1998). Dabei sind die nicht-signifikanten Querpfade im Übergang zwischen Jahrgang 11 und 12 nicht als Ausbleiben eines Lernzuwachses zu deuten (vgl. Abb. 2), sondern als Indiz, dass neben der Autoregression innerhalb der Konzeptbereiche offenbar ein hoher Kompetenzstand in einem Konzeptbereich in Jahrgang 11 nicht additiv zu einem höheren Kompetenzstand in einem anderen Konzeptbereich in Jahrgang 12 beiträgt. Gerade diese Auffälligkeiten geben jedoch wertvolle Hinweise für die Weiterentwicklung von Unterrichtsansätzen, um die intendierten Curriculumseffekte besser erreichen zu können.

Die latenten Korrelationen zwischen den Basiskonzepten innerhalb der vier Messzeitpunkte (vgl. Tab. 2) fallen zunächst im Vergleich zwischen Jahrgang 9 und Jahrgang 10 ab, steigen jedoch dann wieder an. Der Anstieg in den Zusammenhängen ließe sich als Indikator für eine zunehmende Integration der konzeptbezogenen Kompetenzen der Schülerinnen und Schüler deuten. Wahrscheinlicher ist jedoch die Annahme, dass es sich dabei um Selektionseffekte handelt. Da die Schülerinnen und Schüler ab Jahrgangsstufe 10 die Möglichkeit haben, Chemie als Unterrichtsfach abzuwählen, liegt ab Jahrgang 11 eine Positivauswahl vor, die sich hier vermutlich in konzeptübergreifend höheren Kompetenzständen und damit auch höheren Interkorrelationen niederschlägt. Dies wird durch die ansteigenden Reliabilitäten (vgl. Tab. 1) gestützt. Führt man die Analysen ausschließlich mit den Schülerinnen und Schülern durch, die von Jahrgang 9 bis 12 durchgehend Chemie belegt haben, finden sich jedoch nur minimale Abweichungen (i. d. R. in Richtung stärkerer Zusammenhänge, jedoch vorwiegend in der zweiten Nachkommastelle), so dass zumindest nicht davon auszugehen ist, dass in Abhängigkeit des Kurswahlverhaltens differenzielle Befundmuster zu erwarten sind.

Übergreifend lässt sich festhalten, dass die dargestellten Befunde die zu erwartende Diskrepanz zwischen dem intendierten und erreichten Curriculum bestätigen. Die Basiskonzepte sind ein zentrales Strukturierungselement der ländergemeinsamen Bildungsstandards für den Mittleren Schulabschluss (KMK 2004a) und der einheitlichen Prüfungsanforderungen für das Abitur (KMK 2004b). Die Fachanforderungen in Schleswig-Holstein haben diese Struktur aufgegriffen und konkretisiert. Ziel ist es damit, im Chemieunterricht über einen Zeitraum von bis zu vier Jahren größere Effekte im Sinne einer Kompetenzentwicklung und -vertiefung dieser zentralen fachlichen Konzepte zu erreichen, als es durch das nacheinander Abhandeln einzelner Themenbereiche bisher gelungen ist. Allein die Einführung curricularer Vorgaben reicht dafür jedoch nicht aus, wie bereits andere Implementationsstudien gezeigt haben. Sowohl hinsichtlich des Kompetenzzuwachses als auch hinsichtlich der Quervernetzung zwischen den drei erhobenen Konzepten liegen in der hier untersuchten Stichprobe bislang sehr geringe Effekte vor. Zudem scheint weniger eine systematische Kompetenzentwicklung aller drei Konzepte erreicht worden zu sein. Das Befundmuster deutet vielmehr an, dass in den Jahrgängen 9 bis 11 zunächst das Materiekonzept fokussiert wird, bevor in der Oberstufe das Konzept der Chemischen Reaktion die zentrale Aufmerksamkeit erhält. Das Energiekonzept scheint insgesamt kaum im Fokus des Unterrichts zu stehen. Die hohem Interkorrelationen zwischen den drei Konzepten in Jahrgangsstufe 12 sind vermutlich in erster Linie auf zunehmende Selektionseffekte zurückzuführen, da sowohl autoregressive als auch kreuzverzögerte Effekte in der Oberstufe eher abfallen bzw. ausbleiben.

6 Limitationen

Wenngleich in der Entwicklung und Zusammenstellung des Tests zahlreiche Vorkehrungen getroffen wurden, eine curricular und inhaltlich valide Interpretation der Testergebnisse sicherzustellen, muss natürlich einschränkend insbesondere auf die geringe Aufgabenanzahl hingewiesen werden. Zehn geschlossene Aufgaben wurden pro Konzeptbereich herangezogen, um das Verständnisniveau der Schülerinnen und Schüler einer Jahrgangsstufe zu erfassen (vgl. Ferber et al. 2015). Damit ging auch die Einschränkung einher, dass die konzeptbezogenen Kompetenzen nicht in der vollen Breite, wie sie die Lehrplanvorgaben formulieren, durch mehrere Aufgaben abgedeckt werden konnten. Stattdessen konnten inhaltsnahe Kompetenzen z. T. nur durch einzelne Aufgaben adressiert werden. Aufgrund der begrenzten Testzeit und der ohnehin schon aufwändigen längsschnittlichen Erhebung war es uns jedoch nicht möglich, diese Anzahl substantiell zu erhöhen, ohne eine deutliche höhere Panelmortalität zu riskieren.

Die dargestellten Befunde der Zusammenhänge zwischen den längsschnittlich erhobenen Testergebnissen wurden im Rahmen dieser Studie als Indiz gedeutet, inwieweit kohärente und kumulative Lerngelegenheiten vorliegen, die (so theoretisch angenommen) zu einem systematischen Kompetenzaufbau bzgl. der einzelnen Konzepte führen sollten. Unterrichtliche Maße, welche Lerngelegenheiten in den einzelnen Klassen tatsächlich vorlagen und inwieweit diese von den Schülerinnen und Schülern auch genutzt wurden, wurden nicht erhoben und entsprechend auch nicht in der Analyse berücksichtigt. Dies betrifft auch den Anfangsunterricht Chemie in den Jahrgangsstufen 7 bzw. 8, die im Rahmen der vorliegenden Studie nicht einbezogen wurden, so dass nicht die gesamte Entwicklung konzeptbezogener Kompetenzen vom Anfangsunterricht bis zum Abitur in den Blick genommen werden konnte.

Derartige Informationen würden eine Interpretation der erhobenen Befunde jedoch deutlich stützen und auch differentielle Unterschiede zwischen Klassen und/oder Schulen aufzeigen, die sicherlich zu erwarten sind. Eine Anbindung an den tatsächlich erteilten Unterricht und eine Berücksichtigung des Anfangsunterrichts sollten nachfolgende Untersuchungen in den Blick nehmen. Hier war eine Begleitung der Schülerinnen und Schüler über die gesamte Schulspanne im Rahmen des Projekts nicht zu bewerkstelligen, zum einen aus projektorganisatorischer Sicht durch die zeitlich begrenzte Dauer der Projektförderung, aber auch aus schulorganisatorischer Sicht, da sich die Schulen im Rahmen dieser Studie darin unterschieden, in welcher Jahrgangsstufe der Chemieunterricht einsetzt. Alle Schülerinnen und Schüler hatten am Ende der 8. Jahrgangsstufe dieselbe Anzahl Chemiestunden erteilt bekommen, allerdings verteilten sich diese Stunden durch Lücken oder Epochalunterricht je nach Schule unterschiedlich auf vorhergehende Jahrgangsstufen. Erst ab Klasse 9 liegt eine unmittelbare Vergleichbarkeit vor, so dass dieser Bruch zwischen dem Anfangsunterricht und der Jahrgangsstufe 9 im Rahmen des Projekts gewählt wurde.

Mit Blick auf die vorhandene Datenlage ließen sich die Befunde insofern auch dahingehend interpretieren, dass die in den Ergebnissen dargestellten niedrigen positiven Beziehungen zwischen den Konzeptverständnisniveaus aufeinanderfolgender Jahrgänge eigentlich gar kein Indiz für eine mangelnde unterrichtliche Kohärenz darstellen, sondern lediglich den Kompetenzzuwachs der Schülerinnen und Schüler über die Zeit abbilden. Wenn dies der Fall wäre, wäre jedoch eine sehr viel gleichförmigere Befundlage der Zusammenhänge über die Zeit und zwischen den Konzeptbereichen zu erwarten. Insbesondere die autoregressiven Pfade sollten in diesem Fall deutlich einheitlicher vorliegen, selbst bei gänzlich ausbleibenden Kompetenzzuwächsen.

7 Implikationen

Mit Blick auf das intendierte Curriculum in Form der Bildungsstandards, EPA und Lehrpläne erscheinen Monita und Implikationen auf Basis der vorgestellten Befunde nur bedingt möglich, insbesondere weil detaillierte Einblicke in das „umgesetzte Curriculum“ in Form des tatsächlich erteilten Unterrichts fehlen. Der ausschließliche Blick auf das erreichte Curriculum in Form der Kompetenzentwicklung auf Seiten der Schülerinnen und Schüler deutet jedoch an, dass Anpassungen auf den beiden „höheren“ Ebenen des umgesetzten und des intendierten Curriculums notwendig erscheinen. Die Befunde der vorliegenden Studie geben erste Hinweise für zentrale Ansatzpunkte insbesondere durch die Zusammenhänge und Trends der Konzeptentwicklungen. Mit Blick auf das ausgewiesene Ziel eines kumulativen Kompetenzaufbaus erscheint es bspw. naheliegend, die „Kumulativität“ der vorgegebenen Lernziele und Wege zu deren Erreichung deutlicher zu machen, als es in der jetzigen Form der (konzept-getrennten) Auflistung mehr oder weniger zusammenhängender Fachinhalte vorgenommen wurde. Eine explizite Ausweisung von Beziehungsgefügen, sowohl innerhalb der einzelnen Basiskonzepte als auch Verknüpfungen zwischen den vier getrennt ausgewiesenen Basiskonzepten, wäre dazu ein erster Schritt. Der Umfang der Vorgaben würde dadurch womöglich steigen (vgl. Oelkers 2006), die Zielperspektive des Aufbaus von flexiblen und anwendbaren konzeptbezogenen Kompetenzen aber womöglich deutlich stärker herausgestellt und somit Lehrkräften die Grundidee eines anhand von Basiskonzepten strukturierten Curriculums nachvollziehbarer aufzeigt werden.

Das Ausweisen dieser inhaltlichen Beziehungen im Sinne eines kumulativen Kompetenzaufbaus ist jedoch nicht trivial. Auch viele der aktuellen Lehrpläne versuchen in ihrem Aufbau kumulative Lernpfade anzudeuten (BIMI 2016), allerdings orientiert sich diese inhaltliche Strukturierung vorwiegend an der historischen Wissensgenese. „Dazu müsste geklärt werden, inwieweit die historische Entwicklung von Basiskonzepten (im Sinne ‚historischer Lernlinien der Wissenschaft‘, die auch ‚Sprünge‘ und ‚Schlingerkurse‘ aufweisen) tatsächlich mit den (individuellen) Lernlinien von Schülern übereinstimmen“ (Parchmann et al. 2006, S. 131). Entsprechend lässt sich ein kohärenter Aufbau von Lerngelegenheiten unter unterschiedlichen Perspektiven vornehmen, sei es aus historischer oder inhaltlicher Sicht (Fortus und Krajcik 2012) oder aus Sicht der Lernenden (Sikorski und Hammer 2017). Mit Blick auf die Implikationen und Effektivität unterschiedlicher Ansätze gibt es jedoch nur wenig empirische Evidenz, insb. in Form experimenteller Vergleichsstudien (Duncan und Gotwals 2015). Diese Art von Evidenz scheint jedoch zunehmend notwendig zu sein, um die notwendigen Einblicke in das Wirkungsgefüge zwischen intendiertem, umgesetztem und erreichtem Curriculum zu erlangen, um auf dieser Basis Anpassungen vorzunehmen, die ein kumulatives und kohärentes Lernen auf Seiten der Schülerinnen und Schüler unterstützen und somit zu ihrer Kompetenzentwicklung beitragen.