Einleitung – Wissenselemente für professionelles Handeln im Studium

Das an der Universität vermittelte Professionswissen stellt die Grundlage für erste Unterrichtsplanungen dar, die in Praxisphasen erprobt werden und mit denen die Entwicklung professioneller Handlungskompetenzen angebahnt wird (vgl. Kunter et al. 2011; Terhart et al. 2011). Deswegen sollte den Studierenden in der ersten Ausbildungsphase eine theoretisch fundierte und systematisch verknüpfte Wissensbasis vermittelt werden, die im Idealfall praxisrelevant ist und ihnen so die spätere berufliche Tätigkeit erleichtert (Cochran et al. 1993; Kunter et al. 2011; Terhart et al. 2011). Damit erhält die Gestaltung einer vertikal kohärenten Lehre – sprich die Vermittlung von Wissenselementen, die über verschiedene Phasen der Lehrerbiografie relevant bleiben – eine hohe Relevanz (Canrinus et al. 2017; Hammerness und Klette 2015; Muller 2009; Hellmann 2019). Denn dadurch kann Diskontinuität im Professionalisierungsprozess und dem häufig genannten Theorie-Praxis-Dilemma mit der einhergehenden Entstehung von trägem Wissen (Bromme und Tillema 1995; Bromme 1981) vorgebeugt werden (Hammerness und Klette 2015; Hellmann 2019; McQuillan et al. 2012; Muller 2009; Smeby und Heggen 2014; Terhart et al. 2011). Es ist nicht ungewöhnlich, dass Lehrpersonen über Professionswissen verfügen, von dem die Forschung annimmt, dass es für die Praxis relevant ist, dies aber von ihnen in der Praxis nicht angewendet wird (Mandl et al. 1994; Renkl 1996). So wurde der Begriff der Feiertagsdidaktik geprägt (Meyer 1991) als eine (Fach-)didaktik, der nur während der Ausbildung von Lehrpersonen eine Existenzberechtigung zuerkannt wird. Beispielsweise berichten Lehrpersonen in Studien, die alltägliche Planungsprozesse analysieren, dass didaktische Theorien zwar eine gewisse Orientierungsfunktion zu Beginn der Ausbildung haben, aber die Umsetzung in der Praxis schwierig ist (z. B. Haas 1998; Tebrügge 2001; Bromme 1981). Gerade bei der Vielzahl zu vermittelnder Kompetenzen (vgl. KMK 2018) und einer begrenzten Stundenanzahl des fachdidaktischen Studienteils, erscheint es deswegen sinnvoll, eine Fokussierung auf wichtige Wissenselemente vorzunehmen, die auch in der Praxis relevant bleiben, um so eine strukturierte und kohärente Wissensverarbeitung zu ermöglichen und dem Theorie-Praxis Dilemma vorzubeugen (Vogel 2011).

Im Bereich der Lehrer Aus- und Weiterbildung gibt es eine Bandbreite an verschiedenen Ansätzen, Wissenselemente festzulegen, von denen angenommen wird, dass sie zu professionellem Handeln führen (Brunner et al. 2006; Baumert und Kunter 2011; Erpenbeck 2009; Oser 2001). Auf der einen Seite wird für spezifische Ausprägungen von kognitiven Dispositionen (wie z. B. dem Vorhandensein von Wissenselementen aus der Trias von fachlichen, pädagogischen und fachdidaktischen Wissensbereichen) sowie für spezifische Ausprägungen von affektiven Merkmalen, wie z. B. der Motivation, normativ festgelegt, dass diese Dispositionen in einem engen Zusammenhang mit erfolgreichem Handeln im Unterricht stehen (Baumert und Kunter 2011). Durch empirische Untersuchungen werden die Annahmen über Wirkzusammenhänge dieser normativ festgelegten Dispositionen mit erfolgreichem Handeln im Unterricht überprüft. Auf der anderen Seite werden prototypische Anforderungssituationen im Lehrerberuf dahingehend analysiert, welche spezifischen Dispositionen zum erfolgreichen Handeln im Beruf benötigt werden (Oser 2001; NBPTS 2016; Kauertz und Schleicher 2019). Dabei sind prototypische Anforderungssituationen Ausschnitte aus dem professionellen Alltag einer Lehrperson und entsprechen einer deutlich abgrenzbaren Aufgabe des Lehrpersonenhandelns. Anhand dieser Anforderungssituationen können – sowohl deklarative als auch prozedurale – Wissenselemente abgeleitet werden, die nach Oser (1997) vier Kriterien erfüllen müssen, um die Grundlage für kompetentes Handeln darstellen zu können.

  1. 1.

    Das Kriterium der Theorie: Die Wissenselemente für professionelles Handeln müssen auf Theorien zur Beschreibung von Wirkungsbedingungen guter Lehr-Lernprozesse aus den verschiedenen Bezugsdisziplinen aufbauen (Fachdidaktik, Bildungswissenschaften, Sozialpsychologie, Psychologie, etc.).

  2. 2.

    Das Kriterium der Empirie: Durch empirische Untersuchungen werden theoretische Annahmen über die verschiedenen Wirkungsbedingungen bestätigt. Für relevante Wissenselemente professionellen Handelns sollten einzelne Forschungsresultate zu komplexen Annahmen der Theorie vorliegen.

  3. 3.

    Das Kriterium der Qualität: Die Theorien und damit auch die Wissenselemente sollten eine differenzierte Betrachtung von guten und schlechten Unterrichtsbedingungen ermöglichen.

  4. 4.

    Das Kriterium der Ausführbarkeit: Die Wissenselemente sollten für eine Überführung in unterrichtliches Handeln auch „in der Praxis repräsentierbar und einsetzbar sein“ (Oser 1997).

Auch wenn sich auf den ersten Blick beide Ansätze zur Identifikation von professionellem Wissen in ihrem Ausgangspunkt unterscheiden, haben sie doch Folgendes gemeinsam: Die Identifikation von Wissenselementen, deren Wirksamkeit für erfolgreiches Handeln im Unterricht anhand empirischer Analysen und Befunde über Wirkmechanismen in schulischen Lehr-Lernprozessen überprüft sind (Kriterium 1–3; Oser 1997). Lediglich das vierte Kriterium von Oser fordert darüber hinaus, dass auch Praktikerinnen und Praktiker des schulischen Alltags die aus Theorie und Empirie abgeleiteten Wissenselemente für relevant in alltäglichen Entscheidungs- und Planungsprozessen betrachten sollen. Diese Wissenselemente sollen somit den Status der „Feiertagsdidaktiken“ überwunden haben und nicht mehr das träge Wissen aus dem Studium repräsentieren (Renkl 1996; Meyer 1991).

Hier setzt dieser Beitrag an, in dem beispielhaft zur Anforderungssituation „Einschätzung von Schülerschwierigkeiten beim Umgang mit Experimentiermaterial“ Wissenselemente theoretisch und empirisch abgeleitet werden und untersucht wird, inwieweit Lehrpersonen mit Unterrichtserfahrung diese bei typischen Bewertungssituationen zur Einschätzung der Schwierigkeit von Experimentiermaterial heranziehen. Vor allem dann erscheint es sinnvoll, diese Wissenselemente als Grundbausteine für professionelles Handeln im Studium zu vermitteln.

Theoretischer Hintergrund

Wissenselemente zur Einschätzung von Schülerschwierigkeiten beim Experimentieren

Eine typische Anforderungssituation von Physik-Lehrpersonen, auf die bereits im Studium vorbereitet werden soll, ist die Diagnostik von Schwierigkeiten experimenteller Lernumgebungen (Artelt 2009; Kechel 2016; Draude 2016; KMK 2018). Eine Vermittlung von Wissenselementen erscheint für ein kompetentes Handeln in dieser Anforderungssituation insofern vielversprechend, als dass Ostermann et al. (2018) für den Mathematikunterricht bereits zeigen konnte, dass Lehrpersonen, denen fachdidaktisches Wissen über Schülerschwierigkeiten vermittelt wird, bessere Einschätzungen von Aufgabenschwierigkeiten vornehmen konnten. Für experimentelle Lernumgebungen muss neben der Einschätzung der gegebenen Aufgabenstellung zusätzlich das Experimentiermaterial einbezogen werden, mit dem die Aufgabenstellungen bearbeitet werden. Die hierbei zu vermittelnden Wissenselemente können gemäß allgemeiner Strukturierungen des theoretischen physikdidaktischen Wissens für den deutschsprachigen Raum (Gramzow et al. 2013; Sorge et al. 2017; Tepner et al. 2012; Kirschner 2014) als Vernetzung von fachdidaktischen Wissenselementen aus den Bereichen Schülerschwierigkeiten, Aufgaben und dem Einsatz von Experimenten eingeordnet werden – also in Summe fachdidaktische Wissenselemente zur Einschätzung von Schülerschwierigkeiten beim Experimentieren (vgl. auch Riese 2009). Im vorliegenden Beitrag werden deswegen relevant erscheinende Wissenselemente zur Einschätzung von Schülerschwierigkeiten beim Experimentieren herausgearbeitet, die das Kriterium der Theorie (1), der Empirie (2) und der Qualität (3) erfüllen. Daran anschließend wird untersucht, inwieweit diese Wissenselemente von Lehrpersonen mit Unterrichtserfahrung zur Einschätzung der Schwierigkeit von experimentellen Lerngelegenheiten herangezogen werden und damit auch das Kriterium der Ausführbarkeit (4) erfüllen. Damit wären sie als relevante Wissenselemente für professionelles Handeln im Bereich der Diagnose von Schwierigkeiten beim Experimentieren identifiziert, die bereits im Studium vermittelt werden könnten.

Theoretische und empirische Ableitung von Wissenselementen

Durch eine lange Tradition der Untersuchung von Schülerschwierigkeiten im naturwissenschaftlichen Unterricht kann für die Identifikation von relevanten Wissenselementen zur Einschätzung von Schülerschwierigkeiten beim Experimentieren bereits auf einige Klassifizierungen von Ursachen für Schülerschwierigkeiten zurückgegriffen werden (Groß 2013; Gut-Glanzmann 2012; Hopf 2007; Jong und van Joolingen 1998; Jung et al. 1977; Kechel 2016; Wiesner 1992). Die neueste Unterteilung von Kechel (2016) unterscheidet zwischen endogenen und exogenen Bedingungsfaktoren. Unter endogenen Bedingungsfaktoren werden Lernschwierigkeiten verstanden, die bei der Aufnahme und Verarbeitung von Informationen im Lernenden selbst liegen. Unter exogenen Bedingungsfaktoren werden sowohl sachbedingte Lernschwierigkeiten, die sich durch den Lerngegenstand selbst begründen, wie zum Beispiel seine Abstraktheit (Gut-Glanzmann 2012; Wodzinski 2006) als auch lehrbedingte Lernschwierigkeiten, die durch fach- oder unterrichtsmethodische Maßnahmen entstehen (Wodzinski 2006), verstanden.

Eine von Kechel (2016) vorgenommene Zuordnung von Lernschwierigkeiten zeigt, dass eine umfangreiche Zusammenstellung von endogenen Bedingungsfaktoren bereits vorliegt. Hierunter fallen zum Beispiel fehlende mathematische Fähigkeiten und physikalisches Vorwissen, mangelndes Interesse an Physik oder mangelnde Konzentrationsfähigkeit. Draude (2016) zeigte bereits, dass auch Lehrpersonen mathematische Fähigkeiten und mangelndes Interesse als schwierigkeitserzeugende Faktoren bei einer Einschätzung der Schwierigkeit eines Experimentes zum Hook’schen Gesetz nannten. So konnte Draude (2016) für diese spezifischen Merkmale und für dieses spezifische Experiment bereits nachweisen, dass sie allen vier Kriterien von Oser genügen und damit als Wissenselemente im Studium vermittelt werden sollten.

Auf der Seite der exogenen Bedingungsfaktoren können mindestens zwei Aspekte die Schwierigkeit einer experimentellen Lernumgebung ausmachen und sich teilweise gegenseitig bedingen: Die experimentelle Aufgabenstellung und das verwendete Experimentiermaterial. So hängt z. B. die Offenheit und damit ein Merkmal, das Schwierigkeit erzeugt, nicht nur von der Aufgabenstellung, sondern auch von dem konkreten Experimentiermaterial ab (z. B. Priemer 2011; Dreyfus 1986).

Für die Einschätzung der Schwierigkeit von Aufgabenstellungen haben bereits einige Klassifizierungen von Merkmalen für Aufgabenstellungen Einzug in fachdidaktische Lehrbücher erhalten (Kauertz et al. 2015; Wiesner et al. 2011) und wurden damit zum anerkannten Kanon theoretischen fachdidaktischen Wissens über den Einsatz von Aufgaben im Physikunterricht. So kann die Schwierigkeit einer experimentellen Aufgabenstellung z. B. anhand von kognitiven Prozessen, der geforderten Fähigkeiten verschiedener Kompetenzfacetten und der Komplexität eingeschätzt werden (Trendel und Lübeck 2018).

Die Schwierigkeit einer experimentellen Lernumgebung kann aber auch durch das verwendete Experimentiermaterial bedingt sein. Dieses birgt spezifische Schwierigkeiten wie zum Beispiel die Anzahl und Art zu berücksichtigender Variablen (Arnold et al. 2013; Croker und Buchanan 2011; Hammann et al. 2006; Ross 1988). Gibt das Experimentiermaterial die Operationalisierungen einer Variablen nicht direkt vor, erhöht das außerdem den Anspruch des Experimentierens (Arnold et al. 2013). In diesem Beitrag sollen zunächst Merkmale zur Einschätzung der Schwierigkeit, die durch die Auswahl von Experimentiermaterialien hervorgerufen werden, vorgestellt werden, die aus empirischen Befunden und theoretischen Überlegungen abgeleitet wurden. Diese Merkmale erfüllen zunächst Osers (1997) Kriterium der Theorie (1), der Empirie (2) und der Qualität (3). Daran anschließend wird empirisch untersucht, inwieweit diese Wissenselemente auch von Lehrpersonen zur Einschätzung der Schwierigkeit von Experimentiermaterialien herangezogen werden und damit auch das Kriterium der Ausführbarkeit (4) erfüllen. Die somit als theoretisch fachdidaktische Wissenselemente zur Einschätzung der Schwierigkeit von Experimentiermaterialien im Studium vermittelt werden können, die über verschiedene Phasen der Lehrerbiografie hinweg relevant bleiben.

Materialbedingte Merkmale zur Einschätzung der Schwierigkeit von Experimenten

Zur Identifikation von Merkmalen, die den Umgang mit dem Experimentiermaterial erschweren, wurde eine ausführliche Literaturrecherche durchgeführt. Neben Studien zum praktischen Experimentieren (z. B. Gut-Glanzmann 2012; Doran et al. 1995; Gott und Duggan 1996; Stecher et al. 2000) wurden auch Studien zum computergestützten Experimentieren (z. B. Bergey et al. 2015; Gößling 2011; Künsting et al. 2008) und Studien zu Experimentieraufgaben, welche als komplexes Problemlösen (z. B. Mulder et al. 2010; Stemmann 2016; Vollmeyer 1996) aufgefasst werden, einbezogen. Außerdem werden auch theoretische Betrachtungen ohne empirische Überprüfung aufgenommen (z. B. Dreyfus 1986). Neben exogenen Faktoren werden auch diejenigen endogenen Faktoren berücksichtigt, die sich unmittelbar mit der Materialseite in Beziehung setzen lassen.

Häufig werden Experimente dazu eingesetzt, den Zusammenhang zwischen einer unabhängigen und einer abhängigen Variablen zu untersuchen und dabei eventuell vorhandene Kontrollvariablen zu berücksichtigen. Lernende gehen aber nur unsystematisch mit Variablen um und die Umsetzung der Variablenkontrollstrategie stellt für sie eine große Herausforderung dar (Arnold et al. 2013; Croker und Buchanan 2011; Hammann et al. 2006; Ross 1988; Gott und Duggan 1996). Abhängige und unabhängige Variablen werden erkannt, aber nicht hinreichend spezifiziert. Konfundierende Variablen werden bei der Planung von Untersuchungen gar nicht oder nur unspezifisch berücksichtigt. So fanden Arnold et al. (2013), dass Oberstufenschülerinnen und -schüler Defizite im Bereich konfundierter Variablen zeigen, wohl aber in der Lage sind, unabhängige Variablen zu verändern und abhängige Variablen zu beobachten. Sowohl Croker und Buchanan (2011) als auch Berge (1990) konnten zeigen, dass das Vorwissen über relevante Variablen eine entscheidende Rolle spielt, ob geeignete, variablenkontrollierte Experimente durchgeführt wurden. Hammann et al. (2006) beschreibt ebenfalls, dass nur wenige Schülerinnen und Schüler in der Lage sind, konfundierte Experimente zu erkennen und Schwierigkeiten haben, die abhängige und unabhängige Variable zu variieren, wodurch auch bei der Datenauswertung nicht von kausalen Interpretationen ausgegangen werden kann. Dies ist deswegen problematisch, da der Effekt einer fehlenden Fähigkeit zur Variablenkontrolle für einen erfolgreichen Umgang mit dem Experiment bereits nachgewiesen ist (Chen und Klahr 1999; Vollmeyer 1996; Vollmeyer und Rheinberg 1998; Greiff et al. 2014; Stemmann 2016). Darüber hinaus haben Studien gezeigt, dass die Fähigkeit zur Variablenkontrolle ein signifikanter Prädiktor in Bezug auf den Wissenserwerb ist (Künsting 2007; Künsting et al. 2008; McElhaney 2011; Stender et al. 2018). Eine Möglichkeit, die Einflüsse der Variablenkontrollstrategie zu minimieren, wäre, die Anzahl der Variablen zu reduzieren. Dann hätte das Fehlen einer Variablenkontrollstrategie weniger Auswirkungen auf das erfolgreiche Experimentieren. Zusätzlich kann die Art der Variablen einen Einfluss auf die Schwierigkeit haben: Handelt es sich um eine Basisgröße (z. B. Masse), die direkt gemessen werden kann, oder um eine Größe, die erst durch Berechnungen abgeleitet wird (z. B. Dichte), beziehungsweise ist die Variable für Lernende quantifizierbar (z. B. Länge) oder handelt es sich um kategoriale Variablen (z. B. Material)? Damit hängt zusätzlich zusammen, ob man die Variable visuell wahrnehmen kann. Hier fließt die theoretische Annahme mit ein, dass Variablen einfacher zu kontrollieren sind, wenn man sie einfacher wahrnehmen kann (Dreyfus 1986). Sowohl für die Anzahl der Zusammenhänge zwischen den Variablen als auch die Anzahl irrelevanter unabhängiger Variablen, wurde in mehreren Studien ein Einfluss auf die Schwierigkeit einer Aufgabe nachgewiesen (Greiff et al. 2014; Stadler et al. 2016; Stemmann 2016). Kluge (2008) kontrastierte „einfache“ und „schwere“ Experimentiersituationen gegeneinander, die sich in der Art der Zusammenhänge unterschieden (direkte/indirekte Zusammenhänge; Feedback Loops; Eigendynamiken) und konnte einen Effekt auf den Lernzuwachs nachweisen. Greiff et al. (2014) konnten aufbauend auf diesem Befund differenzierter nachweisen, dass ein indirekter Zusammenhang in einer Aufgabe das Lernen erschwert. Hiervon kann abgeleitet werden, dass neben der Anzahl der Zusammenhänge auch die Art der Zusammenhänge zwischen den Variablen relevant ist.

Offenheit wird als ein relevantes Merkmal für die Gestaltung von physikalischen Aufgaben betrachtet (Wodzinski 2007). Der Grad der Offenheit kann durch die Anzahl der Lösungswege operationalisiert werden (Kauertz et al. 2015). Gut-Glanzmann (2012) und Priemer (2011) beziehen diese Beschreibungen auf das Experimentieren und sie argumentieren, dass Experimente, die mehrere Lösungswege zulassen, eine höhere Lösungswahrscheinlichkeit haben, da mehrere Lösungswege als richtig gelten. Die Offenheit kann nicht nur durch die Anzahl der Lösungswege charakterisiert werden, sondern auch durch die Anzahl der möglichen Lösungen (Gut-Glanzmann 2012). Können mehrere Lösungen als richtig angenommen werden, ist das Ziel offener gestaltet und auch hier die Wahrscheinlichkeit, eine richtige Lösung zu erhalten, größer. Priemer (2011) beschreibt dabei ohne empirische Prüfung Möglichkeiten, Experimente anhand dieser Merkmale offen zu gestalten. Müssen für die richtige Lösung mehrere Lösungsschritte abgearbeitet werden, so birgt jeder einzelne dieser Schritte die Option Fehler zu begehen. Der Einfluss der Anzahl an Lösungsschritten auf das erfolgreiche Lösen von Problemsituationen (Berg et al. 2010; Kaller et al. 2011) und auf das erfolgreiche physikalische Experimentieren konnte bereits gezeigt werden (Franz et al. 2015). Müssen die Lernenden für die Lösung eigenständige Operationalisierungen einer Variablen finden, die sie untersuchen sollen, so erhöht dies den Anspruch des Experimentierens (Arnold et al. 2013). Sind diese gefunden, so stellen schwierige und exakte Messungen dieser Variablen Lernende vor höhere Anforderungen beim Experimentieren (Gut-Glanzmann 2012). Damit kann die Messbarkeit einer Variablen das Experimentieren erschweren. Dies deutet sich auch in einer qualitativen Studie von Kechel (2016) an, der Schwierigkeiten von Lernenden beim praktischen Experimentieren zum Hooke’schen Gesetz analysiert hat. In dieser Studie fällt Lernenden zum Beispiel das genaue Ablesen von Zollstöcken schwer und wurde nicht sachgerecht durchgeführt (Kechel 2016). Müssen die ermittelten Daten ausgewertet werden, so kann die Interpretation des Ausgangs des Experimentes bei einem qualitativen Experiment einfacher sein als die Quantifizierung eines Zusammenhangs mit mathematischen Werkzeugen. Dementsprechend kann auch die Art der Auswertung die Schwierigkeit beeinflussen.

Dreyfus (1986) leitet für die Chemie theoretisch ab, dass die Vertrautheit der Lernenden mit der Funktionsweise und Anwendung der Geräte die Schwierigkeit von Experimentiermaterial beeinflussen kann. Gut-Glanzmann (2012) greift diese Annahme auf und setzt sie in Beziehung mit der Struktur und der Übersichtlichkeit einer Aufgabe bzw. eines Materials, um ein zielführendes Experimentieren zu erleichtern. Ist die Funktionsweise des Materials aufgrund von Vertrautheit oder guter Übersichtlichkeit einfach erschließbar, so scheint dies das Experimentieren zu vereinfachen. Zusätzlich konnten Stemmann und Lang (2016) für technische Gerätschaften nachweisen, dass die Anzahl der Bedienelemente und damit die Einstellungsoptionen eines Geräts den Umgang mit dem Gerät erschweren. Die Passung der Experimentiermaterialien zueinander kann ebenfalls einen Effekt haben. Ist beispielsweise der zur Verfügung stehende Messbereich eines Messgeräts nicht sensitiv genug, um kleine Veränderungen in der abhängigen Variablen präzise genug zu messen, kann dies einen Einfluss darauf haben, ob die Messwerte einfach oder schwierig zu interpretieren sind. Steht zusätzlich mehr Experimentiermaterial zur Verfügung als benötigt wird, entsteht Offenheit. Gut-Glanzmann (2012) argumentiert zwar, dass durch Offenheit eine größere Anzahl an Lösungswegen und Lösungen möglich sein kann und damit das Experimentieren erleichtert wird, allerdings eignet sich gemäß des Merkmals Passung der Experimentiermaterialien nicht jede Kombination von Experimentiermaterial gleich gut, um einen deutlichen Effekt zu erzeugen. Dies verengt trotz der Offenheit den Lösungsraum und beschränkt die Auswahl auf wenige sinnvolle Experimentiermaterialien. Müssen Lernende bei einer Auswahl von Materialien selbst darauf achten, die geeignetsten Materialien auszuwählen, so birgt dies mögliche Fehler und erschwert das Experimentieren. Mehr Wahlmöglichkeiten zwischen Experimentiermaterialien erschweren demnach das Experimentieren. Darüber hinaus scheint der händische Anspruch für den Aufbau und die Durchführung eines Experimentes eine Rolle zu spielen. So zeigt Kechel (2016) für ein Experiment zum Hooke’schen Gesetz, dass Lernende nicht in der Lage waren, mit Tischklemmen umzugehen. Was den konkreten händischen Anspruch bei einem Experiment konstituiert, ist zwar experimentspezifisch, trotzdem lässt sich das Merkmal auf unterschiedliche Experimente übertragen. Wenn Lernende mit Materialien arbeiten, so müssen sie jedem Material eine Bedeutung für das Experiment zuordnen und die Funktionsweise erkennen. Je größer die Anzahl der zu verwendenden Materialien ist, desto komplexer wird dieser Verarbeitungsprozess und Fehler bei der Zuordnung können entstehen. Tesch (2005) und auch Börlin (2012) unterscheiden zur Klassifizierung von Experimenten zwischen Alltags- und Experimentiermaterial, das von Lehrmittelfirmen hergestellt wird. Zum einen sollen moderne Lernmaterialien, und damit auch Experimente, an die Lebenswelt der Lernenden anknüpfen (vgl. Möller 2010). Dies kann mit Experimentiermaterialien aus dem Alltag der Lernenden erreicht werden. Allerdings kann bei Verwendung von Alltagsmaterialien auch der Ausgang des Experimentes von zu vielen Einflussfaktoren abhängen, so dass das Lernen erschwert wird. Dementsprechend lässt sich für das Merkmal Alltag/Lehrmittel nicht ableiten, welche Art des Experimentiermaterials das Experimentieren erleichtert. Zusätzlich kann die Art der Anzeige die Anforderungen variieren, die eine präzise Messung mit sich bringt. Bei analogen Anzeigen ist exaktes Ablesen erforderlich, bei digitalen Anzeigen kann ein vermeintlich präziser Wert einfach abgelesen werden.

Diese Zusammenstellung von empirischen Befunden und theoretischen Überlegungen zeigt eine Vielzahl von materialbedingten Merkmalen zur Einschätzung der Schwierigkeit von Experimenten. Die Merkmale erfüllen Osers (1997) Kriterien der Theorie (1), der Empirie (2) und der Qualität (3). Damit sie aber als praxisrelevante fachdidaktische Wissenselemente zur Einschätzung der Schwierigkeit von Experimentiermaterialien gelten können, müssen sie auch das Kriterium der Ausführbarkeit (4) erfüllen. Denn nur Merkmale, die alle vier Kriterien erfüllen, können als relevant für den späteren beruflichen Alltag betrachtet werden. Eine Übersicht der einzelnen Merkmale findet sich in Tab. 2.

Forschungsfragen

Eine begründete Auswahl von Wissenselementen, die über mehrere Phasen der Lehrerbildung relevant bleiben und die zu professionellem Handeln führen, erscheint aufgrund einer begrenzten Stundenanzahl des fachdidaktischen Studienanteils notwendig. Hierzu können Wissenselemente anhand von Anforderungssituationen abgeleitet werden, von denen angenommen wird, dass sie notwendig für ein erfolgreiches Handeln in der Anforderungssituation sind (z. B. Oser und Oelkers 2001; Kauertz und Schleicher 2019). Am Beispiel der Anforderungssituation „Einschätzung von Schülerschwierigkeiten beim Experimentieren“ wurden basierend auf einer umfangreichen Literaturrecherche empirischer Befunde und theoretischer Überlegungen Merkmale von Experimentiermaterialien als Bedingungsfaktoren für Schülerschwierigkeiten herausgearbeitet. Diese materialbedingten Merkmale sind theoriebasiert, empirisch überprüft und ermöglichen eine differenzierte Betrachtung der Schwierigkeit von Experimentiermaterial und erfüllen damit drei der vier von Oser (1997) festgelegten Kriterien für Wissenselemente professionellen Handelns. Ob das letzte Kriterium der Ausführbarkeit in der Praxis für diese Merkmale erfüllt ist, ist derzeit noch unklar. Dieses Kriterium wäre dann erfüllt, wenn die theoretisch abgeleiteten materialbedingten Merkmale überwiegend diejenigen Merkmale repräsentieren, die auch für Praktikerinnen und Praktikern bei Bewertungen von Schwierigkeiten konkreter Experimentiermaterialien relevant sind. Deswegen sollen im Rahmen dieses Beitrages folgende Fragestellungen untersucht werden:

Forschungsfrage 1

Welchen relativen Anteil der genannten Merkmale nehmen die aus der fachdidaktischen Literatur abgeleiteten materialbedingten Merkmale bei der Bewertung der Schwierigkeit von Experimentiermaterialien durch Praktikerinnen und Praktikern ein?

Werden häufig theoretisch abgeleitete materialbedingte Merkmale von Praktikerinnen und Praktikern zur Bewertung herangezogen, so spricht dies für eine hohe Praxisrelevanz. Trotzdem könnten einige dieser Merkmale nur in vereinzelten Bewertungssituationen relevant sein, wohingegen andere Merkmale über verschiedene Bewertungssituationen hinweg häufiger herangezogen werden. Zweiterer Fall würde aufgrund der Generalisierbarkeit dieser Merkmale über Bewertungssituationen hinweg für eine höhere Relevanz und damit Ausführbarkeit dieser Merkmale in der Praxis im Sinne des vierten Kriteriums von Oser sprechen. Inwieweit dies zutrifft, wird mit folgender Forschungsfrage untersucht:

Forschungsfrage 2

Welche Merkmale werden über verschiedene Bewertungssituationen hinweg häufiger zur Bewertung der Schwierigkeit von Experimentiermaterialien von Praktikerinnen und Praktikern herangezogen?

Methode

Zur Beantwortung der Forschungsfragen wurde eine Online-Befragung mit Lehrpersonen durchgeführt. Im Folgenden werden die Stichprobe, der eingesetzte Fragebogen sowie die Vorgehensweise zur Datenanalyse dargestellt.

Stichprobe

Für die Teilnahme an der Befragung wurden E‑Mails mit der Bitte, diese an Physiklehrpersonen weiterzuleiten, an Gymnasien und Gesamtschulen in NRW versendet. Insgesamt haben 101 Physiklehrpersonen den Fragebogen vollständig und 22 Physiklehrpersonen teilweise ausgefüllt. Die Lehrpersonen haben durchschnittlich 12,8 Jahre Physikunterricht erteilt (SD = 9,6). Ihnen wurde mitgeteilt, dass die Befragung ca. 45 min in Anspruch nimmt und anonym durchgeführt wird. Als Incentive wurden unter allen teilnehmenden Personen Amazon-Gutscheine im Gesamtwert von 1000 € (5 × 100 €; 10 × 50 €) verlost.

Online-Fragebogen

Im Rahmen dieser Studie wird untersucht, inwieweit theoretisch und empirisch abgeleitete materialspezifische Merkmale zur Einschätzung von Schwierigkeiten der Lernenden beim Umgang mit dem Experimentiermaterial auch von Lehrpersonen bei spezifischen Bewertungssituationen herangezogen werden.

Der Online-Fragebogen bestand aus zwei Teilen. Die Lehrpersonen wurden im ersten Teil mit offenem Antwortformat gefragt „[a]nhand welcher Kriterien [sie einschätzen], ob ein Experiment schwierig ist oder nicht“, um so einerseits den bestehenden Merkmalskatalog mit diesen Antworten abzugleichen und andererseits den Merkmalskatalog um weitere Merkmale von Praktikerinnen und Praktikern zu ergänzen. Im Sinne einer qualitativen Inhaltsanalyse wurde ein Kategoriensystem entwickelt, das sowohl Merkmale, die durch die Literaturrecherche identifiziert wurden, als auch Merkmale, die von Praktikerinnen und Praktikern genannt wurden, umfasst (Mayring 2015).

Im zweiten Teil des Fragebogens sollten Lehrpersonen für 21 Experimente entscheiden, welche Variante eines Experimentes sie für schwieriger halten. Um sicherzustellen, dass alle Lehrpersonen die entsprechenden Themenfelder unterrichten, wurden die Experimente anhand einer Sichtung der Lehrpläne und Schulbücher der verschiedenen Schulformen in NRW curricular valide zum Inhaltsfeld Mechanik auf Niveau der Sekundarstufe 1 mit dem Fokus auf die Themenfelder Auftrieb, Hooke’sches Gesetz, schiefe Ebene, Dichte und Flaschenzug entwickelt. Die Breite der Themenfelder soll eine Generalisierbarkeit der Befunde über mehr als ein Experiment hinweg ermöglichen (vgl. FF2). In Abb. 1 findet sich eine Bewertungssituation, bei der die Anzahl der Kontrollvariablen verändert wurde.

Abb. 1
figure 1

Beispielhafte Darstellung einer Bewertungssituation für ein Experiment zum Hooke’schen Gesetz

Bei jeder Bewertungssituation wurde den Lehrpersonen eine konkrete physikalische Fragestellung mit den zu untersuchenden physikalischen Variablen vorgegeben. Zusätzlich wurde Material festgelegt, das in beiden Varianten des Experimentes genutzt werden soll. Die Varianten der Experimente wurden so konstruiert, dass sie sich mindestens hinsichtlich eines Merkmals aus dem Merkmalskatalog unterscheiden. Eine Übersicht, welche Merkmale impliziert wurden, findet sich in Tab. 1. Damit konnte von den Lehrpersonen mindestens ein Merkmal als Unterschied zwischen den Optionen für die Einschätzung herangezogen werden. Die Lehrpersonen sollten in einem geschlossenen Antwortformat zunächst angeben, welche Variante des Experiments sie für schwieriger halten. Eine Begründung dafür sollte in einem darauffolgenden offenen Antwortfeld gegeben werden. Diese Antworten wurden mit Hilfe des im ersten Analyseschritt entwickelten Kategoriensystems kategorisiert.

Tab. 1 Überblick über die veränderten Merkmale in den einzelnen Bewertungssituationen

Statistische Verfahren

Mit den so ermittelten Daten wurde analysiert, wie häufig Lehrpersonen materialbedingte Merkmale, die basierend auf einer Literaturrecherche hergleitet wurden, zur Einschätzung der Schwierigkeit heranziehen. Ein geringer Anteil von theoretisch abgeleiteten materialbedingten Merkmalen spräche dafür, dass theoretisch abgeleitete materialbedingte Merkmale bei Einschätzungen von Praktikerinnen und Praktikern in konkreten Bewertungssituationen nur eine geringe Relevanz hätten (Forschungsfrage 1). Per Konstruktion der Bewertungssituationen ist allerdings denkbar, dass die relative Häufigkeit der Nennung von theoretisch abgeleiteten materialbedingten Merkmalen stark an den Vergleich der zwei Versionen von Experimentiermaterial gebunden ist. Deswegen wurde mit logistischen Regressionsanalysen (Agresti 2007; Field et al. 2012) überprüft, ob allein diese Konfundierung statistisch dazu führt, dass Lehrpersonen bei spezifischen Situationen häufiger theoretisch abgeleitete materialbedingte Merkmale nennen. Als abhängige Variable wurde dichotom zwischen theoretisch abgeleiteten materialbedingten Merkmalen und den übrigen Merkmalen unterschieden. Als unabhängige Variablen wurden drei Variablen berücksichtigt: Die Variable Bewertungssituation, die angibt zu welcher Bewertungssituation das genannte Merkmal gehört, die Variable impliziert, die angibt, ob das genannte Merkmal in der jeweiligen Bewertungssituation impliziert wurde und die Variable Lehrperson, die angibt, welche Lehrperson das Merkmal genannt hat. Die Variablen gingen 0/1 (für die Variabel „impliziert“) bzw. dummy-kodiert (für die Variable „Bewertungssituation“ und „Lehrperson“) in die Analyse ein. Damit wird analysiert, inwieweit die Häufigkeit der Nennung von theoretisch abgeleiteten Merkmalen durch spezifische Bewertungssituationen, durch die Implikation von Merkmalen oder durch einzelne Lehrpersonen beeinflusst wird.

Inwieweit spezifische Bewertungssituationen einzelne Merkmale triggern, wurde mit Hilfe von Kontingenztabellen analysiert. So wurde analysiert, ob Merkmale über verschiedene Experimentiersituationen hinweg häufiger zur Einschätzung von Praktikerinnen und Praktikern herangezogen und damit eine generalisierbare Relevanz dieser Merkmale angenommen werden kann (Forschungsfrage 2).

Ergebnisse

Erster Analyseschritt – Entwicklung eines Kategoriensystem zur Erfassung von endogenen und exogenen Merkmalen

Zur Analyse, welche theoretisch abgeleiteten materialbedingten Merkmale von Lehrpersonen als Kriterien zur Einschätzung der Schwierigkeit von Experimentiermaterial losgelöst von einer konkreten Bewertungssituation genannt wurden, wurden die Antworten zur Frage „Anhand welcher Kriterien schätzen Sie ein, ob ein Experiment schwierig ist oder nicht?“ herangezogen. Hierzu wurde das Ablaufmodell induktiver Kategorienbildung nach Mayring (2015) beachtet und eine strukturierte Zusammenfassung der Antworten vorgenommen und damit induktiv Merkmale abgeleitet, die von Lehrpersonen genannt wurden. Die so induktiv abgeleiteten Merkmale wurden mit den theoretisch abgeleiteten Merkmalen abgeglichen und in einem kollektiven Austausch entschieden, inwieweit diese Merkmale inhaltlich deckungsgleich sind.

Der in Tab. 2 dargestellte Merkmalskatalog enthält neben theoretisch abgeleiteten materialbedingten Merkmalen (gekennzeichnet mit b) auch materialbedingte Merkmale, die nicht theoretisch abgeleitet wurden, aber von den Lehrpersonen genannt wurden und der Kategorie materialbedingt zugeordnet wurden. Neben diesen Merkmalen nannten Lehrpersonen auch Merkmale, die nicht den materialbedingten Merkmalen zugeordnet werden können. Diese ergänzen bzw. unterstützen aber bereits gefundene Merkmale aus anderen Studien (vgl. Kechel 2016). Diese Merkmale sind in Tab. 3 zusammengefasst.

Tab. 2 Ergänzter Merkmalskatalog
Tab. 3 Innen‑/ Lehr-/ und Sachbedingte Merkmale zur Klassifizierung der Schwierigkeit von Experimenten

Durch diesen Analyseschritt entstand ein Kategoriensystem, das sowohl die durch das Literaturreview abgeleiteten materialbedingten Merkmale als auch die Merkmale enthält, die nur von Lehrpersonen genannt wurden (vgl. Tab. 2 und 3).

Zweiter Analyseschritt – Praxisrelevante Merkmale für konkrete Bewertungssituationen

Mit Hilfe dieses Kategoriensystems wurden die von Lehrpersonen in den 21 konkreten Bewertungssituationen angegebenen Begründungen klassifiziert. Dabei wurden die gegebenen Begründungen in Sinnabschnitte gegliedert und jede Situation bezüglich des Auftretens aller Merkmale bewertet. Diese Bewertung wurde dichotom vorgenommen, entsprechend ob das jeweilige Merkmal genannt wurde oder nicht genannt wurde. Zur Überprüfung der Objektivität der Klassifizierung der Merkmale wurde eine Doppelkodierung von 152 Lehrerantworten (7,2 % des Datensatzes), die gleichmäßig verteilt über die 21 Bewertungssituationen zufällig gezogen wurden, durchgeführt. Zur Berechnung der Interraterreliabilität wurden Kappa und die mittlere prozentuale Übereinstimmung berechnet. Allerdings setzt Kappa für eine sinnvolle Interpretation zusätzlich voraus, dass Subkategorien von allen Beobachtern gewählt werden – es müssen homogene Randverteilungen vorliegen, da sonst trotz hoher prozentualer Übereinstimmungen niedrige Werte von Kappa auftreten oder Kappa nicht berechenbar ist (Gwet 2014; Wirtz und Caspar 2002). Für einige Kategorien liegen keine homogenen Randverteilungen vor (vgl. Tab. 2 und 3). Deswegen wurde als Alternative das robustere Gwets AC1 berechnet (Gwet 2014). Bei der Einteilung in Sinneinheiten konnte für die Anzahl von Sinneinheiten je Lehrerantwort eine Übereinstimmung von \(\mathit{\kappa }appa=0{,}68\); (prozentuale Übereinstimmung = 80 %; Gwet’ AC1 = 0,77) erreicht werden. Bei Differenzen lag bis auf zwei Fälle eine Abweichung um nur eine Sinneinheit vor, sodass angenommen werden kann, dass die Anzahl an Sinneinheiten je Antwort reliabel eingeschätzt werden kann. Tab. 3 zeigt die Übereinstimmung für die Güte der Kodierung der Nennung einzelner Merkmale von 121 der 152 Lehrerantworten, bei denen die Anzahl der Sinneinheiten von zwei Kodierern gleich eingeschätzt wurden. Insgesamt ergibt sich ein mittleres Kappa von \(\overline{\kappa }=0{,}79\) \((sd=0{,}19)\), eine mittlere prozentuale Übereinstimmung \(\overline{\mathrm{\varnothing }}=98{,}23\) \((sd=2{,}07)\) und ein mittleres Gwets AC1 \((AC_{1}=0{,}98)\) \((sd=0{,}03)\). Dementsprechend kann angenommen werden, dass bei gleicher Einteilung von Sinneinheiten die Sinneinheiten den einzelnen Merkmalen überwiegend übereinstimmend zugeordnet werden konnten. In den Fällen, in denen keine Übereinstimmung zu den Sinneinheiten bzw. Kategorien vorlag, wurde im Nachgang gemeinsam eine Einteilung in Sinneinheiten und eine Zuordnung zu den Kategorien vorgenommen.

Dritter Analyseschritt – Analyse der Häufigkeit der Nennungen von theoretisch abgeleiteten materialbedingten Merkmalen bei konkreten Bewertungssituationen

Zunächst wurde zur Beantwortung der ersten Forschungsfrage über relative Häufigkeiten analysiert, welchen Anteil die aus der fachdidaktischen Literatur abgeleiteten materialbedingten Merkmale bei der Einschätzung der Schwierigkeit von Experimentiermaterialien durch Praktikerinnen und Praktikern einnehmen. Die relative Häufigkeit der Nennung von theoretisch abgeleiteten materialbedingten Merkmalen liegt über alle Bewertungssituationen hinweg bei 0,66. Bei fast allen Bewertungssituationen liegt die relative Häufigkeit der Nennung der Merkmale über 0,5. Einzige Ausnahme ist die Bewertungssituation Auftrieb1 (vgl. Abb. 2).

Abb. 2
figure 2

Relative Häufigkeit der Nennung von theoretisch abgeleiteten materialbedingten Merkmalen je Bewertungssituation

Mit einer logistischen Regressionsanalyse wurden folgende mögliche Konfundierungen für die in Abb. 2 dargestellten Häufigkeitsverteilungen untersucht. Die Nennung von theoretisch abgeleiteten Merkmalen könnte damit zusammenhängen, dass die in den jeweiligen Bewertungssituationen implizierten Merkmale die Nennung theoretisch abgeleiteter Merkmale stärker triggern. Zusätzlich könnte die Nennung von theoretisch abgeleiteten materialbedingten Merkmalen nur durch einzelne Lehrpersonen und nur bei spezifischen Bewertungssituationen signifikant häufiger erfolgen. Deswegen wurde bei der logistischen Regression für jede Sinneinheit, die einem Merkmal zugeordnet wurde, bei der abhängigen Variable dichotom zwischen theoretisch abgeleiteten materialbedingten Merkmalen und den übrigen Merkmalen unterschieden. Als unabhängige Variablen wurde die Variable impliziert, die Variable Bewertungssituation und die Variable Lehrperson berücksichtigt (vgl. Abschnitt Statistische Verfahren). Da bei der Bewertungssituation Flaschenzug1 die meisten theoretisch abgeleiteten materialbedingten Merkmale genannt wurden, wird diese Bewertungssituation als Baseline gewählt, so dass ein signifikanter Einfluss auf die Nennung von theoretisch abgeleiteten materialbedingten Merkmalen einer anderen Bewertungssituation eine signifikant häufigere bzw. seltenere Nennung von theoretisch abgeleiteten materialbedingten Merkmalen als bei der Bewertungssituation Flaschenzug1 indiziert. Analog sind signifikante Einflüsse der Variablen „Lehrperson“ zu interpretieren. Insgesamt wurden 6 Modelle im Hinblick auf ihre Passung zum Datensatz verglichen (siehe Tab. 4).

Tab. 4 Modelle der logistischen Regressionen, welche unterschiedliche Modellparameter berücksichtigen

Ein Vergleich der Modelle zeigt, dass das Modell 6 zwar die größte Varianzaufklärung vorweist (größtes R2), aber im Vergleich zu Modell 4 überangepasst ist (größeres AIC). Dementsprechend wird gemäß Agresti (2007) im Folgenden das Modell 4 als das am besten zu den Daten passende Modell angenommen. Aufgrund der Übersichtlichkeit werden in Tab. 5 nur β-Koeffizienten und Odds-Ratios für alle Bewertungssituationen dargestellt, die signifikant die Nennung von theoretisch abgeleiteten materialbedingten Merkmalen beeinflussen. Eine Darstellung der Koeffizienten aller Modelle ist im Online-Appendix zu finden.

Tab. 5 Modell 4 mit standardisierten Regressionskoeffizienten und Odds-Ratios

Abb. 3 visualisiert, die durch die logistische Regressionsanalyse ermittelten Einflüsse auf die Nennung von theoretisch abgeleiteten materialbedingten Merkmalen. Hier sind die relativen Häufigkeiten der Variable „theoretisch abgeleitet materialbedingt“ unter Kontrolle der Variable „impliziert“ dargestellt. Aufgrund der gewählten Baseline der Variablen Bewertungssituation sind die Odds-ratios in Bezug auf die Häufigkeit der Nennung von theoretisch abgeleiteten materialbedingten Merkmalen bei der Bewertungssituation Flaschenzug1 zu interpretieren. Bei der Bewertungssituation Flaschenzug1 können 43 Sinneinheiten den nicht in der Bewertungssituation implizierten Merkmalen zugeordnet werden. Von diesen Sinneinheiten wurden 53,5 % nicht materialbedingten Merkmalen zugeordnet.

Abb. 3
figure 3

Relative Häufigkeit der Variable „theoretisch abgeleitet materialbedingt“ unter Kontrolle der Variable „impliziert“

Die in Tab. 5 dargestellten Koeffizienten zeigen, dass allein bei den Bewertungssituationen Hook1, Auftrieb1 und Schiefe Ebene2 die Wahrscheinlichkeit der Nennung von nicht theoretisch abgeleiteten Merkmalen um den Faktor 2,61; bzw. 5,50 bzw. 2,70 signifikant erhöht ist (vgl. Odds-Ratios). Insgesamt wurden bei allen anderen Sinneinheiten, die nicht den implizierten Merkmalen zugeordnet wurden, im Mittel 53,81 % den von Lehrpersonen genannten Merkmalen zugeordnet. Dementsprechend ist der Anteil der Nennung von theoretisch abgeleiteten materialbedingten Merkmalen für alle Bewertungssituation zwar niedriger, wenn diese nicht impliziert wurden, liegt aber ungefähr bei der Hälfte der Nennungen.

Zur Analyse der zweiten Forschungsfrage, ob spezifische Merkmale nur in konkreten Bewertungssituationen relevant sind, ist in Abb. 4 die relative Häufigkeit der Nennung der einzelnen Merkmale je Bewertungssituation dargestellt. Die fett umrandeten Rechtecke geben an, welche konkreten Merkmale bei dem Vergleich zweier Versionen von Experimentiermaterial impliziert wurden (vgl. auch Tab. 1). Lehrpersonen nennen zwar Merkmale, die in den Vergleich der Varianten impliziert wurden, diese bilden aber nicht bei jeder Bewertungssituation den Fokus der von Lehrpersonen genannten Merkmale ab. Zum Beispiel konnten bei der Bewertungssituation Auftrieb3 nur 19 % der Antworten den Merkmalen zugeordnet werden, die impliziert wurden, wohingegen das bei der Bewertungssituation Hook1 66 % sind.

Abb. 4
figure 4

Relative Häufigkeit aller Merkmale je Bewertungssituation (mit * gekennzeichnete Merkmale sind Merkmale, die theoriebasiert abgeleitet wurden, N entspricht der absoluten Anzahl an Sinneinheiten je Bewertungssituation bzw. Merkmal)

Die Abb. 4 zeigt, dass einige Merkmale bei vielen Bewertungssituationen genannt wurden und, je Bewertungssituation betrachtet, bei vielen Bewertungssituationen auch häufiger als die anderen Merkmale (viele Rechtecke mit einem hohen Anteil an dunkleren Rechtecken). Dies sind zum Beispiel die Merkmale „händischer Anspruch“, „Funktion einfach erschließbar“, „mathematisches Wissen“, „Operationalisierung“ und „Anzahl Lösungsschritte“, die bei vielen Bewertungssituationen häufig genannt werden. Diese scheinen für die Einschätzung der Schwierigkeit von Experimentiermaterial für unterschiedliche Experimente relevant zu sein. Zum anderen gibt es Merkmale, die zwar nur bei wenigen Bewertungssituationen genannt wurden, aber bei diesen Bewertungssituationen häufiger als die anderen für diese Bewertungssituation relevanten Merkmale (wenige dunkle Rechtecke). Vor allem die Merkmale „Anzahl der Variablen“, „Analog vs. Digital“, „Wahlmöglichkeiten“, „Art des Materials“ und „technisches Wissen“ werden von vielen Lehrpersonen nur bei spezifischen Bewertungssituationen zur Bewertung der Schwierigkeit herangezogen. Abschließend gibt es Merkmale, die zwar bei vielen Bewertungssituationen, aber je Bewertungssituation betrachtet seltener als die anderen Merkmale genannt wurden (viele helle Rechtecke). So wird zum Beispiel das Merkmal „Erfahrung mit Schülerexperimenten“ bei vielen Bewertungssituationen nur von wenigen Lehrpersonen genannt.

Diskussion

Ziel dieser Studie war es zu analysieren, inwieweit empirisch abgeleitete Merkmale zur Einschätzung der Schwierigkeit von Experimentiermaterialien auch von Lehrpersonen mit Unterrichtserfahrung herangezogen werden. So sollten beispielhaft anhand der Anforderungssituation „Einschätzung von Schülerschwierigkeiten beim Umgang mit Experimentiermaterial“ diejenigen Wissenselemente ermittelt werden, die nicht nur empirisch und theoretisch relevant sind, sondern auch von Lehrpersonen zur Einschätzung der Schwierigkeit von Experimentiermaterialien herangezogen werden. Denn dann können sie gemäß Oser (1997) als Wissenselemente professionellen Handelns betrachtet werden und Einzug in den curricularen Kanon der Physikdidaktik erhalten.

Rückschlüsse auf handlungsrelevante Wissensstrukturen

Um zu untersuchen, inwieweit theoretisch und empirisch abgeleitete Merkmale von Lehrpersonen auch in der Praxis für Einschätzungen der Schwierigkeit von Experimentiermaterial herangezogen werden, sollten Lehrpersonen zunächst angeben, wonach sie allgemein die Schwierigkeit von Experimentiermaterial einschätzen. Die aus diesen Antworten induktiv abgeleiteten Merkmale wurden mit den theoretisch abgeleiteten Merkmalen verglichen. Acht der 20 Merkmale, die durch die Literaturrecherche ermittelt wurden, sind inhaltlich deckungsgleich mit Merkmalen, die von Lehrpersonen genannt wurden. 18 zusätzliche Merkmale wurden von Lehrpersonen genannt, die nicht den „materialbedingten Merkmalen“ zugeordnet werden können. Sie ergänzen bzw. unterstützen aber bereits gefundene Merkmale aus anderen Studien und können den Kategorien der endogenen, lehr- bzw. sachbedingten Merkmale zugeordnet werden (vgl. Tab. 2 und 3; Wodzinski 2006). Dies spricht zunächst für eine geringe Relevanz der materialbedingten Merkmale für Bewertungen der Schwierigkeit von Experimentiermaterial aus Sicht der Praktiker und Praktikerinnen, welche damit das vierte Kriterium von Oser nicht erfüllen. Aber trotz Ergänzung von endogenen, lehr- und sachbedingten Merkmalen, zeigt sich bei 20 von 21 konkreten Bewertungssituationen, bei denen theoretisch abgeleitete materialbedingte Merkmale gezielt verändert wurden, dass über die Hälfte der Antworten den materialbedingten Merkmalen zugeordnet werden konnten, die empirisch und theoretisch hergeleitet wurden (vgl. Abb. 2). Und dies auch unabhängig davon, ob ein spezifisches materialbedingtes Merkmal impliziert wurde (vgl. Abb. 3 und 4). Dies zeigt, dass theoretisch abgeleitete materialbedingte Merkmale neben anderen exogenen und endogenen Merkmalen eine Relevanz für Bewertungen von Lehrpersonen bei konkreten Bewertungssituationen haben. Trotzdem zeigt die häufige Nennung endogener Merkmale wie „technisches Wissen“ und „mathematisches Wissen“, die nicht in den Vergleich von Experimentiermaterialien impliziert wurden (vgl. Abb. 4), dass eine Fokussierung auf materialbedingte Merkmale, wie sie ursprünglich vorgenommen wurde, nicht ausreicht, um die von Lehrpersonen herangezogenen Merkmale zur Einschätzung der Schwierigkeit von Experimentiermaterial angemessen abzudecken. Grund hierfür kann sein, dass aus Lehrerperspektive materialbedingte bzw. allgemein exogene Merkmale nicht losgelöst von endogenen Merkmalen betrachtet werden. Fehlendes mathematisches Wissen (Kategorie endogen) führt z. B. zu Schwierigkeiten bei quantitativen Auswertungen. Damit kann mit der gewählten Art der Auswertung (Kategorie materialbedingt) die Schwierigkeit eines Experimentes angepasst werden, wenn fehlendes mathematisches Wissen die Auswertung erschwert. Es ist denkbar, dass Lehrpersonen in diesen Fällen nicht aus Perspektive einer möglichen Veränderung des Materials argumentieren, sondern fehlende Schülervoraussetzungen und damit endogene Merkmale benennen. Dies deutet darauf hin, dass Studierenden im Studium vermittelt werden sollte, dass exogene Bedingungsfaktoren nicht losgelöst von endogenen Bedingungsfaktoren betrachtet werden können und diese für das erfolgreiche Bearbeiten einer experimentellen Lernumgebung interagieren (Härtig et al. 2017; Wodzinski 2006). Deswegen sollten Studierende exogene Merkmale kennen, da diese einen Überblick geben, welche Parameter bei der Gestaltung von Experimenten verändert werden können. Doch erst in Relation zu endogenen Merkmalen, die zur Einschätzung der Fähigkeiten konkreter Schülerinnen und Schüler dienen, kann entschieden werden, welche Varianten eines Experimentes für die entsprechenden Schülerinnen und Schüler zielführend eingesetzt werden können.

Für einige Merkmale, die von Lehrpersonen zur Einschätzung der Schwierigkeit von Experimentiermaterial herangezogen werden, liegt bereits eine gute empirische Erkenntnisbasis vor, die die Annahmen der Lehrpersonen stützen (z. B. Anzahl der Variablen (Arnold et al. 2013; Croker und Buchanan 2011; Hammann et al. 2006; Ross 1988; Chen und Klahr 1999; Vollmeyer und Funke 1999; Künsting et al. 2008)). Der Einfluss anderer Merkmale ist aber derzeit noch nicht empirisch abgesichert (z. B. Wahlmöglichkeiten, händischer Anspruch). Hier liegt zunächst nur eine Bestätigung einer generellen bzw. materialspezifischen Praxisrelevanz dieser Merkmale aus Sicht der Lehrpersonen und damit die Erfüllung von Osers (1997) viertem Kriterium der Ausführbarkeit von Wissenselementen professionellen Handelns vor. Inwieweit eine Anpassung der Schwierigkeit des Experimentiermaterials anhand dieser Merkmale im Sinne der individuellen Förderung zu besseren Lernergebnissen führt, ist aber bislang nicht untersucht und damit das Kriterium der Empirie als ein weiteres Kriterium von Oser (1997) für diese Merkmale noch nicht überprüft. Die Lernwirksamkeit dieser Merkmale sollte in weiterführenden empirischen Studien überprüft werden, damit alle vier Kriterien von Oser erfüllt sind. Vor allem bei erwiesener Lernwirksamkeit erscheint es sinnvoll, diese Wissenselemente als Grundbausteine für professionelles Handeln im Studium zu vermitteln.

In solchen Studien könnten gezielt einzelne Merkmale in Abhängigkeit der Schülervoraussetzungen verändert werden und daraus resultierende Veränderungen in der Schülerleistung analysiert werden. Für eine erste Überprüfung eines relevanten Effektes würden sich zunächst Merkmale anbieten, die von Lehrpersonen nur für spezifische Bewertungssituationen als relevant betrachtet werden (z. B. Anzahl der Variablen, Analog vs. Digital, Wahlmöglichkeiten). Diese materialspezifischen Merkmale scheinen von Lehrpersonen nur bei spezifischen Ausprägungen von Experimentiermaterial als relevant betrachtet zu werden. Die Merkmale „Analog vs. Digital“ und „technisches Wissen“ wurden dann fokussiert, wenn in einer Variante des Experimentiermaterials digitale Messwerterfassungssysteme eingesetzt wurden und diese mit analogen Varianten verglichen wurde. Wohingegen das Merkmal „Anzahl der Variablen“ dann genannt wurde, wenn in einer Version der beiden Experimentiermaterialien gezielt eine zweite Variable verändert wurde. Die Lehrpersonen haben somit das Experimentiermaterial als schwieriger identifiziert, bei dem die Lernenden die Variablenkontrollstrategie anwenden müssen. Das Merkmal „Wahlmöglichkeiten“ wurde dann fokussiert, wenn sich die Lernenden bei einer Variante des Experimentiermaterials zwischen Material entscheiden müssen, das nützlich bzw. weniger nützlich ist. Alle diese Merkmale eignen sich für eine gezielte Analyse der Lernwirksamkeit dieser Merkmale, denn sie können gezielt bei der Zusammenstellung von Experimentiermaterial beachtet werden, weil es sich um exakt erfassbare Veränderungen der Eigenschaften des Experimentiermaterials handelt und somit eine Veränderung zu einem isolierten Lerneffekt führen kann. Bislang bleiben einige dieser Merkmale aber „ohne empirische Überprüfung ihrer Wirksamkeit oft blind“ (Oser 1997). Dieses gilt auch für Merkmale, die von Lehrpersonen über verschiedene Experimentiermaterialien hinweg genannt wurden (z. B. Händischer Anspruch, mathematisches Wissen, Operationalisierung, Deutlichkeit des Phänomens und Anzahl der Lösungsschritte (vgl. Abb. 3)). Diese Merkmale scheinen aber für die Einschätzung der Schwierigkeit von Experimentiermaterial aus Praxissicht für unterschiedliche Experimente relevant zu sein und könnten – bei vorliegendem Nachweis der empirischen Wirksamkeit – als generelle Merkmale zur Einschätzung der Schwierigkeit den Studierenden vermittelt werden. Dies könnten Wissenselemente zur Einschätzung der Schwierigkeit von Experimentiermaterial sein, die in fachdidaktischen Lehrveranstaltungen vermittelt werden könnten, da sie für mehrere Bewertungssituationen gelten und auch von Praktikern und Praktikerinnen herangezogen werden. So könnte ein Bruch zwischen dem im Studium vermittelten fachdidaktischem Wissen und dem Wissen, das Lehrpersonen für Bewertungssituationen heranziehen, vermieden und somit einer Diskontinuität im Professionalisierungsprozess vorgebeugt werden (Hammerness und Klette 2015; Hellmann 2019; McQuillan et al. 2012; Muller 2009; Smeby und Heggen 2014; Terhart et al. 2011). Dies kann insgesamt ein Ansatz zur Herstellung von vertikaler Kohärenz – also von Kohärenz über die verschiedenen Phasen der Lehrerbildung hinweg – sein (Hellmann 2019). Da auf eine spezifische Bewertungssituation zur Einschätzung von Schülerschwierigkeiten beim Umgang mit physikalischem Experimentiermaterial fokussiert wird, wurden dabei Wissenselemente abgeleitet, die dem physikdidaktischen Wissen zugeordnet werden können. Zusätzlich wurden nur von wenigen Lehrpersonen fachunspezifische Merkmale wie zum Beispiel die Selbstständigkeit der Schülerinnen und Schüler genannt. Dementsprechend werden für diese Bewertungssituationen Wissenselemente des pädagogischen Wissens nur bedingt herangezogen. Im Schulalltag können allerdings Anforderungssituationen vorliegen, bei denen Lehrpersonen aus verschiedenen Bereichen ihres Professionswissens schöpfen müssen. Denkbar sind hier zum Beispiel Entscheidungen während der Unterrichtsplanung, bei denen nicht nur fachdidaktisches Wissen, sondern auch pädagogisches Wissen z. B. über Classroom-Management herangezogen wird. Diese Anforderungssituationen könnten in weiteren Studien herangezogen werden, um zu analysieren, inwieweit Lehrpersonen aus verschiedenen Quellen ihres Professionswissens schöpfen. So könnten die anhand der Anforderungssituation ermittelten praxisrelevanten Wissensstrukturen in den verschiedenen Lernangeboten der Fächer, der Fachdidaktiken und der Bildungswissenschaften verortet und explizite Lerngelegenheiten geschaffen werden, bei denen diese Wissenselemente für eine erfolgreiche Bewältigung der Anforderungssituation vernetzt werden. Damit wäre es möglich horizontal kohärente Lerngelegenheiten in der Lehrerbildung zu gestalten (Hellmann 2019).

Im Gegensatz dazu könnten Merkmale, die Osers (1997) erstes Kriterium der Theorie für Wissenselemente professionellen Handelns erfüllen, aber von Lehrpersonen nur selten genannt werden, auf den ersten Blick in der universitären Lehre vernachlässigt werden, da sie in der späteren Praxis nicht mehr relevant erscheinen. „Denn eine Theorie ohne Handlungstradition bleibt unwirksam“ (Oser 1997). Dies gilt aber nur so lange, bis ein relevanter Effekt eines dieser Merkmale in (zukünftigen) empirischen Studien nachgewiesen wird. Denn dann erfüllt das Merkmal Osers (1997) Kriterium der Empirie. Daher sollten angehende Lehrpersonen für dieses Merkmal explizit sensibilisiert werden, damit es handlungsrelevant für Praktikerinnen und Praktiker wird und damit ein Effekt auf erfolgreiches Lernen in der Unterrichtspraxis erzielt werden kann. Dementsprechend kann die Festlegung von Wissenselementen für professionelles Handeln, die im curricularen Kanon der Fachdidaktik verankert werden sollen, nur durch eine wechselseitige Verzahnung von wissenschaftlichen Befunden und der schulischen Praxis sinnvoll sein (Oser 1997).

Grenzen dieser Studie

Im Rahmen dieses Beitrages wurde auf Schwierigkeiten fokussiert, die durch die Wahl des Experimentiermaterials beeinflussbar sind. Trotzdem ist ein Ergebnis dieser Studie, dass dies aus Praxissicht nicht losgelöst von endogenen Schülerschwierigkeiten betrachtet werden kann. Genauso können aber auch materialbedingte Schwierigkeiten mit aufgabenspezifischen Schwierigkeiten interagieren. So kann z. B. das Merkmal Anzahl der Lösungswege nicht nur vom Experimentiermaterial, sondern auch von der Aufgabenstellung beeinflusst sein (vgl. Kauertz et al. 2015; Trendel und Lübeck 2018). Auf welche Merkmale Lehrpersonen bei der Einschätzung einer gesamten experimentellen Lernumgebung fokussieren, ist in dieser Studie nicht untersucht worden. Hier könnte es sein, dass sie nicht auf Merkmale fokussieren, die das Experimentiermaterial betreffen, sondern auf Merkmale, welche die Aufgabenstellung betreffen. Zusätzlich könnten weitere Bedingungsfaktoren, wie zum Beispiel die Ausstattung der Sammlung, die Entscheidung für Experimentiermaterialien und experimentelle Lernumgebungen beeinflussen. Diese Aspekte sind aufgrund der Fokussierung auf die Einschätzung der Schwierigkeit von Experimentiermaterialien in dieser Studie noch nicht abgedeckt worden, erscheinen aber relevant, wenn Planungsprozesse von Lehrpersonen zum Einsatz von Experimenten analysiert werden.

Zusätzlich werden in dieser Studie die relativen Häufigkeiten als Maß für die Praxisrelevanz einzelner Merkmale zur Einschätzung der Schwierigkeit von konkreten Experimentiermaterialien herangezogen. Die Ergebnisse zeigen, dass eine Reihe von Merkmalen vorliegen, die Lehrpersonen zunächst als wichtig für die Einschätzung angegeben haben, die aber in den konkreten Entscheidungssituationen des Fragebogens nicht genannt werden. Diese Merkmale scheinen damit keine Relevanz bei den Bewertungsprozessen für die Einschätzung des von uns vorgelegten Experimentiermaterials aus Lehrerperspektive zu haben. Da im Rahmen dieser Studie bestimmte Merkmale durch die Gestaltung der Bewertungssituationen getriggert wurden, lässt sich hieraus aber nicht ableiten, dass diese Merkmale auch dann nicht genannt worden wären, wenn sie bei der Gestaltung der Bewertungssituationen mit eingeflossen wären. Dies bleibt eine offene Fragestellung. Darüber hinaus zeigt die log-lineare Regression, dass bei drei Bewertungssituationen (Hook1, Auftrieb1, Schiefe Ebene2) unter Kontrolle der implizierten Merkmale, die Häufigkeit der Nennung von nicht theoretisch abgeleiteten Merkmalen signifikant erhöht ist. Bei der Bewertungssituation Auftrieb1 haben die Lehrpersonen vor allem das nicht theoretisch abgeleitete Merkmal „mathematisches Wissen“ genannt, wohingegen bei Hook1 vor allem das theoretisch abgeleitete und implizierte Merkmal „Anzahl der Variablen“ genannt wurde. Bei Hook1 ist lediglich von einem geringen Anteil von Nennungen nicht implizierter Merkmale (48 von 145) die Häufigkeit der Nennung nicht theoretisch abgeleiteter Merkmale signifikant höher als bei der Bewertungssituation Flaschenzug1. Eine ähnliche Verteilung liegt bei der Bewertungssituation Schiefe Ebene2 vor. Eine systematisch vorliegende Ursache für die signifikante Erhöhung von nicht theoretisch abgeleiteten Merkmalen unter Kontrolle der implizierten Merkmale, die für alle drei Bewertungssituationen gelten könnte, konnte auf Basis der Analysen allerdings nicht identifiziert werden.

Im Rahmen dieser Studie wurde auf eine Anforderungssituation fokussiert, bei der angenommen werden kann, dass deklarative Wissensstrukturen von angehenden Lehrenden erworben werden müssen, um die Schwierigkeit von Experimentiermaterial einschätzen zu können. Für viele Anforderungssituationen im Schulalltag müssen Lehrpersonen allerdings auf prozedurale Wissensstrukturen zurückgreifen. Die Extraktion von praxisrelevanten prozeduralen Wissensstrukturen von Lehrpersonen erscheint hierbei nicht mehr nur durch Fragebögen möglich zu sein. Dementsprechend ist die Methodik dieser Studie nicht auf die Analyse aller Anforderungssituationen und hierzu relevanter Wissenselemente übertragbar. Hierzu scheinen vielmehr Erhebungsmethoden wie qualitative Inhaltsanalysen (Mayring 2015) bzw. die dokumentarische Methode (z. B. Mannheim 1980; Nohl 2017) zur Extraktion von Wissenselementen der Lehrpersonen sinnvoller.

Fazit und Ausblick

Die Erkenntnisse dieser Studie dienen insgesamt der Gestaltung einer kohärenten Lehre und der Identifikation von Wissenselementen, mit denen nicht nur aus empirischer und theoretischer Perspektive die Schwierigkeit von Experimentiermaterialien eingeschätzt werden kann, sondern die auch über verschiedenen Phasen der Lehrerbiografie relevant bleiben (Oser 1997; Canrinus et al. 2017; Hammerness und Klette 2015). So könnte einer Diskontinuität im Professionalisierungsprozess und dem häufig genannten Theorie-Praxis-Dilemma mit der einhergehenden Entstehung von trägem Wissen (Bromme und Tillema 1995; Renkl 1996) vorgebeugt werden (Hammerness und Klette 2015; McQuillan et al. 2012; Smeby und Heggen 2014; Terhart 2007). Ziel ist es, das Curriculum der universitären Lehre so anzupassen, dass angehende Lehrpersonen dem an der Universität erworbenem Wissen einen großen Nutzen in der Praxis zuschreiben. Für curriculare Entscheidungen bezüglich des zu vermittelnden fachdidaktischen Wissens zur Einschätzung der Schwierigkeit von Experimentiermaterial können aus dieser Studie folgende Erkenntnisse gezogen werden: Es konnten Merkmale identifiziert werden, die von Lehrpersonen über verschiedene Experimente und Experimentiermaterialien hinweg oder nur bei spezifischen Experimentiermaterialien häufig genannt wurden. In der Lehre könnte somit zwischen generellen als auch experimentspezifischen Merkmalen zur Einschätzung der Schwierigkeit, die durch die Wahl des Experimentiermaterialien bedingt ist, unterschieden werden. Zusätzlich zeigen die Ergebnisse, dass Lehrpersonen materialbedingte Merkmale (exogene Merkmale) nicht losgelöst von den Lernvoraussetzungen der Schülerinnen und Schüler betrachten (endogene Merkmale). Dementsprechend sollte den Studierenden auch vermittelt werden, dass eine Betrachtung der Schwierigkeit des Experimentiermaterials losgelöst von Schülervoraussetzungen und aufgabenspezifischen Schwierigkeiten nicht zielführend erscheint und alle Bedingungsfaktoren für Schülerschwierigkeiten bei der Gestaltung einer experimentellen Lernumgebung berücksichtigt werden sollten.