1 Einleitung

Die Aneignung fachlicher Konzepte kann durch schon vorhandene Vorstellungen der Schülerinnen und Schüler zu den Unterrichtsgegenständen erschwert werden, wenn es Lehrkräften nicht gelingt diese aufzugreifen (Schrenk et al. 2019). Das Aufgreifen kann auf der einen Seite planvoll erfolgen, in dem in der Literatur dokumentierte Vorstellungen bereits bei der Unterrichtsplanung bedacht und/oder eine Diagnostik vorbereitet wird (z. B. Kattmann 2015). Auf der anderen Seite müssen Lehrkräfte aber auch im Unterrichtsverlauf geäußerte Schülervorstellungen wahrnehmen und interpretieren können, um angemessen darauf zu reagieren (Shavelson et al. 2008). In dieser Studie geht es um letztere Diagnosen, welche spontan – also „on-the-fly“ – erfolgen. Zusätzlich zur allgemeinen Komplexität des Unterrichtsgeschehens stellt dabei die Flüchtigkeit der Situation eine besondere Herausforderung dar (Knievel et al. 2015).

Will man Fertigkeiten zu „on-the-fly“-Diagnosen bereits in der ersten Phase der Lehramtsausbildung fördern, stellt sich die Frage, in welcher Weise dies effektiv geschehen kann. Der Einsatz von Fallmedien hat in der Lehrerbildung bereits eine längere Tradition (Gaudin und Chaliès 2015). Vorliegende Studien zur Wirksamkeit der Fallarbeit beziehen sich in den meisten Fällen auf das Lernen mit Unterrichtsvideos (Syring et al. 2015). Dabei bleibt offen, inwieweit der Einsatz von Videos einen Mehrwert im Vergleich zu anderen Vermittlungsmöglichkeiten hat (Sunder et al. 2016). Insbesondere mit Bezug zu fachdidaktischen Aspekten von Unterricht finden sich kaum Studien, die z. B. systematisch den Einsatz unterschiedlicher Fallmedien als Förderinstrumente vergleichen (vgl. Chernikova et al. 2019).

Für eine Förderung von Fertigkeiten zur Diagnose von Schülervorstellungen ist von Interesse, welchen Einfluss der Diagnosegegenstand (unterschiedliche Schülervorstellungen) und das Fallmedium auf die Diagnosefertigkeiten und deren Erwerb haben. In der vorliegenden Studie wurde im Rahmen einer Intervention zur Förderung von Diagnosefertigkeiten variiert, welche Fallmedien eingesetzt wurden (Video bzw. Text) und welche biologischen Inhaltsbereiche die Schülervorstellungen betreffen. Einer Kontrollgruppe wurde Wissen über die Schülervorstellungen ohne ein Training an Fallmedien vermittelt. Das DiaCoM-Rahmenmodell von Loibl et al. (2020) bietet die Möglichkeit, die beim Diagnostizieren zugrundeliegenden kognitiven Mechanismen als Informationsverarbeitungsprozesse zu deuten.

2 Schülervorstellungen und deren unterrichtsbegleitende Diagnose

2.1 Die Bedeutung von Schülervorstellungen für das Lernen

Schülervorstellungen sind eine wichtige Lernausgangslage (Schrenk et al. 2019) und sind damit im naturwissenschaftlichen Unterricht ein bedeutsamer Diagnosegegenstand (Rath 2017). Mit Schülervorstellungen sind die bereits vorhandenen Vorstellungen von Lernenden zu naturwissenschaftlichen Phänomenen, Begriffen und Prinzipien gemeint (Gebhard 2013; Häußler 1998). Den fachlich gültigen Vorstellungen entsprechen Schülervorstellungen häufig nicht oder nur teilweise (Kattmann 2015; Schecker und Duit 2018).

Für den Themenbereich der Stoffkreisläufe konnte beispielsweise übereinstimmend und über unterschiedliche Altersgruppen hinweg nachgewiesen werden, dass von vielen Lernenden in erster Linie abiotische Faktoren (z. B. Wind, Wärme, Frost) als Ursache für Zersetzungsprozesse angesehen werden, während die ursächliche Bedeutung von Mikroorganismen nicht als Erklärung genannt wird (Baisch 2009; Leach et al. 2008). Solche Vorstellungen entstehen meist aufgrund von Alltagserfahrungen der Lernenden (Hammann und Asshoff 2015; Häußler 1998) oder aufgrund von vorangegangenem Unterricht (Schrenk et al. 2019).

Für die Planung und Durchführung naturwissenschaftlichen Unterrichts sind Schülervorstellungen deswegen so bedeutsam, weil sie das Lernen entscheidend beeinflussen: Die Konstruktion neuen Wissens erfolgt auf Grundlage vorhandener Vorstellungen (Riemeier 2007). Gleichzeitig haben sich Schülervorstellungen als änderungsresistent erwiesen (Duit et al. 2008) bzw. sie verändern sich oft nicht so, wie es Lehrkräfte beabsichtigen (Zabel und Gropengießer 2011). In den Naturwissenschaftsdidaktiken besteht ein breiter Konsens darüber, dass Schülervorstellungen zum Ausgangspunkt des Unterrichts gemacht werden sollen (z. B. Kattmann 2017; Schrenk et al. 2019) – insbesondere bei Stoffgebieten, in denen es viele wissenschaftlich nicht haltbare Schülervorstellungen gibt (Schecker und Duit 2018). Um mit im Unterricht aktuell auftretenden Schülervorstellungen umzugehen, müssen Lehrkräfte diese spontan wahrnehmen und interpretieren können (Shavelson et al. 2008).

2.2 Unterrichtsbegleitende Diagnosen von Schülervorstellungen als Ziel pädagogische Diagnostik

Mit dem Ziel einer adaptiven Unterrichtsgestaltung werden Schülervorstellungen zu einem zentralen Gegenstand unterrichtsbegleitender pädagogischer Diagnostik (Beck et al. 2008; Klieme und Warwas 2011; Ruiz-Primo und Furtak 2006). Pädagogische Diagnostik kann u. a. als Prozess des Einschätzens lernrelevanter Schülermerkmale verstanden werden (Herppich et al. 2017a). Gelegenheiten zur Einschätzung von Schülervorstellungen bieten insbesondere verbale Äußerungen der Schülerinnen und Schüler (Rath 2017), beispielsweise wenn Lehrpersonen bei Gruppenarbeiten Erklärungen der Lernenden mithören (Shavelson et al. 2008) oder wenn Lernende zum Unterrichtsgespräch beitragen (Ruiz-Primo und Furtak 2007).

Unterrichtsbegleitende Diagnosen können auch geplant verlaufen, z. B. wenn Lehrpersonen sich vorab eine lernzielorientierte Frage überlegen und diese in der Interaktion mit den Schülerinnen und Schülern stellen (Glogger-Frey und Herppich 2017). Neben dieser geplanten Diagnostik, sollten Lehrpersonen Schülervorstellungen auch diagnostizieren können, wenn sie die Schüleräußerungen nicht bewusst hervorgerufen haben. Wenn Prozesse des Diagnostizierens von Schülervorstellungen spontan und unmittelbar erfolgen, werden diese Einschätzungen als „on-the-fly“-Diagnosen bezeichnet (Glogger-Frey und Herppich 2017; Klieme und Warwas 2011; Shavelson et al. 2008). „On-the-fly“-Diagnosen sind für Lehrkräfte nur eingeschränkt planbar. Zudem stellt die Flüchtigkeit der diagnostischen Situation eine besondere Herausforderung für Lehrkräfte dar (Knievel et al. 2015).

Dass unterrichtsbegleitende Diagnosen von Schülervorstellungen in Verbindung mit Adaptionen des Unterrichts das Lernen der Schülerinnen und Schüler förderlich beeinflussen können, ist theoretisch sehr plausibel (Rath 2017). In einigen Studien konnte für den naturwissenschaftlichen Unterricht auch empirisch gezeigt werden, dass sich entsprechende Unterrichtspraktiken, d. h. ein unterrichtsbegleitendes Diagnostizieren von individuellen Lernständen und entsprechende Unterrichtsadaptionen, positiv auf den Lernzuwachs der Schülerinnen und Schüler auswirken (Decristan et al. 2015; Furtak et al. 2016a; Ruiz-Primo und Furtak 2007). Angesichts der Herausforderung, die solche Unterrichtspraktiken mit sich bringen, stellt sich die Frage, wie diagnostische Fertigkeiten bereits bei angehenden Lehrkräften gefördert werden können (Dannemann et al. 2018; Ruiz-Primo 2011).

2.3 Konzeptualisierung von kognitiven Fertigkeiten zur unterrichtsbegleitenden Diagnose von Schülervorstellungen

Für adaptives Unterrichtshandeln ist die Güte des diagnostischen Urteils über den aktuellen Lernstand der Schülerinnen und Schüler maßgebend (Brühwiler 2017). Ausgehend von den diagnostischen Urteilen können Lehrkräfte für pädagogische Handlungen Konsequenzen ableiten; z. B. Feedback an die Lernenden (z. B. von Aufschnaiter et al. 2018; Furtak et al. 2016a) oder auch weitere diagnostische Aktivitäten durchführen; z. B. Rückfragen an die Lernenden stellen, wenn eine Lehrkraft das eigene Verständnis über die Schülervorstellungen erweitern möchte (z. B. Heitzmann et al. 2019; Herppich et al. 2017b; Van de Pol et al. 2014). Insofern stellt der Erwerb von Fertigkeiten zur Urteilsbildung ein spezifisches, aber wesentliches Element bei der Förderung diagnostischer Kompetenzen von Lehrkräften dar.

Das unterrichtsbegleitende, spontane Diagnostizieren von Schülervorstellungen in Schüleräußerungen kann verstanden werden als ein andauerndes Filtern von Informationen, um daraus diagnostische Urteile in Form von Hypothesen zu generieren (Heitzmann et al. 2019). Die kognitiven Mechanismen, welche der Verarbeitung jener Informationen unterliegen, können als Informationsverarbeitungsprozesse der Wahrnehmung und Interpretation konzeptualisiert werden (Blömeke et al. 2015; Loibl et al. 2020). Wahrnehmung bedeutet hier, dass im Fluss der Aussagen im Sinne eines thematisch selektiven Erkennens (Blomberg et al. 2011) diejenigen Aussagen identifiziert werden, deren Interpretation für ein Verständnis der zugrundeliegenden Schülervorstellungen wichtig sein könnte. Interpretation meint in diesem Kontext, inwiefern wahrgenommene Schüleräußerungen hinsichtlich eines Verständnisses der dahinterliegenden Schülervorstellungen gedeutet werden.

In Anlehnung an Blömeke et al. (2015), können die kognitiven Prozesse des Wahrnehmens und Interpretierens als situationsspezifische, kognitive Fertigkeiten betrachtet werden. Diese vermitteln zwischen kognitiven Dispositionen (z. B. Fachwissen und fachdidaktisches Wissen) bzw. affektiv-motivationalen Dispositionen (z. B. Interesse, Einstellungen) und der Performanz der Lehrkräfte. Eine Förderung der situationsspezifischen, kognitiven Diagnosefertigkeiten des Wahrnehmens und Interpretierens bezieht sich entsprechend auf einen spezifischen Anteil eines umfassenderen Konstrukts diagnostischer Kompetenz.

2.4 Kriterien für die Beurteilung des Niveaus kognitiver Fertigkeiten zur unterrichtsbegleitenden Diagnose von Schülervorstellungen

Das Fertigkeitsniveau bei der Urteilsbildung ergibt sich aus dem Zusammenspiel der beiden oben beschriebenen Teilfertigkeiten des Wahrnehmens und Interpretierens (Sherin et al. 2011) und zeigt sich in Verhaltensaspekten der diagnostizierenden Lehrkräfte; z. B. Verbalisierung des diagnostischen Urteils, Rückmeldung an die Lernenden (Loibl et al. 2020). Ein hohes Fertigkeitsniveau zeichnet sich einerseits dadurch aus, dass relevante Schüleräußerungen als bedeutsam für eine Einschätzung der Lernenden wahrgenommen werden. Andererseits ist die Angemessenheit der Interpretation ausschlaggebend. Wenn die Ausprägungen der hier beschriebenen Diagnosefertigkeiten empirisch untersucht und beschrieben werden, dann handelt es sich um eine Rekonstruktion der kognitiven Prozesse. Von den vorliegenden Daten wird auf die vermuteten Informationsverarbeitungsprozesse des Wahrnehmens und Interpretierens geschlossen (Furtak et al. 2016b). Wenn Daten z. B. in Form verbalisierter Antworten vorliegen, beziehen sich die Rückschlüsse zudem eher auf das Produkt einzelner Prozesse (z. B. Interpretieren) als auf die Prozesse selbst (Loibl et al. 2020).

Für die Beurteilung der Interpretationsleistung lassen sich sowohl inhaltliche als auch formale Kriterien theoretisch begründen. Aus fachdidaktischer Perspektive ist es unzureichend, wenn fachlich nicht gültige Aussagen der Lernenden lediglich als abweichend von einer wissenschaftlich korrekten Darstellung gekennzeichnet werden. Um Schülerinnen und Schülern aussichtsreiche Lernwege zu ermöglichen, gilt es vielmehr, aus den Schüleräußerungen die dahinterliegenden spezifischen Vorstellungen zu erschließen und die Denkweisen zu verstehen (Furtak et al. 2016a; Gropengießer und Marohn 2018; Schrenk et al. 2019). Im Rahmen der fachdidaktischen Vorstellungsforschung wurden Schülervorstellungen zu vielen biologischen Themen empirisch erhoben und hinsichtlich ihrer gedanklichen Konstruktion beschrieben (z. B. Kattmann 2015).

Nach Helmke (2017) liegt formal ein charakteristisches Merkmal des Diagnostizierens darin, anhand vorgegebener Kategorien, Begriffe oder Konzepte zu urteilen (vgl. dazu auch Heitzmann et al. 2019). Prinzipiell können Kategorien bei der Diagnose von Schülervorstellungen sowohl induktiv, also von den Schüleräußerungen her, als auch deduktiv, d. h. von Forschungsergebnissen ausgehend gebildet werden (z. B. Hammann und Jördens 2014). Da Lernende oft ähnliche Vorstellungen zu bestimmten Themen haben, ist es beim Diagnostizieren von Schülervorstellungen für die Lehrkräfte tatsächlich in vielen Fällen möglich, auf der Grundlage von Forschungsergebnissen gezielte Hypothesen zu den Vorstellungen der Lernenden zu bilden (Taber 2017). Auf diese Weise dürfte eine zielgerichtete und zuverlässige Deutung der Vorstellungen der eigenen Schülerinnen und Schüler eher gelingen (Gropengießer 1996; Kattmann 2015). Vor dem Hintergrund, dass insbesondere informelle Diagnoseleistungen als fehleranfällig gelten (Schrader 2013), erscheint eine hypothesengeleitete Interpretation anhand bekannter Schülervorstellungen insbesondere für angehende Lehrkräfte bzw. Lehrkräfte mit wenig Erfahrung als vorteilhaft. Darüber hinaus ermöglicht eine Zuordnung von Schüleräußerungen zu bekannten Schülervorstellungen, sich bei pädagogischen Entscheidungen an entsprechenden Vorschlägen für spezifische Instruktionsstrategien zu orientieren (z. B. Kattmann 2015). Zusammenfassend zeigt sich ausgehend von den hier aufgeführten theoretischen Überlegungen eine gute Interpretationsleistung bei der Bildung diagnostischer Urteile darin, dass ausgehend von einer Analyse der Denkweise der Lernenden die (vermutete) Vorstellung möglichst präzise kategorisiert und benannt werden kann (vgl. Grossman et al. 2009).

2.5 Wie können Fertigkeiten zur Diagnose von Schülervorstellungen gefördert werden?

2.5.1 Welche Wirkungen hat der Einsatz unterschiedlicher Fallmedien auf den Erwerb von Diagnosefertigkeiten?

Beim Diagnostizieren fällt es Studierenden und Berufseinsteiger/-innen oft schwer, ihr Wissen in komplexen Unterrichtssituationen auf konkrete Fälle anzuwenden (Heitzmann et al. 2019). Um bei Lehramtsstudierenden kognitive Fertigkeiten in Bezug auf das Diagnostizieren von Schülervorstellungen in flüchtigen Unterrichtssituationen zu fördern, sollte eine Lernbedingung gewählt werden, die sich der unterrichtlichen Situation in wichtigen Facetten annähert und gleichzeitig nicht überfordert (Grossman et al. 2009, 2018). Das Lernen an Fällen ermöglicht es, Anforderungen des beruflichen Alltags zu veranschaulichen und Fertigkeiten zur Beurteilung und Reflexion von Praxissituationen zu fördern (Krammer 2014). Fallbasiertes Lernen wird in der Lehrerbildung vor allem anhand von Video- und Textfällen realisiert (Schneider et al. 2016).

Die Analyse von Videofällen hat sich in der Lehrerbildung grundlegend bewährt (Gaudin und Chaliès 2015). Videos bilden viele Facetten der unterrichtlichen Situation ab (z. B. Flüchtigkeit der Situation, Mimik und Gestik der Lernenden und Lehrkräfte). Aufgrund dieser Nähe zur komplexen unterrichtlichen Realität gelten Videofälle als besonders authentisch. Allerdings sind sie damit eine komplexe Vorlage und stellen hohe Anforderungen an die Informationsverarbeitungskapazitäten von angehenden Lehrkräften dar (Syring et al. 2015). Die relative Flüchtigkeit der Information in Videos im Vergleich zu Textfällen kann einen Einfluss auf die Prozesse der Informationsverarbeitung haben (Leahy und Sweller 2011; Loibl et al. 2020). Textfälle (z. B. Transkripte) ermöglichen insofern eine Komplexitätsentlastung (Reh und Schelle 2010). Sie gelten allerdings als weniger authentisch, da sie weniger Facetten der unterrichtlichen Realität abbilden (Schutz et al. 2018).

Hinsichtlich der Möglichkeiten und Einschränkungen des Einsatzes beider Fallmedien stellt sich die Frage, inwieweit sich der Einsatz von Text- oder Videofällen als vorteilhaft bei der Förderung kognitiver Fertigkeiten in Bezug auf die Diagnose von Schülervorstellungen erweist. Einige Studien weisen darauf hin, dass Text- und Videofälle ein ähnliches Potential bei der Förderung bestimmter Lehrerkompetenzen haben (z. B. Kramer et al. 2017; Schneider et al. 2016; zur Wahrnehmung und Interpretation in Bezug auf Classroom Management), wobei bei Schneider et al. die Textgruppe für den Teilaspekt der Qualität der Interpretation eine bessere Leistung zeigte als die Videogruppe. Die Autoren führen dies auf die höhere kognitive Belastung durch die Unterrichtsvideos zurück (Schneider et al. 2016).

Studien, bei denen verschiedene Fallmedien (z. B. Video- und Textvignetten) als Förderinstrumente in der Lehrerbildung verglichen wurden, beziehen sich bislang weitgehend auf die Förderung professioneller Unterrichtswahrnehmung im Bereich der Klassenführung (z. B. Kramer et al. 2017; Schneider et al. 2016; Syring et al. 2015). Ob sich eine Förderung mithilfe von Text- oder Videofällen effektiver auf den Erwerb von gegenstandsspezifischen Diagnosefertigkeiten (hier: Diagnostizieren von Schülervorstellungen) auswirkt, bleibt weitgehend offen.

2.5.2 Welche Bedeutung hat der Diagnosegegenstand für den Erwerb von Diagnosefertigkeiten?

Es wird angenommen, dass die Diagnosegüte in Abhängigkeit der einzuschätzenden Merkmale variiert (Schrader und Praetorius 2018; Spinath 2005). Insofern sind mit dem Ziel der Entwicklung spezifischer Fördermaßnahmen auch die Effekte auf den Erwerb von Diagnosefertigkeiten, welche von unterschiedlichen Eigenschaften des Diagnosegegenstands möglicherweise ausgehen, zu berücksichtigen.

Bei Schülervorstellungen als Diagnosegegenstand liefern verbale Äußerungen der Lernenden wesentliche Indizien (Schecker und Duit 2018). In den Äußerungen zum Vorschein kommende Schülervorstellungen unterscheiden sich u. a. hinsichtlich des Diagnoseinhalts, z. B. themenübergreifende Phänomene (z. B. Anthropomorphismen) oder spezielle Themen wie bestimmte Bereiche in der Ökologie (Stoffkreisläufe, Ökosysteme, Auswirkungen des Klimawandels etc.) oder Humanbiologie (Hammann und Asshoff 2015). Darüber hinaus unterscheiden sich Schülervorstellungen auch hinsichtlich der Komplexität ihrer gedanklichen Konstruktion (Gropengießer 2006).

Die Relevanz bestimmter Wissensbestände auf Seiten der Lehrkräfte (u. a. Fachwissen und fachdidaktisches Wissen) für den Erwerb von Diagnosefertigkeiten ist unbestritten (z. B. Baumert und Kunter 2006). Rath (2017) konnte für die Diagnose physikalischer Schülervorstellungen neben der Bedeutung von Fachwissen die Relevanz spezifischen fachdidaktischen Wissens (hier: Wissen über spezifische Schülervorstellungen) nachweisen. Aufgrund der Vielzahl zu diagnostizierender Schülervorstellungen stellt sich die Frage, inwiefern diagnostische Fertigkeiten inhaltsbezogen, d. h. bezogen auf inhaltlich spezifische Vorstellungen, erworben werden oder diese Fertigkeiten dann auch in anderen Inhaltsbereichen ein verbessertes diagnostisches Urteilen ermöglichen.

2.6 Ziele der Studie und Forschungsfragen

Bisher gibt es wenig empirische Evidenz darüber, wie der Erwerb gegenstandsspezifischer diagnostischer Fertigkeiten bezogen auf das unterrichtsbegleitende Diagnostizieren von Schülervorstellungen gefördert werden kann. Eine Förderung von Diagnosefertigkeiten mithilfe von Fallmedien bietet die Möglichkeit einer komplexitätsreduzierten Annäherung an die unterrichtliche Situation. Es ist zu klären, inwiefern der Einsatz von Fallmedien den Erwerb von Diagnosefertigkeiten begünstigt und ob sich ein bestimmtes Fallmedium (hier: Video oder Text) effektiver auf den Erwerb von Diagnosefertigkeiten auswirkt. Theoretisch ist es plausibel, dass sich auch unterschiedliche Eigenschaften des Diagnosegegenstands (hier: unterschiedliche Inhaltsbereiche der Schülervorstellungen) auf den Erwerb von Diagnosefertigkeiten auswirken. Aufgrund der Vielzahl möglicher Schülervorstellungen ist es von großem praktischen Interesse, inwiefern Diagnosefertigkeiten inhaltsbezogen oder über unterschiedliche Inhaltsbereiche hinweg erworben werden.

Ziel der Studie war es, zur Klärung dieser Forschungslücken bezüglich des Erwerbs von Diagnosefertigkeiten durch eine systematische Variation von Fördermedien und Diagnosegegenständen beizutragen. Dabei standen folgende drei Forschungsfragen im Fokus:

Forschungsfrage 1

Führt ein Training an Fallmedien in Kombination mit der Vermittlung spezifischen fachdidaktischen Wissens zu einer Verbesserung diagnostischer Fertigkeiten im Vergleich zu einer Kontrollgruppe, in der nur spezifisches fachdidaktisches Wissen vermittelt wird?

Forschungsfrage 2

Lassen sich diagnostische Fertigkeiten mit Video- oder Textvignetten wirksamer fördern?

Forschungsfrage 3

Werden diagnostische Fertigkeiten mithilfe von vignettenbezogenen Fördermaßnahmen inhaltsspezifisch erworben oder erfolgt auch eine Sensibilisierung für einen anderen Inhaltsbereich?

3 Methode

3.1 Stichprobe und Design

An der Untersuchung nahmen insgesamt N = 36 Lehramtsstudierende der Biologie (23 weiblich) teil. Die Studie fand im April 2018 im Rahmen eines Kompaktseminars statt. Das Alter der Studierenden lag zwischen 20 und 34 Jahren (M = 23,37 Jahre; SD = 3,55). In der Stichprobe waren die Studiengänge des Lehramts für die Primar- und Sekundarstufe I vertreten (7 Primarstufe). Die Studierenden befanden sich zum Zeitpunkt der Studie durchschnittlich im vierten Fachsemester (M = 4,4; SD = 1,45). Alle Studierenden haben zum Zeitpunkt der Intervention ein fachwissenschaftliches Grundlagenstudium im Fach Biologie durchlaufen. Die Benotung der entsprechenden Modulklausur lag im Durchschnitt bei M = 2,8 (SD = 0,66). Schülervorstellungen zur Ökologie sind zuvor nicht Gegenstand im Studium gewesen. Alle Studierenden hatten bereits Unterrichtserfahrung in Form der Teilnahme an einem Orientierungspraktikum (OSP) gesammelt.

Die Studie folgte einem experimentellen Prä-Posttest-Design. Die Lehramtsstudierenden wurden randomisiert den Experimentalbedingungen zugewiesen (s. Tab. 1). In den Experimentalbedingungen wurden für die Intervention die Fallmedien (Video vs. Text) und die Eigenschaften der Diagnosegegenstände (Schülervorstellungen aus zwei Inhaltsbereichen innerhalb eines übergeordneten biologischen Themas) systematisch variiert. Alle verwendeten Schülervorstellungen bezogen sich auf ökologische Basiskonzepte aus dem übergeordneten Themenbereich der Stoffkreisläufe. Die Schülervorstellungen betrafen entweder die Bedeutung von Pflanzen in Ökosystemen (BP) oder die Stoffzersetzung (SZ). Der Kontrollgruppe wurden fachdidaktische Inhalte zu denselben Schülervorstellungen vermittelt, sie nahm aber nicht an einer Intervention mithilfe von Fallmedien teil.

Tab. 1 Experimentalgruppen und Kontrollgruppe (N = 36)

3.2 Materialien zur Förderung diagnostischer Fertigkeiten

Um die Diagnosefertigkeiten der Lehramtsstudierenden zu trainieren, wurden für die Intervention zu jedem Inhaltsbereich (BP und SZ) drei Videofälle in Orientierung an Manuals zur Produktion geskripteter Videovignetten entwickelt (Gartmeier 2014; Hoppe-Seyler et al. 2014; Piwowar et al. 2017). Die Videofälle haben eine Länge von ca. zwei Minuten. In den insgesamt sechs Videofällen bearbeitet eine Gruppe von vier Schülerinnen und Schülern Aufgaben zu Stoffkreisläufen (je 3 Videofälle mit Aufgaben zu Pflanzen in Ökosystemen bzw. zur Stoffzersetzung). Dabei werden jeweils Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen (BP) bzw. Schülervorstellungen zur Stoffzersetzung (SZ) geäußert. Die Auswahl der Schülervorstellungen, welche in den Gruppenarbeiten geäußert werden, erfolgte literaturbasiert um möglichst repräsentative Fälle abzubilden (Dannemann et al. 2019; Piwowar et al. 2017; Schneider et al. 2016). Um vergleichbare Textfälle zu erstellen, wurden die Videofälle transkribiert und um nonverbale Informationen (Mimik/Gestik der Schüler etc.) angereichert. So entstanden sechs Fälle in Form von Transkripten mit je ca. 2000 Zeichen (s. Abb. 1). Sowohl Video- als auch Textfälle enthalten Zusatzinformationen zu Schulart, Klassenstufe, Thema der Stunde und verwendeten Unterrichtsmaterialien.

Abb. 1
figure 1

Auschnitt aus einem Textfall. Gespräch zwischen Schülern über die Ursachen und Prozesse der Stoffzersetzung

3.3 Instrument zur Erfassung der Diagnosefertigkeiten

Um die Wirkung der Intervention auf die Diagnosefertigkeiten zu erfassen, wurde sowohl vor als auch nach der Intervention ein Videotest durchgeführt (vgl. z. B. Blomberg et al. 2011). Zu beiden Messzeitpunkten wurde dasselbe Messinstrument verwendet. Der Videotest zur Messung der Diagnosefertigkeiten bestand aus zwei kurzen Videofällen (ca. 2 min) mit Schülerinnen und Schülern der neunten Klassenstufe einer Realschule. Eine Gruppe von vier Schülerinnen und Schülern löst Aufgaben zum Themenbereich der Stoffkreisläufe. Die Videofälle wurden in Anlehnung an authentische Unterrichtsszenen geskriptet. Die Unterrichtsausschnitte wurden so ausgewählt, dass die Äußerungen zu fachlichen Konzepten durch die Schülerinnen und Schüler im Fokus der Unterrichtsszenen stehen. Die Auswahl der Schülervorstellungen erfolgte mit Bezug zu vorliegenden Forschungsergebnissen, die in Zusammenstellungen typischer Schülervorstellungen aufgeführt werden (Hammann und Asshoff 2015; Kattmann 2015). Die in den Videofällen geäußerten Schülervorstellungen wurden jeweils den entsprechenden Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen (erster Teil des Videotests, z. B. anthropozentrische Zuweisung von Bedeutung) bzw. Schülervorstellungen zur Stoffzersetzung (zweiter Teil des Videotests, z. B. Zersetzung durch Einwirkung abiotischer Faktoren) zugeordnet. Ein Beispiel zur Schülervorstellung Zersetzung durch Einwirkung abiotischer Faktoren (vgl. z. B. Hammann und Asshoff 2015) ist die Aussage eines Schülers, dass die Veränderungen bei den Blättern durch Wind verursacht würden (vgl. Schüler 4 im Transkript, s. Abb. 1).

Zu jedem Videofall erhielten die Studierenden Informationen zur Unterrichtssequenz (z. B. Namen der Schülerinnen und Schüler, Klassenstufe, verwendete Arbeitsmaterialien), um Beobachtungen einzelnen Lernenden zuordnen zu können und sich ein Bild von der diagnostischen Situation zu machen. Die im Test verwendeten Videofälle unterschieden sich von den Videofällen im Rahmen der Intervention sowohl in Bezug auf die Schülergruppe, als auch die Aufgaben, welche von den Schülerinnen und Schülern bearbeitet wurden.

Die Studierenden sollten die offene Frage „Was erscheint Ihnen aus der Perspektive eines Biologielehrers/einer Biologielehrerin relevant für den weiteren Lehr-Lernprozess?“ beantworten und ihre Beobachtungen bezugnehmend auf einzelne Schüleräußerungen mit kurzen Erläuterungen und mit entsprechenden Zeitankern notieren (Minuten- und Sekundenangabe). Für die Erfassung der Interpretationsleistung von Unterrichtssituationen und speziell auch von Schülervorstellungen in Schüleräußerungen hat sich ein offenes Antwortformat bewährt (Kersting 2008; Rath 2017). Durch dieses können verschiedene Niveaus von Diagnosefertigkeiten erfasst werden. Beispielsweise kann festgestellt werden, ob eine Schülervorstellung in einer Schüleräußerung wahrgenommen wird und inwiefern die Denkweise thematisch verortet und benannt werden kann. Durch die Formulierung der offenen Frage sollte abgebildet werden, dass sich unterrichtsbegleitendes Diagnostizieren häufig spontan und unmittelbar vollzieht (Shavelson et al. 2008). Durch die Verwendung von Videos sollte die Flüchtigkeit der diagnostischen Situation abgebildet werden (Leahy und Sweller 2011). Die Studierenden durften die Videofälle nur einmal anschauen und lediglich zum Notieren von Beobachtungen pausieren. Die Bewältigung der auf diese Weise präsentierten Anforderungen verlangt, dass schnell und situationsbezogen auf Professionswissen zurückgegriffen werden muss (vgl. Blömeke et al. 2014). Um die Reliabilität der Messung von Diagnosefertigkeiten mithilfe des Vignettentests zu bestimmen, wurde Cronbachs Alpha berechnet. Die Reliabilität war gut (Cronbachs Alpha = 0,86).

3.4 Versuchsablauf

Einführend wurde allen Studierenden im Vorlesungsstil diagnoserelevantes Fachwissen (Ökosystem Wald, Biozönosen, Zersetzung etc.) und allgemeines fachdidaktisches Wissen zu Schülervorstellungen (z. B. Bedeutung von und Umgang mit Schülervorstellungen) in zwei Sitzungen à 90 min. vermittelt (s. Tab. 2). Spezifisches fachdidaktisches Wissen über typische Schülervorstellungen zum Themenbereich der Stoffkreisläufe wurde im Rahmen eines 90-minütigen Diagnosetrainings vermittelt. Die Diagnosetrainings wurde nach den Vorgaben des evidenzbasierten Modells Problemorientierten Lehrens und Lernens (Rieß und Mischo 2017) gestaltet. Zunächst wurde den Studierenden Vorgehensweisen und Lösungsbeispiele „erfolgreicher“ Diagnostikerinnen und Diagnostiker gezeigt. Dabei wurden spezifische Schülervorstellungen mithilfe von Ankerbeispielen und treffenden Namen bzw. Beschreibungen nachvollziehbar gemacht (Schrenk et al. 2019). Anschließend wurden die Studierenden aufgefordert, insgesamt drei Video- oder Textfälle auf das Vorkommen von Schülervorstellungen hin zu analysieren, sich auszutauschen und ihre Antworten mit Lösungsvorschlägen zu vergleichen. Im Rahmen dieser Fallarbeit mit Hilfe von Videos bzw. Texten arbeiteten die Studierenden je nach Gruppenzuweisung entweder mit Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen (BP) oder Schülervorstellungen zur Stoffzersetzung (SZ). Um den Einfluss der Dozierenden auf die Ergebnisse weitgehend auszuschließen sowie weitere Bedingungen (z. B. Lernzeit, Formulierung der Aufgaben) konstant zu halten, wurden diese fallbasierten Anteile der Intervention als vorstrukturierte Gruppenarbeit konzipiert und konnten von den Studierenden selbständig bearbeitet werden.

Tab. 2 Ablauf des Versuchs

Die Sitzung einer Kontrollgruppe lief zeitlich parallel zu der Fallarbeitsphase der Interventionsgruppen ab. Der Kontrollgruppe wurde im Gegensatz zu den Interventionsgruppen spezifisches fachdidaktisches Wissen sowohl über Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen (BP) also auch Schülervorstellungen zur Stoffzersetzung (SZ) vermittelt. Anstelle einer Anwendung dieses Wissens in Form von fallbasierten Diagnosetrainings erhielten die Studierenden die Aufgabe, einen Unterricht zu planen, in welchem diese Schülervorstellungen adressiert werden.

3.5 Auswertung der Diagnoseleistung als abhängige Variable

Die Diagnoseleistung (abhängige Variable) wird bestimmt durch die Ausprägung der Diagnosefertigkeiten des wissensgeleiteten Wahrnehmens und Interpretierens (s. Abschn. 2.3). Die Antworten der Studierenden wurden in Anlehnung an die qualitative Inhaltsanalyse (Mayring 2015) ausgewertet. Die Kategorienbildung erfolgte sowohl deduktiv als auch induktiv. Zunächst wurde kodiert, ob eine in Bezug auf Schülervorstellungen relevante Schüleräußerung überhaupt als bedeutsam für das weitere Lehren und Lernen erkannt wurde, d. h. ob die Studierenden eine Beobachtung zu der entsprechenden Stelle im Video mit einem Zeitanker notiert haben. Für diesen Fall wurde unterschieden, ob entweder in der betreffenden Schüleräußerung eine Schülervorstellung wahrgenommen wurde oder ob die Schüleräußerung in Bezug auf andere unterrichtliche Themenbereiche (z. B. Sozialverhalten) interpretiert wurde bzw. lediglich aus fachwissenschaftlicher Perspektive bewertet wurde. Wenn eine Schüleräußerung als Schülervorstellung wahrgenommen wurde, wurde kodiert, inwiefern die Schüleräußerung bezugnehmend auf die dahinterliegende Denkweise inhaltlich eingeschätzt wurde.

Insgesamt entstanden 18 Kategorien zur Beschreibung der Antworten durch die Studierenden. Diese wurden jeweils um Kodierregeln ergänzt. Für die Berechnung der Urteilerübereinstimmung anhand einer Übereinstimmungsmatrix wurden 10 % der Daten doppelt kodiert. Für den Kodierleitfaden konnte eine gute Urteilerübereinstimmung gemessen werden (к = 0,68). Die Kodierung der Daten erfolgte nach einem Beurteilertraining durch eine wissenschaftliche Hilfskraft.

Die im Rahmen der qualitativen Inhaltsanalyse gebildeten 18 Kategorien wurden in eine 6‑stufige, durch drei Experten validierte (ICC = 0,938), quasi-intervallskalierte Skala überführt, indem die Experten die Kategorien jeweils den Werten 1–6 zugeordnet haben (1 = sehr niedriges Niveau der Diagnosefertigkeiten, 6 = sehr hohes Niveau der Diagnosefertigkeiten). Dem Wert 6 wurde z. B. die Kategorie Schülervorstellung wird korrekt interpretiert und sehr präzise kategorisiert zugeordnet. Jeder Antwort der Studierenden, die sich auf eine relevante Stelle im Video bezog, wurde entsprechend ein Wert von 1–6 zugewiesen. Die Werte wurden für jeden Teil des Videotests addiert und ergaben ausgehend von der Ausprägung der Diagnosefertigkeiten ein umfassendes Maß für die Diagnoseleistung in Form eines Summenscores. Die Diagnoseleistung entspricht hier dem Fertigkeitsniveau und bezieht sich auf beide hier erfassten, zusammenhängenden Teilfertigkeiten, also sowohl das bloße Wahrnehmen einer relevanten Schüleräußerung als auch eine in unterschiedlichem Maße angemessene Interpretation hinsichtlich der dahinterliegenden Schülervorstellung.

4 Ergebnisse

Tab. 3 zeigt die deskriptiven Werte für die wichtigsten Variablen in allen Experimentalbedingungen für beide Teile des Tests (Diagnostizieren von Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen [BP] und Diagnostizieren von Schülervorstellungen zur Stoffzersetzung [SZ]). Allen Analysen wurde ein Signifikanzniveau von 5 % zu Grunde gelegt. Die Signifikanztestung erfolgte zweiseitig. Als Maß für die Effektstärke nutzten wir das partielle η2. Nach Cohen (1988) gelten Werte <0,06 als kleine Effekte, Werte zwischen 0,06 und 0,13 als mittlere Effekte und Werte von >0,13 als große Effekte. Ein mittlerer Effekt gilt für unsere Untersuchung als inhaltlich relevant. Aufgrund der verhältnismäßig kleinen Stichprobengröße wurden sämtliche Berechnungen auch mit nicht-parametrischen Verfahren durchgeführt.

Tab. 3 Minimal- und Maximalwerte, Mittelwerte und Standardabweichung der Variable Diagnoseleistung in beiden Teilen des Tests (Diagnose von Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen [BP] bzw. Schülervorstellungen zur Stoffzersetzung [SZ])

4.1 Voranalysen

Die Gruppen unterschieden sich zum Prätestzeitpunkt nicht signifikant in ihren diagnostischen Fertigkeiten (Tab. 3) sowie in den demographischen Daten Alter, Geschlechterverteilung, Studiengang (Primar- bzw. Sekundarstufe), Fachsemester und Benotung im Fach Biologie (alle ps > 0,20).

4.2 Forschungsfrage 1: Führt ein Training an Fallmedien in Kombination mit der Vermittlung spezifischen fachdidaktischen Wissens zu einer Verbesserung diagnostischer Fertigkeiten im Vergleich zu einer Kontrollgruppe, in der nur spezifisches fachdidaktisches Wissen vermittelt wird?

Um diese Fragestellung zu untersuchen, wurden die Zuwächse der Diagnoseleistung von Prä- zu Posttest von Lehramtsstudierenden der Kontrollgruppe verglichen mit den Zuwächsen in der Diagnoseleistung bei Lehramtsstudierenden, die jeweils an video- bzw. textbasierten Diagnosetrainings zu einem bestimmten Inhalt (Bedeutung von Pflanzen in Ökosystemen [BP] oder Stoffzersetzung [SZ]) teilgenommen haben. Die deskriptiven Werte für die einzelnen Gruppen sind in Tab. 3 dargestellt. Abb. 2 gibt einen Überblick über die Zuwächse der Diagnoseleistung von Prä- zu Posttest für beide Teile des Videotests (BP und SZ).

Abb. 2
figure 2

Zuwächse der Diagnoseleistung von Prä- zu Posttest in beiden inhaltlichen Teile des Tests (BP und SZ) mit Standardabweichungen. BP bzw. SZ stehen für die jeweiligen Schülervorstellungen, welche Gegenstand der Tests bzw. der Diagnosetrainings waren (BP Bedeutung von Pflanzen, SZ Stoffzersetzung). Die fallmedienbasierten Trainingsgruppen umfassen die Versuchsgruppen Video_BP und Text_BP (n = 15) bzw. Video_SZ und Text_SZ (n = 14). Als Fallmedien wurden in den Trainings Videos oder Texte eingesetzt. In der Kontrollgruppe (n = 7) wurden Schülervorstellungen sowohl zu BP als auch SZ vermittelt, allerdings ohne Diagnosetrainings. Theoretisch war maximal möglich ein Summenscore im Wert von 108 Punkten. (*p < 0,05; **p < 0,01)

Eine ANOVA mit Messwiederholung zeigte für den ersten Teil des Tests (BP), dass es eine statistisch signifikante Interaktion zwischen der Zeit und den Untersuchungsgruppen gab, F (2; 33) = 8,62; p = 0,001; partielles η2 = 0,343. Bei einem Vergleich mit der Kontrollgruppe, welcher fachdidaktisches Wissen ohne ein Diagnosetraining an Fallmedien vermittelt wurde, konnte gemäß einem Bonferroni-korrigierten post-hoc-Test kein signifikanter Unterschied im Zuwachs der Diagnoseleistung festgestellt werden. Ein Training an Fallmedien hat sich für das Diagnostizieren von Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen nicht als besonders wirksam erwiesen. Entscheidend schien dagegen der Inhaltsbereich zu sein, welcher Gegenstand des Diagnosetrainings war: Es zeigte sich, dass der Zuwachs der Diagnoseleistung bei der Gruppe, welche mit Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen (BP) trainiert hat, deutlich höher ausfiel, als bei derjenigen Gruppe, die an einem Diagnosetraining zu einem anderen Thema (SZ) teilgenommen hat (p = 0,001).

Für den zweiten Teil des Tests (SZ), zeigte eine ANOVA mit Messwiederholung, dass es auch hier eine signifikante Interaktion zwischen der Zeit und den Untersuchungsgruppen gab, F (2; 33) = 24,38; p < 0,001, partielles η2 = 596. Gemäß einem Bonferroni-korrigierten post-hoc-Test unterschieden sich die Zuwächse in der Diagnoseleistung in der Gruppe, welche an Fallmedien zum Thema SZ trainiert hat, signifikant von der Kontrollgruppe (p < 0,001). Beim Diagnostizieren von Schülervorstellungen zur Stoffzersetzung (SZ) erhöhte sich also die Diagnoseleistung in den Gruppen, die an einem Diagnosetraining an Fallmedien teilgenommen haben deutlich im Vergleich zur Kontrollgruppe – allerdings nur dann, wenn auch mit dem entsprechenden Inhaltsbereich (SZ) trainiert wurde. Der Zuwachs der Diagnoseleistung in der Gruppe, welche an Fallmedien zum Thema SZ trainiert hat, fiel signifikant höher aus als bei der Gruppe, die an einem Diagnosetraining an Fallmedien zu einem anderen Thema (BP) teilgenommen hat (p < 0,001).

Zusammenfassend kann mit Bezug zu Forschungsfrage 1 festgehalten werden, dass ein Training an Fallmedien zu einer Verbesserung der diagnostischen Fertigkeiten führt verglichen mit einer Kontrollgruppe, der spezifisches fachdidaktisches Wissen vermittelt wird – allerdings nur bei einem bestimmten Themenbereich (SZ). Darüber hinaus deutet sich an, dass neben den Trainings an Fallmedien die Inhalte, mit denen trainiert wurde, einen entscheidenden Einfluss auf den Erwerb von Diagnosefertigkeiten zu haben scheinen. Dieser Befund wird unter Forschungsfrage 3 näher diskutiert.

4.3 Forschungsfrage 2: Lassen sich diagnostische Fertigkeiten mit Video- oder Textvignetten wirksamer fördern?

Um diese Fragestellung zu untersuchen, wurden die Zuwächse der Diagnoseleistung von Prä- zu Posttest von denjenigen Lehramtsstudierenden verglichen, die an Diagnosetrainings mithilfe von Videos bzw. Texten jeweils zu den gleichen biologischen Inhalten (BP bzw. SZ) teilgenommen haben. Bei einem Vergleich der Gruppen Video_BP und Text_BP konnten mithilfe von t-Tests weder für das Diagnostizieren von Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen (BP) noch für das Diagnostizieren von Schülervorstellungen zur Stoffzersetzung (SZ) signifikante Unterschiede im Zuwachs der Diagnoseleistung ausgehend von der Verwendung unterschiedlicher Fallmedien festgestellt werden, t (13) = 0,75; p = 0,470 bzw. t (13) = 0,391; p = 0,702. Auch bei einem Vergleich der Gruppen Video_SZ und Text_SZ konnte für keinen der beiden Themenbereiche (BP und SZ) mithilfe von t-Tests signifikante Unterschiede im Zuwachs der Diagnoseleistung nachgewiesen werden, t (12) = −0,36; p = 0,72 bzw. t (12) = −1,82; p = 0,09.

Während es für den Zuwachs der Diagnoseleistung zumindest für den Themenbereich SZ einen entscheidenden Unterschied machte, ob an Fallmedien trainiert wurde oder nicht, scheint hier die Wahl des Medienformats (Video oder Text) unerheblich zu sein.

4.4 Forschungsfrage 3: Werden diagnostische Fertigkeiten mithilfe von vignettenbezogenen Fördermaßnahmen inhaltsspezifisch erworben oder erfolgt auch eine Sensibilisierung für einen anderen Inhaltsbereich?

Um festzustellen, inwiefern Diagnosefertigkeiten im Rahmen der vignettenbezogenen Diagnosetrainings inhaltsbezogen erworben werden, wurde mithilfe von t-Tests für jede Experimentalgruppe der Zuwachs der Diagnoseleistung bezogen auf Inhalte, die Gegenstand eines Diagnosetrainings waren (z. B. BP), verglichen mit der Transferleistung, also der Diagnosefertigkeiten bezogen auf einen anderen Inhaltsbereich (z. B. SZ). Die deskriptiven Werte für die Diagnoseleistung zum Prä- und zum Posttestzeitpunkt sind in Tab. 3 dargestellt.

Die Gruppe Video_BP hat an einem Diagnosetraining bezogen auf Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen (BP) teilgenommen. Der Zuwachs der Diagnoseleistung war bezogen auf entsprechende Schülervorstellungen (BP) signifikant höher als bezogen auf Schülervorstellungen aus dem Bereich Stoffzersetzung, t (7) = 3,82; p = 0,006. Auch bei den anderen Gruppen, welche an Diagnosetrainings zu spezifischen Inhalten teilgenommen haben, konnte ein signifikant höherer Zuwachs der Diagnoseleistung festgestellt werden bezogen auf diejenigen Inhalte, welche Gegenstand der Fördermaßnahmen waren verglichen mit anderen Inhaltsbereichen. Die Signifikanzwerte lagen bei p = 0,039 (Text_BP), p = 0,001 (Video_SZ) und p = 0,002 (Text_SZ). Im Vergleich zu den inhaltsspezifischen Fördermaßnahmen scheint eine Sensibilisierung und Förderung in einem anderen Inhaltsbereich für den Erwerb der hier fokussierten Diagnosefertigkeiten wenig wirksam zu sein.

5 Diskussion

In der vorliegenden Studie wurde untersucht, inwiefern sich eine Variation der Fallmedien zur Förderung von Diagnosefertigkeiten (Video- bzw. Textvignetten) und eine Variation der Diagnosegegenstände (unterschiedliche Schülervorstellungen) auf den Erwerb von Diagnosefertigkeiten von Lehramtsstudierenden in flüchtigen Unterrichtssituationen auswirken. Es wurden drei Forschungsfragen formuliert und experimentell untersucht.

5.1 Führt ein Training an Fallmedien in Kombination mit der Vermittlung spezifischen fachdidaktischen Wissens zu einer Verbesserung diagnostischer Fertigkeiten im Vergleich zu einer Kontrollgruppe, in der nur spezifisches fachdidaktisches Wissen vermittelt wird?

Beim Diagnostizieren von Schülervorstellungen zur Stoffzersetzung (SZ) zeigte sich, dass die Lehramtsstudierenden deutlich von einem Training an Fallmedien profitieren im Vergleich zu einer Vermittlung spezifischen fachdidaktischen Wissens ohne entsprechende Anwendungsmöglichkeit. Die Lehramtsstudierenden scheinen hier von einer Lerngelegenheit zu profitieren, die sich in wichtigen Facetten den Anforderungen gelingender unterrichtsbegleitender Diagnosen annähert (Grossman et al. 2018).

Beim Diagnostizieren von Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen (BP) zeigte sich dieser Effekt nicht. Die Diagnosefertigkeiten der Lehramtsstudierenden verbesserten sich zwar, allerdings nicht signifikant im Vergleich zur Kontrollgruppe. Eine mögliche Ursache dafür, dass die Gruppen, welche mit Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen gearbeitet haben, scheinbar weniger von den Trainings an Fallmedien profitiert haben, liegt in den unterschiedlich komplexen gedanklichen Konstruktionen der betreffenden Schülervorstellungen (BP und SZ) und damit unterschiedlichen Anforderungen beim Wahrnehmen und Interpretieren.

Um diese Annahme zu erklären, kann eine Analogie zu hoch- und niedrig-inferenten Urteilen bei der Unterrichtsdiagnostik gezogen werden (Schrader 2014). Während die in der Studie verwendeten Schülervorstellungen zur Stoffzersetzung (SZ) zu den weniger komplexen Konzepten gezählt werden können, handelt es sich bei den ausgewählten Schülervorstellungen zur Bedeutung von Pflanzen in Ökosystemen eher um komplexere Denkfiguren (Gropengießer 2006). Das Diagnostizieren von komplexen Schülervorstellungen (hier: Denkfiguren [BP]) ist ähnlich wie das hoch-inferente Urteilen insofern herausfordernd, als dass unterschiedliche Indikatoren in ihrem Zusammenhang und teilweise über längere Zeitabschnitte hinweg wahrgenommen und aufeinander bezogen werden müssen. Erst dadurch kann auf das Vorliegen einer bestimmten Schülervorstellung geschlossen werden. Dass dagegen weniger komplexe Schülervorstellungen (hier: Konzepte [SZ]) in einem einzigen Satz oder einer Behauptung ausgedrückt werden können (Gropengießer und Marohn 2018), könnte die Häufigkeit der Wahrnehmung und Interpretation von Schülervorstellungen und damit den Erwerb von Diagnosefertigkeiten bei Trainings an Fallmedien begünstigen.

5.2 Lassen sich diagnostische Fertigkeiten mit Video- oder Textvignetten wirksamer fördern?

Ein wesentliches Ziel der Studie war zu untersuchen, ob ein bestimmtes Fallmedium (Video oder Text) als Förderinstrument für „on-the-fly“-Diagnosen von Schülervorstellungen eher geeignet ist. Ergebnisse bisheriger Studien deuten darauf hin, dass Video- und Textfälle bei der Förderung bestimmter Lehrerkompetenzen weitgehend gleichermaßen geeignet sind (Kramer et al. 2017; Schneider et al. 2016). Die Studie repliziert Ergebnisse vorausgegangener Studien insofern, als dass ein Training mit Textfällen ein ähnliches Potential zu haben scheint wie ein Training mit Videofällen. Weder für die Diagnose von Schülervorstellungen zur Bedeutung von Pflanzen (BP), noch für die Diagnose von Schülervorstellungen zur Stoffzersetzung (SZ) konnte bei der Untersuchung der Effekte eine unterschiedliche Wirkung der Lernbedingung Video vs. Text festgestellt werden.

5.3 Werden diagnostische Fertigkeiten mithilfe von vignettenbezogenen Fördermaßnahmen inhaltsspezifisch erworben oder erfolgt auch eine Sensibilisierung für einen anderen Inhaltsbereich?

Das spezifische fachdidaktische Wissen (hier: Wissen über spezifische Schülervorstellungen), welches im Rahmen der Diagnosetrainings vermittelt wurde, scheint eine wesentliche Rolle für den Erwerb von Diagnosefertigkeiten zu spielen: Diagnostiziert werden diejenigen Schülervorstellungen, mit denen auch spezifisch trainiert wurde. Der Befund zu eingeschränkten Transferleistungen über verschiedene Arten von Schülervorstellungen hinweg unterstreicht die Bedeutung von spezifischem fachdidaktischen Wissen für den Erwerb von Diagnosefertigkeiten (siehe auch Todorova et al. 2017). Eine Sensibilisierung und Förderung in einem anderen Inhaltsbereich scheint in Bezug auf die hier untersuchten Diagnosefertigkeiten wenig zu bewirken. Diagnosefertigkeiten scheinen hier inhaltsspezifisch erworben zu werden.

5.4 Implikationen für die Lehrerbildung

Hinsichtlich des Erwerbs von Diagnosefertigkeiten scheint es im Allgemeinen nicht entscheidend zu sein, ob als Förderinstrumente Video- oder Textvignetten verwendet werden. Dazu ist anzumerken, dass für die verwendeten Schülervorstellungen und die betreffende diagnostische Situation fast ausschließlich verbale Äußerungen der Schülerinnen und Schüler von Bedeutung sind. Verbale Äußerungen können in Textvignetten (hier: Transkripten) gut abgebildet werden. Für andere Diagnoseinhalte bzw. diagnostische Situationen sind möglicherweise weitere Informationen wie der Einsatz von Experimenten oder Unterrichtsmedien bzw. Gestik und Mimik (z. B. bei Schüler-Lehrer-Interaktionen) relevant. In solchen Fällen liegt ggfs. ein Mehrwert in der Verwendung von Fallvideos, die die Unterrichtssituationen in ihrer Komplexität und Reichhaltigkeit umfassender als Textfälle abbilden (Koc et al. 2009).

Bei Schülervorstellungen, welche konkret auf sachliche Inhalten bezogen sind (hier: SZ), scheinen Lehramtsstudierende in Bezug auf die Förderung ihrer Diagnosefertigkeiten bereits von einer kurzen Trainingsintervention mithilfe von Fallmedien stark zu profitieren. Schneider et al. (2016) konnten feststellen, dass sich die Anzahl fallbasierter Sitzungen (mit Video oder Text) positiv auf die thematisch fokussierte Selektion von Situationen auswirkte. Für den Fall möglicherweise komplexerer Schülervorstellungen (hier: BP) ist entsprechend zu prüfen, ob ggfs. weitere Trainingseinheiten die Diagnosefertigkeiten verbessern.

Die Vermittlung von spezifischem fachdidaktischen Wissen, also Wissen zu spezifischen Schülervorstellungen, scheint grundlegend für gelingende Diagnosen zu sein. Da sich ein Transfer von Diagnosefertigkeiten zwischen unterschiedlichen Inhaltsdomänen schwierig gestaltet, profitieren Lehramtsstudierende möglicherweise, wenn möglichst viele und unterschiedliche Schülervorstellungen repräsentiert sind. Todorova et al. (2017) zogen für die Förderung professioneller Unterrichtswahrnehmung bezogen auf Lernerunterstützung im naturwissenschaftlichen Unterricht eine ähnliche Schlussfolgerung. Auch wenn die Möglichkeiten Transfers herzustellen begrenzt sind, dürften fallbasierte Diagnosetrainings für Lehramtsstudierende auch insofern in Bezug auf andere inhaltliche biologische Themenbereiche förderlich sein, als dass möglicherweise allgemeine Unterrichtsprinzipien – etwa die Notwendigkeit eines Perspektivenwechsels hin zur Schülerperspektive – vermittelt werden können (Dannemann et al. 2014).

5.5 Grenzen der Studie und weitere Forschung

In Bezug auf die Studie ist einschränkend zu bemerken, dass sich aufgrund der kleinen Stichprobe und der fehlenden (statistischen) Power bei der Auswertung der Ergebnisse lediglich Indizien hinsichtlich des Einflusses fallbasierter Diagnosetrainings sowie unterschiedlicher Schülervorstellungen auf den Erwerb von Diagnosefertigkeiten von Lehramtsstudierenden gewinnen lassen, es jedoch einer Replikation in einer größeren Studie bedarf.

Wir weisen zudem darauf hin, dass für den von uns eingesetzten Vignettentest neben den berichteten Reliabilitätskoeffizienten keine weiteren testtheoretischen Gütekriterien vorlagen. Aufgrund des spezifischen fachdidaktischen Kontexts, in dem Diagnosefertigkeiten hier gemessen wurden, konnten wir leider nicht auf Instrumente mit belegter Reliabilität und Validität zurückgreifen. Grundsätzlich hat sich aber die Erfassung von professionellen Fertigkeiten von Lehrkräften mithilfe von Videovignetten vielfach bewährt (z. B. Hoth et al. 2018; Kaiser et al. 2015; Kersting 2008; Knievel et al. 2015; Star et al. 2011). Nichtsdestoweniger sollte in weiteren Studien vor allem die Validität unserer Art der vignettenbasierten Erfassung von fachdidaktischen diagnostischen Fertigkeiten untersucht werden.

Darüber hinaus lassen sich durch eine Erweiterung des Testinstruments möglicherweise weiterführende Erkenntnisse über den Erwerb von Diagnosefertigkeiten gewinnen. Aufgrund der Bedeutung, die bestimmte Wissensbestände für das Diagnostizieren haben, ist es hier wünschenswert, ergänzend auch deklarative Wissensanteile als Moderatoren gezielt zu erfassen (vgl. z. B. Blömeke et al. 2014). Darüber hinaus wäre es womöglich aufschlussreich, neben Wissenskomponenten auch z. B. Einstellungen oder Motivation zu erfassen, welche als weitere Anteile eines umfassenden Konstrukts diagnostischer Kompetenz angesehen werden (vgl. z. B. Blömeke et al. 2015; Loibl et al. 2020; dieses Heft).

In der verwendeten Testsituation wurde die Flüchtigkeit der diagnostischen Situation als ein Merkmal komplexer Unterrichtspraxis durch einen entsprechenden Einsatz der Videofälle umgesetzt. Im Unterricht sind diagnostische Situationen unter anderem ggfs. auch durch Zeitdruck geprägt. Dieser lässt sich durch eine flüchtige Präsentation von Schüleräußerungen nur bedingt darstellen. Um Zeitdruck beim Diagnostizieren abzubilden, ist es sinnvoll, diese Komponente in die Gestaltung eines Testinstruments aufzunehmen (indem Antworten unter Zeitdruck gegeben werden, vgl. z. B. Knievel et al. 2015).

Im Rahmen des DiaCoM-Rahmenmodells von Loibl et al. (2020) lassen sich die Befunde im Sinne der Informationsverarbeitungsprozesse folgendermaßen deuten: Lehrkräfte diagnostizieren Vorstellungen von Schülerinnen und Schülern zu ökologischen Konzepten. Das hierzu nötige (fachdidaktische) diagnostische Wissen (als Personencharakteristik) wurde nur beim weniger komplexen Diagnosegegenstand wirksam, was auf die Bedeutung der Verfügbarkeit dieses Wissens hinweist. Die relative Flüchtigkeit der Information in Videos im Vergleich zu Textvignetten (als Situationscharakteristik) beeinflusste die Prozesse der Informationsverarbeitung jedoch nicht negativ. Aussagen darüber, inwieweit hier Prozesse des Gedächtnisses und der kognitiven und motivationalen Einflüsse der situativen Verankerung eine Rolle spielen, können im Rahmen des hier vorliegenden Designs allerdings nicht getroffen werden.