1 Einleitung

Diagnostizieren gilt als eine wesentliche Tätigkeit von Lehrkräften: Eine zutreffende Einschätzung über Wissen, Motivation oder Denken der Schülerinnen und Schüler ist Voraussetzung für das Feedback an Lernende oder Eltern, für Übergangsentscheidungen im Bildungssystem, für die Anpassung des Unterrichts (z. B. nach Fähigkeitsniveau), aber auch für die Einteilung eigener Ressourcen (z. B. Artelt und Gräsel 2009; Baumert und Kunter 2013; Glock et al. 2015; Helmke 2010; Hobfoll et al. 2018; Praetorius et al. 2013). Das Wissen und die Fähigkeiten der Lehrkräfte, die für die Vorbereitung, Durchführung und Reflexion von Beurteilungen erforderlich sind, werden unter dem Oberbegriff diagnostische Kompetenz zusammengefasst (Herppich et al. 2018; Leuders et al. 2018; Popham 2009; Schrader 2009; Weinert et al. 1990). Wenn eine Lehrkraft einen Schüler bzw. eine Schülerin, eine Aufgabe oder allgemeiner eine Lehr-Lern-Situation beurteilt, werden sowohl der Prozess als auch das Ergebnis dieser Diagnose allgemein als diagnostisches Urteil bezeichnet (Artelt und Rausch 2014). Die Qualität eines diagnostischen Urteils wird traditionell anhand seiner Akkuratheit bewertet (Anders et al. 2010; Hoge und Coladarci 1989; Spinath 2005; Südkamp et al. 2012; Schrader 1997). Dabei interessieren z. B. folgende Fragen: Wie gut stimmt ein Urteil der Lehrkraft mit einer objektiven Bewertung der Merkmale des Schülers oder der Schülerin (z. B. Fähigkeit) oder des Materials (z. B. Aufgabenschwierigkeit) überein? Jede systematische Abweichung dieser Genauigkeit wird als Beurteilungsfehler betrachtet (wie in allgemeinen Theorien über soziale Urteile; z. B. Kahneman 2003), den es zu vermeiden gilt.

Studien zur diagnostischen Kompetenz von Lehrkräften konzentrieren sich auf verschiedene Aspekte. Die meisten Forschungsarbeiten zielen darauf ab, den Einfluss verschiedener situativer Faktoren (z. B. der untersuchten Lerngruppe oder der Aufgabenschwierigkeiten) oder der Eigenschaften von Lehrpersonen (z. B. Berufserfahrung oder Fachwissen) auf die Urteilsgenauigkeit zu analysieren (für einen Überblick siehe Südkamp et al. 2012). Andere Ansätze sind an der Untersuchung des breiten Spektrums von Lehrkräfteaktivitäten im Zusammenhang mit Diagnosen interessiert (z. B. Black und Wiliam 2003; Herppich et al. 2018). Der Forschungsstand zu diagnostischem Urteilen wird in der Bildungsforschung jedoch als unbefriedigend angesehen, da bisher noch keine überzeugenden Theorien über die kognitiven Prozesse beim Diagnostizieren aufgestellt wurden (Schrader 2009; Spinath 2005; Leuders et al. 2018; Herppich et al. 2018). Für das Verständnis der Genese eines Urteils ist es jedoch entscheidend, welche Informationen in der Diagnosesituation von einer Lehrkraft wahrgenommen werden und wie diese Informationen verarbeitet werden. Überraschenderweise ist bislang nur wenig über diese Informationsverarbeitungsprozesse von Lehrkräften bekannt.

An dieser Stelle setzt das Rahmenmodell DiaCoM (Explaining Teachers’ Diagnostic Judgements by Cognitive Modeling; Erklärung der diagnostischen Urteile von Lehrkräften durch kognitive Modellierung; Loibl et al. 2020) an. Das DiaCoM-Rahmenmodell bietet eine theoretische Basis für Forschungsansätze, die diagnostische Urteile von Lehrkräften als Informationsverarbeitungsprozesse erklären wollen. Die Beiträge in diesem Heft nehmen expliziten Bezug zum DiaCoM-Rahmenmodell und haben das Ziel, Erklärungswissen zum Entstehen diagnostischer Urteile zu generieren. Das Rahmenmodell wird im Folgenden in seiner Struktur und seiner forschungsstrategischen Funktion vorgestellt. Der Text orientiert sich dabei an der ausführlichen Darstellung bei Loibl et al. (2020).

2 Das DiaCoM-Rahmenmodell und seine Komponenten

Das DiaCoM-Rahmenmodell (Loibl et al. 2020) konzeptualisiert diagnostisches Urteilen in Bildungskontexten als kognitive Prozesse einer Lehrkraft über Schülerinnen und Schüler (z. B. deren Fähigkeit) oder über Anforderungen (z. B. Aufgabenschwierigkeiten) auf der Grundlage der Informationen, die explizit oder implizit in einer diagnostischen Situation bestehen. Es bezieht sich auf Theorien der kognitiven Informationsverarbeitung und beschreibt diese zunächst auf generische Weise. Dabei werden im DiaCoM-Rahmenmodell nicht alle für eine diagnostische Unterrichtssituation relevanten Aspekte abgebildet: Zum einen haben Lehrkräfte im DiaCoM-Rahmenmodell eine definierte Rolle als urteilende Subjekte und Schülerinnen und Schüler als Objekte von Urteilen. Das heißt, dass z. B. Prozesse der Selbsteinschätzung von Schülerinnen und Schülern oder die Metakognition von Lehrkräften über ihr eigenes Urteil hier nicht einbezogen werden. Zum zweiten werden komplexe Handlungen von Lehrkräften im Umfeld der diagnostischen Urteile, wie z. B. das Generieren von Diagnoseaufgaben oder das Führen diagnostischer Gespräche, im DiaCoM-Rahmenmodell nicht berücksichtigt, da wir uns auf kognitive Informationsverarbeitungsprozesse konzentrieren, die an der Entstehung diagnostischer Beurteilungen beteiligt sind. Demgegenüber beziehen Ansätze anderer Forschungsgruppen (cosima: Heitzmann et al. 2019; NeDiKo: Herppich et al. 2018) solche Aktivitäten von Lehrkräften in diagnostischen Situationen mit ein.

Innerhalb dieses Fokus spezifiziert das DiaCoM-Rahmenmodell vier Komponenten, die in Abb. 1 dargestellt und in den folgenden Abschnitten erläutert werden: die Personencharakteristika (d. h. die Merkmale der Lehrkraft) (PC), die Situationscharakteristika (SC), das diagnostische Denken (DD) als Informationsverarbeitung und schließlich das Diagnoseverhalten (DV). Dabei soll das DiaCoM-Rahmenmodell nicht eo ipso als kognitives Modell diagnostischen Denkens verstanden werden, sondern vielmehr als „forschungsheuristisches Modell“. Zentrale Funktion des DiaCoM-Rahmenmodells ist es Forschungsprozesse zu strukturieren, welche das Ziel haben, Erklärungswissen zur Genese diagnostischer Urteile zu generieren. Dies wird dadurch möglich, dass nach Spezifikation der informationsverarbeitenden Prozesse theoretische Voraussagen darüber getroffen werden können, welche Personen- und Situationscharakteristika zu welchem diagnostischen Verhalten führen. Solche Zusammenhänge sind dann einer experimentellen Prüfung durch systematische Variation der Situation oder der Personen (z. B. durch Instruktion) zugänglich.

Abb. 1
figure 1

Komponenten des DiaCoM-Rahmenmodells. (Loibl et al. 2020)

Die Komponente des diagnostischen Denkens (DD) ist das Herzstück des DiaCoM-Rahmenmodells. Diagnostisches Denken wird im Modell als kognitive Informationsverarbeitung konzeptualisiert. Informationen stammen aus der Situation oder werden im Langzeitgedächtnis gespeichert. Somit kann die Informationsverarbeitung durch stabile Merkmale (z. B. Überzeugungen) oder vorübergehende Zustände (z. B. Stress) der Lehrperson moderiert (gefiltert, geändert, modifiziert usw.) werden. Obwohl das DiaCoM-Rahmenmodell die kognitive Modellierung des diagnostischen Denkens hervorhebt, schlagen wir kein allgemeingültiges kognitives Modell für alle diagnostischen Situationen oder Forschungsfragen vor. Stattdessen muss diese Komponente des Rahmenmodells in Bezug auf das jeweilige Forschungsziel spezifiziert werden, indem auf der breiten Literatur zu Informationsverarbeitungsmodellen aufgebaut wird – z. B. zum Urteilen und Entscheiden (Gigerenzer und Gaissmaier 2011), zum Problemlösen (Newell und Simon 1972; Schoenfeld 1985) oder zum induktiven Schließen (z. B. Feeney und Heit 2007). Die möglichen Spezifikationen sind so vielfältig wie die diagnostischen Urteilsprozesse, die beschrieben werden sollen. Konkrete Beispiele finden sich in den in diesem Heft vorgestellten Studien sowie in den Beispielstudien in Loibl et al. (2020).

Die Personencharakteristika (PC) umfassen alle Merkmale der Lehrperson (z. B. Wissen, Überzeugungen, Motivation), die die Beurteilung eines schulischen Diagnosegegenstandes beeinflussen können. Wissen kann allgemein (z. B. Wissen über pädagogische Inhalte über Schülertypen) oder spezifisch in Bezug auf Schülerinnen und Schülern oder Aufgaben sein (z. B. vermutete Eigenschaften der Schülerinnen und Schüler, Kenntnis der Lösungen der Schülerinnen und Schüler oder typische Fehler bei bestimmten Aufgaben). Diese Konzeptualisierung von Eigenschaften (Traits) ermöglicht die Formulierung theoretischer Annahmen über die Verwendung von Wissen und/oder den Einfluss von wissensbasierten Überzeugungen während des Urteilsprozesses. Um solche theoretischen Annahmen zu testen, ist es notwendig, die Eigenschaften von Lehrkräften zu messen oder experimentell zu manipulieren (z. B. durch gezielte Instruktionen vor der Beurteilung einer diagnostischen Situation). Bestimmte Situationen können zudem einen temporären kognitiven, motivierenden oder emotionalen Zustand (State, z. B. Stress) auslösen, der den Beurteilungsprozess beeinflussen kann. Abhängig von der Forschungsfrage kann es daher wichtig sein, den Zustand der Lehrkraft als situationsspezifisches Merkmal der Person zu manipulieren und/oder zu messen. Die meisten Lehrkräfteeigenschaften (wie motivationale Dispositionen oder intellektuelle Fähigkeiten) sind schwer zu trainieren. Wissensfacetten sowie ausgewählte situative Merkmale stellen stattdessen Komponenten im Modell dar, die durch Interventionen leicht verändert werden können.

Innerhalb des DiaCoM-Rahmenmodells geben die Situationscharakteristika (SC) den Kontext vor, auf den die Lehrkraft stößt oder der von der Lehrkraft bewusst oder unbewusst erzeugt wird. Diese diagnostische Situation enthält die Informationen, die die Lehrperson nutzen kann, um Rückschlüsse auf Materialien oder Schülerinnen und Schüler zu ziehen. Im DiaCoM-Rahmenmodell müssen diese Informationen explizit durch Cues definiert werden (vgl. Brunswik 1955). Cues stellen diejenigen Informationen dar, die beim Diagnostizieren verwendet werden können. Einige Cues können leicht wahrgenommen werden (sog. Oberflächenmerkmale, d. h. Merkmale, die durch niedrig-inferenzielle Informationsverarbeitung identifiziert werden können), während Tiefenstrukturmerkmale nur mit hohem kognitiven Aufwand und durch hoch-inferenzielle oder komplexe Informationsverarbeitung erkannt und eingeordnet werden können. Ob eine Situation tatsächlich einen bestimmten Cue enthält, kann theoretisch festgelegt werden – etwa bei systematischer Konstruktion einer Situation – oder durch die Befragung von Expertinnen und Experten empirisch bestimmt werden. Cues können sich auf Aufgaben, auf Schülerinnen und Schüler oder auf Aspekte des Kontextes (z. B. die Klassenkomposition) beziehen. Bei der Spezifizierung des DiaCoM-Rahmenmodells bedarf es einer bewussten und auf den Forschungszielen basierenden Entscheidung zur Auswahl und Konzeptualisierung der Cues. Durch Auswahl geeigneter Cues kann eine valide theoretische Darstellung der Situation erreicht werden. Durch systematisch variierende Cues können experimentell kontrollierte Bedingungen erzeugt und Theorien über die Verwendung dieser Cues während der Informationsverarbeitung validiert werden. Experimente zur Cue-Nutzung sind vielversprechend, da die Informationsdichte oder das Auftreten von Cues in der Forschung leicht manipuliert werden können.

Schließlich bezieht sich die Komponente des diagnostischen Verhaltens (DV) auf alle Arten von beobachtbarem Verhalten von Lehrerkräften. Das diagnostische Verhalten kann sowohl im Hinblick auf den Beurteilungsprozess als auch auf das Beurteilungsergebnis betrachtet werden. Bevor das diagnostische Urteil gefällt wird, können Augenbewegungen, Protokolle zum Lauten Denken oder andere Prozessdaten verwendet werden, um auf die zugrundeliegenden Beurteilungsprozesse (das diagnostische Denken) zu schließen. Mündliche oder schriftliche Antworten sowie (Unterrichts‑)Handlungen können als Indikator für das Beurteilungsergebnis herangezogen werden. Dabei ist der Übergang zwischen diagnostischem Verhalten im Prozess und als Ergebnis fließend.

Die Anwendung des DiaCoM-Rahmenmodells beschränkt sich auf die Prozesse und Ergebnisse, die mit der sofortigen Beurteilung nach der Darstellung einer diagnostischen Situation verbunden sind. Aktivitäten der Lehrkraft wie das Beschaffen weiterer Informationen (über die Klasse oder aus der Fachliteratur) oder die Entscheidung über eine Unterrichtsstrategie werden absichtlich nicht im DiaCoM Rahmenmodell betrachtet, um eine kontrollierte Erforschung der fokussierten Prozesse zu ermöglichen. Andere Modelle umfassen solche weiterführenden Prozesse (NeDiKo: Herppich et al. 2018 und cosima: Heitzmann et al. 2019). Obwohl das DiaCoM-Rahmenmodell so nur einige Aspekte der diagnostischen Aktivitäten von Lehrkräften abdeckt, kann es immer noch erhebliche Unterschiede bei den diagnostischen Urteilen hinsichtlich der Struktur der Diagnosesituation, der Einflussfaktoren und der potenziell relevanten kognitiven Prozesse erklären.

Zusammenfassend konzentrierte sich bisher der überwiegende Teil der Forschung zu diagnostischen Urteilen von Lehrkräften auf die Genauigkeit der Urteile im Vergleich zu (standardisierten) Tests. Für diesen Forschungsansatz wurden bereits einige relevante Faktoren identifiziert, die korrelativ mit der Urteilsgenauigkeit in Beziehung stehen (vgl. Südkamp et al. 2012). Korrelationsstudien können die Genese der Urteile durch kognitive Prozesse jedoch nicht erklären. Mit dem DiaCoM-Rahmenmodell schlagen wir eine Grundlage vor, um Hypothesen und Studiendesigns abzuleiten, die sich auf kognitive Modellierungen konzentrieren und so dazu beitragen, den Prozess des diagnostischen Denkens in Bildungskontexten zu verstehen. Genau diese Strategie wird in den Beiträgen des Themenhefts verfolgt.

3 Das DiaCoM-Rahmenmodell als forschungsstrategischer Rahmen

Die Genese diagnostischer Urteile ist das Ergebnis unterschiedlicher kognitiver Prozesse. Die Nutzung und das Ergebnis der kognitiven Informationsverarbeitung werden vom Typ der Diagnosesituation und vom Diagnosegegenstand beeinflusst. Wie oben ausgeführt, wurden erst in wenigen Bereichen solche kognitiven Prozesse der Urteilsgenese näher untersucht. Die Beiträge dieses Themenhefts setzen an diesem Desiderat an. In allen Beiträgen werden theoretisch fundierte Modelle der Genese diagnostischer Urteile, verstanden als Informationsverarbeitungsprozesse, in spezifischen Diagnosesituationen experimentell auf ihre Geltung geprüft und so Erklärungswissen zu diagnostischen Urteilsprozessen generiert.

  1. 1.

    In jedem Beitrag ist ein konkreter Typ einer diagnostischen Situation spezifiziert (z. B. Einschätzung von Lösungen, Aufgaben, mit/ohne Zeitdruck usw.).

  2. 2.

    Jeder Beitrag fokussiert auf einen konkreten Diagnosegegenstand. Dieser ist einerseits in einem konkreten Schulfach curricular zentral und andererseits in der Forschung bereits so intensiv behandelt, dass es dazu konsolidierte Erkenntnisse auf der Schülerebene gibt (z. B. Schwierigkeiten in Aufgaben, Fehlvorstellungen von Lernenden usw.).

  3. 3.

    In diesem Rahmen werden in jedem Beitrag diagnostische Urteile als Informationsverarbeitungsprozesse theoretisch beschrieben und das hier beschriebene Rahmenmodell damit ausdifferenziert: Prozesse der Wahrnehmung von Hinweisreizen (Cues) in der Situation, Prozesse der Interpretation im Sinne einer wissensgesteuerten Kategorisierung, Prozesse der Entscheidung z. B. als Gewichtung unterschiedlicher Informationen. Die Annahmen über solche Prozesse variieren in den Beiträgen. Die Forschungsfragen und das Design der Projekte sind schließlich auf eine möglichst experimentell angelegte empirische Prüfung der jeweiligen Annahmen über diagnostische Urteilsprozesse ausgerichtet: Die Situation kann systematisch über Hinweisreize variiert werden, die Personenvariablen werden durch Interventionen kontrolliert verändert, die Einflüsse als Vorhersagen auf diagnostisches Verhalten operationalisiert und sodann experimentell überprüft.

Die hier angedeutete Strategie zur Generierung von Erklärungswissen zu diagnostischen Urteilsprozessen wird in Loibl et al. (2020) ausführlicher dargestellt und auf bestehende Studien zu diagnostischen Urteilen angewendet. Im Folgenden wird der forschungsstrategische Nutzen des Modells anhand der Beiträge des vorliegenden Themenhefts illustriert.

Der Beitrag von Rieu, Loibl, Leuders und Herppich fokussiert auf die Genese diagnostischer Urteile über Mathematikaufgaben aus der Bruchrechnung (DV), konkret die relative Schwierigkeit von Aufgaben im paarweisen Vergleich, die sich systematisch bezüglich ihrer schwierigkeitsgenerierenden Merkmale (SC) unterscheiden. Es wird angenommen, dass solche Urteile entstehen, indem schwierigkeitsrelevante Aufgabenmerkmale in Aufgaben identifiziert und gewichtet werden (DD). Die Manipulation des hierzu nötigen fachdidaktischen Wissens (PC), und die systematische Variation der präsentieren Merkmale (cues) und der verfügbaren Zeit (SC) erlauben eine experimentelle Prüfung dieser Annahme über die Informationsverarbeitungsprozesse: angehende Lehrkräfte verknüpfen bei der Aufgabendiagnose tatsächlich systematisch die Aufgabenmerkmale und ihr spezifisches fachdidaktisches Wissen.

Auch im Beitrag von Becker, Spinath, Ditzen und Dörfler werden diagnostische Urteile über die Schwierigkeit von Mathematikaufgaben (DV) in den Blick genommen. Die Autorinnen und der Autor stellen in ihrer Studie die Annahme ins Zentrum, dass unter psychischer Anspannung wie Stress (State, PC) kognitive Kapazitäten gebunden werden, was informationsverarbeitende Prozesse (DD) beim Diagnostizieren von Aufgabenschwierigkeiten, beeinträchtigen kann. Mit einer Kombination von Eye-Trackingdaten, Verbalprotokollen und Cortisolwerten aus Speichelproben sowie einer experimentellen Stressinduktion können sie ihre Erklärung diagnostischer Urteile empirisch untermauern.

Witzigmann und Sachse untersuchen in ihrem Beitrag die Urteile von Französischlehrkräften zu mündlichen Sprachproduktionen von Kindern (DV). Sie explorieren dabei, in welchem Umfang fachdidaktische Expertinnen und Experten dabei auf eine Vielzahl von Merkmalen auf inhaltlicher und sprachlicher Ebene (z. B. hinsichtlich Aussprache, Wortschatz aber auch pragmatischen Elementen) zurückgreifen (DD). Der Urteilsprozess wird dabei durch holistische Urteile einerseits und ein analytisches Raster andererseits strukturiert. Die Befunde können als Ausgangspunkt für systematischere Untersuchungen der bislang noch nicht erforschten Genese von Urteilen über mündliche Sprachproduktionen dienen.

Hoppe, Renkl und Rieß untersuchen, wie (angehende) Lehrkräfte die Vorstellungen von Schülerinnen und Schülern zu ökologischen Konzepten diagnostizieren (DV). Das hierzu nötige (fachdidaktische) diagnostische Wissen (PC) wurde erst im Zusammenhang mit einem Training wirksam und auch nur bei nicht zu komplexem Diagnosegegenstand. Die relative Flüchtigkeit der Information in Videos im Vergleich zu Textvignetten (SC) beeinflusste die Prozesse der Informationsverarbeitung (DD) jedoch nicht negativ.