1 Einleitung

Die Unterrichtsplanung ist traditionell Gegenstand der Allgemeinen Didaktik sowie der Fachdidaktiken, die zusammen eine kaum noch zu überschauende, weiter zunehmende Anzahl an Konzepten und Planungsmodellen hervorbringen (vgl. John 2006; Jäger und Maier 2019; Kron et al. 2014; Scholl 2018; Wiater 2006). Trotz einer solchen Vielfalt dominieren im deutschsprachigen Diskurs zur Unterrichtsplanung und in der Lehrer*innenbildung auch aus fachdidaktischer Sicht nach wie vor die bildungstheoretische und die lerntheoretische Didaktik (Busch 2009; vgl. Lüders 2018), sodass für die Allgemeine Didaktik beansprucht wird, „den grundlegenden theoretischen Rahmen für die Unterrichtsplanung“ zu schaffen (Zierer et al. 2015, S. 376).

Allgemein- und fachdidaktische Konzeptionen bieten generell orientierende Prinzipien und vereinfachende Modelle, die geeignet erscheinen, um komplexe Anforderungen, die an Lehrer*innen mit der Unterrichtsplanung gestellt werden, überschaubar und handhabbar zu machen (Wolf 2020). Sie scheinen überdies selbst nicht durch empirische Forschungsbefunde abgesichert und legitimiert werden zu müssen (vgl. Bohl 2004; Gräsel 2006; Rothland 2013), wie die Genese immer wieder neuer Planungskonzeptionen oder -modelle ohne empirisch gestützte Theoriebildung verdeutlicht (vgl. Scholl 2018).

Die geringe Priorisierung der Unterrichtsplanung als Forschungsgegenstand in der empirischen Bildungs- und Professionsforschung erscheint bemerkenswert. Lehrer*innen wenden in den Phasen ihrer Qualifikation, des Berufseinstiegs und allgemein im Beruf einen beträchtlichen Teil ihrer Qualifikations- und Arbeitszeit für die Vorbereitung und Planung von Unterricht auf (vgl. Munthe und Conway 2017). Unterrichtsplanung gilt als Kernanforderung im Lehrer*innenberuf, die es auf der Basis von in der Lehrer*innenbildung grundzulegenden und in der zweiten Ausbildungsphase in Deutschland auch zu überprüfenden Fähigkeiten und Fertigkeiten zu bewältigen gilt (König 2020; Strietholt und Terhart 2009).

Vor diesem Hintergrund erscheint es von Interesse, dass gerade in den letzten Jahren aus dem Kontext der interdisziplinären empirischen Bildungsforschung mehrere Forschungsinitiativen erwachsen sind, die sich mit zunehmender Intensität der Modellierung und empirischen Erfassung unterrichtlicher Planungskompetenz widmen. Gemein ist diesen Forschungsansätzen die Bezugnahme auf die empirische, methodisch vornehmlich quantitativ ausgerichtete Forschung zur professionellen Kompetenz von Lehrkräften. Gleichwohl werden recht unterschiedliche Antworten auf zentrale Fragen und Herausforderungen gegeben, die mit der empirischen Erfassung von Kompetenzfacetten bezogen auf die beruflichen Anforderungen der Unterrichtsplanung angesprochen werden. Ziel des vorliegenden Stichwortbeitrags ist es daher, eine Bestandsaufnahme aktueller empirischer Forschung zur Unterrichtsplanungskompetenz (UPK) zu leisten. Im Zuge dessen werden

  • relevante Forschungshintergründe benannt, Diskussionslinien skizziert und eine Begriffsdefinition angeboten (Abschn. 2),

  • zentrale empirische Zugänge analysiert (Abschn. 3),

  • Fragen zur Relationierung von professionellem Wissen, affektiv-motivationalen Dispositionen und UPK betrachtet, eine Zusammenfassung bisher vorgelegter empirischer Befunde zur Entwicklung im Rahmen der Lehrer*innenbildung und Bedeutung unterrichtlicher Planungskompetenz angehender wie berufstätiger Lehrkräfte für die Qualität ihres Unterrichts gegeben (Abschn. 4),

  • um vor diesem Hintergrund die bisherige Forschung zur UPK zu bilanzieren (Abschn. 5)

  • und abschließend ausgewählte Herausforderungen und Forschungsdesiderate zu diskutieren (Abschn. 6).

Mit der Bezugnahme der hier in Rede stehenden Forschungsinitiativen auf den Kompetenzbegriff und die Forschung zur Handlungskompetenz von Lehrer*innen geht einher, dass die empirischen Beiträge im Wesentlichen dem quantitativen Forschungsparadigma folgen. Daher beruht der vorliegende Stichwortbeitrag im Kern auf entsprechend quantitativ bzw. quantitativ-qualitativ ausgerichteter Forschung zur UPK, auch wenn an geeigneten Stellen auf rein qualitative Studien verwiesen wird und diese in die Darstellung einbezogen werden.

2 Professionelle Kompetenz und Unterrichtsplanung von Lehrkräften

2.1 Forschung zur professionellen Kompetenz von Lehrkräften

Kaum ein anderer Gegenstandsbereich der empirischen Bildungsforschung im deutschsprachigen Raum hat in den vergangenen 15 Jahren derart beachtliche Fortschritte gemacht wie die Forschung zur professionellen Kompetenz von Lehrkräften. Insbesondere mit dem Stichwortbeitrag von Baumert und Kunter (2006) in der Zeitschrift für Erziehungswissenschaft verbinden sich zahlreiche Bemühungen zur empirischen Erfassung des Professionswissens von Lehrkräften mithilfe standardisierter Testverfahren wie auch ihrer affektiv-motivationaler Charakteristika, die sich in das häufig zitierte „heuristische Modell professioneller Handlungskompetenz“ (Baumert und Kunter 2006, S. 482) einordnen bzw. dieses als theoretische Verortung für eigene Ansätze nutzen.

Besondere Prominenz in diesem Kontext haben empirische Untersuchungen erlangt, die mithilfe von standardisierten Testverfahren Facetten des Lehrer*innenprofessionswissens direkt erfassen. In der Folge sind in den vergangenen Jahren zahlreiche Wissenstests entwickelt worden, die bei angehenden bzw. berufstätigen Lehrkräften fachliches, fachdidaktisches oder fachunabhängiges, pädagogisches Wissen messen (vgl. im Überblick z. B. Blömeke und Delaney 2014; Kaiser et al. 2020; Voss et al. 2015). Eine beachtliche Erweiterung hat dieser Forschungsdiskurs zuletzt durch die stärkere Berücksichtigung „situationsspezifischer Fähigkeiten“ erfahren: Im Modell „Kompetenz als Kontinuum“ (Blömeke et al. 2015, S. 7) werden sie als proximal, das Wissen (verstanden als „kognitive Disposition“) hingegen als distal für die Performanz erachtet. Insbesondere im deutschsprachigen Raum sind in den letzten Jahren eine beträchtliche Anzahl von Studien publiziert worden, die das Konzept der professionellen Unterrichtswahrnehmung (teacher noticing; Sherin et al. 2011) aufgreifen und diese – unter Bezugnahme auf das Modell von Blömeke et al. (2015) – als situationsspezifische Fähigkeit verorten (vgl. das systematische Review von König et al. 2022a).

Auffällig erscheint, dass die berufliche Anforderung des Planens von Unterricht bislang nur am Rande in den Blick genommen wurde. Zwar finden sich in einzelnen Wissenstests, die das fachdidaktische oder pädagogische Wissen messen, Teilaufgaben, die durchaus (basales) Planungswissen in – dann aber eher unverbundenen – Einzelaspekten testen; auch finden sich vereinzelt Fragen zum Treffen von Entscheidungen oder zur Entwicklung von Handlungsalternativen in (stellvertretenden) Unterrichtssituationen in Messinstrumenten zur professionellen Unterrichtswahrnehmung (vgl. König et al. 2022a). Eine Forschung, die explizit jene Fähig- bzw. Fertigkeiten in den Blick nimmt, die die (erfolgreiche) Bewältigung von professionellen Anforderungen der Unterrichtsplanung direkt erfassen, ist hingegen erst in der jüngsten Zeit erkennbar. Dabei stellt sich die Frage, wie sich diese Forschung selbst im bestehenden Diskurs zur professionellen Kompetenz von Lehrkräften verortet.

2.2 Unterrichtsplanung als berufliche Anforderung von Lehrkräften – und als Gegenstand der Kompetenzforschung

Die Unterrichtsplanung gehört zweifelsfrei zu den beruflichen Anforderungen, die Lehrkräfte im Alltag zu bewältigen haben (vgl. Munthe und Conway 2017). Vor allem aber ist anzunehmen, dass Lehrer*innen im Zuge der Planung von Unterricht – mehr oder weniger explizit – eine Reihe von relevanten Entscheidungen treffen (müssen), die keineswegs folgenlos für die Prozess- und Ergebnisqualität ihres Unterrichts sind. Hierauf hat bereits, beginnend in den 1970er-Jahren, die Forschung zu Handlungsentscheidungen (decision making) bei Lehrkräften wie auch seit Beginn der 1980er-Jahre die Forschung zur Lehrer*innenexpertise aufmerksam gemacht (Shavelson 1983; Stigler und Miller 2018). Unter dem Gesichtspunkt der Planung von Handlungen ist die Unterrichtsplanung ein „kognitiver Vorgang (Ereignisse resümieren, antizipieren, schlussfolgern, auswählen, bewerten), der selbst wieder kognitive Inhalte, nämlich Wissen, Vorstellungen, Erinnerungen zum Gegenstand hat und dessen Produkt, der Plan nämlich, selbst wieder wirksam werden kann, indem er Teil des Wissens des Lehrers wird (in niedergeschriebener wie auch im Gedächtnis gespeicherter Form)“ (Bromme und Seeger 1979, S. 60). Die damit angesprochenen Fähigkeiten sind mit der Lehrer*innenbildung untrennbar verbunden: Planung von Unterricht ist nicht nur Gegenstand der Ausbildung von Lehrkräften, sondern auch Prüfungsgegenstand der zweiten Ausbildungsphase (König 2020; Strietholt und Terhart 2009).

Vor diesem Hintergrund ist eine Reihe von Ansätzen der empirischen Bildungsforschung zu sehen, die in den letzten Jahren insbesondere im deutschsprachigen Raum initiiert wurden – und aktuell mit zunehmender Intensität verfolgt werden (vgl. Wernke und Zierer 2017): Alle uns bekannten Ansätze weisen dabei zunächst die Gemeinsamkeit auf, sich – mehr oder weniger vertiefend – auf die empirische Forschung zur professionellen Kompetenz von Lehrkräften zu beziehen.

Auffällig ist jedoch, dass die vorliegenden Ansätze bei genauerer Betrachtung recht verschiedene Antworten auf zentrale Fragen und Herausforderungen geben, die mit der Bezugnahme auf die empirische Untersuchung von Lehrer*innenkompetenzen bezogen auf berufliche Anforderungen der Unterrichtsplanung angesprochen sind. So liegen z. B. unterschiedliche Antworten dazu vor, was – unter anderem allgemeindidaktisch oder fachdidaktisch begründet – UPK ist und wie sie sich zu den Facetten professioneller Handlungskompetenz einschlägiger Modelle der empirischen Bildungsforschung (Baumert und Kunter 2006; Blömeke et al. 2015) verhält; ferner wie sie begründet, modelliert und empirisch erfasst wird. Scheinbar wird allgemein der o. g. Diskurs zur professionellen Kompetenz von Lehrkräften referenziert, auf einer darunterliegenden Ebene werden Begriffe jedoch unterschiedlich gedeutet und genutzt. Bei aller Unterschiedlichkeit der aktuell vorliegenden Ansätze lassen sich jedoch auch zugrundeliegende Forschungstraditionen und -paradigmen erkennen, auf die die einzelnen Ansätze verschiedentlich – und mehr oder weniger deutlich – Bezug nehmen (s. Tab. 1):

  • Forschungsansätze zur Unterrichtsplanung mit Bezugnahme auf den o. g. Diskurs der Kompetenzforschung im deutschsprachigen Raum und hier insbesondere auf das Modell professioneller Handlungskompetenz (Baumert und Kunter 2006; Kunter et al. 2013).

  • Erkenntnisse und methodische Zugänge der Expertiseforschung, z. B. mit Blick auf Vergleiche von Gruppen angehender bzw. berufstätiger Lehrkräfte, denen unterschiedliche Expertisestadien zugeschrieben werden, sog. Experten-Novizen-Vergleiche (u. a. Bromme 1992; Stigler und Miller 2018).

  • Forschungsbeiträge zur Unterrichtsplanung mit Fokus auf das benötigte professionelle Wissen von Lehrer*innen (Shulman 1987), dessen prognostische Validität für die Planungsfähigkeit unterstellt wird, ohne Letzteres konkret zu untersuchen.

  • Forschungsbeiträge zur Unterrichtsplanung im Sinne situationsspezifischer Ansätze, die die Gebundenheit der Unterrichtsplanung an Kontexte (etwa die zu unterrichtenden, spezifischen Lerngruppen, vgl. John 2006; Mutton et al. 2011) berücksichtigen. In diesem Zusammenhang wären dann jene Ansätze, die die Kontextualisierung bzw. den Situationsbezug betonen, zu nennen. Dieser Strang nimmt – im Gegensatz zur bis heute etablierten bzw. typischen Lehrer*innenwissensforschung – die Situation der Planung in den Blick. Typisch hierfür sind authentische Situationen (z. B. schriftliche Planungen von Referendar*innen) oder stellvertretende Situationen (z. B. Text‑/Planungsvignetten).

  • Forschungsansätze zur Unterrichtsplanung, die die in den 1970er- und 1980er-Jahren betriebene Forschung zum decision-making aufgreifen. Sie sehen in der Unterrichtsplanung einen besonders wichtigen Bereich des Treffens von Entscheidungen im Lehrer*innenberuf. Eine wichtige Referenz sind die Arbeiten von Shavelson – sowohl die älteren zum decision-making von Lehrkräften (u. a. Shavelson und Borko 1979; Shavelson 1983; Shavelson und Stern 1981) als auch die jüngeren zu Grenzen von Lehrer*innenwissenstests (Shavelson 2010). Die internationale Forschung zur Gestaltung eines adaptiven Unterrichts greift ebenfalls erneut den Strang der Forschung zum decision-making bei Lehrkräften auf (vgl. Parsons et al. 2018), wodurch die aktuelle Bedeutung zusätzlich sichtbar wird.

  • Forschungsbeiträge zur Unterrichtsplanung als Problemlöseprozess (Neely 1986; Shuell 1990). Hier könnte die Forschung genannt werden (z. B. Yinger 1980), die gezeigt hat, dass Lehrkräfte keineswegs didaktischen Modellen folgen, sondern sehr pragmatisch lösungsorientiert arbeiten.

  • Ansätze zur Unterrichtsplanung in der Tradition der Forschung zu Handlungsschemata bzw. Skripten. Die Expertiseforschung hat herausgearbeitet, dass Lehrkräfte ihr professionelles Wissen in Form von Skripten organisieren, die sie bei Prozessen des Wahrnehmens, Interpretierens und Entscheidens in didaktischen Situationen (v. a. Unterrichtsplanung und -durchführung) nutzen (Berliner 2001). Solche prozeduralen Wissensrepräsentationen können sich aus zuvor deklarativ vorliegenden Handlungsplänen entwickeln (Anderson 1996). Dass kognitive Schemata bzw. Skripte von Lehrkräften informationsverarbeitenden Prozessen der Unterrichtsplanung zugrunde liegen und Auswirkungen auf ihr unterrichtliches Handeln haben, wurde verschiedentlich ausgearbeitet (u. a. Leinhardt und Greeno 1986; Putnam 1987; Schoenfeld 2000).

Tab. 1 Theoretische Verortung ausgewählter Studien

Während einzelne oder mehrere dieser Forschungsperspektiven in den nachfolgend näher zu betrachtenden Studien aufgegriffen werden (s. Tab. 1), sie also durchaus von den Forscher*innen zur Kenntnis genommen werden und verschiedentlich eine Rolle spielen, bleiben die weiterführenden Einlassungen der Autor*innen jedoch nicht selten unkonkret. Dies erschwert eine klare Ableitung des Begriffs UPK aus der Lektüre der Studien sowie eine mögliche Zusammenführung der in der empirischen Modellierung bzw. Operationalisierung gewählten Ansätze. Auf der einen Seite kann eine Ursache hierfür sicherlich allgemein darin zu finden sein, dass nicht durchgehend ein einheitliches Verständnis von „Kompetenz“ ebenso wenig wie von „Performanz“ vorliegt (vgl. Rothland 2021). Ein weiterer Grund könnte darin bestehen, dass zwar Vorstellungen zu unterrichtsplanerischen Fähigkeiten bei Lehrkräften in der Literatur existieren (z. B. Terhart 2005), diese aber überwiegend implizit bleiben. So gelten beispielsweise auch Skripts in der Unterrichtsforschung als ein uneinheitliches, theoretisch wenig entwickeltes deskriptives Konstrukt, dessen Merkmale sich schwer bestimmen und damit kaum für die Operationalisierung von UPK nutzen lassen. Auf der anderen Seite finden sich aber auch in den zu betrachtenden Studien selbst Ursachen, die eine klare Ableitung des UPK-Begriffs erschweren.

So operationalisieren beispielsweise Backfisch et al. (2020, S. 1) in ihrer Studie das professionelle Wissen von angehenden und berufstätigen Mathematiklehrkräften (Fachwissen, fachdidaktisches Wissen, technologisches Wissen) als Lehrer*innenexpertise („teachers’ expertise“) bzw. professionelle Kompetenz („cognitive conditions (i.e., professional competence)“), um seine Bedeutung für die (Szenario-basierte) Anfertigung eine Unterrichtsplanung zu analysieren. Letztere wird unterschiedlich bezeichnet: Es handelt sich um die kognitive Anforderung des „reasoning“ (S. 3), die Tätigkeit „designing“ (S. 8), um eine Fähigkeit („ability“, S. 3), dann wieder um eine Qualität der Unterrichtspläne („quality“, S. 3), später dann um das situationsbezogene Wissen der (angehenden) Lehrkräfte („situational knowledge“, S. 6). Während also bei der Verwendung bekannter Kategorien des professionellen Lehrer*innenwissens mit Referenz u. a. auf Shulman (1987) und einer Einbettung in das Modell professioneller Kompetenz mit Verweis u. a. auf Kunter et al. (2013) den bekannten Vorstellungen aus der in Abschn. 2.1 angesprochenen Bildungsforschung gefolgt wird und damit begrifflich nachvollziehbar bleibt, entzieht sich die Messung der Planungsfähigkeit über den von Backfisch et al. (2020) entwickelten Szenario-basierten Ansatz einer klaren Begriffsdefinition. Ohne Zweifel liefert die Studie von Backfisch et al. (2020) nicht nur einen innovativen Ansatz zur Messung von Planungsfähigkeit, sondern stellt hoch interessante empirische Befunde zum Vergleich angehender und berufstätiger Lehrkräfte wie auch Korrelate zum professionellen Wissen bereit; das Konstrukt UPK selbst bleibt jedoch begrifflich und theoretisch unterbestimmt.

Im internationalen Diskurs zur Messung von Planungsfähigkeit wird den Referenzen der im deutschen Kontext entstandenen Forschungsbeiträge zur Lehrer*innenkompetenzforschung nur wenig gefolgt. In jüngeren und einschlägigen Forschungsarbeiten von Jacobs et al. (2008) oder Morris und Hiebert (2017) wird zwar betitelnd der Begriff der Kompetenz genutzt, ohne dass sich aber daraus eine Verbindung zum deutschsprachigen Forschungsdiskurs ergibt. Kurze Referenzen erfolgen hier zur Expertiseforschung und auch zur Literatur im Bereich decision-making oder Unterrichtsplanung als Problemlösung (z. B. Yinger 1980). Interessanterweise erfolgt aber auch hier eine Abgrenzung von Messverfahren zur Testung von Lehrer*innenwissen auf der Basis einer Argumentation, die vergleichbar der in Studien aus dem deutschsprachigen Raum ist: „A commonly used approach relies on standardized and usually decontextualized tasks such as surveys, tests, and other assessments for teachers […] such tasks usually occur outside the normal practices of a classroom teacher and his or her students, and therefore may not be reliable predictors of a teacher’s or a student’s action in context“ (Jacobs et al. 2008, S. 1097). Das von Jacobs et al. (2008) entwickelte Instrument zur Analyse von Unterrichtsplanungen soll somit situationsspezifischer eine Evaluation ermöglichen als auch unterrichtliche Performanz reliabel vorhersagen, gleichwohl sie dieses nicht als Ersatz für z. B. Wissenstests oder Unterrichtsbeobachtungen sehen (Jacobs et al. 2008, S. 1098). Somit finden sich hier durchaus Korrespondenzen mit dem sieben Jahre später publizierten Modell von Blömeke et al. (2015), das aktuell für situationsspezifische Ansätze zur Erforschung von UPK genutzt wird.

2.3 Diskussionslinien zur UPK

Neben den in Abschn. 2.2 herausgearbeiteten Forschungstraditionen und -paradigmen existieren – gerade im deutschsprachigen Raum – offene Diskussionslinien zur UPK, auch wenn diese nicht immer mit empirischer Forschung unterlegt werden. Zur Vervollständigung der nachfolgend zu betrachtenden Studien wie auch zur Begründung einer stärker systematischen Forschung zur UPK werden diese skizziert (eine tabellarische Übersicht zu den in diesem Kontext vorgelegten „Modellierungen“ bietet Tab. 1 des elektronischen Supplements zum Stichwortbeitrag).

2.3.1 Relationierung von UPK und professionellem Wissen

Der Bezug auf vorhandene Wissensbestände ist gerade bei der Unterrichtsplanung als mentalem Handeln im Gegensatz etwa zum unmittelbaren und schnellen Interaktionsgeschehen im Unterricht relevant, kann doch gerade hier entlastet vom unmittelbaren Handlungsdruck wohlüberlegt auf verschiedene Wissensbestände reflektiert zurückgegriffen werden (Wolf 2021). Insofern wird wiederholt die Annahme geäußert, dass Lehrkräfte auf verschiedene Facetten ihres Professionswissens bzw. ein „spezifisches allgemein- und fachdidaktisches Planungs- und Konzeptionswissen als einer bedeutsamen Facette ihres professionellen Lehrer*innenwissens“ (Scholl et al. 2019, S. 75) zurückgreifen. Offen ist jedoch, welche Bedeutung welchen Teilen des Professionswissen dabei zukommt und ggf. UPK bedingt. Zudem erscheint unbestimmt, in welcher Beziehung die Wissensfacetten zueinanderstehen. Annahmen wie diese, dass je fundierter das Professionswissen sei (fachlich, fachdidaktisch, pädagogisch), „desto ausgeprägter zeigt sich die Planungskompetenz“ (Zierer et al. 2015, S. 378), gilt es empirisch zu belegen (Rothland 2021).

2.3.2 Erwerb von UPK im Rahmen der Lehrer*innenbildung

Wie nachfolgend genauer dargelegt wird (s. Abschn. 3 und 4), werden im Rahmen der empirischen Forschung zur Unterrichtsplanung häufig Lehramtsstudierende in der ersten und Referendar*innen in der zweiten Phase der Lehrer*innenbildung adressiert. Die Entwicklung von UPK wird über die ersten beiden Phasen der Lehrer*innenbildung hinaus zudem als ein komplexer berufsbiographischer Prozess beschrieben (vgl. Sandfuchs 2006; Seel und Aprea 2014).

Beide Phasen der Lehrer*innenbildung würden einen „Schwerpunkt auf die Vermittlung von Planungskompetenz bei angehenden Lehrkräften in den einzelnen Ausbildungsabschnitten“ legen (Rey et al. 2018, S. 129): In der ersten Phase erfolge eine „überwiegend theoretische Annäherung an die Unterrichtsplanung“ (Rey et al. 2018, S. 129) und UPK werde „in Lehrveranstaltungen in Form von Planungswissen, aber auch begleitend zu Praktika grundgelegt“ (Rey et al. 2018, S. 133). An anderer Stelle wird davon ausgegangen, dass UPK „insbesondere im Kontext von Praktika“ (bereits) ausgebildet werde (Schnebel et al. 2017, S. 108), um schließlich anhand von Unterrichtsentwürfen in der zweiten Phase beurteilt und auch benotet zu werden (Kirsch 2020b, S. 407). Gerade mit den Praxisphasen in der ersten Phase der Lehrer*innenbildung wird die Hoffnung verbunden, dass dort das erworbene theoretische Planungswissen prozeduralisiert werde (Kirsch 2020a, S. 2). Die Unterrichtsplanung wird daher auch als „Katalysator des Transformationsprozesses“ vom in der Lehrer*innenbildung vermittelten Wissen zum Handeln oder vom deklarativen zum prozeduralen Wissen beschrieben (Stender et al. 2015, S. 123).

2.3.3 Auswirkungen auf Lehrer*innenverhalten, Unterrichtsqualität und das Lernen der Schüler*innen

Der UPK, die es in der Lehrer*innenbildung grundzulegen gilt, wird eine erhebliche Bedeutung für die Performanz der Lehrkräfte im Unterricht, die Prozessqualität des Unterrichts und schließlich auch für den Lernerfolg der Schüler*innen zugeschrieben. „Planungskompetenzen bilden die Grundlage für die Gestaltung und Steuerung des Unterrichtsprozesses“ (Kucharz et al. 2014, S. 20) und eine durchdachte Planung sei als „wichtige Komponente gelingenden Unterrichts“ anzusehen (Schnebel et al. 2017, S. 108). Planung sei die „Schlüsselstelle des Unterrichtens“ (Zierer et al. 2015, S. 376) und Lehrkräfte betonen selbst die Bedeutung der Unterrichtsplanung als Notwendigkeit für den Unterrichtserfolg (Tebrügge 2001, S. 211). Angesichts dieser weitgehenden und zugleich unbelegten Annahmen bedarf es einer Forschung, die UPK systematisch und unter Berücksichtigung aktueller Standards der Kompetenzforschung umfassend in den Blick nimmt. Inwieweit dies bereits durch aktuelle Studien jüngst begonnen wurde und welche Perspektiven sich daraus ergeben, wird in den folgenden Abschnitten betrachtet.

2.4 Vorschlag für eine Arbeitsdefinition „Unterrichtsplanungskompetenz“

Vor dem Hintergrund des skizzierten Forschungsdiskurses und der offenen Diskussionslinien sowie des nachfolgend näher zu beschreibenden Standes empirischer Forschung schlagen wir vorab folgende heuristisch verstandene Arbeitsdefinition vor: Insbesondere mit Bezug auf das Expertise-Paradigma und den kompetenzorientierten Ansatz bezeichnet UPK erlernbare kognitive Fähig- und Fertigkeiten (cognitive abilities and skills) sowie damit verbundene affektiv-motivationale Dispositionen von Lehrkräften, die sich inhaltlich und funktional auf Anforderungen der Planung von Unterricht beziehen und die erfolgreiche Bewältigung solcher Anforderungen wahrscheinlich machen. Der Forschung zum decision-making folgend beinhalten diese Fähig- und Fertigkeiten das Treffen von planungsbezogenen Entscheidungen, möglicherweise einhergehend mit oder aufbauend auf kognitiven Prozessen der Wahrnehmung und Interpretationen von Situationen, wie sie von aktuellen situationsspezifischen Ansätzen der Kompetenzforschung hervorgehoben werden; sie sind jedenfalls spezifisch für Planungssituationen und unterscheiden sich dadurch von Konzeptionen professionellen Wissens in bisherigen empirischen Studien, die diese Kontextualisierung nicht oder nicht in diesem Auflösungsgrad aufweisen. Gleichwohl sind grundsätzlich Zusammenhänge oder sogar Überschneidungen zu den bislang fokussierten Facetten professionellen Wissens denkbar.

3 Empirische Zugänge zur Erfassung der Unterrichtsplanungskompetenz

Nachfolgend werden 19 Verfahren zur Erfassung von UPK betrachtet (Tab. 2), basierend auf 44 Publikationen als näher einbezogene Literatur (s. die im Literaturverzeichnis jeweils ausgewiesenen Titel). Die Auswahl dieser Verfahren orientiert sich nach den folgenden Zielsetzungen: Priorisiert werden Studien aus dem deutsch- und englischsprachigen Raum, die darauf zielen, Fähigkeiten, Fertigkeiten bzw. Kompetenzen im Bereich der Unterrichtsplanung bei (angehenden) Lehrkräften möglichst standardisiert zu erfassen. Dabei sollen sich diese Studien zugleich in dem in Abschn. 2.2 dargelegten Forschungsfeld lokalisieren lassen und mit der Arbeitsdefinition (s. 2.4) korrespondieren. Die so gewonnene, beispielgebende Auswahl näher zu betrachtender Studien, ihrer Ansätze und Verfahren soll das Spektrum empirisch-quantitativer Zugänge im Kontext der Forschung zur UPK erfassen und abdecken.

Tab. 2 Verfahren zur Erfassung der Unterrichtsplanungskompetenz

Unter diesen Prämissen wurde eine umfängliche Recherche deutsch- und englischsprachiger Publikationen getätigt. Übliche Datenbanken (u. a. ERIC, FIS Bildung, Web of Science) wurden u. a. unter Einsatz der diesem Stichwortbeitrag zugrundeliegenden Schlüsselwörter als Suchbegriffe (inklusive Trunkierungen) genutzt. Die breit angelegte Recherche offenbarte zunächst, dass das Forschungsfeld in den zu betrachtenden Aspekten als sehr heterogen zu bewerten ist. Die genauere Betrachtung der ermittelten Literatur (Screening von Titeln, Abstracts, Keywords) zeigte, dass nur wenige systematisch angelegte Untersuchungen vorliegen, die der aufgestellten Arbeitsdefinition (s. 2.4) zumindest anteilig entsprechen. Daher erschien die Anwendung der Methode eines systematischen Literaturreviews unpassend (vgl. Munn et al. 2018): Die getroffene Auswahl liefert stattdessen die Grundlage für eine Bestandsaufnahme, in der nicht sämtliche, bislang publizierte Einzelstudien im Sinne eines systematischen Literaturreviews Berücksichtigung finden können. Sie hätte nicht als eindeutiges Ergebnis einer einzelnen Schlagwortsuche über Datenbanken systematisch ermittelt werden können. Vielmehr hätte ein systematisch ermittelter (sehr) kleiner Korpus durch Hinzunahme anderweitig auffindbarer Studien (z. B. „footnote chasing“) angereichert werden müssen. Um diese Problematik, die durch die Tatsache eines noch sehr jungen, schwach strukturierten Forschungsfelds bedingt sein dürfte, zu begegnen, wurden stattdessen, ausgehend vom gewählten Fokus, vorhandene Studien entsprechend anhand der folgenden Kriterien ein- bzw. ausgeschlossen:

  1. 1.

    Unter den Studien, die als Datengrundlage mit Befragungen arbeiten, wurden Kompetenzselbsteinschätzungsstudien berücksichtigt (z. B. Bach 2013), jedoch Untersuchungen, die (angehende) Lehrpersonen über Unterrichtsplanungen befragen oder Meinungsumfragen durchführen, ausgeschlossen (z. B. Aydin 2014).

  2. 2.

    Unter jenen Studien, die als Datengrundlage authentische Planungsdokumente, meist schriftliche Planungen, verwenden, wurden empirische Studien, die aus unserer Sicht eine nur geringe Reichweite der empirischen Analyse von Planungen aufweisen, nicht berücksichtigt. Dies betrifft z. B. qualitative Studien mit (sehr) kleinen Fallzahlen, in denen zwar schriftliche Unterrichtsplanungen exploriert oder interpretiert werden, ohne dabei jedoch auf Basis konkreter Kriterien eine Kodierung vorzunehmen (z. B. Rabin und Smith 2016; Rusznyak und Walton 2011). Erforderlich für den Einbezug war, dass kodierte Kriterien auch eine Wertung erfahren (Bildung eines oder mehrerer Fähigkeitscores; z. B. Jacobs et al. 2008) bzw. darüber hinaus sogar entsprechende Kriterien auch einer Skalierungs- bzw. Faktorenanalyse unterzogen werden (z. B. König et al. 2015, 2021).

  3. 3.

    Von besonderem Interesse waren jene Studien, die als Vignettentest bezeichnet werden können (einschließlich der Studien, die ihr Vorgehen als „Performanztest“ bezeichnen, z. B. Schröder et al. 2020). Diese Untersuchungen weisen eine Testung von UPK im stärker testdiagnostischen Sinn auf und umfassen auch psychometrische Prüfungen.

  4. 4.

    Schließlich wurden auch Studien berücksichtigt, die stärker das Wissen über Planung in den Vordergrund stellen; im Unterschied zu den Vignettentests sind sie allerdings weniger kontextualisiert, und im Vergleich mit bekannten Testungen des fachdidaktischen oder pädagogischen Wissens (z. B. Blömeke und Delaney 2014; Voss et al. 2015) richten sich diese Wissenstests ausschließlich auf Wissen über die Planung von Unterricht.

Ferner blieben auch folgende Studiendesigns unberücksichtigt: Reine Interviewstudien zur Unterrichtsplanung (z. B. Bieda et al. 2020), Studien über Audioaufnahmen von Planungen in Gruppen von Lehrpersonen (z. B. Jofré und Stein 2019) sowie Evaluationsstudien zur Anwendung vorgefertigter Unterrichtspläne bzw. -materialien (z. B. Marks und Eilks 2010). Auch haben wir keine Analyse bestehender Tests zum fachdidaktischen oder pädagogischen Wissen zu ihren Planungswissensanteilen durchgeführt. Da zum Teil mehrere Studien vorliegen, die ein Verfahren einsetzen, beziehen wir uns nachfolgend entweder auf mehrere Publikationen oder eine der aussagekräftigsten Publikationen. Insgesamt betrachten wir im Folgenden vier Kompetenzselbsteinschätzungsverfahren, fünf Verfahren basierend auf der Analyse authentischer Planungsdokumente, acht Vignettentests und zwei Tests zur Erfassung von professionellem, auf Unterrichtsplanung spezialisierten Lehrer*innenwissen (Tab. 2).

3.1 Erfassung von UPK über Kompetenzselbsteinschätzungen

Im Projekt Entwicklung Studierender in Schulpraktika (ESIS) wurden zwei Skalen zur Erfassung Allgemeindidaktischer Planungskompetenz (APK) entwickelt (Bach 2013; Bach et al. 2010). Mit der ersten Dimension, der Planungskomponente (z. B. „Ich begründe die Wahl der Unterrichtsmethoden“), werden Aspekte allgemeindidaktischer Planungsmodelle in den Blick genommen „und somit jener allgemeindidaktische Kompetenzbereich einbezogen, der als Anwendung des didaktischen Wissens über Planungsmodelle für Unterricht beschreibbar ist“ (Bach 2013, S. 159). Hinzu kommt als zweite Dimension (z. B. „Ich verwende allgemeindidaktische Literatur“) der „aktuelle Literaturbezug“. Hier soll die Verwendung von Literatur bei der Unterrichtsplanung erfasst werden. Ein weiteres Selbsteinschätzungsinstrument wurde von Freisler-Mühlemann et al. (2021) entwickelt. UPK wird hier mittels einer fünf Items umfassenden Skala ausgehend von der Frage „Wie schätzen Sie derzeit Ihre Kompetenzen in den folgenden Bereichen des Lehrberufs ein?“ bewertet (Beispiel-Item: „Den Unterricht didaktisch begründet planen“; Freisler-Mühlemann et al. 2021, S. 142). Auf der Basis einer eindimensionalen Selbsteinschätzungsskala mit 16 Items wird UPK auch in der Untersuchung von Schnebel et al. (2017) erhoben. Angehende Lehrkräfte werden aufgefordert, ihre Kompetenzen in der „Ausarbeitung zentraler Planungsdimensionen Ziele, Lerninhalte, fachspezifische Arbeitsformen, curriculare Verortung, methodische Entscheidungen, Lernvoraussetzungen und diagnostische Aktivitäten sowie kognitiv anregende Aufgabenstellungen“ einzuschätzen (Schnebel et al. 2017, S. 109 f.). Schließlich wurde im Projekt Die Bedeutung des professionellen Wissens angehender Deutschlehrkräfte für ihre Planung von Unterricht (PlanvoLL-D) eine dreidimensionale Skala Selbsteingeschätzte Planungskompetenz entwickelt, die sich auf die Diagnose der Lerngruppe, der davon abhängigen Aufgabenauswahl und -formulierung sowie darüberhinausgehende Planungsaspekte bezieht (König et al. 2017).

Gemein ist den hier genannten, ausschließlich im deutschsprachigen Raum anzutreffenden Selbsteinschätzungsskalen, dass sie UPK allesamt fachunabhängig bzw. -unspezifisch operationalisieren. Auch zeigen sich zwar inhaltliche Überschneidungen auf Item-Ebene (etwa Lernvoraussetzungen der Schüler*innen diagnostizieren und berücksichtigen), eine einheitliche Konzeptualisierung von UPK wird jedoch nicht erkennbar (vgl. Rothland 2021).

3.2 Erfassung von UPK über die Analyse schriftlicher Unterrichtsplanungen

Die Analyse schriftlicher Unterrichtsplanungen ist Gegenstand vor allem qualitativer Forschung (z. B. Rabin und Smith 2016; Rusznyak und Walton 2011). Ferner nehmen einzelne Studien eine inhaltsanalytische Kodierung mithilfe eines Kriterienrasters vor, um auf Einzelitem-Ebene deskriptive Aussagen etwa zum Erreichen bestimmter Planungsanforderungen zu ermöglichen (z. B. Ruys et al. 2012; Taylan 2018). Im Folgenden fokussieren wir auf solche Studien, die darüber hinaus auch mindestens eine Skalenbildung von konzeptualisierten Inhaltsbereichen vorgenommen haben.

Das bereits in den 1990er-Jahren initiierte Verfahren Performance Assessment for California Teachers (PACT) zur Lizenzierung zukünftiger Lehrkräfte in den USA, das heute als edTPA (Sato 2014) geführt wird, umfasst als eine Komponente auch die Evaluation von schriftlichen Unterrichtsplanungen, die von angehenden Lehrkräften für Prüfungszwecke eingereicht werden. Auf einer vierstufigen Antwortskala werden die Arbeitsproben gewertet (von 1 „Standard nicht erfüllt“ bis 4 „überragende Performanz“), wobei fünf Leitfragen genutzt werden (z. B. „How does the instructional design make the curriculum accessible to the students in the class?“, Pecheone und Chung 2006, S. 27). Eine Faktorenanalyse bestätigt den aus diesen fünf Items gebildeten Score „Planning“ (Pecheone und Chung 2006, S. 30).Footnote 1

Eine relativ frühe Untersuchung stammt von Jacobs et al. (2008) für den naturwissenschaftlichen Unterricht. Das verwendete Science Lesson Plan Analysis Instrument (SLPAI) unterscheidet vier Subskalen, die zur Evaluation alltäglicher, von Lehrkräften erstellter Planungen gedacht sind: Orientierung an Standards und naturwissenschaftlicher Forschung (Alignment with Endorsed Practices), kognitive und metakognitive sowie soziokulturelle und affektive Aspekte der Unterrichtsplanung (Lesson Design and Implementation – Cognitive and Metacognitive Issues/Sociocultural and Affective Issues) und Verwendung naturwissenschaftlicher Denk- und Arbeitsweisen (Portrayal and Use of the Practices of Science). Die Konzeptualisierung orientiert sich an den National Science Standards (National Research Council 1996), während andere theoretische Bezüge unerwähnt bleiben (vgl. Tab. 1). Eine Auswertung erfolgt für eine Stichprobe von n = 25 berufstätigen Lehrkräften auf Subskalenebene, ohne dass diese einer psychometrischen Skalierung unterzogen werden. Skalenreliabilitäten werden nicht berichtet.

Ausgehend von dem Forschungsdesiderat, eine Kompetenzmodellierung und -erfassung im Bereich der Planung von Unterricht anzugehen, wurde im Projekt Planungskompetenz von Lehrerinnen und Lehrern (PlanvoLL) ein standardisiertes und reliables Verfahren zur Analyse von schriftlichen Unterrichtsplanungen entwickelt (König et al. 2015). Inhaltlich wird auf die Frage fokussiert, inwieweit angehende Lehrkräfte im Rahmen ihrer schriftlichen Unterrichtsplanung eine Passung zwischen den kognitiven Voraussetzungen einer Lerngruppe und der im Unterricht zu bearbeitenden Aufgaben herstellen („didaktische Adaptivität“).Footnote 2 Elf Kriterien dienen der Messung und lassen sich vier Kategorien zuordnen (vgl. Tab. 2).

Im Rahmen des Projektes wurden die erste und die letzte schriftliche Lehrprobenplanungen von n = 106 Berliner Referendar*innen analysiert (König et al. 2015, S. 384). Auf Basis von IRT-Skalierungsanalysen konnte ein reliabler Gesamtscore gebildet werden. Das Konstrukt wurde im Nachfolgeprojekt PlanvoLL‑D an einer größeren Stichprobe von Referendar*innen in Nordrhein-Westfalen und Berlin erneut gemessen. Die Reliabilität wie auch weitere psychometrische Eigenschaften konnten hierbei repliziert werden (König et al. 2020a).

Den Ansatz aus PlanvoLL weiterführend wurde außerdem im Rahmen des Projekts PlanvoLL‑D eine Rahmenkonzeption zur Planungskompetenz entwickelt, das sogenannte CODE-PLAN-Modell (cognitive demands of lesson planning) (König et al. 2021). Die mit dem Konstrukt „didaktische Adaptivität“ im Projekt PlanvoLL begonnene Forschung wurde damit durch weitere kognitive Anforderungen der Unterrichtsplanung deutlich erweitert (vgl. auch in diesem Heft Krepf und König 2022), die nun erstmals in einem übergreifenden Modell vereint werden. Dieses Modell bildet den allgemeinen theoretischen Rahmen für die Konzeptualisierung von sechs Anforderungen, um die Planungskompetenz von angehenden Lehrpersonen empirisch zu beschreiben und zu analysieren: Transformation von Inhalten (content transformation), Erstellung von Aufgaben (task creation), Adaptivität an die Voraussetzungen der Lernenden (adaption of learning dispositions), Zielklarheit (clarity of learning objectives), Kontextualisierung in die Unterrichtseinheit (unit contextualization), Phasierung der Unterrichtsstunde (phasing).

Eine Operationalisierung der Fähigkeiten zur Bewältigung dieser theoretisch postulierten sechs Anforderungen wird weiterhin wie im Ansatz aus PlanvoLL über die Kodierung schriftlicher Planungen und eine anschließende Indikatoren- sowie Skalenbildung erzielt. Es lassen sich sechs reliable Skalen an einer Stichprobe von 337 schriftlichen, für Lehrproben konzipierte Unterrichtsplanungen bilden (König et al. 2021). Die Faktorenstruktur kann konfirmatorisch auf latenter Ebene abgesichert werden, zugleich kann in einem second order Faktorenmodell ein Gesamtscore abgebildet werden, der alle sechs Dimensionen umfasst.

Gemein ist den genannten Verfahren, dass sie nicht Lehramtsstudierende, sondern angehende Lehrkräfte am Ende ihrer Ausbildung (Lizenzierungsverfahren in den USA, Referendariat in Deutschland) oder sogar berufstätige Lehrkräfte adressieren sowie mit der kriterienbezogenen Analyse authentischer Planungen (nach denen auch unterrichtet wird) und einem generierten Wertungsschema die UPK ermitteln. Der Fokus ist jeweils auf eine einzelne Unterrichtsstunde begrenzt. Die Kodierung schriftlicher Planungen ist, verglichen mit z. B. den Verfahren der Kompetenzselbsteinschätzungen, dennoch mit einem relativ hohen Aufwand verbunden, alle Studien berichten (zufriedenstellend hohe) Übereinstimmungsmaße unabhängig gegebener Urteile (Interrater-Reliabilität).

3.3 Erfassung von UPK mithilfe von Vignettentests

Die größte Anzahl der empirischen Studien arbeitet mit Vignettentests. Hierunter versammeln wir testdiagnostische Erhebungsverfahren, die eine Planungssituation oder mehrere Planungssituationen skizzieren und im Anschluss von den (angehenden) Lehrkräften darauf bezogene Planungsaufgaben bzw. Testfragen bearbeiten lassen. Es handelt sich also nicht um authentische Planungsdokumente, sondern kodiert bzw. gewertet werden die auf stellvertretende Planungssituationen und ihre weiterführenden Fragen gegebenen Antworten der Proband*innen.

Ein breit rezipierter und auch für weitere Studien beispielgebender Vignettentest stammt aus dem Forschungskontext zur Adaptiven Lehrkompetenz (Baer et al. 2008, 2011; Beck et al. 2008). Eine inhaltsanalytische Auswertung der auf zwei Vignetten mit offenem Antwortformat gegebenen Antworten erfolgt vor allem anhand der auf UPK bezogenen Dimensionen didaktische und diagnostische Kompetenz (Larcher et al. 2010). Im Textvignettentest von Wolf (2020) werden ähnlich wie bei Baer et al. (2008, 2011) die Proband*innen dazu aufgefordert, einem fachfremd unterrichtenden Kollegen Hinweise zu geben und zu begründen, welche Aspekte der Unterrichtsplanung als besonders relevant anzusehen und wie diese umzusetzen sind (Wolf et al. 2022). Die produzierten Texte werden danach ausgewertet, welchen inhaltlichen Wissensbereichen die Bearbeitungen zuzuordnen sind (Tab. 2). Außerdem wird kodiert, ob die identifizierten Aspekte von den Proband*innen lediglich (korrekt) benannt werden (Begriffswissen), oder darüber hinaus deren Umsetzung erläutert (Handlungswissen) und begründet (Begründungswissen) wird. Schließlich wird erfasst, ob die Elemente jeweils fachdidaktisch konkretisiert oder allgemeindidaktisch bzw. fachunspezifisch benannt, erläutert und begründet werden.

Backfisch et al. (2020, S. 10) adaptierten für ihre Studie mit n = 94 angehenden bzw. berufstätigen Mathematiklehrer*innen Rating-Schemata, die häufig zur Evaluation von Unterrichtsprozessqualität verwendet wurden, und nutzen diese mit Blick auf die Bewertung der über ihren Szenario-basierten Ansatz erstellten Unterrichtsplanungen. Sie inkludieren somit Aspekte von Unterrichtsqualität hinsichtlich kognitiver Aktivierung und konstruktiver Unterstützung. Zusätzlich wird die Qualität der Verwendung von Informations- und Kommunikationstechnologie in der Unterrichtsplanung über ein Item erfasst. Weder eine Skalierung noch eine Reliabiliätsanalyse wird berichtet, die Autor*innen analysieren Gruppenmittelwerte wie auch Zusammenhänge zum Professionswissen auf Basis dieser zwei Subskalen.

Ebenfalls in einem fachdidaktischen Kontext erfasst Kirsch (2020a; vgl. Kirsch 2022, in diesem Heft) die sachunterrichtliche Planungskompetenz auf der Basis von Textvignetten. Die Proband*innen werden mit berufstypischen, problemhaltigen Planungssituationen als Stimulus konfrontiert und sollen dann ein mögliches, angemessenes Verhalten beschreiben. Inhaltlich sind die Textvignetten nach sechs Teiltätigkeiten der Sachunterrichtsplanung gestaltet (s. Tab. 2), wobei „Bildungsinhalte bestimmen“ und „Ziele festlegen“ zusammengefasst werden, sodass fünf Vignetten erprobt werden (Kirsch 2022, in diesem Heft). Zur Bewertung der Bewältigung der sechs Teiltätigkeiten werden insgesamt 48 Qualitätsstandards als Bewertungskriterien genutzt (Adaptivität, Kohärenz, Kognitive Aktivierung, Strukturierung, Korrektheit). Auf Basis einer Stichprobe von n = 106 Lehramtsstudierenden zeigt sich, dass im Vergleich mit einem Fünf-Faktoren-Modell, in dem die fünf Vignetten als latente Variablen spezifiziert werden, das Generalfaktormodell die bessere Passung aufweist, sodass auf Eindimensionalität des Konstruktes geschlossen wird (Kirsch 2020a, S. 11).

König et al. (2022b, in diesem Heft) entwickelten auf Basis des im vorherigen Abschn. 3.2 beschriebenen CODE-PLAN Modells (König et al. 2021) einen Vignetten-Test, um UPK standardisiert und effizienter als über die aufwändige Kodierung von schriftlichen Unterrichtsplanungen zu erfassen. Zudem wird das Ziel verfolgt, UPK nicht nur bei angehenden, sondern auch bei berufstätigen Lehrkräften testen zu können. Mithilfe von good practice Planungen konnten drei realistische Situationen konzipiert werden, die für die Unterrichtsplanung im Fach Deutsch typisch sind. Die für die Vignetten entwickelten 36 Testfragen beziehen sich auf kognitive Anforderungen der Unterrichtsplanung, wie sie im CODE-PLAN Modell beschrieben werden, wobei sie zu folgenden vier Anforderungen gebündelt werden: Fachwissenschaftliche Aufbereitung, Zielklarheit, Strukturierung und Didaktische Adaptivität. In einer eindimensionalen Skalierung an einer Stichprobe von über n = 200 Proband*innen (81 Bachelor-, 75 Master-Studierende, 31 Referendar*innen, 32 Junglehrkräfte) erweist sich der Test als reliabel, darüber hinaus lassen sich die vier Anforderungen als Subskalen reliabel abbilden. Es lassen sich somit die vier Dimensionen Fachwissenschaftliche Aufbereitung, Zielklarheit, Strukturierung und Didaktische Adaptivität unterscheiden, sie bilden hier vier in IRT-Skalierungen empirisch trennbare Dimensionen (EAP-Reliabilität zwischen 0,74 und 0,82), allerdings sind die Interkorrelationen der vier Skalen hoch (latent: 0,77–0,89; manifest: 0,52–0,64).

Einen fachspezifischen Zugang forcieren Morris und Hiebert (2017), indem sie n = 27, sich im Berufseinstieg befindenden Mathematiklehrkräften vier Vignetten (lesson planning tasks) vorlegten, jeweils mit Schwerpunkt auf ein fachliches Thema (Multiplikation zweistelliger Zahlen, Subtraktion von Brüchen, Division von Brüchen, Mittelwertbildung). Zur Auswertung werden Kategorisierungen entlang von Schlüsselkonzepten (key concepts) verwendet (Entwicklung der Konzeptbedeutung, Wahl der Darstellung, Rechtfertigung der Standardprozedur). Der Vignettenaufbau umfasst jeweils eine kontextuelle Einleitung, gefolgt von den einzelnen Testfragen. Eine Skalierung der Testfragen erfolgt nicht, die Auswertung wird getrennt für die Vignetten und Schlüsselkonzepte vorgenommen. Deskriptive Befunde erfolgen anhand von Häufigkeiten erreichter Scores bzw. anhand von Gruppenbildungen.

Um die „Planungsperformanz“ von Lehramtsstudierende mit dem Unterrichtsfach Physik zu erfassen, entwickelten Schröder et al. (2018) einen standardisierten, ebenfalls fallvignettenbasierten Test. In Begleitseminaren zum Praxissemester wurden Lehramtsstudierende kurz über die Lerngruppe und den vorangegangenen Unterricht sowie zwei Lernziele informiert, um dann in einem Zeitrahmen von 60 min eine 45-minütige Unterrichtsstunde zu planen. Die entstehenden Planungsdokumente wurden anschließend hinsichtlich ihrer Qualität untersucht (Schröder et al. 2018). Um die Qualität der Unterrichtsplanung zu beurteilen, wurde ein Kodiersystem mit sieben Oberkategorien und 45 Kodieritems erarbeitet. Die Oberkategorien waren empirisch auf der Basis einer Stichprobe von n = 96 Pre-Tests und n = 78 Post-Tests begleitend zum Praxissemester nicht voneinander zu trennen, sodass ein reliabler Gesamtscore (Cronbach’s Alpha 0,81) als Maß für die Unterrichtsplanungskompetenz verwendet wurde (Schröder et al. 2020, S. 114).

Bei Stender et al. (2017), die Handlungsskripte auch mit einem Vignettentest (Planungsvignetten) erfassen, um anschließend ihre Struktur und Qualität zu analysieren, werden zunächst sechs Subskalen auf Basis einer Stichprobe mit n = 49 Physiklehrkräften ohne Skalierungsanalyse gebildet (Cronbach’s Alpha 0,62–0,76): Retrievability, Dependency, Concretness, Appropriateness, Coherence, Activation. Anschließend werden die ersten drei und die letzten beiden Skalen als manifeste Variablen für die Modellierung von zwei latenten Variablen im Strukturgleichungsansatz genutzt (Faktor 1: Formale Qualität, Faktor 2: Funktionale Qualität). Die latente Interkorrelation zwischen den beiden Faktoren ist hoch (r = 0,83).

Inhaltlich und formal zeigen die skizzierten Verfahren teilweise große Unterschiede. So schwankt z. B. die Anzahl der verwendeten Vignetten zwischen einer (Backfisch et al. 2020; Schröder et al. 2020) und fünf (Kirsch 2020a); die Studien unterscheiden sich in den ihrer Vignettentestung zugrunde gelegten Dimensionen (Tab. 2), aber auch methodisch in der Prüfung dieser Dimensionen im Rahmen von Skalierungsanalysen: So nehmen einige Studien keine Skalierungsanalyse vor (Backfisch et al. 2020; Baer et al. 2011), berichten aber dennoch Fähigkeitsscores (aufsummierte Einzelitems). Morris und Hiebert (2017) werten überwiegend auf Einzelitem-Ebene aus. Andere Studien verwenden die Testscores aus einer eindimensionalen Skalierung (Kirsch 2020a; Schröder et al. 2020). Eine Analyse der Mehrdimensionalität von UPK wird lediglich von König et al. (2022, in diesem Heft) sowie Stender et al. (2017) vorgenommen. Dabei fällt auf, dass die Interkorrelationen zwischen den empirisch getrennten Subskalen eher hoch oder sogar sehr hoch sind (vgl. auch Kirsch 2020a, 2022, in diesem Heft).

3.4 Erfassung von UPK mithilfe von Wissenstests

Schüle et al. (2017, S. 17) entwickelten einen eindimensionalen allgemeindidaktischen Planungswissentest als Teil des pädagogischen Wissens von (angehenden) Lehrpersonen. Eine hier beispielhaft genannte Testaufgabe lautet: „Sie sind an der fächerübergreifenden Unterrichtseinheit (Deutsch, Politik, Mathematik, Kunst) zum Thema ‚Imagewerbung‘ beteiligt und planen eine Analyse von Anzeigen großer Stromkonzerne. Mit welchem/n der aufgeführten Begriffe lässt sich allgemeindidaktisch begründen, dass die Schüler die Haushaltstarife, die Bedingungen für einen Anbieterwechsel und den Anteil von regenerativen Energiequellen vergleichen? Befähigung zu zunehmender …“. Die Antwortalternativen lauten „Selbstbestimmung, Solidarität, Autonomie, Mitbestimmung“, wobei Autonomie eine falsche Antwortalternative darstellt und die übrigen drei korrekt sind (Arnold et al. 2017, S. 4).

Für die Geschichtsdidaktik wurde der SOSCIE-Test entwickelt (Wolf et al. 2017, 2018; Projekt: Future Social Sciences Teacher’s Competencies). Anhand von 20 geschlossenen dichotomen und Zuordnungs-Aufgaben mit insgesamt 113 Items werden das faktual-konzeptionelle und das prozedurale geschichtsdidaktische Wissen in vier Wissensbereichen abgefragt (Wolf 2020, S. 317; s. Tab. 2): Ziele und Prinzipien, Phasierung und Strukturierung, Medien und Methoden, Aufgaben und Arbeitsaufträge. Als Operationalisierung des faktual-konzeptionellen Wissens liegen Aufgaben vor, die die kognitive Anforderung des „Erinnerns“ von theoretisch-formalen Wissensinhalten umfassen. Das prozedurale Wissen wurde anhand von Items erfasst, denen die Anforderung des „Analysierens“ als wichtiger Denkoperationen bei der Unterrichtsplanung zugrunde liegt. Eine Rasch-Skalierung weist die empirische Trennung der vier inhaltlichen Dimensionen bzw. der zwei wissensbezogenen Dimensionen auf (Wolf 2020, S. 319 f.).

4 Forschungsbefunde zur Unterrichtsplanungskompetenz

4.1 Zusammenhänge der UPK mit kognitiven und affektiv-motivationalen Dispositionen

Einige der in Abschn. 3 vorgestellten Studien nehmen Bezug auf verbreitete Annahmen zum Einfluss kognitiver und affektiv-motivationaler Dispositionen auf die UPK. Insbesondere das Professionswissen wird als wichtige Voraussetzung für die erfolgreiche Planung von Unterricht erachtet (s. 2.3.1).

Im Rahmen des Projekts PlanvoLL‑D wurde an einer Stichprobe von n = 172 Referendar*innen aus Berlin und NRW der Zusammenhang von pädagogischem Wissen als „kognitiver Disposition“ und der „Didaktischen Adaptivität“ als Aspekt von UPK geprüft. Ein allgemeiner Zusammenhang zwischen dem über paper-pencil-Verfahren getesteten pädagogischen Wissen und der über die Analyse schriftlicher Planungen von Lehrproben erfassten „Didaktischen Adaptivität“ zeigte sich nicht (r = 0,02), jedoch konnte ein spezifischer Zusammenhang zwischen der Subskala pädagogischen Wissens zum „Umgang mit Heterogenität“ und dem aus schriftlichen Planungen generierten Konstrukt der „Didaktischen Adaptivität“ aufgezeigt werden (r = 0,21, p < 0,01; König et al. 2020a, S. 12). Dieser Zusammenhang blieb auch unter Kontrolle von Lehramtstyp, Alter, Geschlecht und Länge der schriftlichen Planung erhalten (König et al. 2020a, S. 13). Aufgrund der inhaltlichen Überschneidung von pädagogischem Wissen zum Umgang mit heterogenen Lerngruppen und der auf die Lernvoraussetzungen der Schüler*innen abgestimmten Planung fokussierenden „Didaktischen Adaptivität“ sehen die Autor*innen spezifische Erwartungen zum Zusammenhang von Wissen und UPK bestätigt (König et al. 2020a, S. 14).

Schröder et al. (2020) prüften eher global Zusammenhänge zwischen der im Fach Physik mittels Vignettentest bei Lehramtsstudierenden im Praxissemester erfassten UPK mit dem Fachwissen, dem fachdidaktischen Wissen und dem erziehungswissenschaftlichen Wissen dieser Studierenden. Auch hier wurde das professionelle Wissen mittels paper-pencil-Tests erhoben. Weder zum ersten Messzeitpunkt vor dem Praxissemester (r = 0,01) noch zum zweiten Messzeitpunkt nach dem Praxissemester (r = −0,06) zeigt sich ein signifikanter Zusammenhang der getesteten Planungsfähigkeit mit dem Fachwissen Physik. Dagegen liegt zum ersten Messzeitpunkt die Korrelation zwischen dem physikdidaktischen Wissen und der UPK bei r = 0,32 (p < 0,01), zum zweiten Messzeitpunkt bei r = 0,33 (p < 0,01), zwischen erziehungswissenschaftlichem Wissen und Planungsfähigkeit liegt sie bei r = 0,36 (p < 0,01) bzw. r = 0,25 (p < 0,05). Ein erhöhtes fachdidaktisches und erziehungswissenschaftliches Wissen, nicht aber ein erhöhtes Fachwissen gehen demnach mit einer erhöhten UPK einher (Schröder et al. 2020, S. 119; vgl. auch Riese et al. 2022, in diesem Heft).

Eine Untersuchung des Zusammenhangs zwischen fachdidaktischem Wissen und UPK berichten König et al. (2022b, in diesem Heft) für angehende bzw. berufstätige Deutschlehrkräfte der Sekundarstufe. Zur Erfassung des professionellen Wissens nutzen sie ein Testinstrument zur Erfassung des deutschdidaktischen Wissens (Bremerich-Vos 2019). Zur Erfassung der Unterrichtsplanungsfähigkeit im Fach Deutsch der Sekundarstufe kam der von den Autor*innen entwickelte Vignetten-Test zur Anwendung (s. 3.3). Die so gemessene Planungsfähigkeit korreliert substanziell mit dem deutschdidaktischen Wissen der (angehenden) Lehrkräfte: In einem Pfadmodell, in dem neben dem deutschdidaktischen Wissen auch die Unterrichtserfahrung der beteiligten Untersuchungsgruppen (Bachelor-Studierende, Master-Studierende, Referendar*innen, Junglehrkräfte) als Prädiktor (bzw. als Kontrollvariable) einbezogen wurde, beträgt der Pfadkoeffizient vom Wissen auf die UPK β = 0,53 (p < 0,001).

Ebenfalls im Kontext Unterrichtsplanung für den Fachunterricht Physik zeigt sich in der Studie von Stender et al. (2017, S. 1707), dass die vignettenbasierte Messung von Qualität der Unterrichtsplanungen durch das fachdidaktische Wissen zum spezifischen Thema des Kraftgesetzes von Newton statistisch beeinflusst wird: In einem Pfadmodell kann das Wissen die funktionale Qualität (Coherence, Activation) vorhersagen (β = 0,45; p < 0,01), nicht aber die formale Qualität (Retrievability, Dependency, Concreteness). Letzteres wird in einem weiteren Modell über affektiv-motivationale Merkmale mediiert (Stender et al. 2017, S. 1708).

Für das Fach Mathematik nutzten Backfisch et al. (2020) zwei Testitems mit offenem Antwortformat, um das spezifische mathematikdidaktische Wissen zum Pythagoras-Theorem zu erfassen. Das so gemessene mathematikdidaktische Wissen korreliert signifikant mit der über den Szenario-basierten Ansatz erhobene UPK in Höhe von r = 0,21 (p < 0,05). Angesichts nicht berichteter Reliabilitäten der Messung (weder für das Wissen noch für die UPK) ist die in dieser Studie berichtete Korrelation allerdings nur eingeschränkt interpretierbar.

Auch wenn die Befundlage zum Zusammenhang von professionellem Wissen und UPK – etwa durch sehr unterschiedliche Stichproben und Erhebungsverfahren der jeweiligen Studien – ein nur bedingt einheitliches Bild ergibt, zeigt sich insgesamt, dass die jeweils gemessene UPK nicht unabhängig von testdiagnostisch erfassten Beständen professionellen Wissens ist. Insbesondere können Zusammenhänge der UPK mit fachdidaktischem und pädagogischem Wissen belegt werden, während im Bereich fachlichen Wissens bislang kaum belastbare Zusammenhangsbefunde existieren.

Empirische Befunde zum Einfluss affektiv-motivationaler Dispositionen auf die UPK liegen bislang nur vereinzelt vor. So haben Freisler-Mühlemann et al. (2021) in einer quantitativen Teilstudie den Einfluss der Widerstandskraft, der Gewissenhaftigkeit und der sozialen Unterstützung durch das Kollegium auf die selbsteingeschätzte UPK am Ende des ersten Berufsjahres erfasst. Personale Ressourcen wie Gewissenhaftigkeit (rt1 = 0,32, p < 0,05; rt2 = 0,35, p < 0,05), offensive Problembewältigung (rt1 = 0,30, p < 0,05; rt2 = 0,32, p < 0,05) oder niedrige Resignation bei Misserfolgen (rt1 = 0,32, p < 0,05) stehen in einem positiven Zusammenhang mit der selbst eingeschätzten Planungskompetenz, während sich für die soziale Unterstützung kein signifikanter Zusammenhang zeigt (Freisler-Mühlemann et al. 2021, S. 149).

Als weitere affektiv-motivationale Dispositionen werden zudem epistemologische Überzeugungen in der Domäne Geschichte bei Geschichtslehramtsstudierenden erhoben. Sie erweisen sich u. a. als Prädiktoren des getesteten geschichtsdidaktischen Planungswissens (s. 3.4). Selbstwirksamkeitserwartungen und Leistungsmotivation zeigen hingegen nur vereinzelt schwache Zusammenhänge (Wolf 2020; Wolf et al. 2022). Pädagogische Vorerfahrungen zeigen keine statistisch bedeutsamen Zusammenhänge mit der selbsteingeschätzten allgemeindidaktischen Planungskompetenz (APK), während die Qualität der Beziehung zur Mentor*in eine signifikante Korrelation mit der selbsteingeschätzten Planungskompetenzentwicklung im Praktikum zeitigt (r = 0,29) (Bach 2013, S. 188; s. 3.1).

Schließlich haben Küth et al. (2021, S. 2) den Einfluss psychoemotionaler Einflüsse auf Auswahl und Integration planungsrelevanter Informationen als situationsspezifische Fähigkeiten, konkret Tendenzen im Entscheidungsverhalten als psychoemotionale Einflüsse auf kognitive Operationen erfasst. Unter den Entscheidungstendenzen differenzieren sie nach Vigilanz, Vermeidung, Aufschub und Hyperviliganz. Die Erfassung des selbsteingeschätzten adaptiven Planungsverhaltens erfolgte im Allgemeinen Schulpraktikum (ASP) in der ersten Phase der Lehrer*innenbildung unter Anwendung der Selbsteinschätzungsskalen von König et al. (2017; s. 3.1). Es zeigte sich, dass je weniger aufschiebend und vigiliant das Entscheidungsverhalten vor dem ASP ist, umso höher wird – im Falle der Vigilianz zumindest tendenziell – das adaptive Planungsverhalten eingeschätzt. Die Autoren deuten dies als empirischen Hinweis auf den Einfluss psychoemotionaler Faktoren auf kognitive Entscheidungsoperationen.

4.2 Ausprägung und Entwicklung von UPK in der Lehrer*innenbildung und im Berufseinstieg

Viele der hier betrachteten empirischen Studien zielen auf die Befragung bzw. Testung angehender Lehrkräfte. Damit verbinden sich Annahmen zur Wirkung der Lehrer*innenbildung auf den Erwerb von UPK (s. 2.3.2).

Mit Blick auf die Verfahren der Kompetenzselbsteinschätzung fällt auf, dass Lehramtsstudierende zu Beginn ihres Studiums auch vor der Absolvierung erster schulpraktischer Studien sowie im weiteren Verlauf der ersten Phase der Lehrer*innenbildung ihre UPK bereits hoch einschätzen. So können Schnebel et al. (2017) im sechsten Studiensemester relativ hohe Ausgangswerte der selbsteingeschätzten UPK identifizieren, die sich im Studienverlauf noch weiter steigert. Ein vergleichbarer Befund zeigt sich auch im Projekt ESIS und in weiteren Stichproben, in denen die APK-Skala (s. 3.1) zum Einsatz kommt (Besa et al. 2020, S. 102). Bach identifiziert so bereits zu Beginn des Praktikums (und des Studiums generell) „einen relativ hohen Kompetenzausgangswert“ (Bach 2013, S. 193). In der Studie von Küth et al. (2021) verändern sich die Selbsteinschätzungen der Planungskompetenz im Verlauf eines Praktikums nicht, was aber auf die hohen Ausgangswerte vor dem Praktikum zurückgeführt wird (Küth et al. 2021). Auch im Projektzusammenhang Adaptive Lehrkompetenz zeigen die Lehramtsstudierenden gemessen am Zuwachs im Studienverlauf hohe Ausgangswerte (Baer et al. 2011).

Sowohl im Projekt PlanvoLL als auch im Projekt PlanvoLL‑D konnten mithilfe der Analyse schriftlicher Planungen der ersten und letzten Lehrprobe im Referendariat (quasi-)längsschnittliche Analysen zum möglichen Zuwachs an so gemessener UPK untersucht werden. Für das Konstrukt „Didaktische Adaptivität“ konnte ein statistisch signifikanter Zuwachs mit hoher praktischer Bedeutsamkeit ermittelt werden (d = 0,80) (König et al. 2015, S. 392). Der Zuwachs im Referendariat konnte in PlanvoLL‑D mit einer Stichprobe von Referendar*innen für das Fach Deutsch der Sekundarstufe in Berlin und NRW repliziert werden (d = 1,7) (König 2019, S. 120). Die Erweiterung des Ansatzes der Analyse schriftlicher Planungen in den Dimensionen des CODE-PLAN Modells zeigte schließlich, dass in allen sechs unterschiedenen Dimensionen von UPK-Skalen bezüglich kognitiver Anforderungen ein Zuwachs im Referendariat an dieser Längsschnittstichprobe auffindbar ist (König et al. 2021, S. 13): Transformation von Inhalten (d = 1,62), Erstellung von Aufgaben (d = 0,97), Adaptivität an die Voraussetzungen der Lernenden (d = 1,97), Zielklarheit (d = 1,58), Kontextualisierung in die Unterrichtseinheit (d = 1,98), Phasierung der Unterrichtsstunde (d = 1,33).

Im Projektzusammenhang Adaptive Lehrkompetenz wird die Entwicklung der mittels der beiden Vignetten erfassten UPK im Studienverlauf über drei Messzeitpunkte berichtet (d = 1,00 t1–t2; d = 0,99 t2–t3) (Baer et al. 2008, S. 267), wobei die Lehramtsstudierenden im 5. Semester bereits das Niveau von Praxislehrpersonen erreichen (Baer et al. 2011, S. 104). In einer zweiten Stichprobe wurde die Entwicklung der UPK vom 6. Semester zum Berufseinstieg erfasst. Die erhobene Planungskompetenz nimmt vom 6. Semester ab (Baer et al. 2008, 2011), was mit einer zunehmenden Routinisierung und Automatisierung von Planung diskutiert wird (Baer et al. 2008, S. 269 f.).

Eine Zunahme der Planungsfähigkeit kann auch im Fach Physik identifiziert werden. Mit dem von Schröder et al. (2020) entwickelten Vignettentests konnten zu zwei Messzeitpunkten vor und nach dem Praxissemester auf der Basis des Summenscores der Planungsfähigkeit ein signifikanter Zuwachs belegt werden (d = 0,47) (Vogelsang et al. 2019, S. 486). Die mittels eines Vignettentests (Planungsvignetten) aktivierten Handlungsskripte (angehender) Physiklehrkräfte unterscheiden sich zudem hinsichtlich formaler und funktionaler Merkmale in Abhängigkeit von der zunehmenden Erfahrung der Lehrkräfte: Erfahrene Lehrer*innen können verglichen mit Studierenden und Referendar*innen ihre Handlungsskripte besser abrufen (Retrievability), innerhalb eines Handlungsskripts hängen die Planungsbereiche vermehrt voneinander ab (Dependency) und durch die Handlungsskripte wird eher eine kognitive Aktivierung der Schüler*innen ermöglicht (Activation) (Stender 2014, S. 200 f.; vgl. Stender et al. 2017).

Für das Fach Deutsch der Sekundarstufe zeigen König et al. (2022b, in diesem Heft) anhand einer Stichprobe mit angehenden und berufstätigen Lehrkräften in verschiedenen Ausbildungs- bzw. Karrierestadien, dass die mithilfe des entwickelten Vignettentests erfasste UPK mit ansteigender Unterrichtserfahrung grundsätzlich zunimmt: Referendar*innen und Lehrer*innen als die Gruppen mit der meisten Unterrichtserfahrung schneiden im Test (sowohl im Gesamtscore als auch in den vier Dimensionen Fachwissenschaftliche Aufbereitung, Zielklarheit, Strukturierung, Didaktische Adaptivität) deutlich besser ab als Bachelor- und Master-Studierende (jeweils im 4. Semester), die sich ihrerseits nicht signifikant unterscheiden. Auch zwischen Referendar*innen und (Jung‑)Lehrer*innen zeigen sich keine signifikanten Mittelwertunterschiede. Insgesamt differenziert der Test somit zwischen angehenden Lehrkräften der ersten und zweiten Phase der Lehrer*innenbildung.

Für die beiden Phasen der Lehrer*innenbildung zeigt sich auch im fachdidaktischen Kontext Geschichte im Vergleich von vier erfassten Kohorten (64 Studienanfänger, 131 im Vorbereitungsseminar Praxissemester, 52 im Begleitseminar Praxissemester, 35 Referendar*innen), dass die Referendar*innen über signifikant mehr und praktisch bedeutsam höheres Wissen im Ergebnis beider geschichtsdidaktischen Tests (s. 3.3 und 3.4) verfügen als die Studierenden in verschiedenen Stadien der ersten Phase der Lehrer*innenbildung und hier vor allem der Studienanfänger (Wolf 2020; Wolf et al. 2022).

4.3 UPK, Lehrer*innenhandeln und die Qualität des Unterrichts

Zur Frage, inwieweit UPK-Maße mit Daten zum unterrichtlichen Lehrer*innenhandeln bzw. der Qualität durchgeführten Unterrichts zusammenhängen, liefern einzelne Studien mit Planungsdokumenten bzw. testdiagnostischen Ansätzen Befunde. Dabei fällt auf, dass Studien, die authentische Planungsdokumente analysieren, auch die Durchführung der tatsächlich geplanten Stunde in den Blick nehmen und für diese Konstellation Zusammenhänge ermitteln. Studien, die mit Vignettentests arbeiten, abstrahieren hingegen von solch einer spezifischen Konstellation der Stundenplanung und korrespondierender Stundendurchführung, indem allgemein der Zusammenhang zwischen erreichter Testleistung und z. B. Merkmalen der Qualität des üblicherweise durchgeführten Unterrichts analysiert wird.

Mit Blick auf die Verfahren authentischer Planungsdokumente konnte anhand einer kleinen Stichprobe von n = 22 Referendar*innen zunächst gezeigt werden, dass die mithilfe des in PlanvoLL entwickelten Ansatzes erfasste „Didaktische Adaptivität“ als Merkmal der UPK die Bewertung des Qualitätsmerkmals „Binnendifferenzierung“ durch die von ihnen unterrichteten n = 449 Schüler*innen voraussagt (β = 0,37, p < 0,05; König et al. 2015, S. 396). Der Umfang „Didaktischer Adaptivität“ in den schriftlichen Unterrichtsplanungen steht somit in einem Zusammenhang mit der stärkeren Wahrnehmung von differenzierenden Maßnahmen im Unterricht seitens der Schüler*innen. Im Projekt PlanvoLL‑D konnte der Befund für eine deutlich größere Stichprobe von n = 172 Referendar*innen und mithilfe ihrer selbsteingeschätzten Unterrichtsqualität in geringerer Höhe bestätigt werden (r = 0,17, p < 0,05; König et al. 2020a, S. 12). Für weitere Aspekte der Planungskompetenz, die mit dem CODE-PLAN Modell beschrieben werden, konnten ebenfalls Belege erbracht werden, die an einer Stichprobe von n = 27 Referendar*innen über Urteile der unterrichteten Schüler*innen (n = 564) ermittelt wurden (König et al. 2021): Das Unterrichtsqualitätsmerkmal Klarheit der Instruktion aus Schüler*innensicht korreliert regressionsanalytisch mit den UPK-Maßen Transformation von Inhalten (β = 0,42, p < 0,05), Erstellung von Aufgaben (β = 0,31, p < 0,10) und Kontextualisierung in die Unterrichtseinheit (β = 0,24, p < 0,10); das Unterrichtsqualitätsmerkmal Unterstützung der Lernenden aus Schüler*innensicht korreliert mit den UPK-Maßen Transformation von Inhalten (β = 0,26, p < 0,10), Zielklarheit (β = 0,28, p < 0,01) und Kontextualisierung in die Unterrichtseinheit (β = 0,30, p < 0,05). In all diesen Zusammenhangsanalysen erfolgten die Urteile der Schüler*innen bzw. die Selbsteinschätzungen der Referendar*innen ausschließlich in Bezug auf die Qualität der gehaltenen Unterrichtsstunde, deren schriftliche Planung Grundlage für die Generierung des UPK-Maßes war.

Wird die Steigerung von Fachleistungen der Schüler*innen als Ergebnisqualität des Unterrichts in den Blick genommen, so ist die Analyse von Darling-Hammond et al. (2013) bemerkenswert. Auf Basis der über PACT ermittelten Scores zur UPK konnten Lernfortschritte von unterrichteten Schüler*innen vorhergesagt werden. Diese Analyse verdeutlicht, dass Ratings schriftlicher Unterrichtsplanungen möglicherweise eine bedeutsame Reichweite aufweisen können.

Im Bereich der stärker auf Standardisierung ausgerichteten Vignettentests finden sich Hinweise auf mögliche Zusammenhänge der UPK mit unterrichtlichem Handeln der Lehrkräfte im Projektzusammenhang Adaptive Lehrkompetenz. Dieses Konstrukt setzt sich, so die Ausgangsthese, aus der mittels Vignettentest erfassten adaptiven Planungskompetenz (s. 3.3) und der auf der Basis eines Videotests erhobenen adaptiven Handlungskompetenz zusammen (Beck et al. 2008, S. 169). Die Korrelation zwischen der adaptiven Planungskompetenz und der adaptiven Handlungskompetenz liegt bei r = 0,53 (Beck et al. 2008, S. 135). Die Kombination aus Planungs- und Handlungskompetenz steht des Weiteren in einem Zusammenhang mit einem höheren Lernerfolg der Schüler*innen (Beck et al. 2008, S. 171). Die adaptive Planungskompetenz von n = 49 Lehrkräften steht zudem in einem jeweils schwach signifikanten Zusammenhang mit Aspekten des Unterrichts aus der Schüler*innenperspektive (n = 898): Unterrichtsdruck: r = −0,26 (p < 0,05), Schülerbeteiligung: r = 0,28 (p < 0,05), Vermittlungsqualität: r = 0,29 (p < 0,05), Interessantheit der Unterrichtsgestaltung: r = 0,24 (p < 0,05), Pädagogisches Engagement r = 0,32 (p < 0,05) und Mitsprache: r = 0,25 (p < 0,05) (kein signifikanter Zusammenhang: Lehrerverhalten bei Fehlern, Störneigung, Regelorientierung) (Brühwiler 2014, S. 181).

Während somit sowohl für die Analyse authentischer Planungen als auch Vignettentestungen erste Befunde zur Auswirkung auf Unterrichtsprozess- und Unterrichtsergebnisqualität vorliegen, ist in den weiteren hier betrachteten Studien hingegen offen, in welchem Zusammenhang die Vignettentestungen mit Merkmalen des gehaltenen Unterrichts oder den erreichten Lernergebnissen der unterrichteten Schüler*innen stehen. Aus den betrachteten Studien mit Kompetenzselbsteinschätzungen wie auch den Planungswissenstests liegen keine entsprechenden empirischen Befunde aus Zusammenhangsanalysen vor.

5 Zusammenfassung und Bilanz der Forschung zur UPK

Die vorliegende Aufarbeitung von 19 Verfahren zur standardisierten Erfassung von UPK markiert zunächst die Entwicklung eines jungen Feldes der empirischen Bildungsforschung: Dieses Feld wendet sich der Unterrichtsplanung als einer relevanten, spezifischen Aufgabe des Lehrer*innenberufs zu, konkretisiert hierfür benötigte Fähig- und Fertigkeiten und bearbeitet diese unter Rekurs auf existierende Forschungstraditionen und -paradigmen. Dabei treten vor allem die Kompetenz- und Expertiseforschung sowie situationsspezifische Ansätze und die Forschung zum decision making hervor (s. 2.2). Wenngleich die identifizierten Ansätze und Verfahren im Detail Unterschiede aufweisen, lassen sie sich durchaus unter der vorgeschlagenen Arbeitsdefinition (s. 2.4) versammeln und gemeinsam betrachten.

Vier verschiedene methodische Zugänge werden dabei erkennbar und strukturieren den Überblick über die entwickelten Messverfahren und bislang erzielten empirischen Befunde (s. 3): Erfassung von UPK über Selbsteinschätzungsverfahren, Analyse authentischer Planungsdokumente, Vignettentests und Planungswissenstests. Beinahe alle Verfahren sehen – zumindest konzeptionell – Binnendifferenzierungen nach Inhaltsbereichen bzw. -dimensionen vor, die begrifflich allerdings variieren. Am ehesten finden sich Ähnlichkeiten bezüglich typischer Planungsaspekte wie Ziele, Adaptivität oder Strukturierung. Deutliche Variation zeigt sich in der Berücksichtigung fachlicher Planungsaspekte: Einzelne fächerübergreifende Verfahren verzichten prinzipiell auf Fachlichkeit (z. B. Kompetenzselbsteinschätzungsverfahren). Bei anderen Verfahren erfolgen fachspezifische Nuancierungen hierarchieniedrig im Wesentlichen nur in der Operationalisierung einzelner Items (z. B. Kirsch 2020a). Bei anderen Verfahren wiederum prägt die Fachlichkeit das Testdesign grundsätzlich (z. B. Morris und Hiebert 2017).

Testdiagnostische Erwartungen an die psychometrische Qualitätsprüfung der entwickelten Verfahren werden in unterschiedlichem Maße erfüllt. Nur für wenige Verfahren liegen Befunde zur Prüfung der konzipierten Inhaltsbereiche bzw. -dimensionen vor. Einige Verfahren berichten einen Gesamtreliabilitätswert, verzichten jedoch auf weiterführende psychometrische Prüfung des Erhebungsinstruments, oder es werden Items zu Skalen aufsummiert, ohne weiterführend über die Messeigenschaften des Instruments zu informieren. Die wenigen mehrdimensionalen Skalierungsanalysen zeigen jeweils auf, dass reliable Teildimensionen empirisch unterschieden werden können, diese dann allerdings relativ hoch miteinander korrelieren. Die offensichtlich enge Verknüpfung von Inhaltsbereichen bzw. -dimensionen innerhalb des jeweiligen Verfahrens verweist möglicherweise darauf, dass die UPK als ein vergleichsweise spezifisches Konstrukt gemessen wird. Bilanzierend wirft dies die Frage auf, ob bisherige Messverfahren das Konstrukt UPK möglicherweise zu eng konzeptualisieren (s. 6.1).

Im Gegensatz dazu zeigen einige Studien auf, dass die jeweils gemessene UPK von den etablierten Facetten des Lehrer*innenprofessionswissens empirisch getrennt werden kann (im Sinne einer diskriminanten Validität), denn Korrelationen von UPK mit getestetem Wissen erreichen höchstens eine mittlere Höhe (s. 4.1). Die Korrelationen sind jedoch gleichzeitig auch hoch genug, um zu belegen, dass die jeweils gemessene UPK nicht unabhängig vom professionellen Wissen ist. Es können Zusammenhänge der UPK mit fachdidaktischem und pädagogischem Wissen, überraschenderweise aber nicht mit fachlichem Wissen belegt werden. Zukünftige Forschung müsste genauer klären, ob es einer stärker auf Fachlichkeit bezogenen Erfassung von UPK bedarf, doch auch die Frage nach der Bedeutung fachwissenschaftlicher Grundlagen für die Unterrichtsplanung erscheint damit als Forschungsdesiderat.

Messungen der UPK in der Lehrer*innenbildung geben Hinweise auf den Erwerb bei angehenden Lehrkräften (Abschn. 4.2). Während sich Studierende eher zu hoch bzw. zu ungenau selbsteinschätzen (vgl. Rothland 2018), lässt sich ein Zuwachs an UPK gemessen über die Analyse von Lehrprobenplanungen insbesondere über Längsschnitte im Referendariat nachweisen (große Effekte). Mithilfe von Vignettentests können kleine Zuwächse während des Praxissemesters sowie große für das Referendariat bzw. den Berufseinstieg nachgewiesen werden; Referendar*innen verfügen auch über umfangreicheres Planungswissen als Studierende bzw. Studienanfänger*innen. Über die (quasi-)längsschnittliche Messung von möglichen Zuwächsen in der UPK analysieren die betrachteten Studien allerdings nicht, durch welche Lerngelegenheiten im Besonderen die UPK gefördert wird. Eher ergibt sich global der Eindruck, dass es vor allem die intensiv und durch Prüfungen forcierte Unterrichtsplanungspraxis der zweiten Ausbildungsphase ist, die starke Zuwächse hervorruft. Der Nachweis einer Wirksamkeit von spezifischen Lerngelegenheiten der Lehrer*innenbildung für die UPK bleibt dagegen weitgehend ein Forschungsdesiderat oder anders: Hinweise zeigen, dass sich in der Zeit der Lehrer*innenbildungsphasen etwas verändert, offen bleibt jedoch, wo und wie sie wirken. In diesem Zusammenhang wäre zudem der Mehrwert zu bestimmen, den der mögliche Einsatz von Interventionsstudien für den Erwerb von UPK haben könnte.

Inwieweit UPK im Zusammenhang mit der Durchführung von Unterricht bzw. sogar Lernleistungen der Schüler*innen steht, darüber geben ausschließlich Studien Auskunft, die authentische Planungsdokumente analysieren oder mit Vignettentests arbeiten (s. 4.3). Ergebnisse zu Zusammenhängen mit der Unterrichtsqualität aber auch des Leistungsfortschrittes von Schüler*innen können erste Einblicke in die prognostische Validität einzelner Verfahren belegen. Es fehlt aber noch weitgehend eine systematisch angelegte Forschung zum Zusammenhang von UPK-Maßen und Merkmalen der Prozess- und Ergebnisqualität von Unterricht. Ein Grund könnte hierfür sein, dass die bisherige empirische Unterrichtsqualitätsforschung, deren Messverfahren (z. B. zur Erfassung von Basisdimensionen der Unterrichtsqualität durch Urteile der Lernenden) in den hier berücksichtigten Studien genutzt wurden, nur wenig die Prozessstruktur (Sequenzialität) und noch weniger die Intentionalität unterrichtlichen Lehrer*innenhandelns hinreichend reflektiert, sondern in der Regel aggregierend und statisch die Unterrichtswirklichkeit beschreibt, was mit erheblichen Informationsverlusten einhergeht. Zukünftige Forschung müsste daher die Durchführung von geplantem Unterricht hinsichtlich jener Dynamik von Unterrichtprozessen erfassen, für die UPK besonders prädiktiv sein könnte (vgl. dazu weiterführend Abschn. 6).

Bilanzierend lässt sich die empirische Forschung zur UPK als emergierendes, spezifisches Feld der Professions‑, Kompetenz- und Unterrichtsforschung beschreiben, das einerseits auf einschlägige Forschungstraditionen und -paradigmen sowie offene Diskussionslinien Bezug nimmt, andererseits methodisch neue Ansätze der Kompetenzforschung erschließt. Die in der Bilanz identifizierten und benannten Forschungsdesiderata verdeutlichen, dass sich hierbei Chancen, aber auch Herausforderungen für zukünftige Forschung stellen. Diese sollen nachfolgend diskutiert werden.

6 Diskussion

6.1 Messung von UPK zwischen Standardisierung und Flexibilität

Die in der empirischen Erfassung von UPK dominierenden Vignettentests folgen ebenso wie die Studien, die den empirischen Zugang über authentische Planungsdokumente wählen, im Zuge der zusammenfassenden Bewertung der jeweils kodierten Kriterien zu einem oder mehreren Fähigkeitsscore(s) einer gemeinsamen Auswertungslogik. Sie teilen die Annahme, dass eine in der Summe höhere Anzahl an von den Proband*innen erfüllten bzw. berücksichtigten Kriterien Ausweis einer entsprechend höher ausgeprägten UPK ist. Inwieweit insbesondere bei eindimensional ausgewerteten Instrumenten zur Erfassung von UPK die Standardisierung des Gegenstandsbereichs der Unterrichtsplanung bei gleichzeitig zu fordernder Flexibilität in Planung und Unterrichtsdurchführung (s. 6.2) zu stark in den Vordergrund rückt, erscheint diskussionswürdig.

Auch stellt sich die Frage, ob ein empirisch abgebildeter Fähigkeitsscore einen realistischen Maßstab für die Beurteilung der Qualität der UPK und infolgedessen für eine bestimmte Niveauausprägung bietet. Um mithilfe der psychometrischen Fähigkeitsskalen auszudrücken, ob die indizierte UPK bereits einem erwarteten Maßstab gerecht wird, müssten streng genommen Auswertungen erfolgen, die eine kriteriumsorientierte Testwertinterpretation zulassen (z. B. Klemenz und König 2019) – ähnlich der Bildung von Kompetenzniveaus in Large-scale Assessments auf Ebene von Schüler*innen. Damit einher geht die grundsätzliche Frage, ob die in den jeweiligen Verfahren entwickelte Auswertungslogik so tragfähig ist, dass von der durch eine höhere Punktzahl abgebildeten (immer) differenzierteren Planung explizit auf eine höhere UPK geschlossen werden kann (so etwa bei Kucharz et al. 2014; vgl. Baer et al. 2011). Aus diesem Grund sind gerade für den Gegenstand der UPK Prüfungen der psychometrischen Qualität eines entwickelten Verfahrens wichtig, ebenso die Bildung von Teilscores, um UPK differenziert beschreiben zu können. Ferner wäre über die Bildung von UPK-Profilen (z. B. mithilfe von personenzentrierten Verfahren) nachzudenken.

Nicht zuletzt scheint die Frage der Reichweite von Unterrichtsplanung von der hier in den Blick genommenen Forschung zur UPK nur unbefriedigend beantwortet zu sein: Die Verfahren fokussieren auf die Planung einzelner Unterrichtsstunden, teilweise wird die Kontextualisierung der einzelnen Stunde in einer Reihenplanung thematisiert (vgl. auch in diesem Heft Krepf und König 2022). Noch wird die mittel- und langfristige Unterrichtsplanung von Lehrkräften (z. B. Jahresplanung) aber nicht von Verfahren der UPK adressiert.

6.2 Gewissheit und Ungewissheit: Verhältnis von UPK-Maßen und unterrichtlichem Handeln

Das prosperierende Forschungsfeld zur UPK ist auch zukünftig gut beraten, nicht dem Trugschluss aufzusitzen, mit immer genauerer Modellierung, Operationalisierung und Messung die Unvorhersehbarkeit des Unterrichtens überwinden zu können. Auch über eine Elaboration von UPK mithilfe messmethodischer Aufwände bleiben unterrichtliche Abläufe stets nur begrenzt antizipierbar. Die nicht vollständig bekannten oder durchschaubaren wechselseitigen Beziehungen aller Planungsparameter und Wirkungen, die Dynamik der zu planenden Unterrichtssituation, die Komplexität und Vernetzung der Planungsvariablen sowie der Koexistenz divergierender Ziele (Gassmann 2013; Weingarten 2019, S. 19 f.) bedingen, dass sich die Unterrichtsdurchführung generell zwischen dem in der Planung Diagnostizierten, Antizipierten und Beabsichtigten und der situationsangemessenen (nicht lerngruppenbezogenen) Revidierung, Adjustierung oder gar Improvisation bewegt (Brühwiler 2014; Rothland 2021). Die „doppelte Kontingenz“ unterrichtlicher Prozesse (z. B. Baumert und Kunter 2006, S. 476) muss der Konzeption von Planungskompetenz immanent sein: „Double contingency implies that teachers cannot be certain of the effects of their actions in the classroom. Their classroom teaching and communication are not preemptively decidable through lesson planning“ (König et al. 2021, S. 469).

Verläuft ein Unterricht nach Plan, ist das noch nicht zwingend Ausweis seiner Qualität (vgl. Gassmann 2013). Gerade die Expertiseforschung schreibt Expert*innen einen flexibleren Umgang mit der Verfolgung des Geplantem im Unterricht als Noviz*innen zu. Die Unterrichtsplanung kann und sollte somit auch die Funktion haben, Lehrer*innen ein flexibles Unterrichtshandeln zu ermöglichen, da nicht alles antizipiert und exakt geplant werden kann. Hier liegt möglicherweise das unterscheidende Moment in der Lehrer*innenbildung, die, anders als in der Praxis des Lehr*innenberufs, einen Fokus auf die mögliche Planbarkeit von Unterricht legt – man denke etwa an die Verkaufsschlager in zweistelliger Auflagenhöhe wie „Unterrichtsrezepte“ (Grell und Grell 2010) oder den „Leitfaden Unterrichtsvorbereitung“ (Meyer 2007) – und angesichts einer nötigen kognitiven Entlastung angehender Lehrkräfte beim Erlernen sogar legen muss, jedenfalls in der Erwartung angehender Lehrkräfte (vgl. Horstmeyer 2021). Andererseits sollten gerade angehende Lehrkräfte sich nicht der Illusion hingeben, mit der Planung vollständige Sicherheit für die eigentliche Unterrichtshandlung zu gewinnen, indem man eine maximale Anzahl an alternativen Handlungsoptionen für alle Eventualitäten erarbeitet und bereithält. Eine solche „Überplanung“, die Sicherheit vermitteln soll und die Kontrollierbarkeit der zu planenden, nicht vollends vorhersehbaren Situation suggeriert, ist als Ausweis von UPK ebenso kritisch zu beurteilen wie eine „Unterplanung“, ein „Adhocismus“ (vgl. Weingarten 2019).

Für die in diesem Beitrag im Fokus stehende empirische Forschung zur UPK folgt daraus die anspruchsvolle Herausforderung, der situationsangemessenen Flexibilität als Qualitätsmerkmal des Lehrer*innenhandelns bei gleichzeitiger standardisierter Erfassung von UPK und Performanz im Unterricht gerecht zu werden. Es kann schließlich auch der Unterricht eine höhere Qualität aufweisen, in dessen Verlauf der detailliert und vorbildlich ausgearbeitete, mit einem hohen Fähigkeitscore bewertete Plan frühzeitig und vollständig verworfen wird (Rothland 2021). Der Ansatz, die Bewertung der Qualität der UPK an das Kriterium der Prozessqualität des realisierten Unterrichtsgeschehens zu binden, ist im Forschungsdiskurs jedenfalls weiter zu diskutieren und zu entwickeln. Eine vollständige Entkopplung erscheint dabei indes abwegig, ist die Unterrichtsplanung doch kein Selbstzweck.

6.3 Die Rolle der UPK in der Lehrer*innenbildung

Die versammelten Befunde sind in zweierlei Hinsicht erstaunlich klar: Erstens schätzen Studierende ihre UPK selbst (zu) hoch ein, zweitens kommt es im Wesentlichen erst im Referendariat zum Erwerb von UPK. Angesichts des fehlenden Erwerbs von UPK in der ersten Phase der Lehrer*innenbildung (sieht man einmal von kleineren Effekten im Praxissemester ab) ist es fraglich, ob UPK bereits bei Lehramtsstudierenden überhaupt erfasst werden soll, da sich die angenommenen Voraussetzungen (z. B. fachdidaktisches und pädagogisches Wissen als kognitive Dispositionen) selbst erst noch in der Erwerbsphase befinden; sofern Wissen als Voraussetzung für UPK angenommen wird (z. B. Stender 2014), ist eine Messung von UPK kaum oder nur bedingt sinnvoll, da zunächst das Wissen betrachtet werden müsste.

Ferner gilt es, die Zielperspektive der Forschungsbemühungen eindeutig zu bestimmen. So wird in den einzelnen Beiträgen nicht immer deutlich, ob die UPK selbst oder nicht vielmehr die Überprüfung der Wirksamkeit der Lehrer*innenbildung festgemacht am Indikator UPK im Vordergrund steht, wenn es bspw. heißt, dass ein standardisiertes Instrument zur Erfassung von Planungskompetenzen angehender Lehrkräfte zum Zwecke der Evaluation des Praxissemesters entwickelt wird (Kirsch 2020a, S. 1). UPK wird in solchen Projektzusammenhängen vor allem als abhängige Variable modelliert und weniger als Prädiktor für unterrichtliches Handeln (Besa et al. 2020).

Perspektivisch gilt es, berufserfahrene Lehrkräfte über die benannten vereinzelten Studien und auch über die Phase des Berufseinstiegs hinaus in der Forschung zur UPK stärker in den Blick zu nehmen. Wird UPK modelliert, operationalisiert und empirisch erfasst, dann wäre – so eine generelle Folgerung – auch, wenn nicht sogar „zuerst bei denen anzusetzen, die über die hier im Fokus stehende Kompetenz bereits in unterschiedlicher Ausprägung verfügen (können): den im Beruf stehenden, routinierten Lehrerinnen und Lehrern“ (Rothland 2021, S. 22; vgl. Neuweg 2014, S. 604). Diese Forderung birgt jedoch forschungspragmatisch Einschränkungen bzw. neue Herausforderungen: Während die elaborierte schriftliche Stundenvorbereitung von Referendar*innen – kritisiert als „Ausbildungsartefakt“ (Seel 2011, S. 40) – den hier betrachteten Studien zufolge offensichtlich eine empirisch gut zu analysierende Basis für die Identifikation von UPK bietet, erweisen sich Unterrichtsplanungen bei berufserfahrenen Lehrkräften eher als ein geistiges Produkt, das kaum oder nur eher knapp schriftlich festgehalten wird und somit weniger fassbar erscheint (Seel 2011). In beiden Gruppen anwendbar hingegen sind Vignettentests, die auch aufgrund weiterer methodischer Vorteile als der vielleicht vielversprechendste Zugang zur zukünftigen Erfassung von UPK erscheinen.

6.4 Was ist UPK? Verhältnisbestimmungen zu existierenden Kompetenzmodellen

Ausgehend von der heuristisch verstandenen Arbeitsdefinition (s. 2.4) stellen sich zum Ende dieses Stichwortbeitrags eine Reihe übergreifender Fragen. Ihre Beantwortung dürfte möglicherweise erst in den kommenden Jahren im Anschluss an zukünftige Forschungsbemühungen und Intensivierungen ansatzweise gelingen. Eine der grundsätzlichen Fragen lautet: Reichen die bisherigen Kompetenzmodelle aus, deren Grenzen durch das junge Forschungsfeld zur UPK deutlich werden?

Hier zeichnet sich ab, dass das häufig zitierte Modell generischer Handlungskompetenz von Baumert und Kunter (2006, S. 482) als alleinige Referenz insofern nicht länger ausreichend erscheint, als keine Studie allein mit diesem auskommt: UPK ist z. B. mehr als das bislang modellierte Professionswissen, und es wird entsprechend getrennt von UPK gemessen und untersucht. Nicht alle Wissensinhalte im Modell generischer Handlungskompetenz sind für die UPK relevant. Wenn postuliert wird, dass es „die“ professionelle Handlungskompetenz von Lehrkräften gibt – als eine hierarchiehohe Vorstellung von Lehrer*innenkompetenz und als generisches Modell nicht nur im Sinne von fachübergreifend, sondern generisch auch in Bezug auf alle Anforderungsbereiche, darunter die Unterrichtsplanung –, dann müsste UPK dort enthalten sein oder integriert werden, aber auch spezifisch ausgewiesen werden können.

Zwar ist der Handlungsbezug im Titel des Modells professioneller Handlungskompetenz von Lehrkräften angelegt, im Begriff der UPK ist das Tun, das Diagnostizieren, Beurteilen und Entscheiden usw. jedoch viel konkreter als es allein der sich auf das Handeln von Lehrer*innen beziehende Titel des Modells von Baumert und Kunter (2006) beschreibt. Das Treffen von Entscheidungen, das Vorabdiagnostizieren manifestiert sich – den hier betrachteten Studien zufolge – vergleichsweise konkret in der UPK. Je konkreter der Anforderungsbereich einer Unterrichtsplanung gefasst wird, desto allgemeiner bleibt die Vorstellung im generischen Modell professioneller Handlungskompetenz dahinter zurück. Es scheint daher eine bedeutsame Aufgabe weiterer Forschung zur UPK zu sein, herauszuarbeiten, was die konkreten Anforderungen sind und welche Teilaspekte der Kompetenzfacetten dazu passen und vonnöten sind (z. B. konkretes Wissen). Dies stellt sich analog für die affektiv-motivationalen Variablen professioneller Handlungskompetenz. Trotz der hier angesprochenen Grenzen besteht letztlich aber kein Zweifel, dass das Modell von Baumert und Kunter (2006) als paradigmatische Rahmung zur Emergenz der hier betrachteten Forschung zur UPK maßgeblich beiträgt.

Die Facetten situationsspezifischer kognitiver Fähigkeiten (wahrnehmen, interpretieren, entscheiden) im Modell Kompetenz als Kontinuum von Blömeke et al. (2015) bieten möglicherweise einen erweiterten Raum, in dem UPK als situationsspezifische Fähigkeit verankert werden kann (vgl. König et al. 2020a). Eine solche Verortung bedarf aber weiterer Entwicklungen, da auch in diesem Modell keine professionsspezifischen Aufgaben wie Unterrichtsplanung ausgewiesen werden – im Gegenteil: das Modell Kompetenz als Kontinuum ist generisch in dem Sinne, als dass es auch auf andere Berufe als den Lehrberuf bezogen wird. So gilt eine direkte Adaption des Modells von Blömeke et al. (2015) noch als zu allgemein. Es werden zwar die Komponenten berücksichtigt, die beispielsweise in der Forschung zum Noticing bzw. zur professionellen Wahrnehmung üblich sind (vgl. das Review von König et al. 2022a), aber es bedarf genauerer Definitionen, um welches Wissen, um welche affektiv-motivationale Merkmale es sich konkret handelt. Aus diesem Grund macht beispielsweise das CODE-PLAN Modell ein Angebot zur gegenstandsbezogenen Differenzierung kognitiver Anforderungen, die die Wahrnehmung und Interpretation wie auch die Entscheidungsfindung in Planungssituationen beschreibbar machen (König et al. 2021).

Ein ausgewiesenes Desiderat gilt es zuletzt in Bezug auf die affektiv-motivationalen Variablen zu benennen, sind diese doch im Zusammenhang mit UPK bislang unsystematisch untersucht worden. An Stelle einer Erfassung allgemeiner Selbstwirksamkeitserwartungen oder vereinzelter Persönlichkeitsdimensionen könnte beispielsweise der Umgang mit Unsicherheit oder die Ungewissheitstoleranz gerade für UPK vor dem Hintergrund des Strebens nach Planungssicherheit angesichts fehlender Unterrichtserfahrungen angehender Lehrkräfte in der Lehrer*innenbildung relevant sein. Ebenso wären motivationale Dispositionen zu spezifizieren, die dem Wunsch nach Handlungssicherheit, aber auch nach Handlungsentlastung während des unterrichtlichen Interaktionsgeschehens entsprechen. Hier setzt sich die Diskussion zum Professionswissen fort, denn nur spezifische affektiv-motivationale Aspekte, die für UPK relevant sind, dürften den Forschungsprozess auf Dauer weiter voranbringen.