Die Frage, was die Qualität von Unterricht ausmacht, beschäftigt die empirische Unterrichtsforschung seit Jahrzehnten (für eine Übersicht siehe Helmke 2017). Dabei wurden in den letzten Jahren in unterschiedlichen Forschungsgruppen verschiedene Konzeptualisierungen zur Beschreibung von Unterrichtsqualität entwickelt, die seitdem parallel eingesetzt werden. Diese unterscheiden sich darin, welche Dimensionen von Unterrichtsqualität einbezogen werden, wie diese strukturiert und benannt sind und danach, ob sie ausschließlich generisch, d. h. fachübergreifend, ausgelegte Dimensionen in den Blick nehmen (z. B. drei Basisdimensionen, vgl. Klieme et al. 2001) oder auch fachspezifische Dimensionen von Unterrichtsqualität (z. B. für die Mathematik, vgl. Learning Mathematics for Teaching Project 2011). Eine aktuelle Synthese solcher Konzeptualisierungen für den Mathematikunterricht (Praetorius und Charalambous 2018) deutet darauf hin, dass Unterrichtsqualität mittels der im deutschsprachigen Raum populären, generisch ausgerichteten drei Basisdimensionen nicht umfassend beschrieben werden kann (Klassenführung, konstruktive Unterstützung, kognitive Aktivierung; siehe Beitrag 1, Praetorius, Rogh und Kleickmann, in diesem Thementeil), sondern mathematikdidaktischer Ergänzungen bedarf. Allerdings bezieht sich diese Feststellung lediglich auf das Fach Mathematik. Die Fokussierung auf den Mathematikunterricht trifft auch auf einen Großteil der bisherigen Studien in der generisch ausgerichteten empirischen Unterrichtsforschung zu. Die Diskurse um Unterrichtsqualität in anderen Fachdidaktiken werden vielfach unverbunden dazu geführt. Die im Thementeil für die kontrastierend ausgewählten Fachdidaktiken der naturwissenschaftlichen FächerFootnote 1, Sport und Geschichte aufgearbeiteten Forschungsstände veranschaulichen die Notwendigkeit, den Blick über den Mathematikunterricht hinaus zu weiten (siehe Beiträge 2–4 in diesem Thementeil: Heinitz & Nehring; Herrmann & Gerlach; Zülsdorf-Kersting). Die Auswahl der Fächer erfolgte dabei so, dass durch die Zugehörigkeit zu unterschiedlichen Bereichen – Naturwissenschaften (mit besonderem Fokus auf Chemie), Gesellschaftswissenschaften (Geschichte) und dem musisch-ästhetischen Bereich (Sport) – eine möglichst große Bandbreite unterschiedlicher Fächer abgedeckt werden konnte.

Im vorliegenden Beitrag werden die zentralen Ergebnisse der Einzelbeiträge des Thementeils vergleichend diskutiert. Das methodische Vorgehen in den Einzelbeiträgen wie auch die herangezogenen Forschungsarbeiten wurden in den Einzelbeiträgen umfassend dargestellt und werden an dieser Stelle nur wiederholt, wenn es das Textverständnis erfordert. Wir gehen zunächst auf die Relevanz eines Vergleichs zwischen verschiedenen Fächern sowie der allgemeinen empirischen Unterrichtsforschung ein und leiten daraus die Fragestellungen des Beitrags ab (Abschn. 1). Danach werden der gewählte methodische Ansatz (Abschn. 2) sowie die Ergebnisse des Vergleichs der fachdidaktischen Diskurse zu Unterrichtsqualität dargestellt (Abschn. 3) und diskutiert (Abschn. 4).

1 Relevanz und Fragestellungen

In der empirischen Unterrichtsforschung wurden in den letzten Jahrzehnten insbesondere generische Dimensionen von Unterrichtsqualität mit dem Ziel der Identifikation allgemeingültiger Aspekte von Unterrichtsqualität fokussiert (Helmke 2017; Kunter und Trautwein 2013). Unterrichtsqualität wird dabei im Sinne des Educational Effectiveness Paradigmas vornehmlich über die Effektivität von Unterricht bestimmt (z. B. Muijs et al. 2014; Seidel und Shavelson 2007). Unterricht ist demzufolge dann als qualitätsvoll zu bezeichnen, wenn er erwünschte Entwicklungen bei Schülerinnen und Schülern (z. B. Leistungszuwachs) wahrscheinlich macht. Die konkreten empirischen Untersuchungen fokussierten dabei generische Merkmale von Unterrichtsqualität, fanden aber vorrangig im Mathematikunterricht sowie in naturwissenschaftlichen Fächern statt (siehe z. B. Kunter und Ewald 2016; Praetorius et al. 2018).

In den Folgejahren wurde insbesondere von Mathematikdidaktikerinnen und -didaktikern, aber auch von anderen Fachdidaktikerinnen und -didaktikern, vermehrt darauf hingewiesen, dass zentrale Aspekte von Unterrichtsqualität mit den bislang vorrangig generisch ausgerichteten Dimensionen nicht hinreichend erfasst werden. Die Notwendigkeit einer Anpassung und Ergänzung um fachspezifische Unterrichtsaspekte wird u. a. damit begründet, dass insbesondere diese fachlichen Aspekte von Unterricht lernwirksam sind (Seidel und Shavelson 2007). In der Folge wurden neben generisch ausgerichteten Instrumenten zur Erfassung von Unterrichtsqualität stärker fachspezifische Instrumente entwickelt. Einige dieser Instrumente umfassen dabei ausschließlich bedeutsame Dimensionen von Unterrichtsqualität aus mathematikdidaktischer Sicht (z. B. MQI, vgl. Charalambous und Litke 2018), weitere hybride Instrumente kombinieren generische und mathematikspezifische Dimensionen (z. B. TRU, vgl. Schoenfeld 2018). Forschungsgruppen unterscheiden sich danach, welches der Instrumente sie einsetzen. Sie treffen damit auch eine Auswahl hinsichtlich der fokussierten Dimensionen von Unterrichtsqualität sowie eine Wahl hinsichtlich deren Strukturierung und Benennung. Praetorius und Charalambous (2018) haben eine umfassende konzeptuelle Integration generischer und fachspezifischer Aspekte des Mathematikunterrichts aus zwölf im deutschsprachigen Raum sowie international eingesetzten Instrumenten vorgelegt (generische Frameworks: CLASS, DMEE, ISTOF, 3 Basisdimensionen; mathematikspezifische Frameworks: IQA, MQI, M‑Scan; hybride generisch-mathematikspezifische Frameworks: TRU, UTOP, TEDS-Unterricht, MECORS & QoT). In der Folge eines induktiven, konsensuellen Vorgehens zur Identifikation gemeinsamer und spezifischer Dimensionen, Subdimensionen sowie beobachtbarer Indikatoren konnte ein Framework zusammengestellt werden (siehe Spalte 1 in Tab. 1; siehe auch Praetorius et al. in diesem Thementeil). Das im Folgenden als Syntheseframework bezeichnete Framework fasst generische und fachspezifische Aspekte von Unterrichtsqualität mit dem Ziel einer umfassenden Erfassung zusammen.

Tab. 1 Verortung der fachdidaktischen (Sub‑)Dimensionen von Unterrichtsqualität im Syntheseframework

Vier der sieben identifizierten Dimensionen, ihre jeweiligen Subdimensionen sowie die diesen zugeordneten Indikatoren fokussieren auf eine prototypische Lehr-Lernsequenz: (1) Eine angemessene Auswahl und Thematisierung von Inhalten und FachmethodenFootnote 2 ermöglicht die Auseinandersetzung mit relevanten Lerngegenständen; (2) die kognitive Aktivierung ist ausgerichtet auf die Unterstützung tiefenverarbeitender Lernprozesse; (3) die Unterstützung des Übens fokussiert auf die Konsolidierung des Gelernten und (4) formatives Assessment wird durchgeführt, um Informationen zur Optimierung von Lernprozessen zu erhalten. Die drei weiteren Dimensionen bilden die Grundlage für die Lehr-Lernsequenz: (5) Unterstützung des Lernens aller Schülerinnen und Schüler (z. B. Differenzierung und Adaptivität) sowie (6) sozio-emotionale Unterstützung sind für alle Schritte des Lernprozesses relevant, und (7) Klassenführung wird als grundlegende Voraussetzung angesehen, um Lernprozesse zu ermöglichen. Die vier Dimensionen, die sich an einzelne Schritte der Lehr-Lernsequenz anlehnen, umfassen dem Syntheseframework entsprechend sowohl generische als auch fachspezifische Aspekte, wobei insbesondere bei der Dimension Auswahl und Thematisierung von Inhalten und Fachmethoden eine stärkere Gewichtung fachspezifischer Aspekte erfolgte. Die drei weiteren, für alle Schritte im Lernprozess relevanten Dimensionen umfassen nahezu ausschließlich (Klassenführung und sozio-emotionale Unterstützung) oder mehrheitlich (Unterstützung des Lernens aller Schüler*innen) generische Aspekte.

Aufgrund des mathematikdidaktischen Fokus bleibt jedoch weitgehend offen, ob dieses Syntheseframework, das generische und mathematikdidaktische Dimensionen kombiniert, auch für andere Fächer Gültigkeit hat. Um diesem Desiderat zu begegnen, werden im vorliegenden Beitrag drei Fragestellungen bearbeitet:

  1. 1.

    Welche Überschneidungen existieren zwischen dem Syntheseframework und den fachspezifischen Merkmalskatalogen zu Unterrichtsqualität in den naturwissenschaftlichen Fächern sowie in den Fächern Sport und Geschichte?

  2. 2.

    Welche im Syntheseframework als relevant erachteten (Sub‑)Dimensionen von Unterrichtsqualität werden in den fachdidaktischen Diskursen der naturwissenschaftlichen Fächer sowie der Fächer Sport und Geschichte nicht berücksichtigt?

  3. 3.

    Welche fachspezifischen Anpassungen und Ergänzungen des Syntheseframeworks sind nötig, um die fachspezifischen (Sub‑)Dimensionen und Indikatoren von Unterrichtsqualität in den naturwissenschaftlichen Fächern sowie in den Fächern Sport und Geschichte abbilden zu können?

2 Methode

Die Bearbeitung der Fragestellungen erfolgte im gesamten interdisziplinären Team, so dass eine diskursive Aushandlung einerseits zwischen Vertreterinnen und Vertretern der einzelnen Fachdidaktiken sowie andererseits zwischen denjenigen der Fachdidaktiken und der allgemeinen empirischen Unterrichtsforschung ermöglicht wurde (insgesamt 6 Personen, davon 1–2 Vertreter*innen pro Fach bzw. Ausrichtung; zu den damit verbundenen Limitationen der Arbeit siehe Abschn. 4.4). Grundlage der vorliegenden Analyse bildete das im vorherigen Abschnitt beschriebene Syntheseframework (für eine ausführliche Herleitung und Darstellung siehe Praetorius et al. in diesem Thementeil). Es bietet den Vorteil, dass neben generischen auch fachspezifische (Sub‑)Dimensionen enthalten sind (z. B. Akkuratheit der vermittelten Inhalte) und damit einige der notwendigen fachspezifischen Anpassungen und Ergänzungen bereits abgedeckt werden können.

Die Diskussionen im interdisziplinären Team orientierten sich an den Darstellungen in den Einzelbeiträgen dieses Heftes aus den verschiedenen Disziplinen. In diesen Beiträgen wurden die im Syntheseframework abgebildeten (Sub‑)Dimensionen und Indikatoren mit den erarbeiteten Forschungsständen zu Unterrichtsqualität in den naturwissenschaftlichen Fächern sowie den Fächern Sport und Geschichte verglichen.Footnote 3 Als Forschungsstand wurden dabei diejenigen Aspekte von Unterrichtsqualität einbezogen, die in dem jeweiligen Fach theoretisch als zentrale Aspekte angenommen werden und/oder empirisch untersucht wurden (Letzteres in Tab. 1 mit (E) gekennzeichnet). Die betreffenden empirischen Untersuchungen umfassen qualitative Befragungen, korrelative und varianzanalytische querschnittliche Untersuchungen, (videobasierte) Beobachtungsstudien, Interventionsstudien sowie längsschnittliche Untersuchungen.

Um den aktuellen Forschungsstand möglichst umfassend abzudecken, wurde für jedes Fach in Anlehnung an das PRISMA-Statement (preferred reporting items for systematic reviews and meta-analyses; Ziegler et al. 2011) eine systematische Literaturrecherche von Forschungsarbeiten im deutschsprachigen Raum durchgeführt. Forschungsarbeiten außerhalb des deutschsprachigen Raums wurden aufgrund der teils stark unterschiedlichen fachdidaktischen Konzeptionen in den verschiedenen Ländern und Sprachräumen nicht berücksichtigt (siehe auch Beiträge 2–4 in diesem Themenheft). Die gewählten Datenbanken und Suchbegriffe unterschieden sich je nach Fach/Fächergruppe. Dies liegt erstens an den unterschiedlichen Begrifflichkeiten, die in den jeweiligen fachspezifischen Diskursen Verwendung finden und somit zur Identifikation der relevanten Literatur als geeignet erschienen, zweitens an unterschiedlichen Verschlagwortungen der verwendeten Datenbanken und drittens an der Orientierung des Reviews für die Naturwissenschaften an einem bereits existierenden, international ausgerichteten Review.

Für das Fach Sport wurde neben der erziehungswissenschaftlich ausgerichteten Datenbank peDOCS die sportwissenschaftliche Datenbank bisp-surf.de verwendet. Die verwendeten Suchbegriffe lauteten „Unterrichtsqual*“, „Unterricht“ UND „qualität“, „gut*“ UND „Unterricht“, „Sportunterricht“ UND „Klassenführung“, „Aktivierung“, „Klima“ sowie in peDOCS zusätzlich „Sport“. Nach dem Screening verblieben 42 relevante theoretisch-konzeptionelle sowie empirische Literaturquellen für die Analysen (vgl. Herrmann & Gerlach in diesem Thementeil). Für das Fach Geschichte wurde neben peDOCS die geschichtsdidaktische Datenbank Index Didacticorum verwendet. Suchbegriffe bei peDOCS lauteten „Unterrichtsqualität“ UND „Geschichtsunterricht“ UND „gut“ sowie „history“ UND „quality“, Suchbegriffe für die geschichtsdidaktische Datenbank waren „Forschung“ UND „Unterrichtsforschung“ UND „Unterrichtsangebot“ UND „Prozessqualität“ sowie „Forschung“ UND „Unterrichtsforschung“ UND „Wirkungen“. Nach dem Screening wurden 23 theoriebezogene sowie empirische Publikationen in die Analysen einbezogen (vgl. Zülsdorf-Kersting in diesem Thementeil). Für die Naturwissenschaften wurde aufgrund der hohen Anzahl an Studien im Bereich Unterrichtsqualität eine Fokussierung auf quantitative Videostudien vorgenommen. Neben den einbezogenen Studien eines bereits existierenden Reviews von Dorfner et al. (2017) wurden aktuelle Arbeiten zwischen 2016–2019 ergänzt. Dazu wurden die Datenbanken (peDOCS, ERIC, PsychINFO, Taylor & Francis Online, Wiley Online Library, Springer Link) und Suchbegriffe (z. B. für PeDOCS: Videostudie, Videoanalyse, Unterrichtsbeobachtung) des Reviews von Dorfner et al. (2017) verwendet. Inklusive der bei Dorfner et al. (2017) einbezogenen Publikationen wurden 95 empirische Publikationen analysiert (vgl. Heinitz & Nehring in diesem Thementeil).

Auf Basis der recherchierten Forschungsarbeiten wurden zentrale (Sub‑)Dimensionen in den drei Fachdidaktiken herausgearbeitet. In den Fächern Sport und Geschichte wurde hierfür der Ansatz des narrativen Reviews gewählt, in den Naturwissenschaften wurde aufgrund der hohen Anzahl einbezogener Publikationen eine tabellarische Liste aller genannten Qualitätsaspekte erstellt.

Darauf aufbauend erfolgte in den Einzelbeiträgen ein Abgleich der identifizierten Dimensionen, Subdimensionen und Indikatoren von Unterrichtsqualität mit dem Syntheseframework. Dabei wurde überprüft (siehe Abschn. 3.1), inwiefern in den untersuchten Fächern bzw. Fächergruppen Überschneidungen zwischen dem Framework und den fachspezifischen Beschreibungen von Unterrichtsqualität identifiziert werden können (Fragestellung 1) und welche (Sub‑)Dimensionen in den drei Fachdidaktiken nicht thematisiert wurden (Fragestellung 2). Aufgrund der in den Fächern Sport und Geschichte überschaubaren Publikationslage wurde von den Autoren ein interpretierender Abgleich des Faches mit dem Syntheseframework vorgenommen. Um die große Anzahl an entsprechenden Publikationen in den Naturwissenschaften handhabbar zu machen, wurde die Übereinstimmung zwischen fachdidaktischen Aspekten und Syntheseframework dort mittels einer dreistufigen Skala überprüft („vollständige Übereinstimmung“, „teilweise Übereinstimmung“ und „starke Abweichung“). Für den vorliegenden Beitrag wurden die obigen Zuordnungen der fachdidaktischen Aspekte zum Syntheseframework anschließend im Gesamtteam des vorliegenden Beitrags diskutiert und entsprechende Revisionen vorgenommen, um ein geteiltes Verständnis der (Sub‑)Dimensionen – und somit eine Vergleichbarkeit der jeweiligen fachspezifischen Einordnungen – sicherzustellen. Abschließend erfolgte eine Auseinandersetzung mit der Frage, welche fachspezifischen Anpassungen und Ergänzungen des Syntheseframeworks notwendig sind, um die jeweiligen fachspezifischen Besonderheiten abbilden zu können (Fragestellung 3; siehe Abschn. 3.2). Die Unterscheidung, ob es sich um eine notwendige fachspezifische Ergänzung oder aber lediglich um eine fachspezifische Anpassung handelt, wurde aufgrund der Konzeption der (Sub‑)Dimensionen des Syntheseframeworks getroffen (siehe Praetorius und Charalambous 2018; siehe auch Praetorius et al. in diesem Thementeil). Dissense wurden im Gesamtteam diskutiert und in konsensuale Einschätzungen überführt.

3 Ergebnisse

3.1 Abgedeckte (Sub‑)Dimensionen des Syntheseframeworks in den fachspezifischen Diskursen

Für die erste Fragestellung – Überschneidungen des Syntheseframeworks mit fachspezifischen Ansätzen – und die zweite Fragestellung – im Syntheseframework fehlende fachdidaktische Aspekte – zeigte sich folgendes Bild für die einzelnen Fächer/Fächergruppen:

Für die naturwissenschaftlichen Fächer ließ sich eine sehr hohe Passung des fachspezifischen Diskurses zum Syntheseframework feststellen. Alle sieben Dimensionen des Syntheseframeworks konnten in den fachspezifischen Publikationen identifiziert werden (siehe Tab. 1). Dies galt größtenteils auch für die Subdimensionen: Lediglich zwei der im Syntheseframework enthaltenen 21 Subdimensionen fanden sich in naturwissenschaftsdidaktischen Publikationen nicht explizit (konstruktiver Umgang mit Fehlern und Schwierigkeiten von Schüler*innen beim Üben sowie Beziehung der Schüler*innen untereinander).Footnote 4

Obwohl das Fach Sport mit seinen Zielen, Inhalten und Methoden deutliche Unterschiede zum Fach Mathematik aufweist, fand sich eine vergleichsweise hohe Passung zum Syntheseframework: Fünfzehn der 21 Subdimensionen des Syntheseframeworks wurden auch in der Unterrichtsforschung des Faches Sport explizit diskutiert (siehe Tab. 1). Die Subdimensionen der Dimensionen Klassenführung und sozio-emotionale Unterstützung wurden dabei vollständig abgedeckt. Bei den Dimensionen Auswahl und Thematisierung von Inhalten und Fachmethoden (2 von 4 Subdimensionen), kognitive Aktivierung (in der Konzeptualisierung als motorisch-kognitive Aktivierung mit 3 von 4 Subdimensionen) und formatives Assessment (1 von 4 Subdimensionen) wurden lediglich Teilaspekte im Fach Sport berücksichtigt.

Der fachspezifische Forschungsstand im Fach Geschichte wies im Hinblick auf drei der sieben Dimensionen (Auswahl und Thematisierung von Inhalten und Fachmethoden, kognitive Aktivierung und Unterstützung des Übens) eine Entsprechung zum Syntheseframework auf (siehe Tab. 1). In Bezug auf diese Dimensionen fand sich auch für die Subdimensionen eine hohe Überschneidung mit dem Syntheseframework (Auswahl und Thematisierung von Inhalten und Fachmethoden: 3 von 4 Subdimensionen; kognitive Aktivierung: 4 von 4 Subdimensionen; Unterstützung des Übens: 1 von 2 Subdimensionen). Die Dimensionen Klassenführung, sozio-emotionale Unterstützung, Unterstützung des Lernens aller Schülerinnen und Schüler und formatives Assessment wurden allerdings bislang im fachspezifischen Diskurs nicht oder so gut wie nicht berücksichtigt.

Zusammenfassend lässt sich feststellen, dass eine große Überschneidung der fachspezifischen Forschungsstände zu Unterrichtsqualität mit den Dimensionen sowie Subdimensionen des Syntheseframeworks vorliegt (Fragestellung 1). Zudem wurde sichtbar, welche Dimensionen und Subdimensionen in den einzelnen Fächern bislang keine Rolle spielen (Fragestellung 2): Am deutlichsten ist dies für das Fach Geschichte zu erkennen, in dem einige Dimensionen des Syntheseframeworks in der bisherigen Literatur nicht aufgegriffen wurden. Im Fach Sport wurden insbesondere solche Dimensionen des Syntheseframeworks nur in Teilen thematisiert, die sich auf einzelne Schritte der prototypischen Lehr-Lernsequenz beziehen (Auswahl und Thematisierung von Inhalten und Fachmethoden, kognitive Aktivierung und formatives Assessment). In den naturwissenschaftlichen Fächern hingegen existieren nur vereinzelt Aspekte, die bislang im fachspezifischen Diskurs nicht explizit aufgegriffen wurden (in den Dimensionen Unterstützung des Übens und sozio-emotionale Unterstützung).

3.2 Notwendige fachspezifische Anpassungen und Ergänzungen des Syntheseframeworks

Auch wenn viele der unterschiedenen Dimensionen und Subdimensionen des Syntheseframeworks mit den Fachdiskursen übereinstimmen, bedeutet dies im Umkehrschluss nicht, dass mit diesen die Fachspezifität von Unterrichtsqualität vollständig abgebildet werden kann (Fragestellung 3). Dies wird aus den fachspezifischen Ergänzungen deutlich (siehe Tab. 1). Zwar wurde durch die Aufarbeitung des jeweiligen Forschungsstandes in den Fächern keine Ergänzung einer weiteren Dimension als notwendig erachtet, wohl aber einige Ergänzungen auf Ebene der Subdimensionen. Auf Basis des aktuellen Forschungsstandes wurden für drei der Dimensionen in jeweils einem der Fächer/Fächergruppen Ergänzungen als bedeutsam gesehen (Naturwissenschaften: Auswahl und Thematisierung von Inhalten und Fachmethoden, sozio-emotionale Unterstützung; Geschichte: Unterstützung des Lernens aller Schüler*innen). Für die Dimensionen Klassenführung (Naturwissenschaften; Sport) und kognitive Aktivierung (Naturwissenschaften; Sport) wurden zusätzliche Subdimensionen von zwei Fächern/Fächergruppen ergänzt.

Im Falle der naturwissenschaftlichen Fächer handelte es sich bei den Ergänzungen erstens um fachspezifische Formen der sozio-emotionalen Unterstützung bezüglich der Auseinandersetzung mit Inhalten: Eine besondere Rolle in diesen Fächern spielen die Antizipation von Angst, Respekt oder Ekel beim Umgang mit Lebewesen oder Gefahrstoffen. Des Weiteren kommt im Hinblick auf die Dimension Klassenführung aufgrund der Spezifik experimenteller Tätigkeiten der Gewährleistung der Sicherheit sowie dem Raum- und Materialmanagement hohe Bedeutung zu, da zum einen das Gefährdungspotential bei der Verwendung von Geräten und Chemikalien beachtet werden muss, aber auch die Besonderheiten des Fachraumes speziell in Experimentierphasen, sowohl mit Blick auf die Sicherheit als auch auf die vorhandene Ausstattung. Besondere Aufmerksamkeit im Bereich der kognitiven Aktivierung wurde in den konsultierten Studien auf kooperatives Arbeiten zur zielführenden Aktivierung der Schüler*innen gelegt, das in praktischen Arbeitsphasen, aber auch in der weiterführenden Diskussion der Lerninhalte eine wichtige Rolle einnimmt – wenngleich diese Ergänzung aus Perspektive der allgemeinen Unterrichtsforschung sowie der anderen Fächer nicht spezifisch für die naturwissenschaftlichen Fächer erscheint. Angesichts der Besonderheiten naturwissenschaftlicher Curricula, die hierarchisch und aufeinander aufbauend konstruiert sein können („Spiralcurricula“), ist bei der Dimension Auswahl und Thematisierung von Inhalten und Fachmethoden auf eine adäquate didaktische Reduktion unter Berücksichtigung zukünftiger fachlicher Lernschritte zu achten: Fachinhalte sollten für den Lernstand der Schülerinnen und Schüler angemessen sein, jedoch keine inhaltliche Reduktion erfordern, die später zu Konflikten im weiteren Aufbau von fachlichen Vorstellungen führt und ein Umlernen nach sich zieht („Prinzip der Ausbaufähigkeit“, Risch und Peifer 2018).

Ein Unterrichtsziel des Faches Sport ist es, den Schülerinnen und Schülern zu vermitteln, unter welchen Motiven und Sinnperspektiven sie Bewegung und Sport betreiben können (u. a. Sport treiben, um gesund zu bleiben; um etwas zu leisten; um Gemeinschaft zu erleben; Neumann und Balz 2013). Die Pädagogischen Perspektiven des Sportunterrichts zu berücksichtigen und die Schülerinnen und Schüler zur kognitiven Verarbeitung von Bewegungshandlungen anzuregen, sind zentrale Aspekte der kognitiven Aktivierung im Sportunterricht. Weiterhin schließen Lehr- und Lernprozesse im Fach Sport unmittelbar an Bewegungshandlungen an. Damit läuft die kognitive Auseinandersetzung mit dem Lerngegenstand in einem ständigen Wechsel von kognitiver und motorischer Aktivität ab (Niederkofler und Amesberger 2016). Entsprechend erscheint aus sportdidaktischer Sicht auch die motorische Aktivierung eine bedeutsame Ergänzung der kognitiven Aktivierung zu sein. Für die Dimension Klassenführung stellt sich für das Fach Sport die Besonderheit, dass eine hohe Verletzungsgefahr besteht und die Gewährleistung der Sicherheit oberste Priorität hat. Dabei ergeben sich besondere Anforderungen an das Material- und Raummanagement. Neben der Vielzahl an Sportgeräten und -materialien müssen auch die Position und die Bewegungen der Schülerinnen und Schüler permanent organisiert werden, weil der Sportplatz keine feste Raumordnung (bspw. Sitzreihen) aufweist und sich die Schülerinnen und Schüler im Raum frei bewegen.

Aus Sicht der geschichtsdidaktischen Unterrichtsforschung müsste das Syntheseframework stärker die Qualität der unterrichtlichen Kommunikation in den Blick nehmen. Unterrichtstheoretisch wird in der Geschichtsdidaktik hervorgehoben, dass die im Unterricht angestrebte Elaboration historischer Kompetenzen durch die Kommunikation der beteiligten Akteure geschehen muss (Bracke et al. 2018). Kultivierte Unterrichtsdiskurse sind entsprechend eine wichtige Voraussetzung für erfolgreiche Lernprozesse im Geschichtsunterricht. Empirisch scheint sich diese Einsicht zu bestätigen (vgl. Cohors-Fresenborg et al. 2014; Nowińska 2016). Eine Ergänzung ist erforderlich, da weder die drei Basisdimensionen von Unterrichtsqualität (Klieme et al. 2001) noch das Syntheseframework eine entsprechende (Sub‑)Dimension der Diskursqualität explizit berücksichtigt haben.

Nicht aus Tab. 1 ersichtlich, aber den Einzelbeiträgen zu entnehmen, ist eine weitere Ebene der Fachspezifität, die sich in den Analysen als besonders bedeutsam herausgestellt hat: die Ebene der konkreten Indikatoren der Subdimensionen, also derjenigen Verhaltensaspekte, die in konkreten Unterrichtssituationen beobachtbar sind und eine höhere oder niedrigere Qualität indizieren. Dies soll exemplarisch für jedes Fach/jede Fächergruppe in Bezug auf die Dimension kognitive Aktivierung erläutert werden.

Für die naturwissenschaftlichen Fächer stellt die Einbindung von Schülervorstellungen in den Unterricht ein zentrales Thema im Rahmen der kognitiven Aktivierung dar. Der Gegenstand naturwissenschaftlicher Untersuchungen, z. B. im Chemieunterricht, erstreckt sich von einer unmittelbar sichtbaren makroskopischen Ebene bis hin zu einer submikroskopischen Ebene, mit einer zusätzlichen Nutzung der Symbolebene, um den Untersuchungsgegenstand näher zu beschreiben. Wie in naturwissenschaftsdidaktischen Forschungen wiederkehrend gezeigt, beginnen Schülerinnen und Schüler naturwissenschaftliches Lernen mit bestehenden anschlussfähigen Vorstellungen oder aber fachlich nicht tragfähigen Vorstellungen über Naturphänomene, die den Ausgangspunkt für Lernprozesse darstellen. Qualitätsvoller naturwissenschaftlicher Unterricht aktiviert, integriert und/oder entwickelt diese bestehenden Vorstellungen, um eine anschlussfähige Entwicklung hin zu fachlich adäquaten Vorstellungen zu ermöglichen. Indikatoren für kognitive Aktivierung im naturwissenschaftlichen Unterricht fokussieren deshalb häufig auf die Möglichkeit, dass Schülerinnen und Schüler eigene Ideen und Vorstellungen äußern und die Lehrpersonen diese aufgreifen und konstruktiv einbinden.

Im Fach Sport schließt kognitive Aktivierung unmittelbar an Bewegungshandlungen an. Zur Steuerung dieser Bewegungshandlungen werden neben Wissensrepräsentationen auch motorische Repräsentationen benötigt. Motorische Repräsentationen beinhalten implizite kognitive Aspekte der Bewegungsausführung und sind im Gegensatz zu den expliziten Wissensrepräsentationen nur schwer verbalisierbar. Indikatoren kognitiver Aktivierung im Sportunterricht beinhalten daher neben der Anregung kognitiver Aktivität auch Maßnahmen der Lehrperson, um motorische Performanzen, d. h. das konkrete Bewegungshandeln im Sport, anzuregen. Längsschnittliche Befunde zu den Wirkungen einer solchen kognitiv-motorischen Aktivierung stehen bislang jedoch aus.

Für das Fach Geschichte wären für die Dimension der kognitiven Aktivierung die zentralen Operationen historischen Denkens zu nennen. Im Fach Geschichte sind auf der Ebene der Indikatoren zur Identifikation einzelner für die Dimension der kognitiven Aktivierung relevanter tiefenverarbeitender Lernprozesse Spezifikationen erforderlich, die hier nur exemplarisch angeführt werden können. Historische Sachverhaltsanalysen rekonstruieren beispielsweise einen vergangenen Sachverhalt auf der Basis einer prinzipiell lückenhaften und in sich disparaten Quellenlage. Historische Sachurteilsbildungen dagegen konstruieren kausale Beziehungen zwischen historischen Sachverhalten, wobei im Kern immer theoretische oder theorieförmige Annahmen stehen müssen. Entsprechend dem aktuellen Verständnis von adäquater Vermittlung in der Geschichtsdidaktik wird davon ausgegangen, dass diese Denkleistungen zudem in einem narrativen und moderat konstruktivistischen Rahmen angebahnt werden sollten – wenngleich sich die empirische Befundlage zu positiven Auswirkungen auf historische Denkleistungen noch ausbaufähig darstellt. Mit narrativ ist gemeint, dass historische Denkleistungen in erzählerischer Form prinzipiell auf gegenwärtige Orientierungsbedürfnisse ausgerichtet sein sollen; mit moderat konstruktivistisch ist ein epistemologischer Vorbehalt gemeint, mit dem zwischen Aussagen über historische Sachverhalte und den Sachverhalten selbst zu unterscheiden ist. Von kognitiver Aktivierung wäre also zu sprechen, wenn historische Denkleistungen in diesem Sinne angebahnt würden.

4 Diskussion

Das Anliegen des vorliegenden Beitrags bestand darin, fachspezifische und generische (Sub‑)Dimensionen von Unterrichtsqualität einer vergleichenden Analyse zu unterziehen. Dieser Vergleich zeigte zunächst, dass sich auf einer allgemein formulierten Ebene große Überschneidungen in den Diskursen zur Unterrichtsqualität zwischen der generisch ausgerichteten sowie mathematikdidaktischen Unterrichtsforschung und denjenigen der hier berücksichtigten Fachdidaktiken feststellen lassen. Dies deutet darauf hin, dass es über Fächergrenzen hinweg eine bemerkenswerte Schnittmenge zentraler Dimensionen und Subdimensionen von Unterrichtsqualität zu geben scheint. Auf Ebene der übergreifenden Dimensionen scheint Unterrichtsqualität somit zumindest über die Fächer Mathematik, Naturwissenschaften, Sport und Geschichte generisch beschrieben werden zu können.

Zugleich zeigt die vergleichende Analyse jedoch, dass der bisherige Fokus auf den Mathematikunterricht in der allgemeinen empirischen Unterrichtsforschung dazu geführt hat, dass einerseits Anpassungen der existierenden Dimensionen, Subdimensionen sowie Indikatoren notwendig sind und andererseits Ergänzungen weiterer Subdimensionen und Indikatoren, die in den betreffenden Fächern als relevant angesehen werden, in Erwägung gezogen werden sollten. Solche Ergänzungen – wie beispielsweise die Diskursqualität – wiederum könnten auch stimulierend für andere Fächer wirken, wie sich an den obigen Erläuterungen erkennen lässt.

4.1 Fachspezifische Anpassungen und Ergänzungen

Wenngleich ein Großteil der Dimensionen und Subdimensionen in allen untersuchten Fächern wiederzufinden war, wird in den Einzelbeiträgen deutlich, dass fachspezifische Anpassungen der (Sub‑)Dimensionen sowie der zugehörigen Indikatoren notwendig sind. Diese erscheinen insbesondere auf Ebene der Indikatoren notwendig, da dort der direkte Bezug zum konkreten Gegenstand hergestellt wird. So hat beispielsweise die Dimension sozio-emotionale Unterstützung mit ihrer Subdimension Beziehung zwischen Lehrperson und Schüler*innen eine fachübergreifende Relevanz. Dagegen müssen die (operationalisierbaren) Indikatoren, welche dazu dienen, konkrete Unterrichtssituationen zu beurteilen, auf den Unterrichtsgegenstand bezogen sein. Im Fach Sport muss die Lehrperson beispielsweise dafür Sorge tragen, dass Schülerinnen und Schüler nicht gezwungen sind, sich körperlich zu exponieren (z. B. Vorturnen vor der Klasse), um Beschämung zu reduzieren und einen vertrauensvollen Umgang zwischen Lehrperson sowie Schülerinnen und Schülern herzustellen. In anderen Fächern fällt diese körperliche Exponiertheit weniger ins Gewicht und andere Indikatoren rücken stärker in den Fokus (z. B. emotionale Unterstützung bei Misserfolgserfahrungen).

Über die Ebene der Indikatoren hinaus wurden zudem für alle hier berücksichtigten Fächer jeweils fachspezifische Subdimensionen identifiziert und konzeptualisiert, die in dieser Form in der generisch ausgerichteten sowie mathematikdidaktischen Unterrichtsforschung aktuell nicht diskutiert werden. Entsprechend sollten diesbezügliche Ergänzungen in Betracht gezogen werden – wenngleich in diesem Zusammenhang eine zentrale Herausforderung darin bestehen wird, die Anzahl an Dimensionen und Subdimensionen so zu begrenzen, dass sie in empirischen Untersuchungen umsetzbar sind.

Nicht systematisch berücksichtigt haben wir in unseren bisherigen Analysen zudem, ob die identifizierte Fachspezifität darauf zurückzuführen ist, dass die jeweiligen Subdimensionen nur in einem Fach relevant sind (z. B. Fokus auf Bewegungshandlungen und deren entsprechende Begleitung im Fach Sport) oder aber die zusätzlich identifizierten Aspekte auch potenziell relevant für andere Fächer sind und bislang lediglich in diesen nicht explizit diskutiert wurden (z. B. Förderung des Unterrichtsdiskurses im Fach Geschichte). Neben den jeweils nur für ein Fach genannten Ergänzungen konnten auch fachspezifische Ergänzungen identifiziert werden, die nicht alle, aber mehrere Fächer betreffen (z. B. Gewährleistung der Sicherheit in den Naturwissenschaften sowie im Sport). Die Überschneidungen sprechen dafür, dass diese Aspekte auch in der allgemeinen Unterrichtsforschung stärker thematisiert werden sollten. Offen ist hierbei, inwiefern es sich um Subdimensionen handelt, die wie die sieben unterschiedenen Dimensionen prinzipiell für alle Fächer Relevanz haben oder ob es bestimmte Fächergruppen gibt, die sich durch bestimmte Ergänzungen charakterisieren. So spielen Sicherheitsaspekte vermutlich vor allem in jenen Fächern eine Rolle, in denen Gefahren für die Physis nicht unwahrscheinlich sind. Das in den naturwissenschaftlichen Fächern und im Fach Sport ergänzte Raum- und Materialmanagement hingegen könnte man vermutlich in einigen weiteren Fächern als zu berücksichtigenden Aspekt hinzunehmen, wenngleich es je nach Fach eine unterschiedliche Relevanz haben dürfte. Eine weitere Herausforderung liegt darin, dass die einzelnen Fächer den (Sub‑)Dimensionen in ihrer konzeptuellen Auseinandersetzung sowie in der empirischen Erforschung bislang eine unterschiedliche Bedeutsamkeit zuweisen. Die Dimension Klassenführung spielt beispielsweise im Fach Sport wegen der räumlichen Gegebenheiten sowie der potenziellen Verletzungsgefahr eine zentrale Rolle. Entsprechend existiert hierzu mittlerweile eine Reihe an fachspezifischen Publikationen. In der geschichtsdidaktischen Unterrichtsforschung hingegen spielt die Dimension Klassenführung bislang eine untergeordnete Rolle, möglicherweise weil das Fach auf eine differenzierte eigene Theoriebildung zurückblickt, die stark auf hermeneutischen Traditionen fußt.

4.2 Implikationen aus den Anpassungen und Ergänzungen

Die Implikationen der oben angesprochenen Anpassungen und Ergänzungen konnten im Rahmen der vorliegenden Synthese nur angedacht werden und müssen zukünftig weiter diskutiert werden. So ist bislang offen, inwiefern man bei z. T. sehr unterschiedlichen Indikatoren bestimmter (Sub‑)Dimensionen letztlich noch von demselben Konstrukt sprechen kann. Dies betrifft selbst Dimensionen wie diejenige der Klassenführung, von denen bislang in der allgemeinen empirischen Unterrichtsforschung davon ausgegangen wurde, dass es sich um generische Unterrichtsdimensionen handelt. Um dieser Frage weiter nachgehen zu können, müsste zukünftig diskutiert werden, wodurch sich das Ausmaß an Fachspezifität von Unterrichtsaspekten überhaupt bestimmen lässt. Dies wird in bisherigen Publikationen kaum expliziert. Martin-Raugh et al. (2016) argumentierten, dass die Frage nach der Fachspezifität weniger von der konkreten Operationalisierung abhängt, als eher davon, ob die Bedeutung des zugrundeliegenden Konstrukts über Fächer hinweg dieselbe ist. Um eine entsprechende Einschätzung zu ermöglichen, sind jedoch detaillierte und theoriebasierte Konstruktbeschreibungen notwendig, die bislang kaum vorliegen. In ihrem Übersichtsbeitrag zeigten Praetorius und Charalambous (2018), dass manche Unterrichtsdimensionen je nach Forschungstradition als generisch oder als fachspezifisch interpretiert werden (z. B. kognitive Aktivierung). Die von Praetorius und Charalambous (2018) vorgeschlagene Systematik von rein generischen, über kombiniert fachspezifisch-generische bis hin zu rein fachspezifischen (Sub‑)Dimensionen von Unterrichtsqualität lässt sich allerdings mit den vorliegenden Analysen nicht unterstützen, da selbst Dimensionen wie Klassenführung ein bedeutsames Ausmaß an Fachspezifität aufweisen. Unseren Analysen zufolge hängt die Fachspezifität vielmehr von der fokussierten Ebene ab (Dimension, Subdimension oder Indikator) und lässt sich insbesondere auf Ebene der Indikatoren ansiedeln.

Auf Dimensionsebene deutet sich an, dass die sieben im Syntheseframework unterschiedenen Dimensionen prinzipiell in allen Fächer bedeutsam sein könnten. Fraglich ist lediglich, ob die notwendigen Anpassungen und Ergänzungen auf Indikatoren- und Subdimensionsebene dazu führen, dass sich das dahinterstehende Konstrukt (z. B. Klassenführung) auf Dimensionsebene verändert. Würden die Dimensionen in den Fächern unterschiedliche Konstrukte abbilden, wäre es zumindest notwendig, das jeweilige Fach in der Benennung der Dimension zu ergänzen (z. B. Klassenführung im Sport).

Dass solche Überlegungen nicht nur spezifisch für den Gegenstand Unterricht relevant sind, zeigen Auseinandersetzungen in der interkulturellen Forschung, in der das Problem der Äquivalenz ebenfalls auf mehreren Ebenen diskutiert wird (z. B. Rippl und Seipel 2008; Bachleitner et al. 2014). Dabei werden in der Regel Konstruktäquivalenz und Messäquivalenz mit entsprechenden Unterkategorien unterschieden. So wird unter Konstruktäquivalenz verstanden, dass unter dem theoretischen Konstrukt tatsächlich in allen Kulturen (hier: Fächern) das Gleiche verstanden wird; d. h. im vorliegenden Fall verstehen alle Fächer Unterrichtsqualität als ein multidimensionales, auf die Entwicklung von Schülermerkmalen (z. B. Leistungsentwicklung) ausgerichtetes Konstrukt. Offenbar lassen sich auch alle sieben Dimensionen des Syntheseframeworks in allen Fächern konzeptualisieren. Für bestimmte Dimensionen sind zwar Anpassungen erforderlich (z. B. kognitive und motorische Aktivierung im Sport), die grundsätzliche Terminologie kann jedoch beibehalten werden. Auf der Subdimensionsebene und insbesondere auf der Ebene der Indikatoren sind dann größere Anpassungen notwendig (z. B. Förderung des Unterrichtsdiskurses in Geschichte; Gewährleistung der Sicherheit in den naturwissenschaftlichen Fächern und im Fach Sport). In der interkulturellen Forschung würde man dies als nicht vollständige Konstruktäquivalenz aufgrund unzureichender kategorialer Äquivalenz bezeichnen. Fragen der Messäquivalenz, also der Vergleichbarkeit der empirischen Erfassungen, werden in der Regel erst bei der Datenanalyse in der Prüfung von Faktorstrukturen diskutiert (z. B. faktorielle, metrische oder skalare Äquivalenz beim Vergleich mehrerer Gruppen/Fächer). Beim Streben nach Konstrukt- und Messäquivalenz über Fächer hinweg besteht die Gefahr, dass letztendlich zwar vergleichbare Konstrukte untersucht werden, dass allerdings relevante Subdimensionen oder Indikatoren einzelner Fächer aus dem Blick geraten.

Wir würden entsprechend argumentieren, dass zukünftig verstärkt kritisch diskutiert werden sollte, ob das alleinige Priorisieren von fachübergreifender Äquivalenz und der entsprechende Fokus auf der Identifikation generischer Aspekte von Unterrichtsqualität, angemessen ist. Unserer Einschätzung nach könnte es – ähnlich unserem hier gewählten Vorgehen – zielführend sein, bewusst beides in den Blick zu nehmen: diejenigen Aspekte, die sich als äquivalent beschreiben lassen sowie diejenigen, die spezifisch für bestimmte Fächer sind.

4.3 Herausforderungen bei der Interpretation der Befunde

Bei den Diskussionen im interdisziplinären Team wurden immer wieder Herausforderungen bezüglich einer eindeutigen vergleichenden Interpretation der aktuellen Befundlage zu Unterrichtsqualität in den Fachdidaktiken deutlich. Auf drei zentrale Punkte wird im Folgenden eingegangen.

Erstens wurde in der vorliegenden Arbeit eine Zusammenfassung unterschiedlichster Befunde vorgenommen, obgleich sich die Evidenz zu den einzelnen Dimensionen unterscheidet: So wurde in den Analysen deutlich, dass je nach Fach zu den Dimensionen und Subdimensionen unterschiedlich viele Arbeiten vorlagen sowie diese zum Teil vorrangig konzeptuell, zum Teil vorrangig empirisch ausfielen. Bei den empirischen Arbeiten wiederum handelte es sich nur zum Teil um experimentelle Studien sowie Längsschnittstudien, die Befunde zur Wirksamkeit der betreffenden Aspekte bieten. Entsprechend unterscheidet sich die belastbare Evidenz, die zur empirischen Bedeutsamkeit der jeweiligen Unterrichtsaspekte vorliegt. Dies gilt jedoch nicht nur für die Unterrichtsforschung in den Fachdidaktiken, sondern auch für die allgemeine Unterrichtsforschung (Helmke 2017; Seidel und Shavelson 2007).

Zweitens weisen vereinzelte Arbeiten darauf hin, dass sich die unterschiedenen Unterrichtsdimensionen in ihrer Funktion unterscheiden und entsprechend auch die Begründungen variieren, warum diese Dimensionen als Qualitätsaspekte von Unterricht gelten: Während einige Dimensionen direkt auf den Lernprozess der Schülerinnen und Schüler ausgerichtet sind (z. B. kognitive Aktivierung), sind andere Dimensionen so konzipiert, dass sie diesen nur indirekt beeinflussen (z. B. Klassenführung) (siehe Charalambous und Praetorius 2020; Openshaw und Clarke 1970). Entsprechend müsste in Zukunft in den einzelnen Fächern, aber auch in der allgemeinen Unterrichtsforschung, verstärkt die Funktion der einzelnen Dimensionen mitdiskutiert werden, wenn es um die Bedeutsamkeit von Aspekten der Unterrichtsqualität geht.

Drittens wurde in der fachübergreifenden Diskussion um bedeutsame Aspekte von Unterrichtsqualität rasch deutlich, dass Unterrichtsqualität nicht losgelöst von den Zielen, Inhalten und Methoden des Unterrichts betrachtet werden kann (siehe auch Neumann 2018): Die Qualität von Unterricht wird in der allgemeinen empirischen Unterrichtsforschung in Relation zur Erreichung gesetzter Lernziele auf Seiten der Schülerinnen und Schüler definiert. Darüber hinaus wird in zahlreichen Publikationen auf die Figur des didaktischen Dreiecks verwiesen (z. B. Reusser 2008): Unterricht konstituiert sich neben den handelnden Lehrpersonen sowie den Schülerinnen und Schülern in zentraler Weise durch den Unterrichtsgegenstand. Nimmt man beides zusammen, wird deutlich, dass eine adäquate Auseinandersetzung mit (Sub‑)Dimensionen der Unterrichtsqualität eigentlich nur dann erfolgen kann, wenn diese im Kontext einer expliziten Thematisierung von zu erreichenden fachspezifischen Erziehungs- und Bildungszielen und der unterschiedlichen Lerngegenstände erfolgt. Wie in den Einzelbeiträgen ersichtlich, charakterisiert sich der jeweilige Gegenstand durch ein Zusammenspiel von Zielen, einbezogenen Inhalten sowie den spezifischen Methoden eines Fachs (siehe auch Abb. 1).

Abb. 1
figure 1

Bedeutung des Verhältnisses von Ziel, Inhalt, Methode und Unterricht für die Erforschung von Unterrichtsqualität

Die Abhängigkeit von Unterrichtsqualität von Zielen, Inhalten und Methoden stellt insbesondere für die generische empirische Unterrichtsforschung eine große Herausforderung dar: Werden diese Aspekte bei der Erfassung von Unterrichtsqualität nicht berücksichtigt, kann nicht klar bestimmt werden, ob die Ausprägungen bestimmter Unterrichtsdimensionen ausschließlich Ausdruck einer hohen oder niedrigen Unterrichtsqualität sind oder ob sie auf eine unterschiedliche Ausrichtung des Unterrichts aufgrund von spezifischen Zielen, Inhalten und Methoden zurückzuführen sind. Erziehungswissenschaftlerinnen und -wissenschaftlern sowie Pädagogischen Psychologinnen und Psychologen fehlt für die explizite diesbezügliche Auseinandersetzung in der Regel die notwendige fachliche Expertise. Entsprechend erfordert die Berücksichtigung dieser Abhängigkeiten eine enge Zusammenarbeit der allgemeinen empirischen Unterrichtsforschung mit den jeweiligen Fachdidaktiken. Aber auch innerhalb der jeweiligen Fachdidaktik stellt diese Komplexität eine Herausforderung dar, da die zu erreichenden Ziele, die zu behandelnden zentralen Inhalte sowie die für ein Fach charakteristischen Methoden zum Teil national wie international kontrovers und unterschiedlich diskutiert und zudem von Lehrpersonen unterschiedlich ausgelegt werden. Ein auf Gesellschaftskritik und Emanzipation abzielender Geschichtsunterricht beispielsweise wird Wert auf Ideologiekritik und die Analyse gesellschaftlicher Strukturen legen, wohingegen sich ein wissenschaftspropädeutischer Unterricht eher auf die wissenschaftsförmige Einübung zentraler heuristischer und interpretativer Fachoperationen konzentrieren würde.

In diesem Zusammenhang erscheint es zudem lohnend zu diskutieren, welche Dimensionen von Unterrichtsqualität für alle zentralen Ziele, Inhalte und Methoden hohe Relevanz haben und welche lediglich oder vornehmlich für bestimmte Ziel-Inhalts-Methoden-Konfigurationen bedeutsam sind. Kognitive Aktivierung beispielsweise ist für die eigenständige Planung eines Experiments zur Überprüfung einer Hypothese in den Naturwissenschaften hoch relevant, während es für das auf das Routinen bildende Einüben ausgerichtete Wiederholen einer prozeduralen Tätigkeit (z. B. wiederholtes Pipettieren) ohne Bezug zu Prozessen naturwissenschaftlicher Erkenntnisgewinnung sinnvollerweise nicht als Qualitätsdimension herangezogen werden sollte. Die in den Naturwissenschaftsdidaktiken häufig bemühte Unterscheidung zwischen hands-on-Prozessen und minds-on-Prozessen verweist auf eine ähnliche Sichtweise (Bybee 2006). Klassenführung hingegen ist unabhängig von den gewählten Zielen, Inhalten und Methoden notwendig – wenngleich die konkret eingeschätzte Qualitätsausprägung sehr wohl von diesen abhängig sein könnte. So macht es für die Erfassung von Klassenführung, die aktuell oftmals über stark am Frontalunterricht orientierte Indikatoren abgedeckt wird, einen zentralen Unterschied, welchen methodischen Ansatz Lehrpersonen für ihren Unterricht wählen: Nach unserer Einschätzung weisen die Indikatoren eine höhere Passung auf, wenn die Lehrperson Frontalunterricht durchführt, um neue Inhalte zu vermitteln, als wenn sie offene Unterrichtsformen nutzt. Es erscheint daher sinnvoll, in zukünftigen Untersuchungen stärker zu thematisieren, inwiefern sich die Ausprägung der Dimensionen von Unterrichtsqualität systematisch danach unterscheiden, welche Ziele, Inhalte und Methoden im Fachunterricht verfolgt werden.

4.4 Limitationen der vorliegenden Arbeit

Für die vorliegende Arbeit wurde eine kontrastierende Auswahl von Fächern aus den drei Fächergruppen Naturwissenschaften, musisch-ästhetische Fächer und Gesellschaftswissenschaften vorgenommen. Daher ist durch den Fokus auf die ausgewählten Fächer eine abschließende Beantwortung der Fragestellungen nicht möglich: Die Einordnung der fachspezifischen Diskurse zu Unterrichtsqualität in den Diskurs der allgemeinen empirischen Unterrichtsqualitätsforschung sowie die Notwendigkeit der Ergänzung von (Sub‑)Dimensionen des Syntheseframeworks könnte mit einer anderen Auswahl an Fächern trotz der Bandbreite der hier einbezogenen Fächer ggf. anders ausfallen.

Die Ausrichtung der Fragestellungen geht zudem mit der Einschränkung einher, dass lediglich Aspekte des unterrichtlichen Angebots in den Blick genommen wurden, während Aspekte der Nutzung dieses Angebots durch die Schülerinnen und Schüler in der vorliegenden Arbeit nicht behandelt wurden (für einen Überblick zu Angebots-Nutzungs-Modellen siehe Vieluf et al. 2020). Auch die in Angebots-Nutzungs-Modellen unterschiedenen Rahmenbedingungen (z. B. familiärer Hintergrund; schulische Rahmenbedingungen) und weitere Faktoren (z. B. Merkmale der Lehrperson) wurden im vorliegenden Beitrag nicht berücksichtigt.

Aufgrund der hohen Überschneidung der Diskurse in den Fächern Biologie, Chemie und Physik wurden diese als Fächergruppe behandelt, während die Fächer Sport und Geschichte einzeln betrachtet wurden. Auch dadurch bedingt wurde in den einbezogenen Fächern ein unterschiedlicher methodischer Zugang bezüglich der Suchstrategie der Publikationen gewählt. So wurde in Sport und Geschichte generell nach Publikationen zu Unterrichtsqualität gesucht, in den Naturwissenschaften wurde hingegen aufgrund der hohen Anzahl an vorhandenen Studien eine Fokussierung auf Videostudien vorgenommen. Entsprechend kann kritisch diskutiert werden, inwiefern der in den Fächern dargestellte Forschungsstand hinreichend verglichen werden kann.

Als Kommunikations- und Verständnisgrundlage wurde in der vorliegenden Arbeit das von Praetorius und Charalambous (2018) vorgeschlagene Syntheseframework herangezogen, da dies beansprucht, unterschiedene Dimensionen und Subdimensionen der bisherigen allgemeinen und mathematikdidaktischen empirischen Unterrichtsforschung möglichst umfassend abzubilden. Diese Wahl hat deutliche Auswirkungen auf die vorgestellten Ergebnisse, da diese mit einer anderen Systematik ggf. anders aussähen. So sieht die Unterteilung des komplexen Metakonstrukts Unterrichtsqualität in besser fassbare Teilaspekte in verschiedenen Fächern unterschiedlich aus und ist oft stärker vom Gegenstand als von inhaltsübergreifenden Unterrichtsdimensionen ausgehend konzipiert. Beispielsweise werden in der naturwissenschaftlichen Unterrichtsforschung einzelne Methoden (z. B. Experimentieren, Schulz 2011) als Ausgangspunkt genommen und die Frage nach der Qualität spezifisch für diese Methoden untersucht.

Die Notwendigkeit einer gemeinsamen Kommunikations- und Verständnisgrundlage legte für die Ausrichtung der vorliegenden Arbeit einen generisch ausgerichteten Ansatz nahe. Dies bedeutet jedoch auch, dass sich die in einem Fach etablierten Begrifflichkeiten und Strukturierungen im vorliegenden Beitrag nicht immer wiederfinden und einige Spezifika der einzelnen Fachdidaktiken durch die vorgenommene Einordnung in das Syntheseframework nicht abgebildet werden können. Beispielsweise können naturwissenschaftliche Denk- und Arbeitsweisen (z. B. das Experimentieren) sowohl Inhalt als auch Methode oder Ziel einer Stunde sein und erstrecken sich über mehrere Dimensionen und Subdimensionen des Syntheseframeworks (siehe Heinitz & Nehring in diesem Thementeil).

Eine große Herausforderung der vorliegenden Arbeit bestand darin, zwischen fachspezifischen Anpassungen und notwendigen Ergänzungen zu unterscheiden. Die entsprechende Einordnung wurde diskursiv ausgehandelt. Dabei wurde deutlich, dass eine klare Unterscheidung zwischen Anpassung und Ergänzung nicht in allen Fällen möglich ist, da eine Zuordnung zum Teil je nach Argumentation zu dem einen oder anderen möglich wäre. Insbesondere in der interdisziplinären Zusammenarbeit können unterschiedliche Sichtweisen bei der Einordnung von Unterrichtsaspekten auftreten, die nicht in allen Fällen einvernehmlich lösbar sind. Während beispielsweise von den Vertretern der Naturwissenschaften die Subdimension Adäquate didaktische Reduktion unter Berücksichtigung zukünftiger fachlicher Lernschritte innerhalb der Dimension Auswahl und Thematisierung von Inhalten und Fachmethoden als eine fachspezifische Erweiterung gesehen wurde, könnte sie auch als Bestandteil der Subdimension Auswahl von bedeutungsvollen, dem Lernstand angemessenen Inhalten sowie Fachmethoden interpretiert werden.

Eine weitere zentrale Einschränkung bezieht sich auf die Aufarbeitung des jeweiligen Forschungsstandes in den einzelnen Fächern. Da es sich bei Unterricht um ein sehr komplexes Geschehen handelt, existieren in jedem Fach vielfältige Forschungsbemühungen zu unterschiedlichen Teilaspekten und in verschiedenen Forschungstraditionen. Diese in einem Review zusammenzufassen, ist ausgesprochen herausfordernd und nur bis zu einem gewissen Grad objektivierbar. Entsprechend kann nicht sicher davon ausgegangen werden, dass alle relevanten Arbeiten in den jeweiligen Fächern zum Thema Unterrichtsqualität in den Reviews aufgearbeitet wurden, und auch die Einordnung in das Syntheseframework könnte durch verschiedene Forschende eines Faches unterschiedlich ausfallen. Die Identifikation von notwendigen Ergänzungen des Syntheseframeworks bezieht sich zudem auf bislang durchgeführte Studien in diesem Bereich. Die dabei untersuchten (Sub‑)Dimensionen sind unter Umständen nicht in jedem Fall ausschließlich die für das jeweilige Fach besonders zentralen (Sub‑)Dimensionen, sondern in Teilen auch die eher leicht zu erfassenden Aspekte (z. B. findet sich im Fach Sport bislang ein empirischer Fokus auf die beiden Dimensionen Klassenführung und sozio-emotionale Unterstützung, da unter anderem die Frage nach kognitiver Aktivierung aus den oben genannten Gründen für das Fach Sport mit einigen konzeptuellen Herausforderungen einhergeht).

Für den Vergleich zwischen den ausgewählten Fächern war zudem herausfordernd, dass sich die einzelnen Fachdidaktiken in ihrer forschungsmethodischen Ausrichtung unterscheiden. Entsprechend existiert unterschiedlich viel empirische Forschung zum Thema Unterrichtsqualität in den einzelnen Fächern. Auch die Erhebungsmethoden variieren zwischen den Fächern (z. B. vornehmlich videobasierte Forschung in den Naturwissenschaften vs. vornehmliche Erfassung von Schülerwahrnehmungen in Sport). Durch diese Unterschiede zwischen den Fächern wurde auch in den einzelnen Reviews der Beiträge in diesem Heft eine teilweise unterschiedliche Methodik gewählt, was einen Vergleich zwischen den Fächern erschwert.

4.5 Fazit

Im vorliegenden Beitrag wurde der aktuelle Stand der Forschung zu Unterrichtsqualität über mehrere Fächer hinweg verglichen. Die besondere Herausforderung lag darin, die Fachspezifität und damit die Besonderheiten der jeweiligen Fächer herauszustellen und diese dennoch einem generischen Rahmenkonzept zuzuordnen. Dabei ist es ein vornehmliches Anliegen der einzelnen Fachdidaktiken, Unterrichtsqualität möglichst fachspezifisch abzubilden, während die allgemeine Unterrichtsforschung versucht, in dieser Fachspezifik Gemeinsamkeiten zu finden, welche in übergreifenden Konstrukten abgebildet werden können. In welchem Umfang fachspezifische Aspekte berücksichtigt werden müssen und inwieweit diese wiederum zu generischen Aspekten zusammengefasst werden können, konnte im vorliegenden Beitrag nur in einem ersten Schritt beleuchtet werden und bleibt entsprechend eine zukünftige Aufgabe, welche ausschließlich in einem konstruktiven Austausch zwischen Fachdidaktiken und allgemeiner Unterrichtsforschung gelingen kann.

Als Resümee lässt sich festhalten, dass der hier vorgenommene Fächervergleich einen wichtigen Ansatzpunkt darstellt, um unter dem Dach einer interdisziplinär ausgerichteten Bildungsforschung mögliche Gemeinsamkeiten und Unterschiede in Fächern systematisch zu identifizieren und fächervergleichende Forschungsaktivitäten voranzutreiben.