1 Theoretischer Hintergrund

Eine effektive Klassenführung hat sich in den letzten Jahrzehnten immer wieder als wichtiger Prädiktor von schulischen Lernleistungen auch in der Grundschule erwiesen (zusf. Gabriel 2014; Helmke und Weinert 1997; Pianta et al. 2008; Cadima et al. 2010). Sie gilt als sogenannte Basisdimension guten Unterrichts (z. B. Klieme 2019; Praetorius et al. 2018) und kann nach Seidel (2020) als ein „Syndrom“ aus verschiedenen Maßnahmen und Unterrichtsstrategien verstanden werden, mit dem Ziel für alle Schüler/innen eine möglichst hohe aktive Lernzeit zu ermöglichen und die für das Lernen erforderliche Aufmerksamkeit sicherzustellen. Die bisherige Befundlage zur zeitlichen Stabilität der Klassenführung (gemessen über Beobachterratings) gibt erste Hinweise darauf, dass Klassenführung, beobachtet z. B. im Abstand von einigen Wochen und Monaten, relativ stabil ausgeprägt ist. Wird Klassenführung jedoch innerhalb einer Doppelstunde mehrfach beobachtet (vgl. Jentsch et al. 2019; Gabriel-Busse und Lipowsky 2020, eingereicht), zeigt sich eine größere zeitliche Variation in den Ausprägungen. Da allgemeinhin von den Beobachterratings zur Klassenführung in einer beobachteten (Doppel‑)Stunde auf die Effektivität der Klassenführung in einer untersuchten Klasse geschlossen wird, gilt es langfristig wirksame und demnach zeitlich stabile Unterrichtsmerkmale (z. B. in Bezug auf den Lernerfolg der Schüler/innen) zu erfassen (Jentsch et al. 2019). Dies gilt auch für den Anfangsunterricht der Grundschule, dem eine besondere Bedeutung zugeschrieben wird, da hier erstmals „die prinzipiellen Inszenierungsmuster schulischen Unterrichts“ (Ophardt 2008, S. 246) etabliert werden. Die Situation des Anfangsunterrichts stellt Lehrpersonen im Zusammenhang mit der Klassenführung vor besondere Herausforderungen, da sich die Schüler/innen mit ihren heterogenen Lernvoraussetzungen hier erstmalig zu einer Lerngemeinschaft zusammenfinden, „in der sie Regeln eines in der Klasse organisierten Lehrens und Lernens kennenlernen und verinnerlichen müssen“ (Hörter et al. 2020, S. 259). Im Vergleich zu den älteren Jahrgangsstufen der Grundschule laufen Unterrichtsaktivitäten häufig noch nicht automatisiert ab bzw. folgen keinen festen Routinen, mit entsprechenden Konsequenzen für die Messung zeitlicher Stabilität der Klassenführung (Gabriel-Busse und Lipowsky 2020, eingereicht). Inwieweit sich Unterschiede in der zeitlichen Stabilität für verschiedene Merkmale der Klassenführung (prozess- vs. strukturorientierte; Doyle 1986) zeigen, wurde bislang nicht überprüft.

1.1 Prozess- und strukturorientierte Maßnahmen der Klassenführung

Nach Doyle (1986) gelten Handlungen von Lehrpersonen, die das aktuelle Unterrichtsgeschehen unmittelbar regulieren (z. B. „Allgegenwärtigkeit“, Kounin 2006) oder eine reibungslose Strukturierung des Unterrichts gewährleisten (z. B. „Gruppenmobilisierung“ oder ein effektives Übergangsmanagement als Aspekt des Merkmals „Reibungslosigkeit und Schwung“, Kounin 2006), als sogenannte prozessorientierte Maßnahmen der Klassenführung (vgl. auch Hörter et al. 2020). Nach Kounin (2006) muss die Lehrperson allgegenwärtig sein bzw. buchstäblich „Augen im Hinterkopf“ (ebd., S. 90) haben, um Störungen frühzeitig zu erkennen und gegebenenfalls sofort unterbinden zu können. Eine allgegenwärtige Lehrperson richtet ihren Fokus häufig auf die gesamte Klasse, auch wenn sie mit einzelnen Schülern/innen oder Schüler/innengruppen interagiert. Kounin (2006) bezeichnet diese Fähigkeit als Überlappung, d. h. die Lehrperson kann gleichzeitig mehreren Geschehnissen in der Klasse Aufmerksamkeit zuwenden. Diese kontinuierliche „störungspräventive Überwachung der Schülertätigkeiten“ (Gruehn 2000, S. 129) fördert die Mitarbeit und hemmt Fehlverhalten der Schüler/innen (Kounin 2006). Die Strukturierung des Unterrichts zielt auf die „Koordination der individuellen Lernaktivitäten im Klassenverband ab“ (Hörter et al. 2020, S. 261), womit eine hohe aktive Lernzeit für alle Schüler/innen ermöglicht werden soll (Kounin 2006). Unter Strukturierung des Unterrichts werden verschiedene Maßnahmen zusammengefasst (vgl. auch Hörter et al. 2020): (1) die Gruppenmobilisierung (Kounin 2006), die einhergeht mit einer aktiveren Nutzung der Lernangebote und Beteiligung möglichst aller Schüler/innen im Unterricht, (2) die Gestaltung der Übergänge zwischen einzelnen Unterrichtsphasen bzw. dem effektiven Übergangsmanagements (als Aspekt eines effektiven Zeitmanagements) (Hörter et al. 2020).

Neben prozessorientierten Maßnahmen unterscheidet Doyle (1986) zusätzlich strukturorientierte Maßnahmen der Klassenführung, die auf eine langfristige und effektive Etablierung wiederkehrender Abläufe und Unterrichtsaktivitäten ausgerichtet sind. Beispielsweise können hier jene Handlungen der Lehrperson subsumiert werden, die auf die Etablierung und das Nutzen von Regeln, Routinen und RitualenFootnote 1 ausgerichtet sind (Hörter et al. 2020). Die Etablierung eines effektiven Regelsystems bzw. von Routinen zielt ebenso auf eine effektive Nutzung der Unterrichtszeit sowie auf die Strukturierung der Übergangsphasen bzw. des Unterrichts allgemein ab und gilt als entscheidender Faktor erfolgreichen Lehrens und Lernens im Unterricht (Helmke 2006).

1.2 Zeitliche Stabilität von Beobachterratings zur Klassenführung

Im Rahmen von Beobachtungs- bzw. Videostudien werden die Merkmale der Klassenführung häufig mit Hilfe von Beobachterratings eingeschätzt und auf ihre Wirkungen hin untersucht (z. B. Seidel und Shavelson 2007; für die Grundschule: zusf. Gabriel 2014). Für den Sekundarschulbereich ist die Frage nach der zeitlichen Stabilität und Generalisierbarkeit von Beobachterratings zur Unterrichtsqualität inzwischen relativ gut untersucht worden (z. B. Jentsch et al. 2019; Meyer et al. 2011; Praetorius et al. 2014; Praetorius 2014). Anhand der Berechnung sogenannter Generalisierbarkeitsstudien (G-Studien, vgl. Cronbach et al. 1972; Shavelson und Webb 1991) zeigen entsprechende Ergebnisse eine eher schwache bzw. moderate zeitliche Variation in den Ausprägungen der Klassenführung zwischen unterschiedlichen Stunden einer Lehrperson in ein und derselben Klasse (gemessen im Abstand von wenigen Wochen oder Monaten) (vgl. Tab. 1). Sekundarlehrpersonen scheinen demnach ausgeprägte Routinen entwickelt zu haben, die sie in jeder Unterrichtsstunde und unabhängig vom Unterrichtsinhalt und Beobachtungszeitpunkt anwenden (Seidel 2020).

Tab. 1 Überblick über G‑Studien zur zeitlichen Variation der Klassenführung

Für den Grundschulbereich mangelt es an entsprechenden Studien bzw. die bisherigen Studien im Grundschulbereich untersuchten die zeitliche Stabilität der Klassenführung häufig in Form von Korrelationen zwischen verschiedenen Messzeitpunkten (im Abstand von mehreren Monaten), wobei vor allem für die ersten beiden Schuljahre (Anfangsunterricht) die untersuchten Zusammenhänge eher schwach ausfallen. Eckerth et al. (2012) vermuten, dass sich Schüler/innen vor allem in den ersten beiden Schuljahren (Anfangsunterricht) mit zunehmender Verweildauer besser im Unterrichtsalltag zurechtfinden (z. B. sich an Regeln halten, Routinen verinnerlichen usw.), aber auch die Lehrpersonen die Bedürfnisse der Schüler/innen besser kennen und demzufolge die Unterrichtsgestaltung und die Klassenführung anpassen, mit entsprechenden Konsequenzen für die zeitliche Stabilität der Klassenführung. Im Vergleich zum ersten und zweiten Schuljahr zeigen Studien für das dritte und vierte Schuljahr (zusf. Gabriel-Busse und Lipowsky eingereicht) eine deutlich höhere zeitliche Stabilität der Klassenführung – gemessen anhand von Korrelationen – sowohl innerhalb eines Schuljahres (Helmke und Weinert 1997) als auch über einen Zeitraum von zwei Unterrichtsstunden hinweg (Pianta et al. 2008). Da im Rahmen von Korrelationen die zeitliche Stabilität mit weiteren Faktoren konfundiert ist (Praetorius 2014; Shavelson und Dempsey-Adwood 1976), sollten weitere Faktoren (z. B. Beobachtungszeitpunkt, Merkmal der Klassenführung/eingesetzte Items) berücksichtigt und deren Varianzanteil bestimmt werden. Hier bietet sich die Durchführung von G‑Studien an, wie sie im Sekundarschulbereich in den letzten Jahren vermehrt durchgeführt wurden (vgl. Tab. 1).

Begründet wird die geringe zeitliche Variation der Klassenführung in der Sekundarstufe häufig damit, dass sich sowohl Verhaltensweisen der Lehrperson in Bezug auf die Klassenführung als auch das Verhalten der Schüler/innen nicht kurzfristig verändern und somit zu jedem Beobachtungszeitpunkt in ähnlicher Ausprägung sichtbar sein sollten (z. B. Praetorius 2014; König und Lebens 2012). Inwieweit einzelne Maßnahmen der Klassenführung jedoch kurzfristigen Schwankungen unterworfen sein können, wurde bislang kaum untersucht. Geht man davon aus, dass sich Unterricht durch eine deutliche Sequenzierung einzelner Phasen und Schritte auszeichnet (Lipowsky 2007), können lehrergesteuerte und schülerorientierte Phasen unterschiedliche Anforderungen in Bezug auf die Klassenführung stellen. Erste Hinweise darauf, dass sich beispielsweise während einer Doppelstunde Unterschiede im Klassenführungsverhalten von Lehrpersonen (Sekundarschule) zeigen, liefert die Studie von Jentsch et al. (2019). In der Studie erwies sich die Variabilität der Beobachterratings für die Klassenführung innerhalb einer Doppelstunde als beträchtlich, wobei die Klassenführung vor allem zu Beginn der Doppelstunde von den Rater/innen positiver eingeschätzt wurde. Jentsch et al. (2019) erklären die Unterschiede in den Ausprägungen der Klassenführung damit, dass vor allem zu Beginn des Unterrichts (in einer Doppelstunde) „Maßnahmen der Lehrperson zur Herstellung von Aufmerksamkeit […] erfolgen oder zum Ende einer Unterrichtsstunde ausbleiben“ (ebd. S. 16). Dass das Klassenführungsverhalten innerhalb einer Doppelstunde stärker variiert als bislang angenommen, konnten Gabriel et al. (2015; vgl. auch Gabriel-Busse und Lipowsky 2020, eingereicht) auch für den Anfangsunterricht der Grundschule bestätigen. Für verschiedene fachliche Kontexte (Deutsch und Mathematik) zeigte sich eine hohe Variation in den Ausprägungen der Merkmale der Klassenführung innerhalb einer Doppelstunde (vgl. Tab. 1). Das zugrundeliegende Klassenführungsverhalten einer Lehrperson im Unterricht des ersten und zweiten Schuljahres ist somit auch kurzfristig bestimmten Schwankungen unterworfen.

Um Aussagen über die zeitliche Stabilität der Klassenführung machen zu können, wurden in einem Großteil der bisherigen G‑Studien (Tab. 1: z. B. Gabriel-Busse und Lipowsky 2020; Jentsch et al. 2019; Praetorius 2014; Meyer et al. 2011) Analysen auf Itemebene durchgeführt und die Items als zusätzliche Facette (i) in das Design der G‑Studie integriert. Dem liegt die Annahme zugrunde, dass im Rahmen der Unterrichtsqualitätsforschung Interaktionen zwischen einzelnen Unterrichtssequenzen bzw. Lehrpersonen und Items (z. B. in Bezug auf die Klassenführung) erwartbar und demnach nicht als Fehlervarianz anzusehen sind (Praetorius 2014). In der Studie von Jentsch et al. (2019) ergibt sich so beispielsweise für die Klassenführung ein relativ großer itemspezifischer Varianzanteil (i) gepaart mit einem moderaten Interaktionseffekt k x i, der wiederum bedeutet, dass Klassenunterschiede bzw. Unterschiede zwischen Lehrpersonen in der Klassenführung sogar innerhalb von Doppelstunden itemspezifisch ausfallen und nicht allein auf Unterschiede in den zugrundeliegenden Klassenführungsmerkmalen zurückzuführen sind. Zu ähnlichen Ergebnissen für die Variabilität innerhalb einer Doppelstunde kommen auch Gabriel-Busse und Lipowsky (2020; vgl. auch Gabriel et al. 2015) für den Anfangsunterricht in der Grundschule. Der itemspezifische Varianzanteil, d. h. die zeitstabilen Unterschiede in den Itemschwierigkeiten innerhalb einer Skala sind hier zwar eher gering, der Interaktionseffekt (u: l) x i ist mit einem Varianzanteil von 17 % (1. Schuljahr) bzw. 16 % (2. Schuljahr) jedoch moderat. Die Autor/innen interpretieren dies dahingehend, dass beispielsweise in Abhängigkeit von der jeweiligen Phase im Unterricht bzw. der jeweiligen Teilstunde der Doppelstunde Stärken und Schwächen der Lehrpersonen hinsichtlich der einzelnen Klassenführungsmerkmale ersichtlich werden.

2 Ableitung der Forschungsfragen

In Ergänzung zu den bisherigen Studien (im Sekundar- und Grundschulbereich) soll im vorliegenden Beitrag der Frage nachgegangen werden, inwieweit Unterschiede in der zeitlichen Stabilität in Abhängigkeit vom untersuchten Klassenführungsmerkmal (prozess- und strukturorientiert) bestehen. Dabei liegt der Fokus auf der zeitlichen Stabilität (1) innerhalb von Doppelstunden (zwei Messzeitpunkte im Abstand von 45 Minuten) und (2) messwiederholt gemessen im Abstand von 12 Monaten.

Forschungsfrage Nr. 1:

Inwieweit zeigen sich Unterschiede in der zeitlichen Stabilität für einzelne Klassenführungsmerkmale in Abhängigkeit vom Abstand zwischen den Beobachtungen (innerhalb einer Doppelstunde vs. im Abstand von 12 Monaten)?

Aufgrund der besonderen Herausforderung in Bezug auf die Klassenführung im Anfangsunterricht und in Anlehnung an bisherige Studien (s. oben), kann angenommen werden, dass das Klassenführungsverhalten der Lehrpersonen sowohl innerhalb einer Doppelstunde als auch beobachtet im Abstand von 12 Monaten zeitlich variiert (vgl. Abschn. 1.2) (Hypothese 1).

Zusätzlich wird im Rahmen der vorliegenden Studie untersucht, inwieweit in Anlehnung an Doyle (1986) Unterschiede in der zeitlichen Stabilität bestehen, je nachdem, ob es sich um eine prozess- oder strukturorientierte Maßnahme der Klassenführung handelt.

Forschungsfrage Nr. 2:

Zeigen sich Unterschiede in der zeitlichen Stabilität zwischen prozess- und strukturorientierten Maßnahmen der Klassenführung?

Prozessorientiere Maßnahmen regulieren eher das aktuelle Unterrichtsgeschehen. Sie sind weniger planbar und sollten somit zeitlich variabler sein (Hypothese 2). Strukturorientierte Maßnahmen sind hingegen eher auf die langfristige effektive Etablierung wiederkehrender Abläufe und Unterrichtsaktivitäten ausgerichtet (vgl. Abschn. 1.1) und sollten demnach zeitlich stabiler ausfallen (Hypothese 3). Inwieweit dies für den Anfangsunterricht der Grundschule zutrifft, soll explorativ überprüft werden.

3 Methodisches Vorgehen

3.1 Stichprobe

Die Überprüfung der Forschungsfragen erfolgt anhand der Daten aus der Videostudien Deutsch/Sprache (VSS) und Videostudie Mathematik (VSM) der PERLE-Studie (Persönlichkeits- und Lernentwicklung von Grundschulkindern; Greb et al. 2007; Lipowsky et al. 2013). Die VSS fand im ersten Schuljahr (März 2007), die VSM im zweiten Schuljahr (März 2008) statt (Greb et al. 2009; Lotz et al. 2011; Lotz und Corvacho del Toro 2013). Für insgesamt 21 Lehrpersonen liegen vollständige Daten zur Klassenführung für beide Fächer vorFootnote 2. Diese bilden die Grundlage für die nachfolgenden Analysen. Von jeder dieser Lehrpersonen (♀ = 20; ♂ = 1) wurden jeweils 90 Minuten (Doppelstunde) Deutsch- (1. Schuljahr) bzw. Mathematikunterricht (2. Schuljahr) in ein und derselben Klasse beobachtet. Vier Lehrpersonen sind unter 35 Jahre, 14 Lehrpersonen sind zwischen 35 und 55 Jahre und eine Lehrperson ist über 55 Jahre alt. Im Mittel haben die teilnehmenden Lehrpersonen 14,5 Jahre Berufserfahrung (N = 17; Min = 1; Max = 35; SD = 10,7). Die Angaben zu Alter und Berufserfahrung der Lehrpersonen stammen aus einem Fragebogen vom November 2006. Für zwei Lehrpersonen liegen keine Angaben zum Alter, für vier Lehrpersonen keine Angaben zur Berufserfahrung vor. Durchschnittlich nahmen pro Klasse 18 Schüler/innen sowohl an der VSS als auch an der VSM teil (vgl. Lotz und Corvacho del Toro 2013; Mösko et al. 2013).

3.2 Das hoch inferente Ratingsystem zur Klassenführung

Die Klassenführung wurde mit Hilfe eines hoch inferenten Ratingsystems erfasst. Für jedes der in Tab. 2 aufgeführte Klassenführungsmerkmal wurde die Grundidee beschrieben sowie diverse verhaltensnahe Indikatoren/Negativindikatoren formuliert (Gabriel und Lipowsky 2013). Zwei geschulte Rater/innen (Student/innen des Lehramts, höheres Semester) schätzten unabhängig voneinander insgesamt sechs Merkmale der Klassenführung auf einer vier-stufigen Skala ein. Während einer zweitägigen Schulung wurden die Rater/innen zuerst mit dem Aufbau des Ratingsystems vertraut gemacht. Hierbei wurden den Ratern/innen Ankerbeispiele und Videoausschnitte für jedes zum Rating anstehende Klassenführungsmerkmal vorgestellt. In Anlehnung an Korbarg und Seidel (2003) galt das Training ab dem Zeitpunkt als abgeschlossen, als sich die Rater/innen und die Entwicklerin des Ratingsystems über die Zuordnung beobachtbaren Verhaltens zu einem hoch inferenten Merkmal der Klassenführung einig waren (konsensuelle Validierung, vgl. Bortz und Döring 2006, S. 328).

Tab. 2 Mittelwerte, Standardabweichungen, bivariate Korrelationen sowie Inter-Rater-Übereinstimmung auf Item- und Skalenebene getrennt nach prozess- und strukturorientierten Maßnahmen der Klassenführung

Die erste Einschätzung bezog sich auf die ersten 45 Minuten der Doppelstunde, die zweite Einschätzung auf die zweiten 45 Minuten der Doppelstunde. Der Unterteilung einer Doppelstunde in zwei Segmente gingen inhaltliche Überlegungen voraus: Da junge Schüler/innen im Gegensatz zu älteren eher kurze Konzentrationszeiten habenFootnote 3, erschien es vielen Lehrpersonen aus der vorliegenden Stichprobe sinnvoll, eine Pause nach den ersten 45 Minuten zu machen. Im Nachgang der Videostudien (Interview) begründeten die Lehrpersonen dies u. a. damit, dass 90 Minuten Unterricht am Stück eher untypisch wären.

Die Inhalte der Doppelstunde wurden vorgegeben (1. SJ Deutsch: Lotz und Corvacho del Toro 2013; 2. SJ Mathematik: Mösko et al. 2013). Die Einschätzungen erfolgten somit für zwei Unterrichtseinheiten in zwei verschiedenen Fächern im Abstand von ca. 12 Monaten, jeweils bestehend aus zwei aufeinander aufbauenden Stunden einer Lehrperson in ein und derselben Klasse. Zur Überprüfung der Qualität der hoch inferenten Daten wurde für jedes der sechs Klassenführungsmerkmale auf Basis aller Videos der PERLE-Studie (1. SJ Deutsch: N = 48 Videos, 2. SJ Mathematik: N = 49 Videos) der relative Generalisierbarkeitskoeffizient (G-Koeffizient) als Maß für die Übereinstimmung zwischen den zwei Rater/innen (Inter-Rater-Reliabilität) berechnet (Gabriel und Lipowsky 2013). Die Inter-Rater-Übereinstimmungen für die einzelnen Klassenführungsmerkmale (berechnet über die gesamte Doppelstunde) liegen für das 1. Schuljahr (Deutsch) zwischen 0,68 und 0,90 und für das 2. Schuljahr (Mathematik) zwischen 0,81 und 0,95 (vgl. Tab. 2) und können als zufriedenstellend angesehen werden.

3.3 Design der G-Studien

Um die Fragestellungen zu überprüfen, werden die unterschiedlichen Klassenführungsitems – im Gegensatz zum bisherigen Vorgehen im Rahmen von G‑Studien (vgl. Abschn. 1.2) – nicht als zusätzliche Facette in das Untersuchungs-Design der G‑Studie integriert, sondern es wird für jedes Klassenführungsmerkmal eine separate G‑Studie berechnet (vgl. Abschn. 4.2).

Den Analysen liegt ein geschachteltes Zwei-Facetten-Design ((s: l)×j -Design) zugrunde, mit dem es möglich ist, insgesamt fünf Varianzquellen für jedes der acht Klassenführungsmerkmale zu unterscheiden. Neben dem zu erfassenden Merkmal (stabile Ausprägung des jeweiligen Merkmals der Klassenführung) einer Lehrperson (l) (bzw. Klasse) wurden folgende Facetten (d. h. Varianzquellen) einbezogen:

  • die Unterrichtsstunden (geschachtelt in Lehrpersonen; s: l) (= Varianz, die auf die Unterschiede einer Lehrperson zwischen der 1 und 2. Stunde innerhalb einer Doppelstunde entfällt),

  • das Schuljahr (j)Footnote 4 (= Varianz, die auf die Unterschiede zwischen den 12 Monaten auseinanderliegenden Unterrichtseinheiten entfällt),

  • die Interaktion Lehrperson-Schuljahr (l x j) (= Varianz, die auf Unterschiede einer Lehrperson zwischen den 12 Monaten auseinanderliegenden Unterrichtseinheiten entfällt),

  • die Residualvarianz bzw. Interaktion höchster Ordnung ((s: l) x j, e).

Eine Analyse der Rater-Effekte steht nicht im Fokus der Untersuchung. Die beiden Rater-Urteile wurden daher pro Messzeitpunkt durch Mittelwertbildung zusammengefasst. Dieses Vorgehen wird von Pietsch und Tosana (2008) als Maßnahme „zur Sicherung der Urteilsqualität bei Unterrichtsbeobachtungen“ diskutiert (S. 438). Da Studien zeigen, dass das Ausmaß an Varianz in den Beobachterratings in Abhängigkeit von der Analyseebene (Item- vs. Skalenebene) variiert (z. B. Praetorius 2014), werden in weiteren Schritt zusätzlich die über die einzelnen Klassenführungsitems gemittelten Skalenwerte für zusätzliche G‑Studien herangezogen, wobei neben der Skala Klassenführung auch die zwei Subskalen der Klassenführung (prozess- und strukturorientierte Maßnahmen) überprüft werden (vgl. Tab. 3).

4 Ergebnisse

4.1 Deskriptive Statistiken

Tab. 2 stellt die deskriptiven Statistiken für die prozess- und strukturorientierten Klassenführungsmerkmale für die 1. und 2. Stunde der Doppelstunde getrennt nach Schuljahren und jeweils auf Item- und (Sub‑)Skalenebene dar. Die Klassenführungsmerkmale sind durchgehend positiv ausgeprägt (MW1. SJ 1. Stunde ≥ 2,95; MW1. SJ 2. Stunde ≥ 2,86; MW2. SJ 1. Stunde ≥ 3,05; MW2. SJ 2. Stunde ≥ 2,83). Während die zwei Rater/innen sowohl die prozess- als auch die strukturorientierten Klassenführungsmerkmale im 2. Schuljahr jeweils in der 2. Stunde der Doppelstunde niedriger einschätzen, kann dieser Trend für das 1. Schuljahr nur auf Skalenebene, nicht aber für alle Klassenführungsmerkmale auf Itemebene bestätigt werden: „Gruppenmobilisierung“ wird im 1. Schuljahr im Mittel von den zwei Rater/innen in beiden Stunden gleich hoch (MW = 3,29), „Regelklarheit bzw. -verwendung“ in der 1. Stunde hingegen höher eingeschätzt. Die bivariaten Korrelationen zwischen den zwei Stunden liegen je nach Klassenführungsmerkmal im 1. Schuljahr zwischen r = 0,15 und r = 0,79, wobei für die strukturorientierten Merkmale „Regeln für das soziale Miteinander (Schüler/innen)“ und „Effektiver Umgang mit Unterrichtsstörungen“ im ersten Schuljahr (noch) kein signifikanter Zusammenhang besteht. Im 2. Schuljahr liegen die bivariaten Korrelationen zwischen r = 0,15 und r = 0,69 (vgl. Tab. 2). Lediglich für das Merkmal „Allgegenwärtig der Lehrperson“ lässt sich kein signifikanter Zusammenhang zwischen den beiden Teilstunden der Doppelstunde bestätigen. Über ein Schuljahr hinweg zeigt sich sowohl auf Item- als auch auf (Sub‑)Skalenebene kein signifikanter Zusammenhang (vgl. rechte Spalte, Tab. 2).

4.2 Unterschiede in der zeitlichen Stabilität für prozess- und strukturorientierte Maßnahmen der Klassenführung – Ergebnisse der G-Studien

Die Ergebnisse der G‑Studien (vgl. Tab. 3) zeigen, dass sich die Unterschiede in den Ausprägungen für alle Klassenführungsmerkmale auf Unterschiede zwischen den Lehrpersonen in den Klassen zurückführen lassen (stabile Varianz: l), der Anteil liegt zwischen 5 % und 21 %. Ein deutlich größerer Varianzanteil entfällt auf die Interaktion von Lehrperson und Schuljahr (l x j). Je nach Klassenführungsmerkmal liegt dieser zwischen 21 % (prozessorientiertes Merkmal: Allgegenwärtigkeit der Lehrperson) und 50 % (strukturorientiertes Merkmal: Regelklarheit bzw. -verwendung). Je höher dieser Varianzanteil, desto deutlicher variieren die Ausprägungen der Klassenführungsmerkmale einer Lehrperson in ein und derselben Klasse zwischen dem ersten und zweiten Schuljahr. Lehrpersonen zeigen demnach ein unterschiedliches Klassenführungsverhalten in Abhängigkeit vom untersuchten Schuljahr im Anfangsunterricht, wobei keine eindeutige Aussage in Bezug auf Unterschiede zwischen prozess- und strukturorientierten Merkmalen der Klassenführung getroffen werden kann, da bspw. auch des Merkmal „Gruppenmobilisierung“ als eine prozessorientierte Maßnahme einen ähnlich hohen Varianzanteil (45 %) aufweist wie das Merkmal „Regelklarheit bzw. -verwendung“. Auf Ebene der Subskalen zeigt sich ein eindeutigeres Bild: Für die prozessorientierten Maßnahmen der Klassenführung entfällt mit 39 % gegenüber 24 % für die strukturorientierten Maßnahmen ein deutlich größerer Varianzanteil auf Unterschiede zwischen den beiden Schuljahren. Hypothese 2 und 3 können somit bestätigt werden: Strukturorientierte Maßnahmen der Klassenführung sind – wenn einmal etabliert – zeitlich stabiler. Betrachtet man ergänzend die Ergebnisse für die Gesamtskala Klassenführung zeigt sich, dass für prozess- und strukturorientierte Maßnahmen ca. 60 % der Varianz aufgeklärt werden können, wobei ca. ein Drittel auf Unterschiede zwischen Lehrpersonen entfällt und zwei Drittel auf Unterschiede zwischen Fächern/Schuljahren entfallen. Der Varianzanteil, der auf unterschiedliches Klassenführungsverhalten innerhalb einer Doppelstunde (1. Stunde vs. 2. Stunde, s: l) zurückgeführt werden kann, variiert sowohl für prozess- als auch für strukturorientierte Maßnahmen der Klassenführung gleichermaßen, wobei sich die Höhe der Ausprägung für das Merkmal „Allgegenwärtigkeit der Lehrperson“ mit 21 % deutlich zwischen den zwei Stunden einer Doppelstunde unterscheidet (vgl. Tab. 2). Zusätzlich entfallen je nach Klassenführungsmerkmal bis zu 55 % der Varianz auf das Residuum.

Tab. 3 Ergebnisse der G‑Studien für prozess- und strukturorientierte Maßnahmen der Klassenführung

5 Zusammenfassung und Diskussion

5.1 Die zeitliche Variation prozess- und strukturorientierter Maßnahmen der Klassenführung innerhalb einer Doppelstunde

Im Rahmen der G‑Studie erwies sich die Variabilität der Klassenführung auf Ebene der Gesamtskala bzw. der beiden Subskalen als eher gering (Varianzanteil s: l = 0 bis 2 %), während der Varianzanteil (s: l) auf Itemebene für einzelne Klassenführungsmerkmale teilweise deutlich höher ausfällt (z. B. Allgegenwärtigkeit der Lehrperson). Die Annahme, dass sich die zeitliche Stabilität in Abhängigkeit davon unterscheidet, ob es sich bei dem untersuchten Merkmal um eine prozess- bzw. strukturorientierte Maßnahme der Lehrperson handelt, kann jedoch nur teilweise bestätigt werden. Im Fall des Merkmals Allgegenwärtigkeit handelt es sich um ein prozessorientiertes Merkmal, womit von einer zeitlich variierenden Maßnahme ausgegangen werden kann (vgl. Doyle 1986), die eher das aktuelle Unterrichtsgeschehen reguliert und von der Lehrperson adaptiv innerhalb einer Doppelstunde eingesetzt wird. Bereits Kiel et al. (2013) weisen darauf hin, dass das Klassenführungsverhalten von Lehrpersonen situationsgerecht variieren kann bzw. an aktuelle Lehr-Lern-Situationen angepasst werden sollte (Beck et al. 2008; Neuenschwander 2006). Auch für das Merkmal „Regeln für das soziale Miteinander“ zwischen den Schüler/innen entfällt ein größerer Varianzanteil auf den Effekt s: l (12 %). Dieser bedeutet inhaltlich, dass sich die Ausprägungen in Bezug auf die Einhaltung der Regeln des sozialen Miteinanders im Unterricht zwischen den beiden Stunden einer Doppelstunde unterscheiden. Die Rater/innen schätzten das Merkmal in beiden Schuljahren für die 2. Stunde der Doppelstunde niedriger ein (vgl. Tab. 2). Gabriel-Busse und Lipowsky (eingereicht) diskutieren dieses Ergebnis vor dem Hintergrund der unterschiedlichen Unterrichtsverläufe bzw. Inszenierungsformen der jeweiligen Doppelstunde. Diese führten dazu, dass in beiden Videostudien (1. und 2. SJ) in der 2. Stunde eher schülerorientierter Unterricht in Form von Übungen (zu zweit oder in der Gruppe) stattgefunden hat. Während in dem eher lehrerorientierten Unterricht im ersten Teil der Doppelstunde kaum Möglichkeiten des sozialen Miteinanders zu beobachten waren bzw. das Ausbleiben negativen Schüler/innenverhaltens positiv von den Rater/innen gewertet wurde (vgl. Gabriel und Lipowsky 2013), sind soziale Interaktionen und soziale Beziehungen, die maßgeblich durch im Vorfeld etablierte Regeln reguliert sind, erst im zweiten Teil der Doppelstunde z. B. während des Stationenlernens in Mathematik sichtbar bzw. nehmen Einfluss auf die Umgangsformen bzw. die soziale Kommunikation (vgl. Neuenschwander 2005). Für die übrigen zwei strukturorientierten Maßnahmen der Klassenführung bestätigt sich die Annahme, dass strukturorientierte Maßnahmen kaum kurzfristigen Schwankungen unterworfen sind (Varianzanteil s: l liegt bei 1 und 6 %). Für weitere Beobachtungstudien bedeutet dieses Ergebnis, dass je nach Merkmal im Vorfeld überlegt werden sollte, ob Unterschiede in der Ausprägung in Abhängigkeit von verschiedenen Phasen des Unterrichts erwartbar sein können. Weitere Studien sollten sich hier anschließen.

5.2 Die zeitliche Variation prozess- und strukturorientierter Maßnahmen der Klassenführung innerhalb eines Schuljahres (zwischen 12 Monate auseinanderliegenden Unterrichtseinheiten)

In Bezug auf die zeitliche Variabilität der Beobachterratings zur Klassenführung im Abstand von 12 Monaten bzw. innerhalb eines Schuljahres zeigt sich, dass ein beträchtlicher Varianzanteil auf den Interaktionseffekt Lehrperson × Schuljahr (l x j) entfällt. Dieser liegt auf Skalenebene bei 38 % und variiert auf Itemebene zwischen 21 und 50 %. Das bedeutet, dass in Abhängigkeit vom untersuchten Klassenführungsmerkmal ein großer Varianzanteil auf Unterschiede zwischen den 12 Monaten auseinanderliegenden Unterrichtseinheiten einer Lehrperson entfällt. Sowohl prozess- als auch strukturorientierte Maßnahmen zeigen hier hohe Effektstärken, wobei der Varianzanteil für die prozessorientierten Maßnahmen der Klassenführung (Subskala) höher ist als für die strukturorientierten Maßnahmen. Die hohe Variabilität innerhalb eines Schuljahres kann dadurch erklärt werden, dass es sich bei der vorliegenden Studie um eine Untersuchung im Anfangsunterricht der Grundschule handelt. Im Vergleich zur Sekundarstufe geht es im Primarbereich darum, Regeln (z. B. auch zum sozialen Miteinander oder der Kommunikation) und Routinen zu etablieren. Vor allem in den ersten Monaten der Schulzeit ist es die Aufgabe der Lehrperson, die technischen Regeln und Verfahrensweisen wie beispielsweise das Ablegen der Hefte einzuführen, diese immer wieder zu erläutern und zu erklären und mit den Schülern/innen kontinuierlich einzuüben (Boostrom 1991). Gleiches gilt für die Übergänge zwischen einzelnen Unterrichtsaktivitäten, die auch strukturiert sein bzw. bestimmten Regeln und Ritualen folgen sollten, damit langfristig wenig Zeit verschwendet wird bzw. Unterrichtsstörung aufgrund von Off-Task-Verhalten minimiert werden (Arlin 1979). Aufgrund der hier berichteten Analyseergebnisse muss die Annahme zeitlicher Stabilität für den Anfangsunterricht bzw. für zwei im Abstand von 12 Monaten durchgeführte Beobachtungen zumindest für einzelne Klassenführungsmerkmale verworfen werden, weil aufgrund eines Anpassungsprozesses der beobachteten Lehrpersonen an die Bedürfnisse der Schüler/innen Unterschiede im beobachteten Klassenführungsverhalten zu erwarten sind. Der Anfangsunterricht befindet sich im Verlauf der Schuleingangsphase noch in einem Entwicklungsprozess (vgl. Eckerth et al. 2012). Im Zusammenhang mit der zeitlichen Variation der hier untersuchten Klassenführungsmerkmale muss an dieser Stelle jedoch berücksichtigt werden, dass die beiden untersuchten Doppelstunden (beobachtet im Abstand von 12 Monaten) teilweise nicht so vergleichbar waren (z. B. in Bezug auf Inhalt, Anteil Sozialformen etc.), wie dies für die vorliegende Fragestellung wünschenswert gewesen wäre (s. unten).

Als Konsequenz für weitere Beobachtungsstudien kann geschlussfolgert werden, dass es für den Anfangsunterricht von Bedeutung ist, wann die Merkmale der Klassenführung erfasst werden. Strukturorientierte Maßnahmen variieren im ersten Schuljahr auf Grund der Besonderheit des Anfangsunterrichts. Im zweiten Schuljahr sollten Regeln und Routinen z. B. für ein effektives Übergangsmanagement jedoch etabliert sein, mit entsprechenden Konsequenzen für die Messung der zeitlichen Stabilität. Zudem kann aus den hier berichteten Ergebnissen geschlussfolgert werden, dass Beobachtungen in Bezug auf die Klassenführung im Anfangsunterricht mehrmals im Jahr stattfinden sollten. Es bleibt offen, was ein „optimaler“ Zeitrahmen wäre, um Klassenführung im Anfangsunterricht mit einer hohen Zuverlässigkeit zu erfassen. Wenn die Klassenführung im Anfangsunterricht innerhalb eines Schuljahres so stark variiert, stellt sich zudem die Frage, inwieweit durch ein einmalig erfasstes Merkmal („Momentaufnahme“) Schülerleistungen erklärt werden können, die innerhalb eines Schuljahres zustande kommen.

In der vorliegenden Studie entfiel zusätzlich ein nicht unerheblicher Varianzanteil auf die jeweiligen Residuen. In weiteren G‑Studien sollten demnach zusätzliche potenzielle Fehlerquellen (z. B. Rater/innen, vgl. Gabriel et al. 2015; Gabriel-Busse und Lipowsky 2020) berücksichtigt werden. Die zusätzliche Aufnahme weiterer Varianzquellen führte in dieser Studie dazu, dass negative Varianzkomponenten auftraten, die angesichts der geringen Stichprobengröße für eine zu hohe Modellkomplexität sprechen. Für die Beantwortung der hier zugrunde liegenden Forschungsfrage spielte der Einfluss der Rater/innen jedoch keine Rolle, sodass diese Varianzquelle im Rahmen der G‑Studien bewusst unberücksichtigt blieb.

6 Limitationen der Studie

In dieser Studie wurden G‑Koeffizienten ermittelt, die im Sinne eines Reliabilitätskoeffizienten als niedrig bis moderat gelten können. Hier können neben der starken zeitlichen Variabilität innerhalb von 12 Monaten zwei weitere mögliche Gründe angeführt werden: 1) Eine eher homogene Stichprobe, die zu einer geringen Variabilität in der Klassenführung zwischen verschiedenen Lehrpersonen geführt haben könnte (der Anteil stabiler Varianz liegt lediglich zwischen 5 % und 20 %, je nach Klassenführungsmerkmal) und 2) ein durchweg hoher Anteil an Residualvarianz, der auf unbeobachtete Einflussfaktoren der Klassenführung hindeutet (z. B. Ratereffekte, Unterrichtsgestaltung). Einschränkend muss für die vorliegende Studie angemerkt werden, dass die Unterrichtstunden nicht zufällig ausgewählt wurden, sondern dass für jede der 21 Lehrpersonen jeweils eine Doppelstunde im 1. Schuljahr (Fach Deutsch) und 2. Schuljahr (Fach Mathematik) videografiert wurde. Da für beide Videostudien das Thema vorgegeben wurde (s. oben), bauen die videografierten Einzelstunden der jeweiligen Doppelstunde größtenteils inhaltlich und methodisch aufeinander auf. Demnach liegt keine stochastische Unabhängigkeit zwischen den Einzelstunden vor. Hier stellt sich die Frage, inwieweit für Einzelstunden mit unterschiedlichen Fächern (Themen), die in einem größeren zeitlichen Abstand beobachtet werden, eine größere Variabilität der Klassenführung grundsätzlich erwartet werden kann.

Für weitere Analysen wäre es sinnvoll, anstatt als Analyseeinheiten jeweils 45 Minuten einer Doppelstunde zu verwenden, die Doppelstunde in mehrere Segmente (ähnlich Mashburn et al., 2014 bzw. Jentsch et al. 2019) zu unterteilen und die Klassenführung für verschiedene Oberflächenmerkmale (Lehrmethoden sowie konkrete Organisations- und Sozialformen) des Unterrichts zu erfassen (vgl. Gabriel-Busse und Lipowsky 2020). Im Unterschied zur Sekundarstufe zeichnet sich der Unterricht in der Grundschule durch eine höhere Methodenvielfalt bzw. durch eine Verbindung von eher lehrergelenkten mit offenen, selbstgesteuerten Unterrichtsphasen (Gabriel-Busse und Lipowsky 2020) aus. Es kann angenommen werden, dass in Phasen der Stationen‑, Projekt- oder Gruppenarbeit ein wesentlicher Teil der Klassenführung von der Lehrperson auf die Schüler/innen übertragen wird (Bohl und Kucharz 2010). Übergänge zwischen einzelnen Stationen würden dann beispielsweise von den Schüler/innen selbst initiiert werden und müssten im Vorfeld geregelt werden. Im Vergleich zu traditionellem Unterricht, der weniger anspruchsvolle Lehrmethoden einsetzt, müssen für Formen des selbstständigen oder kooperativen Lernens außerdem deutlich mehr Regeln eingeführt werden bzw. es wird ein flexibleres Regelsystem benötigt (zusf. Doyle 1986). Allgemein könnten durch die Erfassung von Zusammenhängen mit verschiedenen Oberflächenmerkmalen zusätzliche Varianzanteile von Beobachterratings zur Klassenführung erklärt werden (Jentsch et al. 2019; Patrick und Montzicopoulos 2016).

Aufgrund der Konfundierung von Schuljahr (1. vs. 2. Schuljahr) und Fach (Deutsch vs. Mathematik) können keine allgemeinen Schlussfolgerungen für die ersten beiden Schuljahre im Anfangsunterricht gezogen werden, ohne das jeweilige Fach zu berücksichtigen. Obwohl in der vorliegenden Studie das Sample so gewählt wurde, dass die Lehrpersonen beide Fächer gleichermaßen unterrichten, können Unterschiede in der Klassenführung auch vom fachlichen Lerninhalt abhängen. Wie Praetorius et al. (2016) ausführen, hat jedes Fach seine eigene Kultur, weswegen auch die Lehrkräftebildung in Fachdidaktiken organisiert ist. Zudem beeinflusst der jeweilige fachspezifische Inhalt die Wahl der Methoden (Prange 2011) und damit auch die Klassenführung. Aus diesem Grund sollte in weiteren Studien überprüft werden, zu welchen Anteilen die zeitstabile Varianz in den Klassenführungsmerkmalen auf das Schuljahr oder den fachlichen Kontext zurückzuführen ist. Studien für die Sekundarstufe zeigen, dass die Klassenführung, die eine Lehrperson in verschiedenen Fächern zeigt, ähnlich hoch ausgeprägt ist (Praetorius et al. 2016). Lehrpersonen scheinen demnach einmal ausgebildete Routinen in Bezug auf die Klassenführung über verschiedene fachliche Kontexte anzuwenden. Für die Grundschule stehen entsprechende Analysen aus.