Einleitung

Das Klassenmanagement bzw. die Klassenführung von (sportunterrichtenden) Lehrkräften gilt unbestritten als ein bedeutsamer Faktor eines guten (Sport‑)Unterrichts (Gettinger & Kohler, 2006; Heemsoth, 2014; Piwowar, 2013). In Anlehnung an ein integratives Kompetenzverständnis (Baumgartner, 2018a) ist davon auszugehen, dass die hier interessierende beobachtbare klassenführungsbezogene Performanz (klassenführungsbezogene Könnensleistungen) eine bedeutsame Kompetenzfacette des Kompetenzbereichs der Klassenführung darstellt.Footnote 1 Aus der vorliegenden Forschungsliteratur wird ersichtlich, dass die Klassenführung sehr unterschiedlich bestimmt und erfasst wird (z. B. Helmke, 2017). Mit der Zielsetzung, ein Beobachtungsinstrument für klassenführungsbezogene Performanzen von sportunterrichtenden Lehrkräften zu entwickeln, begrenzen wir uns im Folgenden auf solche Merkmale, die im Sportunterricht zu beobachten sind. Handlungen von sportunterrichtenden Lehrkräften, die in der Situation nicht direkt beobachtbar sind, da sie zu einem früheren Zeitpunkt eingeführt wurden oder aus dem Unterricht ausgelagert werden (z. B. Erstellung eines langfristigen Regelsystems; Helmke, 2017) bleiben im Folgenden unberücksichtigt. In Bezug auf diese engere Interpretation wird im folgenden Beitrag der Begriff der Klassenführung verwendet, der sich im Vergleich zum Ausdruck Klassenmanagement auf das im Sportunterricht beobachtbare klassenführungsbezogene Handeln beschränkt.

Obschon die Klassenführung von sportunterrichtenden Lehrkräften als ein relevanter Kompetenzbereich zu deuten ist (Baumgartner, 2013a; Baumgartner, Owassapian, & Perret Guldimann, angenommen; Heemsoth, 2014; Herrmann, Seiler, & Niederkofler, 2016), liegen keine empirisch validierten Beobachtungsinstrumente vor, mithilfe derer die Qualität der klassenführungsbezogenen Performanzen bei (angehenden) sportunterrichtenden Lehrkräften valide, reliabel und objektiv erfasst werden kann. Die Entwicklung derartiger Beobachtungsinstrumente erscheint als bedeutsam, weil diese u. a. die Grundlage zur Eruierung der Effektivität von hochschuldidaktischen Lehr-Lernarrangements darstellen (Baumgartner, 2017b). Der Einsatz von fachübergreifenden Beobachtungsinstrumenten ist nur bedingt möglich, weil die Klassenführung im Sportunterricht fachspezifische Eigenheiten aufweist (Cothran & Kulinna, 2015), die aus Validitätszwecken nicht unberücksichtigt bleiben sollten (vgl. Abschnitt „Zur Klassenführung im (Sport‑)Unterricht“). Der vorliegende Beitrag setzt hier an und zielt auf die Generierung eines Beobachtungsinstruments zur Erfassung der Qualität der klassenführungsbezogenen Performanzen bei (angehenden) sportunterrichtenden Lehrkräften (KlaPe-Sport) verschiedener Schulstufen. Der Fokus wird auf die Erhebung der klassenführungsbezogenen Performanzen – und beispielsweise nicht auf die Messung der Kompetenzfacette des klassenführungsbezogenen Wissens – gelegt, um eine ökologisch valide, verhaltensnahe und situierte Kompetenz- bzw. Performanzdiagnostik zu ermöglichen (Baumgartner, 2017a, 2018b).

Zur Klassenführung im (Sport‑)Unterricht

Klassenführung von (sportunterrichtenden) Lehrkräften umfasst die Gesamtheit unterrichtlicher Maßnahmen, die im Kern auf die Schaffung lernförderlichen Umgebungen abzielen, um sicherzustellen, dass kognitives, sozial-emotionales und motorisches Lernen möglich ist (Kulinna, Silverman, & Keating, 2000). Klassenführung verfolgt dabei keinen Selbstzweck, sondern ist als Mittel zur Förderung der Entwicklung der Schülerinnen und Schüler zu betrachten (Baumgartner, 2017b). Im Vergleich zu anderen Unterrichtsfächern weist der Sportunterricht jedoch fachspezifische Eigenheiten auf (z. B. Cothran & Kulinna, 2015; Oesterhelt, Gerlach, Grimminger-Seidensticker, & Friedrich, 2020): Aufgrund der geringen räumlichen Vorstrukturierung in der Sporthalle oder z. B. auf dem Sportplatz, bilden Organisations- und Ablaufformen in ihren Ausprägungen der Sozial‑, Raum‑, Zeit- und Materialordnung (Funke-Wieneke, 2007) eine zentrale Anforderung bei Herstellung und Erhalt des Unterrichtsrahmens. Des Weiteren ist die Qualität der Akustik häufig gering (Cothran & Kulinna, 2015; Wegener, Wegener, & Kastrup, 2012), es wird eine große Menge an Materialien (Groß- und Kleingeräte) benötigt und aufgrund der exponierten Stellung des Körpers spielen die physische und psychische Verletzbarkeit der Schülerinnen und Schüler (Miethling & Krieger, 2004) eine besondere Rolle, wodurch spezifische Sicherheits- bzw. organisatorische Maßnahmen ergriffen werden müssen. Diese Besonderheiten heben die Bedeutung der Klassenführung gerade für sportunterrichtenden Lehrkräften hervor, was auch in verschiedenen Studien bestätigt wird (Baumgartner, 2013b; Hill & Brodin, 2004). Dementsprechend lässt sich vermuten, dass die Klassenführung im Sportunterricht im Vergleich zu anderen Fächern nicht nur andersartig, sondern auch komplexer ist (Chepyator-Thomson & Liu, 2003).

Mit dieser Einordnung der Klassenführung in den Kontext von (Sport‑)Unterricht bleibt allerdings zunächst offen, welches Unterrichtsverständnis dem klassenführungsbezogenen Handeln zugrunde liegt. Im Zuge der Diskussion um ein sich wandelndes Lehr-Lernverständnis im Nachklang der großen Schulleistungsstudien scheint sich ein Konsens hinsichtlich bedeutsamer Unterrichtsmerkmale abzubilden (Reusser, 2011). Der Fokus richtet sich dabei vor dem Hintergrund eines sozialkonstruktivistischen Verständnisses von Unterricht und Lernen – im Sinne eines interaktiven, problemorientierten Prozesses gegenüber einem reproduktiven, rezeptiven Geschehen – verstärkt auf die Lernenden, die zu erwerbenden Kompetenzen sowie auf die kompetenzbezogenen Lernergebnisse (Baumberger, 2018; Reusser, 2011). Als bedeutsam werden u. a. eine individualisierte Lernbegleitung und das Vernetzen von Wissen und Können zur Gewährleistung (für das Fach Sport: erfahrungsgebundener) verständnisorientierter fachlicher Lernprozesse, die Berücksichtigung von Selbstorganisations- und Selbststeuerungsprozesse sowie die Reflexion lernzielbezogener Lernprozesse genannt (Schierz, 2013; Serwe-Pandrick, 2013). Diese Entwicklungen bringen auch neue Anforderungen an die Klassenführung mit sich. Weinstein (1999) spricht hier von einem neuen Paradigma hin zu einem Klassenmanagement, das die Bedürfnisse von Lernenden stärker mit einbezieht und dabei u. a. auch selbstständiges Lernen ermöglicht. Eine solche Öffnung von Unterricht ist dabei nicht per se mit einem weniger systematischen Vorgehen verknüpft. So verweisen Bohl und Kucharz (2010) darauf, dass die aktive Lernzeit auch im offenen Unterricht nicht automatisch einsetzt, sondern entsprechender Klassenführung bedarf und heben damit deren Bedeutung hervor. Unter Bezugnahme auf die Merkmale von Kounin (2006) zeigen sie dabei sowohl Gemeinsamkeiten als auch Unterschiede zur Klassenführung im klassischen lehrerzentrierten Unterricht auf. Systematische Überlegungen richten sich dabei deutlich stärker auf die Gestaltung der Lernorganisation und weniger der Instruktion. Diese etwas andere Charakteristik der Klassenführung im offenen Unterricht ist bislang allerdings noch wenig erforscht. Inwieweit die bis dato identifizierten Merkmale einer guten Klassenführung auch unter Berücksichtigung von Kontextbedingungen weiter zu spezifizieren und zu ergänzen sind, wird zukünftig noch zu klären sein (Haag, 2018). Dies gilt in ähnlicher Weise auch für Fragen der Notwendigkeit einer schulformspezifischen Klassenführung. Allerdings kann Weinert und Helmke (1997) zufolge gelingender Unterricht auf sehr unterschiedliche (situierte) Weise realisiert werden – wenngleich nicht auf beliebige. Ausgehen lässt sich demnach von grundlegenden Dimensionen, die trotz unterschiedlicher Unterrichtszugänge für die Unterrichtsqualität bedeutsam sind.

Hinsichtlich den weitreichenden Untersuchungen zur Thematik der Klassenführung geht hervor, dass eine erfolgreiche Klassenführung von Lehrkräften die Schulleistungen mit einem mittleren bis starken Effekt positiv beeinflusst (Hattie, 2009). Eine hohe Qualität der Klassenführung steht zudem in positiver Korrelation zur Aufmerksamkeit, zum Engagement und zur Motivation der Schülerinnen und Schüler (Oliver, Wehby, & Reschly, 2011), bewirkt weniger Unterrichtsstörungen (Kounin, 2006), fördert die sozioemotionale Kompetenz der Schülerinnen und Schüler und führt in der Berufseinstiegsphase zu einem geringeren Belastungsempfinden der Lehrkräfte (Dicke, Ellig, Schmeck, & Leutner, 2015). Schwierigkeiten in der Realisierung einer guten Klassenführung stehen in positiver Korrelation zur Arbeitsunzufriedenheit und zum Burnout-Syndrom von Lehrkräften (Brouwers & Tomic, 2000). Entsprechende Erkenntnisse liegen auch für sportunterrichtende Lehrkräfte vor, in denen ein positiver Zusammenhang zwischen Klassenführung und der Qualität der LehrerInnen-SchülerInnen- sowie der SchülerInnen-SchülerInnen-Beziehung nachgewiesen werden konnte (Heemsoth, 2014). Des Weiteren wurde festgestellt, dass sportunterrichtende Lehrkräfte die Klassenführung zwar als relevant, jedoch auch als herausfordernd und belastend bewerten (Baumgartner, 2013a). Die Klassenführung wird in der Ausbildung von sportunterrichtenden Lehrkräften offensichtlich nur wenig berücksichtigt, worauf auch die Studienergebnisse von Lavay, Henderson, French und Guthrie (2012) verweisen. Aus ihrer Untersuchung geht hervor, dass die Dozierenden von 134 untersuchten Ausbildungsstätten der Meinung sind, dass die Klassenführung ein relevanter Faktor des Sportunterrichts ist. Aus der Studie wird jedoch erkennbar, dass diesbezüglich nur sechs Institutionen Kurse im Bereich der Klassenführung anbieten. Der geringe Stellenwert der Klassenführung in der Ausbildung von sportunterrichtenden Lehrkräften wird auch in anderen Studien bestätigt (Garrahy, Cothran, & Kulinna, 2005; Hill & Brodin, 2004).

Qualitätsdimensionen einer guten Klassenführung im (Sport‑)Unterricht

Das Konstrukt der Klassenführung wird in verschiedenen Forschungsbeiträgen durch unterschiedliche latenten Variablen erhoben (z. B. Kounin, 2006; Piwowar, 2013). Latente Variablen sind als Qualitätsdimensionen zu deuten, die durch manifeste Variablen (Items) erfasst werden. Im Folgenden werden latente Variablen dargestellt, welche aus der fachübergreifenden oder fachspezifischen Forschung extrahiert, an das Fach Sport angepasst oder neu generiert wurden. Sie bilden grundlegend ab, was wir unter der Begrifflichkeit der Klassenführung verstehen. Die im Folgenden dargestellten latenten Variablen basieren vor dem Hintergrund eines sozialkonstruktivistischen Lehr-Lernverständnis (vgl. Abschnitt „Zur Klassenführung im (Sport‑)Unterricht“) auf dem derzeitigen Stand zentraler, empirischer Erkenntnisse der Klassenführung, die sich in vorliegenden fachübergreifenden wie fachspezifischen Forschungsarbeiten als bedeutsam für einen lernwirksamen (Sport‑)Unterricht erwiesen haben.

Die latente Variable Klarheit von Ansagen beinhaltet, wie deutlich und verständlich die Lehrkräfte die unterrichtlichen Zielsetzungen sowie Aufgaben, Übungen und weitere Unterrichtsschritte in Form von Ansagen, Fragen, Anregungen kommunizieren (Piwowar, 2013). Studien bestätigen, dass diese Variable in positiver Korrelation zu den Schulleistungen, der Zufriedenheit sowie zum Engagement der Schülerinnen und Schülern steht (Fendick, 1990; Hines, Cruickshank, & Kennedy, 1985). Mit der latenten Variablen Gruppenmobilisierung wird zum Ausdruck gebracht, dass eine Lehrkraft immer eine Gruppe vor sich hat und dafür Sorge tragen muss, dass sich möglichst viele Schülerinnen und Schüler gleichzeitig mit Lernaufgaben auseinandersetzen. Dabei geht es darum, die Klasse als Ganzes in den Unterricht mit einzubeziehen und allen Schülerinnen und Schülern Verantwortung für den Lernprozess zu übertragen, damit sie sich möglichst lange und intensiv mit den Inhalten befassen (Kounin, 2006). Dies gilt auch für diejenigen, die nicht motorisch aktiv mit der Aufgabe beschäftigt sind. Gerade im Sportunterricht ist diese Variable zentral, da in Bewegungsphasen aufgrund der räumlichen und materiellen Bedingungen nicht immer alle Schülerinnen und Schüler gleichzeitig motorisch aktiv sein können. Zudem wird im Sportunterricht häufig selbstständig in Kleingruppen an verschiedenen Stationen gearbeitet, an denen die Lehrkraft nicht überall präsent sein kann, sodass die Verantwortung für den Lernprozess auf die Gruppe übertragen werden muss. Mit der latenten Variable reibungslose Übergänge geht es um eine knappe und eindeutige Überleitung zwischen verschiedenen Unterrichtsphasen. Studien zeigen, dass der Gestaltung von reibungslosen Übergängen ein relevanter Stellenwert zukommt, weil dadurch die aktive Lernzeit erhöht und unterrichtsfernes Verhalten der Schülerinnen und Schüler vermieden werden können (Kounin, 2006). Insbesondere im Sportunterricht mit seinen besonderen Organisationsformen, wo zudem eine große Menge an Materialien benötigt wird, sind reibungslose Übergänge ein relevanter Faktor der Klassenführung (Cothran & Kulinna, 2015). Als fachspezifische latenten Variable gilt der Aspekt Sicherheit, der im Sportunterricht im Vergleich zu anderen Fächern eine hohe Bedeutung zukommt (Wolters & Kemna, 2011). Dies bestätigen auch tätige Lehrkräfte, die diesem Aspekt im Sportunterricht eine vorrangige Stellung zuschreiben (Baumgartner, 2013a). Mit dieser Variable werden alle Maßnahmen eingeordnet, mit denen die sportunterrichtenden Lehrkräfte die physische Sicherheit der am Unterricht teilnehmenden Personen gewährleisten. Eine weitere fachspezifische latente Variable, die Performanztransparenz, greift die Exposition der Lernenden durch die körperliche Aktivität in der Gruppe auf. So wird im Sportunterricht in der Regel direkt sichtbar, was Lernende können oder auch nicht können (Baumgartner, 2013a; Miethling & Krieger, 2004). Im Sinne der psychischen Sicherheit (ebd.) und im Sinne des moralischen Verpflichtungsaspekts der Fürsorglichkeit (Oser, 1998) sollten sportunterrichtende Lehrkräfte u. a. organisatorische Maßnahmen ergreifen, damit sich die Lernenden im Sportunterricht nicht fortwährend ausgestellt fühlen. Dabei geht es um alle Maßnahmen, die helfen, eine zur Schau gestellte Körperlichkeit (z. B. Bewegungsdemonstrationen) auf ein vertretbares Maß zu reduzieren, um schamauslösende oder demütigende Situationen zu vermeiden (Klinge, 2009; Wiesche, 2013). Ein weiteres Spezifikum des Sportunterrichts ist der größere Bedarf an Großgeräten, Kleingeräten (z. B. Bälle) sowie weiterer Unterrichtsmaterialien (z. B. Videos, Flipchart etc.). Die latente Variable Materialnutzung umfasst entsprechend alle Maßnahmen zur sachgerechten und sicherheitsgemäßen Bereitstellung der Großgeräte, Kleingeräte und Unterrichtsmaterialien sowie deren dem Unterrichtsverlauf und dessen Zielsetzung angemessenen Einsatzes (Cothran & Kulinna, 2015). Um sicherzustellen, dass Ansagen auch verstanden werden, ist Aufmerksamkeit seitens der Schülerinnen und Schüler bedeutungsvoll. Dies erfordert ebenfalls eine entsprechende Klassenführung, die mit der latenten Variable Umgang mit Störungen in Verbindung gebracht wird (Heemsoth, 2014). Dabei lassen sich unter Störungen all die Ereignisse einordnen, die verhindern, dass die zur Verfügung stehende Lernzeit optimal genutzt werden kann (Bohl & Kucharz, 2010). Unterrichtsstörungen sind dabei immer ein „Ergebnis subjektiv empfundener und bewerteter Momentaufnahmen“ (Pfitzner & Schoppek, 2000, S. 350) und sind in einen Interaktionsprozess eingebettet, der durch intrapersonale und soziokulturelle Bedingungen geprägt wird. Dies verweist auf eine Vielzahl an Umgangsmöglichkeiten, die situativ sehr unterschiedlich sein können. Studien zeigen auf, dass ein frühzeitiges Eingreifen und beiläufiges Intervenieren geeignete Strategien sein können, Unterrichtsstörungen zu vermeiden. Dabei ist auch darauf zu achten, Schülerinnen und Schüler nicht bloßzustellen (Emmer, Evertson, & Worsham, 2003). Die latente Variable Momentum verweist auf einen sich kontinuierlich weiterentwickelnden, an die Bedürfnisse angepassten Unterrichtsverlauf, bei dem es auch innerhalb der Unterrichtsphasen zu keinen langatmigen, themenbezogen irrelevanten Verzögerungen kommt. Eine solche Klassenführung steht in einem positiven Zusammenhang zum Engagement der Schülerinnen und Schüler sowie in negativer Korrelation mit Unterrichtsstörungen (Kounin, 2006). Diese Variable lässt sich als Unterrichtsfluss beobachten, in dem der inhaltlich-thematische Bogen durch die Vermeidung von Verzögerungen erhalten bleibt. Das Monitoring umschreibt eine Klassenführung, in der die Lehrkraft alle Ereignisse im Blick hat und dies den Schülerinnen und Schülern signalisiert (Casale, Strauß, Hennemann, & König, 2016). Festgestellt wurde, dass ein gutes Monitoring, bei der die Lehrkraft die Gruppe als Ganzes im Blick hat ohne die einzelnen Schülerinnen und Schüler aus den Augen zu verlieren, die Mitarbeit der Lernenden erhöht und aversive Handlungen verringert (Gettinger & Kohler, 2006; Kounin, 2006). Die latente Variable Überlappung charakterisiert die Fähigkeit des Multitaskings, die sich darin zeigt, dass die Lehrkraft in der Lage ist, auf mehrere handlungsauffordernde Situationen gleichzeitig reagieren zu können. Dabei kann es beispielsweise darum gehen, Verständnisschwierigkeiten, Ablaufprobleme oder aufkommende Sicherheitsproblematiken nebenbei zu beheben, ohne den Unterrichtsfokus zu verlieren. Aus den Forschungsbefunden geht hervor, dass ein guter Umgang mit überlappenden Ereignissen zu weniger aversiven Handlungen und zu einem höheren Engagement der Schülerinnen und Schüler führt (Kounin, 2006). Es geht dabei um die hohe Bedeutung einer adäquaten und unmittelbaren Reaktion auf gleichzeitig stattfindende Geschehnisse.

Fragestellung und Methode

Vor dem Hintergrund der in den vorhergehenden Abschnitten wird im vorliegenden Beitrag die folgende Fragestellung bearbeitet: Welche theoretisch abgeleiteten latenten (und manifesten) Variablen erweisen sich für die Erfassung klassenführungsbezogener Performanzen bei (angehenden) sportunterrichtenden Lehrkräften als inhaltlich sowie empirisch valide?

Um diese Fragestellung bearbeiten zu können, wurde eine dreistufige Vorgehensweise gewählt, in welcher sowohl qualitative als auch quantitative Verfahren zum Einsatz kamen (Mixed-methods-Vorgehensweise). Im Folgenden werden das Vorgehen, die Stichproben, das Raterinnen- und Ratertraining sowie das Datenanalysenverfahren dargestellt.

Dreistufige Untersuchungsdurchführung

In einem ersten Schritt wurden auf der Grundlage einer fachübergreifenden sowie fachspezifischen Literatur- und Instrumentenanalyse der Forschungsstand zur Klassenführung zusammengefasst und relevante latente Variablen sowie hochinferente manifeste Variablen zu einer guten Klassenführung im Fach Sport abgeleitet bzw. neu generiert (u. a. Cothran & Kulinna, 2015; Heemsoth, 2014; Kounin, 2006; Piwowar, 2013). Das aus diesem Prozess resultierende Manuskript wurde im Projektteam in einem diskursiven Prozess, der mehrfach wiederholt wurde, überarbeitet und weiterentwickelt. Ziel dieses Vorgehens war die Erarbeitung eines Manuskripts, das den aktuellen Forschungsstand zusammenfasst und das vorläufige Beobachtungsinstrument darlegt. Das resultierende Beobachtungsinstrument bestand aus 10 latenten Variablen (s. Abschnitt „Qualitätsdimensionen einer guten Klassenführung im (Sport‑)Unterricht“) und 55 manifesten Variablen.

Zur inhaltlichen Validierung des Beobachtungsinstruments wurde in einem zweiten Schritt am Projektstandort der PH St.Gallen (CH) eine Delphi-Runde (Heinzer & Baumgartner, 2013) durchgeführt. Hierzu wurde den teilnehmenden 8 Expertinnen und Experten vor der Durchführung das vorliegende Manuskript zur Bearbeitung zugestellt. In der fünfstündigen Delphi-Runde wurden die Ziele des Forschungsprojekts vorgestellt, der aktuelle Forschungsstand dargelegt, die Variablen erläutert und offene Fragen geklärt. Folgend wurden die hergeleiteten Variablen in einem offenen Diskurs besprochen. Unklare manifeste Variablen wurden inhaltlich überarbeitet, redundante gestrichen und neue generiert. Das Beobachtungsinstrument bestand nach diesem Prozess aus 10 latenten und 40 manifesten Variablen.

Zur empirischen Validierung des Beobachtungsinstruments wurde in einem dritten Schritt ein hochinferentes fremdbestimmtes Beurteilungsverfahren durchgeführt, d. h. die Qualität der klassenführungsbezogenen Performanzen einer sportunterrichtenden Lehrkraft wurde mittels des vorliegenden Beobachtungsinstruments durch wissenschaftliche Mitarbeitende und Hilfskräfte beurteilt. Die Qualität der Klassenführung wurde dabei anhand von 166 Unterrichtsstunden bei 91 angehenden und tätigen sportunterrichtenden Lehrkräften verschiedener Schulstufen (w. = 46; m. = 45; Alter: m = 37,48, SD = 12,79, Range = 21–64 Jahre) beurteilt. Da wir davon ausgehen, dass die dargelegten Variablen unabhängig von der Schulstufe bedeutsame Qualitätsdimensionen eines guten Sportunterrichts darstellen, wurden die Daten stufenübergreifend erhoben. Die Datengrundlage stellten zum einen 49 Unterrichtsvideos (à 45 min) von 25 angehenden sportunterrichtende Lehrkräften der Berufsfachschule dar, welche als Lehrgang im Jahr 2013 an der Eidg. Hochschule für Sport Magglingen (EHSM; CH) ihre Ausbildung zur Sportlehrkraft absolvierten (w. = 8; m. = 17; Alter: m = 24,20 Jahre, SD = 2,90; Range = 20–33 Jahre).Footnote 2 Zum anderen wurden 117 Unterrichtsstunden von 66 tätigen sportunterrichtenden Lehrkräften im Feld beurteilt (w. = 38; m. = 28; Alter: m = 43,91, SD = 10,08, Range = 26–64 Jahre). Dazu wurden 29 Unterrichtsstunden von 17 sportunterrichtenden Lehrkräften der Primarstufe (w. = 15; m. = 2; Alter: m = 44,18, SD = 7,97, Range = 35–60 Jahre), 10 Unterrichtsstunden von 5 sportunterrichtenden Lehrkräften der Sekundarstufe I (w. = 3; m. = 2; Alter: m = 46,20, SD = 6,06, Range = 38–54 Jahre; jeweils Projektstandort der PH Ludwigsburg (D)) sowie 78 Unterrichtsstunden von 44 sportunterrichtenden Lehrkräfte der Sekundarstufe II (w. = 20; m. = 24; Alter: m = 43,39, SD = 11,47, Range = 26–64 Jahre; Projektstandort der PH St.Gallen) beobachtet. Folglich wurden die klassenführungsbezogenen Performanzen der (angehende) sportunterrichtenden Lehrkräfte anhand des Beobachtungsinstruments teilweise doppelt beurteilt. Dies war notwendig, weil für die vorliegende Studie nicht genügend Schulen gewonnen werden konnten, um jede (angehende) sportunterrichtende Lehrkraft lediglich einmal zu beurteilen. Die Daten sind dementsprechend nicht unabhängig zu deuten. Weil die doppelt beurteilten (angehenden) Lehrkräfte jedoch jeweils unterschiedliche Inhalte in unterschiedlichen Klassen unterrichteten, wurden die Daten trotz der abhängigen Datenstruktur zur Validierung des Beobachtungsinstruments verwendet.

Stichprobe der Expertinnen und Experten der Delphi-Runde sowie der Raterinnen und Rater zur empirischen Validierung des Beobachtungsinstruments

Die Expertinnen und Experten des Faches Sport, die an der Delphi-Runde teilgenommen haben, wurden anhand der folgenden drei Kriterien ausgewählt: Sie mussten a) über ein Diplom als Lehrkraft verfügen bzw. das zweite Staatsexamen bestanden haben, b) als sportunterrichtende Lehrkraft arbeiten oder gearbeitet haben sowie c) in der Ausbildung tätig sein. Hierdurch sollte sichergestellt werden, dass die Variablen sowohl aus theoretischer als auch aus unterrichtspraktischer Perspektive beurteilt werden können (Baumgartner, 2018b). Es wurden 15 Fachdidaktikerinnen und Fachdidaktiker, die diese Kriterien erfüllen, angefragt, an der Delphi-Runde teilzunehmen, wovon sich zwei Fachdidaktikerinnen und sechs Fachdidaktiker beteiligten. Der Altersdurchschnitt lag bei 42,50 Jahren (SD = 7,69), die Altersspanne reichte von 34 bis 54 Jahren. Sie realisieren durchschnittlich seit 10,38 Jahren (SD = 5,26) hochschulischen Unterricht und lehren 7,5 h pro Woche (SD = 4,54).

Hinsichtlich der empirischen Validierung des Beobachtungsinstruments konnten 4 wissenschaftliche Mitarbeitende sowie 2 wissenschaftliche Hilfskräfte als Raterinnen und Rater gewonnen werden (w. = 2; m. = 4). Der Altersdurchschnitt lag bei 30,17 Jahren (SD = 4,49) und die Altersspanne reichte von 23–37 Jahren. Die wissenschaftlichen Mitarbeitenden verfügen alle über ein Lehrdiplom der Sekundarstufe II (n = 4), die wissenschaftlichen Hilfskräfte verfügen über einen BA Grundschullehramtsabschluss (n = 1) bzw. befanden sich in der Abschlussphase zum Erwerb des 1. Staatexamens für die Sekundarstufe I (n = 1) und haben bereits ihr Praxissemester absolviert.

Raterinnen‑/Ratertraining und Datenerhebung

Eine notwendige Voraussetzung zur empirischen Validierung des Beobachtungsinstruments stellt eine hohe absolute Übereinstimmung bzw. eine hohe Interraterreliabilität der Ratenden dar. Dies bedingt, dass die Ratenden ein präzises Verständnis über die Qualitätskriterien (Variablen) sowie die Qualität der Merkmalsausprägungen hinsichtlich der manifesten Variablen (vierstufige Likert-Skala mit den verbalen Markern: 0 = „trifft nicht zu“; 1 = „trifft eher nicht zu“; 2 = „trifft eher zu“; 3 = „trifft zu“) erlangen (Wirtz & Caspar, 2002), was in vorliegender Studie durch ein Ratendentraining realisiert wurde.Footnote 3 Im Rahmen des Trainings wurde den Teilnehmenden in einem ersten Schritt vor der Durchführung des Trainings das Manuskript und das inhaltlich validierte Beobachtungsinstrument zur Verarbeitung zugestellt. Im Training, das ca. 4 h dauerte, wurden in einem zweiten Schritt die Ziele des Forschungsprojekts vorgestellt, die Variablen erläutert, die Merkmalsausprägungen thematisiert und offene Fragen geklärt. In einem dritten Schritt haben jeweils zwei Raterinnen und Rater unter Berücksichtigung des Beobachtungsinstruments ein erstes (stufenbezogenes) Unterrichtsvideo von (angehenden) sportunterrichtenden Lehrkräften in einem offenen Diskurs geratet.Footnote 4 Die jeweiligen Urteilsabweichungen wurden innerhalb des Ratingteams besprochen und Fragen durch die Verantwortlichen der Projektstandorte geklärt. In einem vierten Schritt wurden in den Ratendenteams jeweils unabhängig voneinander zwei weitere Videos geratet, Urteilsabweichungen aufgegriffen und die Beurteilung vor dem Hintergrund des geführten Diskurses angepasst (Konsensurteil). In einem fünften Schritt wurden offene Fragen geklärt. Schritt vier und fünf fanden am Projektstandort der PH Ludwigsburg während der ersten Beobachtung im Feld statt.

Die 49 Unterrichtsvideos der angehenden sportunterrichtenden Lehrkräfte der Berufsfachschule wurden im Rahmen eines hochinferenten fremdbestimmte Beurteilungsverfahren am Projektstandort der PH St.Gallen durch eine Raterin und einen Rater unabhängig voneinander gescort („double scoring“). Die Datenerhebung im Feld fand am Projektstandort der PH St.Gallen an drei Berufsfachschulen und zwei Gymnasien statt. Die Datenerhebung im Feld am Projektstandort der PH Ludwigsburg fand an zwei Grundschulen und einer Sekundarschule I statt. Die Ratenden beurteilten die klassenführungsbezogenen Performanzen der videografierten angehenden und der unterrichtenden Lehrkräfte während der Beobachtung und setzten am Ende der Lektion die jeweiligen variablenbezogenen Qualitätsausprägungen. Um die Güte der Beurteilung der Ratenden quantifizieren zu können, wurden die 49 Unterrichtsvideos sowie 12 Unterrichtsstunden im Feld jeweils durch zwei Ratende beurteilt („double scoring“). Die personenbezogenen Daten der Lehrkräfte wurden nach der Stunde mittels Fragebogen erhoben. Hinsichtlich der Videografie wurde das Einverständnis der Schulleitung mündlich sowie der angehenden sportunterrichtenden Lehrkräfte und der Schülerinnen und Schüler schriftlich eingeholt. In den Beobachtungen im Feld wurde das Einverständnis der Schulleitung, der Lehrkräfte und der Schülerinnen und Schüler mündlich eingeholt.

Datenanalyseverfahren

Um die absolute Übereinstimmung der Ratendenurteile des Beobachtungsverfahrens quantifizieren zu können, wurden die prozentuale Übereinstimmung (P) und das Übereinstimmungsmaß Cohens Kappa (ҡ) berechnet. Die Güte der Interraterreliabilität wurde anhand des Reliabilitätskoeffizienten ICC eruiert. Zur Überprüfung der Qualität des postulierten reflexiven Modells im Sinne eines hypothetischen Konstrukts wurde das strukturentdeckende Verfahren der explorativen Faktorenanalyse bzw. die Hauptkomponentenanalyse (HKA) mit Promax-Rotation durchgeführt (IBM SPSS 23). Auf der Grundlage einer Inter-Item-Korrelation wird mit diesem multivariaten Verfahren überprüft, welche Qualität die Zusammenhänge zwischen den manifesten und den latenten Variablen aufweisen. Es wurde die HKA angewandt, weil durch dieses datenreduzierende Verfahren ein möglichst ökonomisches Beobachtungsinstrument generiert werden soll (Bühner, 2011). Diesbezüglich wurden manifeste Variablen ausgeschlossen, welche eine geringe Faktorenladung (λ < 0,50), einen geringen Kommunalitätswert (h2 < 0,60) oder einen geringen korrigierten Trennschärfekoeffizient (rit(i) < 0,30) zeigten (Bühner, 2011). Zur Quantifizierung der Güte der latenten Variablen wurde der Kaiser-Mayer-Olkin-Test (KMO-Test) sowie der Barlett-Test durchgeführt. Die interne Konsistenz wurde mit der Berechnung des Cronbachs Alpha (α) quantifiziert. Die empirische Extraktion der latenten Variablen wurde in Anlehnung an das Kaiser-Gutmann-Kriterium realisiert. Zur Überprüfung der Qualität des reflexiven Modells wurde das strukturüberprüfende Verfahren der konfirmatorischen Faktorenanalyse (KFA) durchgeführt (IBM SPSS Amos 23, New York). Dabei sollte nach MacCallum und Widaman (1999) das Verhältnis der Items zur Stichprobengröße 1:5 nicht unterschritten werden, was in vorliegender Studie eingehalten werden kann. Die Güte des Messmodells wurde mittels Maximum-Likelihood-Methode (ML) geschätzt. Im ML-verfahren werden die Populationsparameter der vorliegenden Datenstruktur geschätzt bzw. es wird die Wahrscheinlichkeit überprüft, ob das Modell in einer Grundgesamtheit gilt (Rost, 2004). Diesbezüglich wurde die Bootstrap-Methode mit 1000 Iterationen angewandt, d. h. es wurde in Bezug auf das proklamierte Messmodell 1000-mal weitere Stichproben gezogen, um das Modell zu überprüfen (Chernick, 2008). Fehlende Werte wurden mit der FIML-Technik bearbeitet und dadurch direkt in der Parametereinschätzung ersetzt (Weiber & Mühlhaus, 2010). Zur Bewertung der Güte des Modells wurde die Fit-Indizes (RMSEA, CFI, SRMR, χ2/df) berechnet.Footnote 5 Um die Reliabilität der Konstruktmessung quantifizieren zu können, werden die Faktorreliabilitäten (Rel) berichtet.Footnote 6

Darstellung der Ergebnisse

Hinsichtlich der empirischen Validierung wurde in einem ersten Schritt die HKA auf mehrfaktorieller Ebene durchgeführt. Die latente Variable Performanztransparenz musste dabei ausgeschlossen werden, weil diese Dimension im Sportunterricht nur bei 33,32 % der Beobachtungen beurteilt wurde und die Variable aufgrund des hohen Anteils an fehlenden Werten (N > 10 %; Weiber & Mühlhaus, 2010) zur Berechnungen nicht weiterverwendet werden konnte. Aufgrund einer zu geringen Faktorenladung (λ < 0,50), einem zu geringen Kommunalitätswert (h2 < 0,60) oder einem zu geringen Trennschärfekoeffizient (rit(i) < 0,30) musste von den inhaltlich validierten 40 manifesten Variablen 13 ausgeschlossen werden. Der Anteil fehlender Werte bezüglich der validierten 27 manifesten Variablen ist gering (4,8 %; Weiber & Mühlhaus, 2010), weshalb die Daten zur weiteren Berechnung verwendet werden konnten. Aus der HKA geht eine 9‑faktorielle Lösung hervor (vgl. Tab. 1). Die 9 latenten Variablen erklären insgesamt 78,14 % der Gesamtvarianz. Die Kennwerte sind als zufriedenstellend bis gut zu bezeichnen (KMO = 0,78, Barlett = 0,000, α = 0,87). Die verbleibenden 27 manifesten Variablen weisen gute Faktorladungen (0,69 ≤ λ ≤ 0,97) sowie befriedigende Kommunalitätswerte (0,60 ≤ h2 ≤ 0,86) auf.

Tab. 1 Faktorladungen und Kommunalitätswerte der explorativen Faktorenanalyse (HKA mit Promax-Rotation)

Zur Überprüfung des Messmodells wurde die konfirmatorische Faktorenanalyse (KFA) durchgeführt. Die Fit-Indizes der 9‑faktoriellen Lösung weisen auf akzeptable bis hohe Güte hin (N = 166; χ2 = 482,50, df = 288, χ2 / df = 1,68, SRMR = 0,07, CFI = 0,91, RMSEA = 0,06). Damit konnte das proklamierte Modell auf der Grundlage der vorliegenden Daten validiert werden (vgl. Abb. 1). Aufgrund der geringen Faktorinterkorrelationen (0,00 ≤ Φ ≤ 0,48) wird von einer Überprüfung eines Messmodells zweiter Ordnung abgesehen, d. h. es kann keine latente Variable zweiter Ordnung gebildet werden, der mehrere latente Variablen erster Ordnung (z. B. Monitoring) subsumiert werden können.Footnote 7

Abb. 1
figure 1

Konstrukt klassenführungsbezogene Performanzen im Fach Sport – 9‑faktorielles Messmodell – konfirmatorische Faktorenanalyse

Um die Güte der Urteile der Ratenden quantifizieren zu können, wurden die absolute Übereinstimmung (P, ҡ) bzw. die Interraterreliabilität (ICCeinfach, zuf.) bezüglich der empirisch validierten 27 manifesten Variablen berechnet. Dabei wurden 49 Unterrichtsvideos sowie 12 Unterrichtsstunden in vivo doppelt gescort. Die Ergebnisse weisen auf eine gute bis exzellente Raterübereinstimmung bzw. Raterreliabilität (P = 0,69; ҡ = 0,50; ICCeinfach, zuf.. = 0,80; F[1, 1647] = 4,77, p < 0,001). Zusammenfassend kann festgehalten werden, dass mit dem vorliegenden Datensatz ein multidimensionales, 9‑faktorielles Beobachtungsinstrument zur Erfassung der klassenführungsbezogenen Performanzen von sportunterrichtenden Lehrkräften validiert werden konnte.

Aus den Ergebnissen lassen sich unter Berücksichtigung der empirischen Lösung (vgl. Abb. 1) die postulierten 9 latenten Variablen extrahieren. Das arithmetische Mittel (M) der validierten latenten Variablen bzw. der manifesten Variablen liegt zwischen 2,00 und 2,63 (0,54 ≤ SD ≤ 0,69). Das Cronbachs Alpha (0,78 ≤ α ≤ 0,88) sowie die Faktorreliabilität (0,79 ≤ Rel ≤ 0,88) weisen auf zufriedenstellende Koeffizientwerte (vgl. Tab. 2).

Tab. 2 Empirisch validiertes multidimensionales Beobachtungsinstrument KlaPe-Sport

Diskussion

Beantwortung der Fragestellung

In der vorliegenden Studie wurde die Entwicklung und die empirische Validierung eines multidimensionalen Beobachtungsinstruments zur Erfassung der Qualität der klassenführungsbezogenen Performanzen von sportunterrichtenden Lehrkräften dargelegt (KlaPe-Sport). Vor dem Hintergrund der fachübergreifenden und fachspezifischen Forschungsbeiträge, aus der Realisierung einer Delphi-Runde sowie der empirischen Überprüfung des generierten Modells ging ein 9‑faktorielles reflexives Messmodell hervor, das aus 27 manifesten Variablen besteht. Die 9‑faktorielle Lösung weist einen ausreichenden bis guten Modell-Fit auf. Die Berechnung der absoluten Raterinnen- und Raterübereinstimmung sowie der Interraterreliabilität zeigten gute bis exzellente Kennwerte. Dementsprechend kann festgehalten werden, dass die faktorielle Validität sowie die Reliabilität des KlaPe-Sport-Beobachtungsinstruments eine ausreichende bis hohe Güte aufweisen.

Das validierte Modell unterscheidet sich dabei von anderen Rahmenmodellen zum hier thematisierten Bereich der Qualität der Klassenführung. So legt Piwowar (2013) ein fachübergreifendes Beobachtungsinstrument vor, welches aus einer Struktur zweiter Ordnung besteht. Dabei werden verschiedene latente Variablen den drei Variablen zweiter Ordnung Management der Instruktion, Management von Schülerinnen- und Schülerverhalten, Management der Lehrer-Schüler-Beziehung subsumiert. Für das vorliegende fachspezifische Beobachtungsinstrument ergibt sich hingegen eine Lösung erster Ordnung, weil aus Daten eine Struktur zweiter Ordnung nicht generiert werden kann. Neben den fachspezifischen Unterschieden werden außerdem, im Vergleich zu dem auf Instruktion und Regulierung des Schülerverhaltens basierenden Modell von Piwowar (ebd.), Gestaltungsaspekte unterstützender Lehr-Lernsituationen stärker berücksichtigt. In jüngster Zeit haben auch Linka und Gerlach (2019) im Kontext der Erstellung von Selbsteinschätzungsbögen zum Klassenmanagement im Sportunterricht aus Lehrer‑/Lehrerinnen- sowie Schüler- und Schülerinnensicht ein Rahmenmodell zum Klassenmanagement vorgelegt, dessen empirische Überprüfung bislang noch aussteht.Footnote 8 Auch in diesem fachspezifischen Zugang basiert die Strukturierung des Konstrukts, wie auch bei Piwowar (2013), auf einem stärker lehrerorientierten Fokus. Das vorgeschlagene Rahmenmodell richtet sich zudem auf den weiter gefassten Begriff des Klassenmanagements (vgl. Abschnitt „Einleitung“). In Abgrenzung dazu wurde in vorliegender Studie ein Instrument generiert, womit die beobachtbare Klassenführung, d. h. die diesbezüglichen Performanzen von Lehrkräften, erfasst werden kann.

Limitationen

Die empirische Validierung des Beobachtungsinstruments wurde in der vorliegenden Studie stufenübergreifend realisiert. Es kann davon ausgegangen werden, dass die generierten Merkmale einer guten Klassenführung im Fach Sport in allen Schulstufen eine hohe Relevanz aufweisen. Ein stufenbezogener Vergleich des Messmodells steht allerdings noch aus, um diese Annahme zu stützen. Bedeutsam scheint außerdem eine weiterführende Überprüfung des Instruments hinsichtlich seiner Eignung, die Qualität von Klassenführung auch bei differenten methodisch-didaktischen Zugängen zu erfassen. Ebenfalls eine zukünftige Betrachtung verdient der Umstand, dass eine latenten Variablen (Performanztransparenz) trotz inhaltlicher Validität in der empirischen Überprüfung ausgeschlossen werden musste. In methodischer Hinsicht ist erwähnenswert, dass die vorliegende Studie auf einem abhängigen Datensatz basiert, d. h. (angehende) sportunterrichtenden Lehrkräfte wurden doppelt gescort. Da die doppelt beobachteten (angehenden) sportunterrichtenden Lehrkräfte jedoch in unterschiedlichen Klassen verschiedene Inhalte unterrichteten, wurden die Daten trotz der abhängigen Datenstruktur verwendet.

Fazit und Ausblick

Das validierte Beobachtungsinstrument KlaPe-Sport stellt eine Grundlage dar, um die Qualität der klassenführungsbezogenen Performanzen von (angehenden) sportunterrichtenden Lehrkräften erfassen zu können. Im Konkreten wird dadurch ermöglicht, dass die Qualität der Klassenführung im Sportunterricht anhand der instrumentbezogenen manifesten Variablen und den diesbezüglichen Merkmalsausprägungen beurteilt wird. So lassen sich mit dem Instrument beispielsweise Studien durchführen, welche die Effektivität von hochschuldidaktischen Lehr- und Lernarrangements hinsichtlich des Performanzfortschritts bei (angehenden) sportunterrichtenden Lehrkräften untersuchen. Des Weiteren erscheinen vor dem Hintergrund eines integrativen Kompetenzverständnisses (Baumgartner, 2018a) Untersuchungen erstrebenswert, mithilfe derer der Zusammenhang zwischen der Qualität des klassenführungsbezogenen Wissens, der Wahrnehmungs‑, Interpretations- und Entscheidungsfähigkeiten sowie der Qualität der Performanz erhellt wird. Auch hierbei kann das entwickelte Beobachtungsinstrument einen wichtigen Beitrag leisten, indem es im Vergleich zu Selbsteinschätzungsverfahren eine auf intersubjektiven Fremdbeurteilungsverfahren beruhende, ökologisch validere Erhebung der Performanz ermöglicht.