1 Einleitung

Die Feststellung, dass Unterrichtsprozesse bedeutende Ursachen für die Entwicklung von Schülerkompetenzen darstellen, erscheint trivial. Es ist allerdings erst in jüngeren Jahren gelungen mit Bezug auf Forschungsbefunde aus Large Scale Studien die zentrale Bedeutung der Schulklasse und des Unterrichts für die Entwicklung der Schüler/innen hervorzuheben: „Classrooms are more often than not the greatest source of variation in what students learn and gain as a function of attending school“. (Pianta und Hamre 2009, S. 109) Umfangreiche Kataloge zu Merkmalen von Unterrichtsqualität (bspw. Hattie 2009; Helmke 2009; Meyer 2004), die Ergebnisse der Prozess-Produkt-Forschung (bspw. Brophy 2000; Seidel und Shavelson 2007) sowie der konstruktivistisch orientierten Lehr-Lernforschung (bspw. De Corte 2004) aber auch die Ergebnisse der Teacher Effectivness Research (bspw. Muijs und Reynolds 2010; Creemers 1994) bestätigen den zentralen Einfluss von Unterrichtsprozessen auf das Schülerlernen. Alleine Hattie (2009) ordnet über 20 Einflussfaktoren dem Bereich „Unterrichten“ zu, die seinen Analysen zufolge mindestens eine wünschbare Effektstärke von 0,40 erreichen. So erfreulich die Expansion der unterrichtsbezogenen Forschung ist, so steigt mit ihr auch das Luxusproblem, den Überblick über die relevanten Faktoren der Unterrichtsqualität im Auge zu behalten. Diese Herausforderung betrifft mehrere Bereiche: (1) Lehrpersonen werden überfordert, wenn sie mit langen Listen von gut gemeinten Empfehlungen überhäuft werden; insbesondere wenn nicht vermittelt wird, wann welches Wissen einzusetzen ist (siehe das Tausendfüßersyndrom in Neuweg 2005). (2) Die Lehreraus- und -weiterbildung ist gezwungen aufgrund von zeitlichen Restriktionen aber auch didaktischen Gründen, die zu vermittelnden Inhalte reflektiert zu selektieren und basale Merkmale eher spezifischeren voranzustellen. (3) Auch die Bildungsforschung ist ähnlichen Kapazitätsgrenzen ausgesetzt: Gerade für Forschung, die nicht primär auf Unterrichtsprozesse fokussiert aber dennoch zentrale Aspekte miterheben will (bspw. PISA, Überprüfungen von Bildungsstandards, lokale Studien oder schulinterne Evaluationen), wäre wichtig mit einer ökonomischen Anzahl an Items die „relevanten“ Konstrukte erfassen zu können. Die Identifikation von zentralen bzw. basalen Merkmalen der Unterrichtsqualität und ihrer Wirkungsmechanismen stellt damit ein durchaus praxisrelevantes Anliegen dar.

Studien, wie die von Pianta und Hamre (2009) sowie Klieme et al. (2001, 2009) kommen diesem Anliegen nach. Beide Forschergruppen können auf Basis ihrer Daten zeigen, dass die drei Basisdimensionen „Instructional Support/kognitive Aktivierung“, „Classroom Management“ und „Emotional Support/soziale Unterstützung“ zentral für die fachliche und soziale Entwicklung der Schüler/innen sind. Darüber hinaus wird postuliert, dass diese Faktoren über Mediatoren wie die kognitiven Lernaktivitäten der Schüler/innen, dem Anteil lernbezogener Unterrichtszeit und der intrinsische Lernmotivation positiv auf die Lernleistungen wirken. Bisher wurde diese latente Struktur ausschließlich für die allgemeinbildenden Domänen, allen voran die Mathematik (Kunter et al. 2013), bestätigt. Es fragt sich daher, ob sie auch in Domänen der Berufsbildung, insbesondere im hier analysierten Fach Rechnungswesen, auffindbar ist. Daher werden Daten von 659 Schüler/inne/n aus 24 berufsbildenden mittleren und höheren Klassen der 9. Schulstufe in ein Mehrebenenstrukturgleichungsmodell überführt, das die Annahmen des im nächsten Abschnitt erläuterten Wirkmodells simultan einer empirischen Prüfung aussetzt.

2 Theorie

Welches Phänomen versucht das „theoretical model of basic (deep structure) dimensions of instructional quality“ von Klieme et al. (2009, im Folgenden kurz Unterrichtsqualitätsmodell) zu erklären? Zweifellos kann man darüber diskutieren, an welchen Kriterien Unterrichtsqualität festgemacht werden soll. Allerdings besteht wissenschaftlicher Konsens darüber, dass sich die Qualität von Unterricht in „konsequenterweise primär daran [bemisst], ob auf Seiten der Schüler Lernprozesse initiiert werden und wie nachhaltig diese sind. ‚Guter‘ Unterricht hieße demnach ‚lernwirksamer‘ Unterricht.“ (Helmke 2009, S. 20) Im Einklang mit dieser Zieldefinition von gutem Unterricht versucht das Modell fachliche (ursprünglich in Mathematik) als auch überfachliche Schüleroutcomes mit zentralen Basisdimensionen der Unterrichtsqualität vorherzusagen.

3 Basisdimensionen der Unterrichtsqualität

3.1 Kognitive Aktivierung

Unterricht wird als „kognitiv aktivierend“ bezeichnet, wenn die Lernenden zur aktiven Auseinandersetzung mit den Lerninhalten auf einem für sie optimalen Niveau angeregt werden (z. B. Baumert und Köller 2000; Kunter et al. 2005). Die theoretischen Grundannahmen für die Lernwirksamkeit dieser Dimension basieren einerseits auf kognitiven Lerntheorien (bspw. Piaget 1985) und stammen andererseits aus der Kognitionsforschung (bspw. Carver und Klahr 2001). Demzufolge wird im Modell von Pianta und Hamre (2009) – die zwar nicht explizit von kognitiver Aktivierung sprechen, sondern von instruktionaler Unterstützung – auf die Befunde der Kognitionsforschung verwiesen: Es gilt Lerngelegenheiten zu schaffen, die dem/der Lerner/in ermöglichen bestehende Fähigkeiten anzuwenden und komplexere Fähigkeiten durch Unterstützung (Scaffolding) von Expert/inn/en zu erproben. Darüber hinaus verweisen sie auf die Bedeutung der Schulung der metakognitiven Fähigkeiten der Lerner/innen (z. B. das Bewusstsein über und das Verstehen des eigenen Denkprozesses), den „higher order thinking skills“ und dem lernprozessbezogenen Feedback, die allesamt als zentrale Merkmale kognitiv aktivierenden Unterrichts anzusehen sind (Helmke 2009).

Nach Klieme et al. (2009, S. 140 f.) wird Unterricht dem Prädikat „kognitiv aktivierend“ u. a. dann gerecht, wenn er inhaltliches Verstehen unterstützt, indem fachliche Konzepte (z. B. der Satz des Pythagoras) explizit gemacht werden und die Beziehungen der elementaren Einheiten (z. B. Rechter Winkel, Flächeninhalte) untereinander sowie die grundlegenden Ideen, Gesetze, Einsichten, Verfahren und Repräsentationen verdeutlicht werden (Brophy 2000, S. 19). Zudem führt er neue Konzepte (Inhalte) so ein, dass auf das Vorwissen der Lernenden, ihre Ideen und Interessen aufgebaut bzw. eingegangen wird. Dabei kommen Aufgaben- bzw. Problemstellungen zum Einsatz, die „höhere kognitive Ansprüche“ an die Lernenden stellen, also bspw. zum Erforschen, Diskutieren, Erklären etc. etwa unterschiedlicher Lösungswege herausfordern. Darüber hinaus ist kognitiv aktivierender Unterricht durch qualitätsvolle Lehrer-Schüler- und Schüler-Schüler-Interaktionen sowie Schülerteilnahmen gekennzeichnet. Das heißt, Lehrpersonen verwenden Schülerfragen, die zum Nachdenken herausfordern, zum kritischen Reflektieren über Konzepte anregen, Zusammenhänge zwischen verschiedenen Konzepten erkennen lassen, oder die bei der Problemlösung und Entscheidungsfindung helfen. Letztlich ist Unterricht, der an dieser Basisdimension ausgerichtet ist, anwendungsorientiert und verfügt über konzeptbezogene Diskurse (Reusser 2008), sodass ein hoher Anteil an echter Lernzeit gewährleistet ist.

3.2 Classroom Management

Genau dieses Ziel des hohen Anteils echter Lernzeit ist für die zweite Basisdimension von Unterrichtsqualität zentral. Die theoretischen Grundannahmen dieser Dimension sehen Pianta und Hamre (2009, S. 113) in den Arbeiten zur Lehrerunterstützung des selbstregulierten Lernens. So beschreiben sie gutes Classroom Management als eines, in dem das Schülerverhalten effizient gesteuert wird, bspw. über organisierende Strukturen und Routinen sowie schüleraktivierende Unterrichtsmaßnahmen. Dieses Verhaltensmanagement soll letztlich zu weniger Schülerfehlverhalten und niveauvollerem Lernen führen.

Klieme et al. (2009) dagegen stützen ihr Modell im Bereich dieser Basisdimension auf die Arbeiten Kounins (1970) zu den Techniken der Klassenführung. Entsprechend charakterisiert eine effiziente Klassenführung u. a. folgende Aspekte: klare Regeln, reibungslose Übergange zwischen Unterrichtssequenzen, Beobachtung der Schülerarbeit, organisierte Unterrichtsplanung, Vermeidung unnötiger Überreaktionen auf kleinere Unterrichtsstörungen, Eingriff bei Schülerfehlverhalten und Aufrechterhaltung des Gruppenfokus. Zusammenfassend gilt: „direct instruction requires teaching and learning processes to take place in an efficient and orderly fashion, with smooth transitions and little time spent dealing with problems of inattentiveness or resistance.“ (Klieme et al. 2009, S. 141)

3.3 Soziale Unterstützung

Sowohl Pianta und Hamre (2009) als auch Klieme et al. (2009) beziehen sich im Rahmen dieser Basisdimension auf Theoriegrundlagen und Befunde der Selbstbestimmungstheorie (SDT; Deci und Ryan 1993). Fasst man die Annahmen und Befunde der SDT zusammen, so ist festzuhalten, dass im sozial-unterstützenden Unterricht Lehrer/innen Wege finden, die psychologischen Grundbedürfnisse nach Autonomie-, Kompetenzerleben und sozialer Eingebundenheit zu befriedigen (Reeve 2002, 2006, S. 228). Sie schaffen es, eine Unterrichtseinheit, die aus Schülerperspektive nicht lernenswert ist, in eine zu verwandeln, die lernenswert ist (Reeve 2006, S. 231). Dies gelingt am ehesten dann, wenn strukturgebende Lehrerhandlungen und -äußerungen in einen autonomieunterstützenden Kontext eingebunden sind und gemeinsam mit Kompetenzerleben auftreten (Deci und Ryan 1993, S. 231). Vor allem die Autonomieunterstützung zeichnet sich durch einen nicht-kontrollierenden, wertschätzenden, empathischen, ermutigenden, die persönlichen Schülerinteressen und -ziele verfolgenden Umgang zwischen Lehrer/inne/n und Schüler/inne/n aus.

Zusammenfassend kann festgehalten werden, dass entsprechend dem hier behandelten Modell Unterrichtsqualität dann vorliegt, wenn der Unterricht (1) Schüler/innen zum Nachdenken und zur intensiven Beschäftigung mit den zu erlernenden Inhalten herausfordert, (2) effizient mit der verfügbaren Lernzeit umgeht und (3) durch eine wertschätzende Lehrer-Schüler-Beziehung die psychologischen Grundbedürfnisse der Schüler/innen befriedigt. Wie wirken diese Basisdimensionen nun auf die Schüleroutcomes?

3.4 Theoretische Wirkannahmen der Basisdimensionen der Unterrichtsqualität

Abb. 1 zeigt, von welchen Annahmen Klieme et al. (2009, S. 140 ff.) im Modell ausgehen. Drei zentrale Wirkpfade sind zu nennen, die auch empirisch haltbar sind, wie die im Folgenden angeführten Studien belegen.

Abb. 1
figure 1

Theoriemodell der Basisdimensionen der Instruktionsqualität und ihre Wirkungen auf Schülerlernen und -motivation. (In Anlehnung an Klieme et al. 2009)

Pfad 1: Ein kognitiv aktivierendes Unterrichtsangebot im oben beschriebenen Sinne führt dazu, dass Schüler/innen (ko-)konstruktiv und reflektierend auf hohem Niveau lernen, was wiederum zu elaborierterem Inhaltswissen bzw. höheren fachlichen Leistungen führt. Empirische Belege für den Effekt des kognitiven Aktivierungspotenzials von Unterricht auf die Schüleroutcomes lassen sich bereits in vielen Studien, u. a. zum Lehrerprofessionswissen, finden (z. B. Baumert et al. 2010; Cauet et al. 2015; Kunter et al. 2005; Lenske et al. 2015; Pauli et al. 2008).

Pfad 2: Effizientes Classroom Management wird als Voraussetzung für ein lernaufgabenbezogenes Schülerengagement bzw. einen hohen Anteil an echter Lernzeit angesehen und hat daher – sowohl indirekt über die kognitive Verarbeitungstiefe in Pfad 1 als auch direkt – positiven Einfluss auf die fachlich-kognitive Leistungserbringung und das Verstehen von neu zu erlernenden Inhalten. Darüber hinaus wirkt diese Basisdimension auch positiv auf motivationale Unterrichtsziele. Nicht nur Einzelstudien (z. B. Baumert et al. 1987; Klieme et al. 2009; Kunter 2005; Kunter et al. 2007; Lenske et al. 2015) sondern auch Meta-Analysen (Korpershoek et al. 2014) belegen den positiven Effekt dieser Dimension auf die Schüleroutcomes.

Pfad 3: Es wird angenommen, dass die soziale Unterstützung Voraussetzung für die Wahrnehmung der Befriedigung psychologischer Grundbedürfnisse ist, die wiederum positiv auf die Emotionen und Affekte sowie in weiterer Folge auf die Entwicklung intrinsischer Lernmotivation wirkt. Die Lernmotivation steht im positiven Zusammenhang mit der fachlichen Schülerleistung. Die Pfadannahmen dieser Dimension wurden bspw. bei Standage et al. (2005) sowie Helm (2015a) empirisch bestätigt.

Unserem Wissen nach wurde das Wirkmodell der Unterrichtsqualität in seiner Gesamtheit bisher einzig in Kunter et al. (2013) einer empirischen Prüfung unterzogen, wobei dort keine nutzungs- bzw. schülerseitigen Mediatoren (z. B. Schüleraktivitäten) analysiert wurden.

4 Methode

4.1 Beschreibung der Stichprobe und des Studiendesigns

Um die in den Pfaden sich widerspiegelnden Hypothesen zu prüfen, wurden 659 Schüler/innen aus 24 österreichischen BMHS-Klassen am Ende der 9. Schulstufe (AlterM = 15,52 Jahre; AlterSD = 9,5 Monate; 69 % weiblich) untersucht. Zur Erhebung der durch die Schüler/innen wahrgenommenen Unterrichtsqualität im Fach Rechnungswesen sowie zur Erfassung von Informationen über das eigene Lernen (z. B. Bearbeitung von Lernaufgaben, Lernmotivation) wurde ein Onlinefragebogen eingesetzt (Bearbeitungsdauer im Mittel rund 25 Minuten; Antwortformat für alle Skalen von 1 = „stimmt gar nicht/nie“ bis 5 = „stimmt genau/immer“). Mittels 45minutigen Papier-Bleistift-Test wurde die Leistung der Schüler/innen im Fach Rechnungswesen erfasst.

4.2 Erhobene Konstrukte

Tab. 1 enthält testtheoretische Informationen sowie Beispielitems zu den erfassten Konstrukten. Die Skalen wurden in Anlehnung an die Erfassung der Unterrichtsmerkmale im Rahmen der Pythagoras-Studie (Rakoczy et al. 2005; Rakoczy und Pauli 2006) selbsterstellt.Footnote 1 Bevor auf die Konstrukte inhaltlich eingegangen wird, ist auf die zufriedenstellende Reliabilität der Skalen sowohl auf Individual (Cronbachs Alpha) als auch auf Klassenebene (ICC (2)) zu verweisen. Auch der ICC (1) liefert interessante Informationen: Mit einer durchschnittlichen Level 2 Varianz von rund 20 % variieren die Faktoren der Basisdimensionen zwischen den Schulklassen deutlich.

Tab. 1 Skalenbeschreibung

4.3 Kognitive Aktivierung

Die kognitiv aktivierende Unterrichtsgestaltung wurde durch zwei Subskalen „Individualisierung“ und „komplexe Lernaufgaben“ erfasst. Die Skala „Individualisierung“ enthält Items, die bspw. danach fragen, inwiefern im RW-Unterricht auf Schülererfahrungen und Vorwissen sowie Interessen eingegangen wird oder Schüler/innen zum Vergleichen ihrer Lösungswege ermutigt werden. Die Skala „komplexe Lernaufgaben“ fragt nach dem Anforderungsniveau von im RW-Unterricht eingesetzten Übungen, und zwar im Hinblick darauf, ob die Aufgaben bspw. nur durch gezieltes Probieren gelöst werden können. Während diese zwei Subskalen das Unterrichtsangebot abdecken, ist die Subskala „Bearbeitung von Lernaufgaben“ Ausdruck von elaboriertem Schülerlernen. Es wird danach gefragt, wie oft Schüler/innen sich beim Lösen von Arbeitsaufträgen zuerst einen Überblick über das Lernziel verschaffen und dieses mit ihrem Vorwissen abgleichen. Individualisierender Unterricht und anspruchsvolles Üben sowie die elaborierte Auseinandersetzung mit Lernaufgaben sind zentrale Merkmale kognitiv-aktivierenden Unterrichts (Baumert und Köller 2000; Clausen et al. 2003; Pauli et al. 2008). Insbesondere im hier betrachteten Rechnungswesenunterricht spielt das Lehren und Lernen auf Basis von Schulbuchaufgaben eine zentrale Rolle (vgl. Helm 2015b; Seifried 2004; Götzl et al. 2013).

4.4 Classroom Management

Die Basisdimension Klassenführung, Klarheit und Struktur wird auf Angebotsseite durch die Subskalen „Allgegenwärtigkeit“, „Restriktivität“ (übernommen aus Eder 1998) und „Struktur“ erfasst. Die Items zur „Allgegenwärtigkeit“ beschreiben Unterricht, in dem die Lehrkraft darauf achtet, dass alle Schüler/innen immer beschäftigt sind und dass niemand im Unterrichtsprozess zurückbleibt. Gleichzeitig ist sie Ausdruck dafür, inwiefern die Lehrperson alles, was in der Klasse passiert, mitbekommt. Die „Struktur“-Items dagegen beschreiben Unterricht, in dem Inhalte von der Lehrperson gut aufeinander aufgebaut werden und klar und verständlich dargestellt sind. Wie sich in den Analysen allerdings herausstellte, lassen sich diese beiden Bereiche aus Schülersicht nicht trennen (latente Korrelation =0,95), sodass sie zu einer gemeinsamen Skala „Allgegenwärtigkeit, Struktur, Klarheit“ zusammengefasst wurden. Die „Restriktivität“-Komponente der Klassenführung enthält Items, die danach fragen, wie konsequent und streng Schülerfehlverhalten sanktioniert wird, wobei die Items eher Ausdruck des Verhaltens einer überforderten Lehrerperson sind, die Sanktionen als letztes Mittel einsetzt, um die Kontrolle zu bewahren. Die nutzungsseitigen Subskalen „Störneigung“ und „Vergeudung von Lernzeit“ enthalten Items, die bspw. nach dem Lärmpegel in der Klasse bzw. der nicht für das Lernen genutzten Zeit im Unterricht fragen.

4.5 Soziale Unterstützung

Die aus Schülersicht wahrgenommene Unterstützung der psychologischen Grundbedürfnisse im Unterricht wurde mit den drei Subskalen „Kompetenzförderung“, „Autonomieförderung“ und „Erleben sozialer Eingebundenheit“ erfragt. „Autonomieförderung“ zielt im Prinzip stark auf die wahrgenommene Empathiefähigkeit der Lehrperson ab und wurde in Anlehnung an Reeve et al. (2008) operationalisiert. Reeve und Kolleg/inn/en konnten in einem psychologischen Experiment nachweisen, dass das Lehrerverhalten von Schüler/inne/n dann als autonomieunterstützend erlebt wird, wenn ihnen Gehör geschenkt wird, nach ihren Bedürfnissen gefragt wird, auf ihre Fragen eingegangen wird und sie das Gefühl haben, dass sich die Lehrperson in ihre Situation versetzen kann. Die „Kompetenz“-Skala erfasst das Gefühl der Anerkennung der eigenen Leistungen im Unterricht und der Möglichkeit auch als schwache/r Schüler/in im Unterricht sich selbst als kompetent zu erleben (siehe bspw. Schwarzer und Jerusalem 2002). Die Items zur „sozialen Eingebundenheit“ erheben das Ausmaß der Klassengemeinschaft (Eder 1998) im Unterricht. Diesen angebotsseitigen Merkmalen steht die der Schülerseite zugeordnete Skala „Wohlbefinden“ gegenüber. Diese Items fragen nach dem Befinden und der Langeweile im Unterricht.

4.6 Schüleroutcomes

In der vorliegenden Studie werden die Schüleroutcomes über die affektive Dimension der „identifizierten Motivation“ und die kognitive Dimension der „Rechnungswesenleistung“ erfasst. Die Wahl der identifizierten anstatt der – intuitiv naheliegenden – intrinsischen Lernmotivation liegt in dem Forschungsbefund (Helm o.J.) begründet, der zeigt, dass die indentifizierte Lernmotivation im Fach Rechnungswesen stärker mit der Leistung assoziiert ist als die intrinsische. Offenbar ist es im Unterricht einfacher die Jugendlichen über die berufliche Relevanz von RW-Inhalten zum Lernen zu motivieren als über den Spaß am Erlernen dieser Inhalte. Die identifizierte Lernmotivation wurden mit dem Instrument von Müller et al. (2007) erfasst.

Um die Rechnungswesenleistung der Schüler/innen zu messen wurde der standardisierte Test „Wissensüberprüfung von Basiskenntnissen der Buchhaltung“ (WBB, Helm 2016) am Ende der 9. Schulstufe eingesetzt. Die Schüler/innen mussten 53 Leistungsaufgaben bearbeiten, die die Verbuchung von laufenden Geschäftsfällen erfordern:

Ein Beispielitem: Du kaufst Handelswaren im Wert von EUR 14.500,00 + 20 % Umsatzsteuer auf Ziel (3300) für dein Unternehmen. Verbuche den Geschäftsfall und schätze die Auswirkung auf den Gewinn ein!

Die Testitems wurden aus dem Kompetenzmodell der Arbeitsgruppe für die österreichischen Berufsbildungsstandards abgeleitet (http://www.bildungsstandards.berufsbildendeschulen.at). Dieses zweidimensionale Modell verortet RW-Aufgaben in einer Inhalts- (laufende Geschäftsfälle – Kostenrechnung) und einer Handlungsdimension (wiederholen – entwickeln). Darüber hinaus decken die Testitems die Kerninhalte des kompetenzorientierten Lehrplans der kaufmännischen BMHS ab (BMUKK 2010). Um die Kompetenzwerte der Schüler/innen vor dem Hintergrund der Item Response Theory zu erhalten, wurden (1) die Schülerantworten mit 1 (richtig) und 0 (falsch) kodiert und (2) Marginal und Conditional Maximum Likelihood-Schätzungen mit der Statistiksoftware R bzw. den Paketen „ltm“ (Rizopoulos 2006) und „eRm“ (Mair et al. 2011) durchgeführt. Da ein zugrunde liegender Faktor angenommen wurde, wurde das Rasch-Modell zur Kompetenzberechnung herangezogen. Die Modellberechnungen weisen sowohl auf Item- als auch Testebene zufriedenstellende Reliabilitätswerte auf (siehe Helm 2016 für die Rasch-Modellgeltungskontrollen). Die EAP- und WLE-Reliabilitäten betragen 0,88 und 0,89. Der klassische Cronbachs Alpha-Wert beträgt 0,91.

4.7 Kontrollvariable Mathematikleistung

Die Leistungsfähigkeit der Schüler/innen in Mathematik zu Beginn der 9. Schulstufe wurde als Kontrollvariable für die Vorhersage der RW-Leistung in das Modell aufgenommen, da sie als domänenverbundene Kompetenz gilt (Winther 2010). Sie wurde mit dem MATKOMP-Test (Eder et al. 2002) erfasst. Dieser verwendet 40 erprobte TIMSS-Items.

4.8 Statistische Analysen

Für die eben beschriebenen Konstrukte wurden Messmodelle (Tab. 2) gebildet. Diese wurden gemeinsam mit den in Abb. 2 abgebildeten Pfaden mittels Mehrebenenstrukturgleichungsmodellierung in Mplus 7 (Muthén und Muthén 1998–2014) hypothesenprüfend getestet. Die Koeffizienten wurden unter Verwendung der Mplus-Option für Maximum Likelihood Estimation with Robust Standard Errors (MLR) geschätzt. Das heißt, Standardfehler sind gegenüber Verletzungen der Normalverteilungsannahme robust, die vor allem bei Items wie „Unsere Lehrkraft kommt gut vorbereitet in den Unterricht“ vorliegen. Bei dieser und ähnlichen Fragen ist es verständlich, dass die Schüler/innen ihre Lehrer/innen eher positiv beurteilen. Als Gütekriterien für die Modellanpassung werden der χ2/df-Wert, der Bentlers Comparative Fit Index (CFI), der Tucker Lewis Index (TLI) und der Root Mean Square Error of Approximation (RMSEA) sowie der Standardized Root Mean Square Residual (SRMR) herangezogen. Als akzeptable Modellfits werden in der Literatur laut Weiber und Mühlhaus (2010, S. 176) üblicherweise folgende Werte verwendet: χ2/df-Werte < 3, CFI-Werte ≥ 0,90, TLI-Werte ≥ 0,90, RMSEA-Werte ≤ 0,08 und SRMR ≤ 0,10.

Tab. 2 Messmodelle
Abb. 2
figure 2

Empirisches Wirkmodell zur Basisdimension „kognitive Aktivierung“. (** p < 0,01, * p < 0,05, ^ p < 0,10, n. s. = nicht signifikant, L1 = Level 1, L2 = Level 2; C = Cluster)

Die Berücksichtigung der hierarchischen Struktur und die Ermittlung von sogenannten Climate-Effekten nach Lüdtke et al. (2008) erfolgt durch die TYPE = TWOLEVEL in Mplus. Dazu wurden die Level 1 (L 1) Variablen am Gruppenmittelwert zentriert, um die reinen L1-Effekte zu erhalten, und die Level 2 (L2) Variablen am Gesamtmittelwert zentriert (Lüdtke et al. 2009; Enders und Tofighi 2007; Algina und Swaminathan 2011). Dieses Vorgehen ermöglicht die Untersuchung von Climate-Effekten, nämlich des Einflusses der individuellen und kollektiven Schülerwahrnehmung von Unterrichtsmerkmalen auf die Schüleroutputs. Bei der Analyse von Climate-Effekten wird angenommen, dass die Unterrichtsqualitätsmerkmale von der individuellen Schülerwahrnehmung – welche als austauschbare Beobachter/innen eines Unterrichtsmerkmals angesehen werden – unabhängig sind (Lüdtke et al. 2009, S. 127).

Um für fehlende Werte vorzubeugen, wurden die Onlinefragen als Pflichtfragen vorgelegt. D. h., ein Fortsetzen des Fragebogens war nur bei vollständiger Beantwortung aller Fragen einer Bildschirmseite möglich. Für die dennoch entstehenden Missings (Papier-Bleistift-Tests und Computerausfälle) wurde die Full Information Maximum Likelihood (FIML) Methode zur Modellierung von fehlenden Werten, wie sie in Mplus implementiert ist, angewandt. Diese Methode basiert auf der weniger restriktiven Annahme, dass die Daten nicht völlig zufällig fehlen (missing completely at random, MCAR), sondern zufällig, bedingt der gegebenen Informationen in den Daten, fehlen (missing at random, MAR).

5 Ergebnisse

Die in Abb. 234 und 5 dargestellten Befunde zeigen, dass die drei Pfade – sowohl einzeln getestet als auch simultan geprüft – die Struktur in den Daten gut widerspiegeln. Alle Modelle weisen akzeptable Fit-Werte auf, wobei die Pfade auf Klassenebene aufgrund der kleinen Clusterzahl mit Vorsicht zu interpretieren sind. Auch gemessen an der Varianzaufklärung erscheinen die Modelle haltbar. So kann bspw. die Rechnungswesenleistung mit nur zwei Prädiktoren zu 10–16 % auf Schülerebene und zu 15–25 % auf Klasseneben erklärt werden.

Abb. 3
figure 3

Empirisches Wirkmodell zur Basisdimension „Classroom Management“. (** p < 0,01, * p < 0,05, ^ p < 0,10, n. s. = nicht signifikant, L1 = Level 1, L2 = Level 2; C = Cluster)

Abb. 4
figure 4

Empirisches Wirkmodell zur Basisdimension „soziale Unterstützung“. (** p < 0,01, * p < 0,05, ^ p < 0,10, n. s. = nicht signifikant, L1 = Level 1, L2 = Level 2; C = Cluster)

Abb. 5
figure 5

Empirisches Wirkmodell zu den Basisdimensionen der instruktionalen Qualität nach Klieme et al. (2009). (** p < 0,01, * p < 0,05, ^ p < 0,10, n. s. = nicht significant, C = Cluster)

Damit belegt die vorliegende Studie im Wesentlichen die Annahmen des Unterrichtsqualitätsmodells nach Klieme et al. (2001, 2009) für das Fach RW: Eine kognitiv aktivierende Unterrichtsgestaltung (Individualisierung und komplexe Lernaufgaben) sagt die elaborierte Aufgabenbearbeitung beim Lernen der Schüler/innen positiv vorher. Diese Art der Lernaufgabenbearbeitung wiederum ist prädiktiv für eine höhere RW-Leistung. Ein strukturierter Unterricht im Sinne eines effizienten Classroom Managements steht im negativen Zusammenhang mit der Störneigung und Vergeudung von Unterrichtszeit, erhöht also den Anteil echter Lernzeit, welcher wiederum positiv die RW-Schülerleistung vorhersagt, wie der negative Effekt der Vergeudung von Lernzeit auf die RW-Leistung belegt. Zuletzt ist die Unterstützung der psychologischen Grundbedürfnisse der Schüler/innen prädiktiv für das Wohlbefinden im RW-Unterricht, was wiederum das Ausmaß der identifizierten Lernmotivation vorhersagt. Letztere ist ein weiterer positiver Prädiktor der fachlichen RW-Leistung. In Summe lassen sich damit die Wirkannahmen gut belegen: Beinahe in allen Analysen zeigt sich, dass die Climate-Effekte (L2-Effekte) signifikant sind. Davon ausgenommen ist der Effekt der kognitiven Aktivierung (Bearbeitung von Lernaufgaben) auf die Schülerleistung. Hier hat der Kontext über die klasseninternen Effekte hinaus offenbar keinen Einfluss auf RW-Leistungen. Im Fall der Autonomieförderung ist zudem erwartungswidrig kein L1-Effekt beobachtbar.

Des Weiteren zeigt sich, dass der Faktor „Allgengegenwärtigkeit, Struktur, Klarheit“ negativ mit dem verschwenderischen Einsatz von Unterrichtszeit assoziiert ist. Darüber hinaus ist der Pfad von der Skala „Restriktivität“ zur „Störneigung“ positiv (!), was darauf hindeutet, dass in Klassen mit höherer Störneigung auch ein restriktiveres Lehrerverhalten, durch bspw. schnellerer und häufigerer Androhung schlechter Noten, beobachtbar ist.

Aufgrund der kleinen Clusterzahl wird im Rahmen der simultanen Prüfung der drei Pfade von der Modellierung von Climate-Effekten abgesehen und stattdessen lediglich die Standardfehler für die Mehrebenenstruktur korrigiert (TYPE = COMPLEX command in Mplus). Werden die drei Pfade simultan geprüft (Abb. 5), so zeigen sich folgende Auffälligkeiten: (1) Die Verarbeitungstiefe (Bearbeitung Lernaufgaben) und die Struktur sind erwartungsgemäß (bspw. Prenzel et al. 2000) mit der identifizierten Motivation assoziiert. (2) Die identifizierte Motivation sagt die RW-Leistung signifikant vorher. (3) Allerdings ist nun im Vergleich zur Einzelpfadprüfung auch auf Individualebene kein direkter Effekt der kognitiven Aktivierung (Bearbeitung der Lernaufgaben) auf die Schülerleistung mehr beobachtbar, dieses Konstrukt scheint nun indirekt über die Schülermotivation zu wirken.

6 Diskussion

Bisher wurden Effekte der Basisdimensionen der Unterrichtsqualität (Klieme et al. 2009) nur im Fach Mathematik (Kunter et al. 2013) simultan geprüft. Wie auch bei Kunter et al. (2013) bestätigen die vorliegenden Analysen die positiven Effekte der Basisdimensionen. Sie zeigen, dass die kognitive Aktivierung, das Classroom Management und die soziale Unterstützung mediiert über das Lernengagement der Schüler/innen bedeutend positiv auf die motivationalen und fachlichen Unterrichtsziele wirken. Damit belegt die vorliegende Studie den zentralen Einfluss des Unterrichts auf den Lernerfolg von Schüler/inne/n; mit einer Ausnahme: Es zeigt sich, dass der Effekt der kognitiven Aktivierung bei simultaner Prüfung aller Pfade verschwindet. Hier sei auf die Studie von Fauth et al. (2014) verwiesen, die zu einem ähnlichen Ergebnis kommt. Auch in der 54 Grundschulklassen umfassenden Längsschnittstudie konnte kein direkter Effekt der kognitiven Aktivierung auf die mittlere Klassenleistung belegt werden, allerdings – wie auch in der vorliegenden Studie – ein indirekter Effekt über das Schülerinteresse. Fauth et al. (2014, S. 7) sehen mögliche Erklärungen dieses erwartungswidrigen Befundes in der jungen Altersgruppe – für die der Zusammenhang zwischen kognitiver Aktivierung und Leistung noch nicht so ausgeprägt ist – und in der erfasst Schulleistung, die lediglich kurzfristige Lerneffekte widerspiegelt. Beide Erklärungen können für die vorliegende Studie nicht gelten, da die Schülergruppe älter ist und langfristige Schülerleistungen erfasst wurden. Allerdings kann argumentiert werden, dass das eingesetzte RW-Testinstrument eher repetitive Schülerleistungen erfasst, für die kognitiv aktivierender Unterricht und elaboriertes Schülerlernen nur teilweise nötig ist.

Aus den Ergebnissen lassen sich einige Schlussfolgerungen für die RW-Unterrichtspraxis ableiten: Sowohl im Rahmen von Unterrichtsvor- und -nachbereitungen sowie in der Lehreraus- und -weiterbildung erscheint es unerlässlich die Frage zu beantworten, wie kognitive Aktivierung, effiziente Klassenführung und soziale Unterstützung im Unterricht gewährleistet werden kann. Für den übungs- und lernaufgabenlastigen RW-Unterricht (Götzl et al. 2013; Seifried 2004) gilt insbesondere in Hinblick auf die kognitive Aktivierung eine ausreichende Verarbeitungstiefe beim Lernen sicherzustellen. Maier et al. (2010) und Fortmüller et al. (2014) haben Kriterienkataloge für kognitiv aktivierende Vorträge und Lernaufgaben erstellt, deren Berücksichtigung im Rahmen der Unterrichtsvorbereitung hilfreich ist. Auch für die Formen der intrinsischen und intrinsisch-nahen (z. B. identifizierten) Lernmotivation gilt, dass der repetitive Abarbeitungscharakter des RW-Unterrichts wenig Raum für das Aufkeimen von Spaß und Interesse am Fach zulässt (bspw. Helm 2015a). Wie die vorliegende Studie zeigt, ist aber bereits eine wertschätzende Lehrer-Schüler-Beziehung motivationsförderlich. In Hinblick auf die effiziente Klassenführung konnte weiters gezeigt werden, dass die Strukturiertheit und Klarheit von Unterricht wesentlich mit dem Anteil echter Lernzeit und der Schülerleistungen zusammenhängt. Lehrpersonen sollten daher gut vorbereitet in den Unterricht kommen, hohen Wert auf einen roten Faden und eine möglichst verständliche Erklärung der RW-Inhalte legen. Zahlreiche Publikationen zeigen vor, wie diese Struktur und Klarheit gewährleistet werden kann (z. B. Meyer 2004; Fortmüller et al. 2014).

Die hier vorgestellten Befunde sowie Handlungsimplikationen sind vor dem Hintergrund folgender Grenzen der vorliegenden Studie zu interpretieren.

(1) Das Modell kann auf den beiden untersuchten Ebenen (Schüler/innen und Klasse) jeweils nur rund ein Fünftel der Varianz in den Leistungsunterschieden aufklären. Dies zeigt, dass u. a. weitere Unterrichtsmerkmale sowie das domänenspezifische Vorwissen Einfluss auf den Lernerfolg im RW nehmen. So konnte Helm (2015a) zeigen, dass alleine das fachspezifische Vorwissen bis zu 40 % der Leistungsvarianz erklärt. (2) Die vorgestellte Studie stellt eine Querschnittsstudie dar, mit der keine Kausalität belegt werden kann. Die angeführten Wirkungsrichtungen sind zwar theoretisch fundiert, es sind aber auch reziproke Effekte denkbar. (3) Zudem wurden Daten auf Basis einer ad hoc-Stichprobe gesammelt, weshalb die Ergebnisse nicht auf die Gesamtheit der RW-Klassen in den österreichischen BMHS verallgemeinerbar sind. (4) Durch den ausschließlichen Einsatz von Selbsteinschätzungsskalen könnte ein Common Method Bias (CMB) die Ergebnisse der vorliegenden Studie verzerren. Analysen zum CMB (Podsakoff et al. 2003) zeigen allerdings, dass lediglich im Faktor „Individualisierung“ vier von acht Items dem CMB unterliegen. (5) Zuletzt ist darauf hinzuweisen, dass die drei Basisdimensionen Aspekte des Lehrerverhaltens und damit genuine Klassenkonstrukte darstellen. Aufgrund der geringen Klassenanzahl war es jedoch nicht möglich für den Stichproben- sowie den Messfehler zu korrigieren (Marsh et al. 2009). Diese Grenzen der Studie zeigen Desiderate auf, die weiteren Forschungsbedarf skizzieren.