1 Einleitung

In den letzten zwei Jahrzehnten hat es im öffentlichen Diskurs einen Paradigmenwechsel hinsichtlich des Umgangs mit Heterogenität in Schule und Unterricht gegeben. Statt Maßnahmen zur Homogenisierung von Lerngruppen zu verfolgen (Tillmann 2008), wird zunehmend gefordert, die Heterogenität als Chance für das schulische Lernen zu begreifen und Schüler*innen im Unterricht verstärkt individuell zu fördern (im Überblick siehe Dumont 2019). Im wissenschaftlichen Diskurs hat diese Forderung eine lange Tradition (im Überblick siehe Dockterman 2018). Für die Lehr-Lernforschung sind hier insbesondere die Forschungsaktivitäten zu sogenannten Aptitude-Treatment-Interaktionen maßgeblich, die auf der Annahme basieren, dass die Effektivität von Unterrichtsmaßnahmen von Merkmalen der lernenden Person abhängt (Cronbach und Snow 1977). Im Kontext dieser Forschung wurde auch das Konzept des adaptiven Unterrichts geprägt. Ziel des adaptiven Unterrichts ist es, das Unterrichtsangebot an die individuellen Lernvoraussetzungen der Schüler*innen anzupassen (Corno 2008; Corno und Snow 1986). Die Adaptivität von Unterricht gilt inzwischen als ein zentraler Aspekt von Unterrichtsqualität (Deunk et al. 2018; Parsons et al. 2018; Praetorius und Charalambous 2018; Vaughn et al. 2022).

Obwohl adaptiver Unterricht sowie verwandte Konzepte wie Differentiated Instruction und Personalized Learning im aktuellen Diskurs eine große Rolle spielen, gibt es bislang überraschend wenig empirische Evidenz dazu, wie solch ein Unterricht in der schulischen Praxis aussehen und gelingen kann – wie eine Vielzahl von Autor*innen kritisch angemerkt haben (Bernacki et al. 2021; Bondie et al. 2019; Jager et al. 2022; Parsons et al. 2018; Vaughn et al. 2022; Whitley et al. 2019). Auch Begrich et al. (2023) haben im Jubiläumsheft der Unterrichtswissenschaft die Untersuchung von adaptiven Unterrichtsformen als eine der zentralen „Perspektiven für eine Unterrichtsqualitätsforschung der Zukunft“ herausgearbeitet. An dieser Stelle möchten wir „weiterdenken“, wie die empirische Untersuchung von adaptivem Unterricht umgesetzt werden kann. Wir greifen dabei auf unsere Erfahrungen aus empirischen Studien, insbesondere der Studie „Adaptivität und Unterrichtsqualität im individualisierten Unterricht (Ada*Q)“Footnote 1, zurück.

2 Was ist adaptiver Unterricht?

Adaptiver Unterricht beschreibt eine Gesamtunterrichtsstrategie, die sich durch eine kontinuierliche Anpassung des Unterrichtsangebots an die individuellen Lernvoraussetzungen der Schüler*innen auszeichnet (Corno 2008; Dumont 2019; Hardy et al. 2019; Randi 2022). Die individuellen Lernvoraussetzungen von Schüler*innen beziehen sich dabei nicht nur auf die kognitiven Grundfähigkeiten und das Vorwissen der Schüler*innen, sondern schließen auch emotional-motivationale Faktoren sowie eine Vielzahl weiterer lernrelevanter Merkmale ein (Corno und Snow 1986).

Der zentrale Befund der ATI-Forschung, der heute als Expertise-Reversal-Effect bekannt ist (Kalyuga 2007), bildet die Basis für die Adaptivität des Unterrichts. So wird der Grad an Unterstützung durch die Lehrkraft in Abhängigkeit der Lernvoraussetzungen der Schüler*innen variiert, wobei Schüler*innen mit weniger günstigen Lernvoraussetzungen mehr Unterstützung erhalten als Schüler*innen, die günstigere Lernvoraussetzungen haben und selbstregulierter lernen können. Dieses Prinzip gilt nicht nur für interindividuelle, sondern auch intraindividuelle Unterschiede von Schüler*innen: Während des Lernprozesses bzw. der Kompetenzentwicklung reduziert die Lehrkraft schrittweise den Grad der Unterstützung und überträgt im Sinne des Scaffolding (van de Pol et al. 2010) zunehmend Verantwortung für den eigenen Lernprozess an die Schüler*innen. Dabei passt nicht nur die Lehrkraft die Unterstützung an die Schüler*innen an, sondern auch die Schüler*innen passen sich über die Zeit in ihrem Lernverhalten an (Corno 2008; Randi 2017).

Die Anpassungen des Unterrichtsangebots können laut Corno (2008) durch Makro- und Mikroadaptionen erfolgen. Unter Makro-Adaptionen werden längerfristige Anpassungen des Unterrichtsangebots verstanden, indem Unterrichtsmethoden, Lernmaterialien, Schwierigkeitsgrad oder Lerninhalt für flexibel formierte Schülergruppen oder für einzelne Schüler*innen variiert wird. Bei Mikro-Adaptationen handelt es sich um situative Anpassungen des Unterrichtsangebots durch die Lehrkraft, die häufig spontan in laufenden Schüler*innen-Lehrkraft-Interaktionen in Form von Fragen, Ermutigungen, Modellierungen, Erklärungen, Herausforderungen oder Rückmeldungen stattfinden (Parsons et al. 2018). Sowohl Makro- als auch Mikroadaptationen erfordern, dass Lehrkräfte den Lernfortschritt der einzelnen Schüler*innen kontinuierlich im Sinne des Formative Assessment (Brookhart 2018) diagnostizieren. Dies kann sowohl durch formelle, standardisierte Verfahren der Lernverlaufsdiagnostik als auch informell „on the fly“ erfolgen.

Ob ein Unterricht adaptiv ist, entscheidet sich auf Ebene der unterrichtlichen Tiefenmerkmale (Decristan et al. 2020) und lässt sich nicht an bestimmten Unterrichtsmethoden oder Sozialformen festmachen. Dennoch lässt sich feststellen, dass die Anpassung des Unterrichtsangebots an individuelle Lernvoraussetzungen im Rahmen eines vorwiegend lehrkraftzentrierten und instruktionsbasierten Unterrichts, in der alle Schüler*innen zur gleichen Zeit das Gleiche tun, an Grenzen stößt (Dumont 2019). Entsprechend kommen im adaptiven Unterricht neben Instruktionen durch die Lehrkraft und Unterrichtsgesprächen im gesamten Klassenverbund verstärkt kooperative und individualisierte Sozialformen zum Einsatz. Wenngleich der soziale Kontext des Klassenverbands im adaptiven Unterricht eine große Rolle spielt (Corno 2008), findet eine Öffnung und Dezentralisierung des Unterrichtsgeschehens statt, indem die Schüler*innen für längere Phasen des Unterrichts Unterschiedliches tun. Somit geht ein adaptiver Unterricht häufig mit hoher Flexibilität und Vielfalt auf Ebene der Oberflächenmerkmale einher.

3 Wie sieht adaptiver Unterricht in der Praxis aus?

Im Rahmen der Ada*Q-Studie konnten wir uns in Grundschulen, die mit dem Deutschen Schulpreis ausgezeichnet wurden, ein Bild davon machen, wie adaptiver Unterricht in der Praxis aussehen kann. Der Deutsche Schulpreis wird unter anderem für den produktiven Umgang mit Vielfalt ausgezeichnet (Beutel et al. 2016). Wenngleich die Auszeichnung der Schulen weder nach rein wissenschaftlichen Kriterien noch unter expliziter Bezugnahme auf die oben dargestellte Konzeption des adaptiven Unterrichts erfolgt, ist aufgrund der Auswahlkriterien sowie der dokumentierten Praxisbeispiele (Schratz et al. 2012) davon auszugehen, dass der Unterricht an den Preisträgerschulen durch einen hohen Grad an Adaptivität gekennzeichnet ist. Dafür sprechen auch unsere eigenen Erfahrungen im Rahmen der Ada*Q-Studie. So konnten wir auf Basis von Interviews mit Schulleitungen von 20 Preisträger-Grundschulen charakteristische Merkmale der Schul- und Unterrichtsorganisation identifizieren, die in hohem Maße mit den theoretischen Annahmen von adaptivem Unterricht übereinstimmen (Dumont et al. 2023). Im Folgenden möchten wir die identifizierten Merkmale kurz umreißen, da sie eine zentrale Grundlage für unsere weiteren Überlegungen zur empirischen Untersuchung von adaptivem Unterricht bilden.

An den von uns untersuchten Schulen des Deutschen Schulpreises wird die Heterogenität der Schüler*innenschaft als eine Bereicherung gesehen und nicht selten durch eine Jahrgangsmischung oder die Inklusion von Schüler*innen mit sonderpädagogischen Förderbedarfen gezielt erhöht. Im Unterricht wird auf diese Heterogenität mit Methoden der Differenzierung und Individualisierung reagiert. So haben die einzelnen Schüler*innen meist individualisierte Lern- und Förderpläne, die Tempo, Menge und Inhalt der zu bearbeitenden Aufgaben festlegen. Damit einher geht eine den Lernprozess begleitende Diagnostik sowie eine große Bedeutung des selbstregulierten Lernens der Schüler*innen, z. B. in Freiarbeitsphasen, in denen sich die Schüler*innen eigene Lernziele setzen. Das gemeinschaftliche und kooperative Lernen spielt ebenso eine Rolle, z. B. in Form von Paten- oder Helfersystemen, die zwischen den Schüler*innen etabliert werden. Des Weiteren zeichnen sich die von uns untersuchten Preisträgerschulen durch einen hohen Grad an Flexibilität in der Organisation von Unterricht aus. So werden im Laufe einer Unterrichtsstunde, eines Tages oder einer Woche Schüler*innen unterschiedlicher Klassen für bestimmte Projekte, Fächer oder Lerninhalte fortlaufend neu gruppiert. Diese Flexibilität der Lerngruppen geht meist mit einer räumlichen Flexibilität einher, d. h. Lernen findet nicht nur im Klassenzimmer, sondern an verschiedenen Orten in der ganzen Schule statt, die von einzelnen Schüler*innen oder Kleingruppen genutzt werden können. Auch ein fester Stundenplan im 45- oder 90-Minuten-Rhythmus ist unüblich. Schließlich findet an den Preisträgerschulen häufig fächerübergreifender Unterricht statt. Das betrifft sowohl Freiarbeitsphasen, in den die Schüler*innen an unterschiedlichen Fächern arbeiten können, als auch fächerübergreifende Projekte oder Unterrichtsstunden zu spezifischen Themen. Für die Gestaltung des Unterrichts wird an vielen Preisträgerschulen Team-Teaching praktiziert und auf die Zusammenarbeit in multiprofessionellen Teams gesetzt.

Wie bereits in Begrich et al. (2023) thematisiert, sprechen unsere Ergebnisse aus der Ada*Q-Studie dafür, dass die Umsetzung von adaptivem Unterricht in der Praxis mit weitreichenden Veränderungen der „grammar of schooling“ (Tyack und Tobin 1994) einhergeht. Dies steht im Einklang mit der Schweizer Studie „Personalisierte Lernkonzepte in heterogenen Lerngruppen (PerLen)“, die „offene und geführte Unterrichtsformen unter Mitwirkung der Schüler*innen“, „individuell-adaptive Lernangebote“, „variable Raum- und Zeitstrukturen“, „Mischung von Jahrgängen und Leistungsniveaus“ und „Fluktuation in Lerngruppen durch dynamische Schülerzuweisung“ als zentrale Charakteristika von personalisierten Lernkonzepten identifizierte (Stebler et al. 2018, S. 174). Ähnlich wie wir in der Ada*Q-Studie waren auch die Autor*innen der PerLen-Studie „von Ausmaß und Variationsvielfalt, worin die Schulen von der herkömmlichen Schul- und Unterrichtsgrammatik abweichen, überrascht“ (Stebler et al. 2018, S. 174).

4 Welche Herausforderungen ergeben sich bei der empirischen Untersuchung von adaptivem Unterricht und wie kann man ihnen begegnen?

Das prototypische Studiendesign der Unterrichtsforschung ist dadurch gekennzeichnet, dass eine idealerweise zufällig ausgewählte und repräsentative Stichprobe von Schulklassen einer Jahrgangsstufe über einen Zeitraum von einem oder mehreren Schuljahren mittels standardisierter Leistungstests, schriftlicher Befragungen und/oder Unterrichtsbeobachtungen mehrfach untersucht wird (siehe z.B. Fauth et al. 2019; Kane und Staiger 2012). Dieses Studiendesign setzt eine Reihe von Annahmen über Schul- und Unterrichtsorganisation voraus: Die Schüler*innen gehören einer Klasse an, eine Klasse besteht aus Schüler*innen der gleichen Jahrgangsstufe, die Schüler*innen werden getrennt nach Fächern unterrichtet, pro Fach werden die Schüler*innen von einer Lehrkraft unterrichtet, der Tag ist in Unterrichtsstunden untergliedert, pro Unterrichtsstunde wird ein Fach unterrichtet, Unterricht findet in Klassenzimmern statt, der Inhalt des Unterrichts ist für alle Schüler*innen weitestgehend gleich und die Lehrkraft entscheidet über den Inhalt des Unterrichts. Wie im vorangegangen Abschnitt dargelegt wurde, können diese Annahmen nicht ohne Weiteres auf Unterricht übertragen werden, der durch einen hohen Grad an Adaptivität gekennzeichnet ist.

Aus der veränderten Schul- und Unterrichtsorganisation, die häufig mit adaptivem Unterricht einhergeht, ergeben sich diverse Herausforderungen für empirische Untersuchungen, die Anpassungen des typischen methodischen Vorgehens in der Unterrichtsforschung notwendig machen. Auf Basis unserer Erfahrungen in der Ada*Q-Studie möchten wir im Folgenden auf die aus unserer Sicht zentralsten Anpassungen eingehen.

4.1 Auswahl der Stichprobe

Die für die Untersuchung von adaptivem Unterricht notwendigen Anpassungen beginnen bereits bei der Auswahl der Stichprobe. Da gegenwärtig erst wenige Lehrkräfte adaptiv unterrichten (Ankrum et al. 2020; Hardy et al. 2022; Pozas et al. 2020; Vaughn 2019), lässt sich anhand repräsentativer Zufallsstichproben kaum empirisches Wissen über die Praxis und die Wirkungen von adaptivem Unterricht generieren. Stattdessen müssen gezielt Stichproben von Schulen und Schulklassen im Sinne des Purposive Sampling gezogen werden, in denen Lehrkräfte ihren Unterricht stärker nach den Prinzipien des adaptiven Unterrichts gestalten. In der Ada*Q-Studie haben wir dies durch die Untersuchung von Schulen, die mit dem Deutschen Schulpreis ausgezeichnet wurden, realisiert. Eine gezielte Stichprobenselektion haben auch andere Studien zu personalisierten und differenzierten Unterrichtsformen bereits umgesetzt (siehe Brevik et al. 2018; Stebler et al. 2018; Vaughn 2019).

4.2 Multimethodischer Zugang

Auch wenn dies für viele Themen der Unterrichtsforschung gewinnbringend wäre, erfordert die empirische Untersuchung von adaptivem Unterricht in besonderem Maße einen multimethodischen Zugang, um ein tieferes und breiteres Verständnis dieses bislang noch wenig erforschten Unterrichtskonzepts zu erlangen und zugleich die Theoriebildung voranzubringen (Greene 2022; McCrudden et al. 2019). Wie in den folgenden Abschnitten ausführlicher dargestellt wird, haben wir in der Ada*Q-Studie daher verschiedene Erhebungsmethoden eingesetzt: Interviews mit Schulleitungen und Lehrkräften, standardisierte Leistungstests, schriftliche Befragungen von Schüler*innen und Lehrkräften, Unterrichtsvideographie sowie Experience-Sampling. Insbesondere die qualitativen Daten aus den Interviews mit Schulleitungen und Lehrkräften haben uns ein tiefergehendes Verständnis für die Besonderheiten der Schul- und Unterrichtsorganisation ermöglicht. Darüber hinaus halten wir, wie auch andere Autor*innen (Jager et al. 2022; van Geel et al. 2018), eine Dokumentenanalyse von Unterrichtsplanungen und Unterrichtsmaterialien für besonders vielversprechend, um adaptiven Unterricht zu untersuchen. So ist davon auszugehen, dass Lehrkräfte im Zuge ihrer Unterrichtsplanung Makro-Adaptationen gezielt vorbereiten. Auch kommt den Unterrichtsmaterialien in einem dezentralen Unterricht, in dem Schüler*innen verstärkt selbstreguliert an unterschiedlichen, für sie passenden Aufgaben arbeiten, eine besondere didaktische Bedeutung zu (Breidenstein und Rademacher 2017).

4.3 Zusammenarbeit mit der Praxis

Ähnlich wie Walkington und Bernacki (2020) halten wir eine verstärkte Zusammenarbeit mit der schulischen Praxis für notwendig, um adaptiven Unterricht empirisch adäquat erfassen und erforschen zu können – so wie das auch Begrich et al. (2023) als generelle Perspektive für die Unterrichtsforschung vorgeschlagen haben. In der Ada*Q-Studie haben wir im Wesentlichen zwei Ansätze einer engeren Zusammenarbeit mit Schulen verfolgt. Zum einen haben wir unser Studiendesign sowie unsere Instrumente vor Beginn der zentralen Datenerhebungen mit Lehrkräften diskutiert und diese daraufhin angepasst (vgl. Abschn. 4.4–4.6). Zum anderen haben wir während der Datenerhebungen eine ganze Woche in den Schulen verbracht und sind so tiefer in den Schul- und Unterrichtsalltag eingetaucht. Nicht selten hatten wir im Laufe der Ada*Q-Studie den Eindruck, selbst die Lernenden – und nicht Wissenschaftler*innen mit Expertenwissen – zu sein. Ähnlich schreibt auch Randi (2022): „While practitioners could benefit from understanding the theory that explains adaptive teaching, researchers could learn from knowing more about what adaptive teachers actually do“ (S. 8). Partizipative Forschungsansätze (von Unger 2014), in denen Wissenschaftler*innen und Praktiker*innen auf Augenhöhe und ko-konstruktiv miteinander arbeiten, könnten hierfür vielversprechend sein.

4.4 Leistungstests

Wenn adaptiver Unterricht mit einer erhöhten Heterogenität der Schüler*innenschaft z. B. durch Jahrgangsmischung oder der Inklusion von Schüler*innen mit sonderpädagogischen Förderbedarfen einhergeht, stellt die Erfassung der Leistungsstände von Schüler*innen eine erhebliche Herausforderung dar. So ist es in jahrgangsgemischten Klassen beispielsweise nicht möglich, den gleichen standardisierten Schulleistungstest für alle Schüler*innen einzusetzen, da solche Tests in der Regel auf bestimmte Jahrgangsstufen ausgerichtet sind. In der Ada*Q-Studie haben wir uns daher dazu entschieden, nur die Schüler*innen der dritten und vierten Jahrgangsstufen der Grundschulen zu testen, da hier die gleichen Tests verwenden werden konnten. Dies hatte jedoch zur Folge, dass wir für die jahrgangsgemischten Klassen nur die Hälfte der Schüler*innen testen konnten. Hier wäre der Einsatz computerbasierter adaptiver Tests ein sinnvoller Lösungsansatz. Während bei herkömmlichen Testverfahren eine festgelegte Menge von Items in einer festen Reihenfolge bearbeitet werden müssen, orientiert sich die Auswahl der Items bei adaptiven Tests am vorherigen Antwortverhalten einer Person (Frey 2020). Diese adaptive Anpassung der Itemauswahl entspricht dem Grundgedanken des adaptiven Unterrichts und würde es ermöglichen, Schüler*innen auf unterschiedlichen Niveaus gleichzeitig zu testen. Dabei könnten auch unterschiedliche Lernziele von Schüler*innen gezielt berücksichtigt werden. Es muss jedoch bedacht werden, dass die Konstruktion und auch der Einsatz von computerbasierten adaptiven Tests sehr aufwändig ist (Frey 2020). Es bleibt zu hoffen, dass in Zukunft auch in Deutschland verstärkt intelligente tutorielle Systeme zur Verfügung stehen, die nicht nur für die Erfassung und Förderung von Leistungen in der Praxis, sondern auch für wissenschaftliche Zwecke genutzt werden können.

Neben einer adaptiven Leistungserfassung sollten auch andere Zieldimensionen wie etwa die emotional-motivationale Entwicklung der Schüler*innen zur empirischen Untersuchung der Wirksamkeit von adaptivem Unterricht herangezogen werden. Unserer Erfahrung nach ist die Erfassung emotional-motivationaler Merkmale in heterogenen Lerngruppen ohne größere Anpassungen der Datenerhebungsmethoden möglich.

4.5 Unterrichtsvideographie

Die Unterrichtsvideographie stellt in der Unterrichtsforschung eine zentrale Methode zur Erfassung von Unterrichtsqualität dar. Oft wird eine einzelne Unterrichtsstunde videographiert, wobei meist zwei Kameras zum Einsatz kommen – eine zur Aufzeichnung des Lehrkraftverhaltens und eine zur Aufzeichnung des gesamten Klassengeschehens (siehe z. B. Hugener et al. 2006). Aufgrund der zeitlichen und räumlichen Flexibilität der Unterrichtsorganisation sowie der flexiblen und variablen Lerngruppen, die für adaptiven Unterricht typisch sind, muss dieses Vorgehen angepasst werden. So ist es kaum möglich, eine Klasse für eine Unterrichtsstunde in einem Klassenzimmer zu videographieren. In der Ada*Q-Studie haben wir daher neben einer Lehrkraft- und Klassenkamera pro Klasse zusätzlich fünf mobile Action-Kameras eingesetzt, die die Schüler*innen bei Einzel- und Gruppenarbeiten, die sich teilweise über das gesamte Schulgebäude verteilt haben, begleitet haben. Zudem haben wir den Unterricht über den Verlauf einer Schulwoche videographiert, um die Wechsel zwischen Lerngruppen abbilden und der unterrichtsorganisatorischen Flexibilität gerecht werden zu können.

4.6 Schriftliche Befragungen

Ebenso können die in der Unterrichtsforschung etablierten schriftlichen Befragungen von Schüler*innen und Lehrkräften zur Erfassung von Unterrichtsqualität nicht ohne weiteres eingesetzt werden. So fokussieren diese typischerweise eine Lehrkraft und ein Fach und implizieren einen stark lehrkraftzentrierten Unterricht (Fauth 2021), was in einem adaptiven Unterricht häufig nicht gegeben ist. In der Ada*Q-Studie waren wir mit der Herausforderung konfrontiert, dass viele Klassen von mehr als einer Lehrkraft in Form des Team-Teaching unterrichtet wurden, Schüler*innen zur gleichen Zeit an unterschiedlichen Fächern arbeiteten und das Unterrichtsgeschehen mitgestalteten. Vor diesem Hintergrund mussten wir verschiedene Anpassungen vornehmen. In Klassen mit Team-Teaching haben wir uns dafür entschieden, die Unterrichtsqualität für beide Lehrkräfte getrennt zu erfassen. Zudem haben wir keine Fokussierung auf ein Fach vorgenommen. Sowohl Schüler*innen und Lehrkräfte wurden geben, den Unterricht über alle Fächer hinweg zu beurteilen. Da in der Grundschule in der Regel die Klassenlehrkraft (bzw. im Fall von Team-Teaching die Klassenlehrkräfte) die meisten Fächer unterrichtet (bzw. unterrichten), war dies problemlos möglich. Schließlich haben wir diverse Anpassungen auf Itemebene vorgenommen, so dass die Formulierungen weniger das Verhalten der Lehrkraft fokussierten. Solche Anpassungen sind nicht nur für Fragebögen, sondern auch für Beobachtungsmanuale notwendig.

4.7 Innovative Datenerhebungsmethoden zur Erfassung von Adaptivität

Darüber hinaus stellt sich bei der empirischen Untersuchung von adaptivem Unterricht die Frage, wie der Grad der Adaptivität als unterrichtliches Tiefenmerkmal erfasst werden kann. In jüngerer Zeit hat es hierzu eine Reihe von Instrumentenentwicklungen gegeben, die entweder auf Schüler*innenfragebögen (van de Pol et al. 2022) oder Unterrichtsbeobachtungen (Ankrum et al. 2020; Hardy et al. 2022; Schipper et al. 2020) basieren. Auch in der Ada*Q-Studie haben wir auf diese beiden empirischen Zugänge gesetzt. Im Gegensatz zu anderen Instrumenten haben wir hier jedoch einen situativen Blick auf das Unterrichtsgeschehen geworfen. So haben wir die Schüler*innen mittels Tablets nach jeder Lerneinheit über den Verlauf einer Schulwoche zu ihrem Unterrichtserleben befragt, wobei die Adaptivität über eine Frage zur subjektiv erlebten Schwierigkeit der vorangehenden Lerneinheit erfasst wurde (Dumont und Ohl 2023). Ein derartiges Experience Sampling bietet den Vorteil, dass intraindividuelle Veränderungen über die Zeit abgebildet werden können, die Einschätzungen weniger Erinnerungsverzerrungen unterliegen und die Schüler*innen zu unterschiedlichen Zeitpunkten an der Befragung teilnehmen können (Zirkel et al. 2015). Um die Schüler*innenperspektive mit ihrem Verhalten im Unterricht zusammenbringen und vergleichen zu können, haben wir zudem jede Unterrichtsstunde über den Verlauf der Schulwoche gefilmt, wobei wir von allen videographierten Schüler*innen die ID erfasst haben. Dies ermöglicht, den Blick auf Lehr-Lernprozesse von einzelnen Schüler*innen zu werfen, was bei der Anpassung des Unterrichtsangebots an die individuellen Lernvoraussetzungen von besonderer Bedeutung ist.

4.8 Statistische Datenanalysen

Schließlich ergeben sich bei der empirischen Untersuchung von adaptivem Unterricht durch seinen hohen Grad an Flexibilität bei der Schul- und Unterrichtsorganisation Herausforderungen bei der statistischen Datenanalyse. Erstens bedeutet die Flexibilität von Lerngruppen eine Auflösung der klassischen Mehrebenenstruktur. Wie bereits Stebler et al. (2018) angemerkt haben, ist eine Zuordnung von Schüler*innen zu Klassen und von Klassen zu Lehrkräften nur begrenzt möglich, da diese im Verlauf einer Schulwoche wechseln kann und eine Klasse nicht selten von mehreren Lehrkräften unterrichtet wird. Entsprechend bilden klassische Mehrebenenanalysen die real existierenden Strukturen nur eingeschränkt ab. Hier könnten kreuzklassifizierte Mehrebenenanalysen einen ersten Ansatz darstellen, wenngleich auch dies der unterrichtsorganisatorischen Komplexität nicht vollständig gerecht wird. Zweitens ist die Analyse von Wirkungen des Unterrichts in einem Fach auf die Leistungsentwicklung und die emotional-motivationale Entwicklung in diesem Fach nur bedingt möglich, da Schüler*innen häufig zur gleichen Zeit unterschiedliche Fächer bearbeiten oder sogar fächerübergreifender Unterricht stattfindet. Insofern ist die kausale Interpretation von Effekten hier besonders herausfordernd. Drittens ist eine offene Frage, wie sich die Unterrichtsqualität im Fall von Team-Teaching analysieren lässt. Liegen beispielweise für eine Klasse Befragungsdaten zur Unterrichtsqualität für zwei Lehrkräfte vor, ist unklar, wie eine valide Datenauswertung erfolgen kann. Beispielsweise gilt es zu berücksichtigen, dass Schüler*innenurteile über verschiedene Lehrkräfte künstliche Kontrasteffekte enthalten können (Jaekel et al. 2021). Hier ist eine umfassende konzeptuelle und empirische Entwicklungsarbeit nötig, die wir mit Blick auf unsere eigenen Daten aus der Ada*Q-Studie erst begonnen haben.

5 Fazit

Zusammenfassend lässt sich sagen, dass die empirische Untersuchung von adaptivem Unterricht äußerst komplex und ressourcenintensiv ist. Nicht selten geht damit auch die Schwierigkeit einher, dass die Datengrundlage weitaus mehr „messy“ ist als bei klassisch angelegten Studiendesigns der Unterrichtsforschung und Gutachter*innen dies im Peer-Review-Prozess kritisch anmerken. In Anbetracht dessen haben auch wir uns, ähnlich wie Stebler et al. (2018), die Frage gestellt, ob man die Durchführung solcher Studien besser vermeiden sollte. Wir schließen uns dem Fazit unserer Kolleg*innen an: Nein, das sollte man nicht. Auch wir sind der festen Überzeugung, dass die Unterrichtsforschung sich nur weiterentwickeln kann, wenn sie weiterdenkt und neue, teilweise auch mühsame Wege beschreitet. Aber nicht nur das methodische Vorgehen der Unterrichtsforschung muss weitergedacht und weiterentwickelt werden, auch die theoretischen Annahmen sollten kritisch hinterfragt werden. So ist beispielsweise noch ungeklärt, in welchem Verhältnis Adaptivität zu den drei Basisdimensionen der Unterrichtsqualität steht (Dumont 2019). Wir sind daher der Auffassung, dass nicht nur Unterricht, sondern auch die Unterrichtsforschung adaptiver werden muss.