1 Einleitung

Die zentrale Bedeutung von Interesse im (naturwissenschaftlichen) Unterricht ist in der Bildungsforschung allgemein bekannt und akzeptiert. Interesse wird positiv mit Leistung, Selbstkonzept, Motivation und Selbstwirksamkeitserwartungen assoziiert (Potvin und Hasni 2014). Neben Faktoren wie der Leistung und dem Selbstkonzept der Lernenden wird auch das Interesse positiv mit den Berufs- und Kurswahlentscheidungen assoziiert (Eitemüller und Walpuski 2018; Maltese und Tai 2011). So fasste Su (2018) in ihrem Review zusammen, dass das Interesse prädiktiv für die Berufswahl ist und positiv mit den aufgebrachten Anstrengungen im Beruf korreliert.

Obwohl Lernende häufig mit einem hohen Interesse an Naturwissenschaften in die Sekundarstufe kommen, hält dieses Interesse nicht an (Potvin und Hasni 2014). Eine differenzierte Betrachtung von Interesse bestärkt diesen Befund: So lässt sich im Chemieunterricht in verschiedenen naturwissenschaftsspezifischen Aktivitäten eine Abnahme des Interesses beobachten (Höft et al. 2019). Ein möglicher Erklärungsansatz für diesen Rückgang des Interesses an den Naturwissenschaften ist die Interessendifferenzierung, welche im Zuge der Pubertät stattfindet. Allerdings sinkt das Interesse in den Naturwissenschaften Chemie und Physik im Vergleich mit anderen Unterrichtsfächern überdurchschnittlich stark (Krapp und Prenzel 2011). Schülerinnen sind von diesem Abfall stärker betroffen als Schüler. Diese Befunde bieten einen Erklärungsansatz für die verhältnismäßig geringe Zahl an Lernenden, die sich nach ihrem Schulabschluss für einen naturwissenschaftlichen Beruf entscheiden (Lyons und Quinn 2010). Gerade unter Einbezug der steigenden Berufsmöglichkeiten im Bereich Mathematik, Informatik, Naturwissenschaften und Technik (MINT) gewinnt dieser Aspekt an Bedeutung. Hieraus ergibt sich eine Herausforderung für die Bildungsforschung: Es muss nach Ansätzen und Möglichkeiten gesucht werden, das Interesse von Lernenden explizit zu fördern bzw. bei bereits naturwissenschaftlich interessierten Lernenden aufrecht zu halten. Für eine effiziente Weiterentwicklung von Chemieunterricht wird in dieser Studie zunächst explorativ untersucht, welche Ansätze zur Interessenförderung bereits realisiert worden sind und wie sie auf das Interesse der Lernenden wirken.

2 Theoretischer Hintergrund und Stand der Forschung

Interesse lässt sich mittels unterschiedlicher theoretischer Ansätze definieren. Gemeinsam haben die meisten Definitionen, dass es sich bei Interesse um ein multidimensionales Konstrukt handelt, welches sowohl affektive als auch kognitive Bestandteile beinhaltet (Krapp 2005; Renninger und Hidi 2016; Schiefele 2009). Krapp (2002) definiert Interesse in der sogenannten person-object theory of interest (POI) als eine „Person-Gegenstands-Beziehung“. Interesse resultiert folglich aus der Auseinandersetzung eines Individuums mit einem Gegenstand in seiner Umwelt. Dieser Gegenstand kann einem tatsächlichen Gegenstand entsprechen, aber auch einem Thema oder einer abstrakten Idee (Krapp und Prenzel 2011). Die POI ist in erster Linie geeignet, eine ontogenetische Entwicklung von Interesse zu erklären, welche per se relativ stabil ist. Weniger adäquat ist sie jedoch, um spontan auftretendes Interesse in einer Situation, bspw. während einer Lerngelegenheit im Schulkontext, zu erklären (Krapp 2002). Hierfür ist eine Betrachtung von Interesse notwendig, die genauso wie die POI zwischen einem stabilen (individuelles Interesse) und einem situationsabhängigen Anteil (situationales Interesse) differenziert (Krapp 2002), aber einen stärkeren Fokus auf das situationale Interesse und assoziierte Prozesse legt (z. B. Hidi 2001).

Individuelles Interesse entspricht prinzipiell dem Interesse, wie es in der POI formuliert wurde: Es umfasst die Prädisposition eines Individuums, sich wiederholt mit einem bestimmten Gegenstand auseinanderzusetzen, und ist damit zeitlich sehr stabil (Schiefele 2009). Bezogen auf die Naturwissenschaften wurde z. B. das Interesse der Lernenden an der Domäne Chemie bzw. am Chemieunterricht untersucht (Daniels 2008), aber auch an spezifischen Fachthemen (Hoffmann et al. 1998; Elster 2007). Weiterhin haben Dierks et al. (2014) mit dem RIASEC+N-Modell (in Anlehnung an das RIASEC-Modell zur Erfassung von Berufsinteressen nach Holland (1997)) eine Möglichkeit zur Ausdifferenzierung individueller Interessen vorgeschlagen und empirisch untersucht (Blankenburg et al. 2016; Höft et al. 2019). Dieser Ansatz ist tätigkeitsbezogen, d. h. es wird das individuelle Interesse von Lernenden an typischen naturwissenschaftlichen Tätigkeiten und Arbeitsweisen untersucht. Der Name des Modells bildet ein Akronym für die verschiedenen Dimensionen, z. B. Realistic (bspw. Experimente nach einer vorgegebenen Anleitung durchführen) oder Investigative (bspw. Experimente planen, um etwas genauer zu untersuchen).

In Abgrenzung zum individuellen Interesse beschreibt das situationale Interesse einen kurzweiligen psychologischen Zustand, welcher von erhöhter Aufmerksamkeit geprägt ist (Harackiewicz et al. 2016). Der Zusammenhang zwischen diesen beiden Arten des Interesses wurde über das Four-Phase Model of Interest Development modelliert (Hidi und Renninger 2006), das eine Entwicklung des Interesses über vier konsekutive Entwicklungsstufen beschreibt: Beginnend mit der Entstehung von situationalem Interesse (triggered situational interest) über ein andauerndes situationales Interesse (maintained situational interest) entwickelt sich aus diesem schließlich ein individuelles Interesse (emerging individual interest), welches im Verlauf der Zeit stabiler wird (well-developed individual interest). Diese verschiedenen Entwicklungsstufen des Interesses gehen mit wachsendem Wissen und einer gesteigerten Wertschätzung bezüglich des Gegenstands einher (Hidi und Renninger 2006). Während der Interessensentwicklung kann zu jedem Zeitpunkt das Interesse zurückgehen oder auf der jeweiligen Stufe stagnieren (Renninger und Hidi 2011). Beides kann durch entsprechende externale Unterstützung verhindert oder gemindert werden (Azevedo 2015). Ist bereits ein individuelles Interesse ausgeprägt, so wirkt sich dieses auch positiv auf die Entwicklung eines situationalen Interesses aus, wie generell von Tsai et al. (2008) und domänenspezifisch für die Naturwissenschaften von Ainley et al. (2002) gezeigt wurde.

Empirische Evidenz für dieses Modell liefern verschiedene Studien: Cheung (2017) untersuchte in einer qualitativen Studie beispielsweise Faktoren, die individuelles Interesse am naturwissenschaftlichen Unterricht fördern, und konnte u. a. das individuelle Interesse an den Naturwissenschaften generell sowie situative Einflüsse wie die konkrete Unterrichtsgestaltung als Einflussfaktoren identifizieren. Letztere fördern dabei zunächst situationales Interesse und dadurch indirekt auch die Entwicklung von individuellem Interesse. Palmer et al. (2017) untersuchten die Entwicklung des situationalen und individuellen Interesses von Grundschullehramtsstudierenden an Naturwissenschaften während eines zehnwöchigen Studienmoduls. Sie konnten zeigen, dass wiederholtes Erleben von situationalem Interesse während des Moduls mit einem relativ stabilen, höheren individuellen Interesse an Naturwissenschaften am Ende des Moduls einhergeht.

Um Lernende bei der Entwicklung eines stabilen individuellen Interesses zu unterstützen, sollte daher das situationale Interesse adressiert werden. Aufgrund der eingangs dargestellten Problematik, dass das Interesse von Lernenden am Chemieunterricht – und am naturwissenschaftlichen Unterricht generell – sehr gering ist bzw. im Verlauf der Sekundarstufe abnimmt, erscheint die Förderung von situationalem Interesse umso wichtiger.

2.1 Trigger von situationalem Interesse

Maßnahmen, die der Initiierung und der Förderung von Interesse dienen, werden unter dem Begriff „Trigger“ zusammengefasst: „The development of a new interest is initiated when something catches the attention of a learner, a process called triggering“ (Renninger et al. 2019, S. 2). Im Bereich der situationalen Interessenförderung lassen sich bereits einige Trigger festhalten, die sich in verschiedenen Studien mit naturwissenschaftlichem Schwerpunkt als empirisch wirksam erwiesen habenFootnote 1. In weiteren Unterrichtsfächern sind Trigger teilweise anders gewichtig oder weichen ab: In sprachlichen Fächer haben z. B. die Gestaltung von Texten einen anderen Stellenwert (Hidi 2001) und Hands-on Aktivitäten umfassen andere Tätigkeiten (z. B. das Erarbeiten von Standbildern im Sinne des szenischen Darstellens).

Der Forschungsstand im naturwissenschaftlichen Unterricht ist sehr divers: Es sind Trigger in verschiedenen unterrichtsrelevanten Bereichen, die in Anlehnung an Fend (1988) eingeteilt wurden, wie in der Administration, aber auch in der Unterrichtsgestaltung, der Lernmaterialgestaltung („Collative Variables“), in der Beziehung zwischen Lehrkraft und Lernenden, Charakteristika der Lehrkraft sowie Aspekte der Selbstbestimmungstheorie untersucht worden. Dabei ist nicht immer eindeutig zuzuordnen, welche Trigger sich tatsächlich auf situationales und welche auf individuelles Interesse auswirken. Auch die Befundlage bezüglich der interessefördernden Wirkung ist nicht durchweg eindeutig. So werden bspw. Hands-on Aktivitäten einerseits als interessefördernd beschrieben (Shirazi 2017). Andererseits schränken Holstermann et al. (2010) diese Feststellung mit ihrer Studie im Biologieunterricht ein, in der sie Hands-on Aktivitäten in verschiedene Bereiche unterteilten und differenzierte Effekte, z. T. sogar negative Effekte, auf das Interesse feststellen konnten. Walpuski und Hauck (2017) bestätigten für den Chemieunterricht, dass nicht jedes Experiment per se für Lernende interessant ist. Sie identifizierten in ihrer Studie zunächst Verbesserungspotenzial von Experimenten im Chemieunterricht (bspw. eine stärkere Betonung der Fragestellung, des Planens und der Diskussion der Ergebnisse). In einem zweiten Schritt setzten sie diese in Experimentierphasen um und konnten ein größeres Interesse bei den Lernenden im Vergleich zur Kontrollgruppe feststellen.

Einschränkungen bezüglich der Wirksamkeit oder Wirkrichtung finden sich auch bspw. bei der Gestaltung von persönlich relevanten Unterrichtsinhalten (Renninger und Bachrach 2015). Im Zuge dieser Studie stellten Renninger und Bachrach (2015) außerdem fest, dass der Interessentrigger „Neuheit“ (novelty) zu stark vereinfacht wird, da sich dieser auf verschiedene Aspekte wie die Neuheit der Lernumgebung, der Methode oder auch des Lerninhalts beziehen kann. Zudem können verschiedene Trigger gleichzeitig auftreten, bspw. eine Kombination aus einer Hands-on Aktivität und Neuheit (der Aktivität und/oder des Inhalts). Demnach sollte ein deutlich detaillierterer Blick auf den Unterricht geworfen werden, um festzustellen, an welcher Stelle Potenziale zur Interessenförderung liegen. Bei fast allen Studien handelt es sich entweder um Interventionen, Reviews oder um post-hoc Untersuchungen von bereits stattgefundenem Unterricht.Footnote 2 Erstere untersuchen per se nicht den Unterricht, der von Lehrkräften konzipiert wird, sondern analysieren die Wirksamkeit der für einen speziellen Zweck erstellten Interventionsmaterialien. Letztere hingegen können aufgrund der temporären Instabilität des situationalen Interesses nur begrenzt analysieren, wann und wodurch dieses bei den Lernenden hervorgerufen wurde. Damit ergibt sich ein Bedarf an einer zeitlich feinkörnigeren Untersuchung des Entstehens und Aufrechterhaltens des situationalen Interesses von Lernenden im naturwissenschaftlichen Unterricht. Wenige empirische Studien haben sich diesem bereits gewidmet: Patall et al. (2016) bspw. haben die Entstehung sowie die Stabilität von situationalem Interesse über den Verlauf einer Unterrichtseinheit (aber nicht innerhalb der Unterrichtsstunden) untersucht, die Unterrichtsqualität als Beschreibung der ablaufenden unterrichtlichen Prozesse wurde dabei nicht berücksichtigt.

2.2 Unterrichtsqualität

Unterricht und seine Wirkung werden maßgeblich von der Lehrkraft beeinflusst, da sie diesen gestaltet und durchführt. Im Rahmen des Angebots-Nutzungs-Modells macht sie den Lernenden das Angebot (den Unterricht) (Helmke 2007). Die Nutzung dieses Angebots erfolgt in Form der Lernaktivitäten der Lernenden; der Lernzuwachs wird als Wirkung oder Ertrag klassifiziert. Im Hinblick auf das Interesse der Lernenden veranschaulicht dieses Modell, dass die Unterrichtsqualität durch die Lehrkraft und deren professionelle Kompetenz beeinflusst wird. Mögliche Kriterien zur Erfassung der Unterrichtsqualität wurden in verschiedenen Katalogen dargelegt und in unterschiedlichen Studien empirisch untersucht. Hier sind u. a. die Arbeiten von Clausen et al. (2003) oder auch die Ergebnisse des COACTIV-Projekts (Kunter und Voss 2013) zu nennen. Aktuelle Betrachtungen zeigen, dass die häufig vorgeschlagene dreidimensionale Struktur der Unterrichtsqualität (Potenzial zur kognitiven Aktivierung, Klassenführung und konstruktive Unterstützung, z. B. Kunter und Voss 2013) die einzelnen Facetten von Unterrichtsqualität sowohl im generischen als auch im fachspezifischen Bereich nicht ausreichend abbilden kann (Praetorius und Charalambous 2018).

Ein fächerübergreifendes Instrumentarium zur Beobachtung von Unterrichtsqualität bietet auch das Projekt EMU (Evidenzbasierte Methoden der Unterrichtsdiagnostik) von Helmke et al. (2010), das sich an Hatties Meta-Analyse lernförderlicher Unterrichtsmerkmale (2009) orientiert und die Bereiche Klassenführung, lernförderliches Klima und Motivierung, Klarheit und Strukturiertheit, Aktivierung und Förderung sowie eine generelle Bilanz der Unterrichtsstunde erfasst (Helmke et al. 2010; s. Tab. 1). Dieses Instrument kann im Zuge der Qualitätssicherung sowohl zur Eigen- als auch Fremdreflexion von Unterricht durch Lehrkräfte genutzt werden.

Tab. 1 Unterrichtsqualitätsmerkmale nach Helmke et al. (2010)

In Hatties Meta-Analyse (2009) wurden diese Kriterien in Bezug auf die Leistung der Lernenden untersucht. Sowohl die Lernzielklarheit (d = 0,75) als auch ein für die Lernenden fordernder Unterricht (d = 0,64), wie er von Helmke et al. (2010) im Bereich Aktivierung und Förderung beschrieben wird, haben einen großen Effekt auf die Leistung. Weiterhin spielt auch elaboriertes Feedback (d = 0,72) eine große Rolle, während die Klassenführung einen mittleren Effekt hat (d = 0,52) (Hattie 2009).

Generell besteht ein großer Zusammenhang zwischen fachübergreifenden und fachspezifischen Merkmalen der Unterrichtsqualität (Praetorius et al. 2020): Die universale Ebene (z. B. der Klassenführung) und die der Subdimension (z. B. Verhaltensmanagement) ist zunächst generisch zu verstehen. Auf Ebene des Indikators bzw. des Items hingegen zeigen sich bspw. für die Naturwissenschaften fachspezifische Besonderheiten (z. B. Allgegenwärtigkeit, Prävention und Intervention), da hier fachdidaktisches Wissen zur Beurteilung genutzt werden muss (Heinitz und Nehring 2020). Folglich lässt sich ein generisches Instrumentarium (z. B. das des EMU-Projekts) durch die konkrete Ausformulierung der Indikatoren für bestimmte Unterrichtsfächer anpassen. Gemäß der Ausführungen im Rahmen der PISA-Studie soll naturwissenschaftlicher Unterricht strukturiert, störungsarm, kognitiv aktivierend und diszipliniert sein. Daneben soll er eine angemessene Unterstützung durch die Lehrkraft bieten, wobei diese im Gleichgewicht mit einer inhaltlichen Öffnung stehen sollte (Schiepe-Tiska et al. 2016). Diese Merkmale der Unterrichtsqualität sind bisher vor allem darauf untersucht worden, ob sie eine positive Auswirkung auf die Leistung der Lernenden haben (Hattie 2009; Stronge et al. 2007). Aufgrund des nachgewiesenen Zusammenhangs zwischen Interesse und Leistung (z. B. Schiefele et al. 1992) kann jedoch davon ausgegangen werden, dass diese Merkmale auch eine positive Wirkung auf das Interesse der Lernenden haben.

Neben Qualitätsmerkmalen ist die Gestaltung von Unterricht ein zentrales Merkmal, die u. a. durch die Wahl der Sozialform, Thematik und Methodik beschrieben werden kann. Diese sind teilweise auch als potenzielle Interessentrigger empirisch untersucht worden (z. B. Gruppenarbeit (Matthews 2004) oder Projektarbeit (Hulleman und Harackiewicz 2009)). Neben diesen methodisch-inhaltlichen Bereichen zählt auch die Phasierung von Unterricht zur Unterrichtsgestaltung (Kiper et al. 2011). Die Idee des Phasierens wurde erstmals von Roth (1957) formuliert. Seine Annahme war, dass Lernen durch ein stufenförmiges Problemlösen erfolgt. Dieses Schema wurde von Petersen et al. (2011) vereinfacht, sodass es auf jeden Unterricht übertragbar ist. Die vereinfachte Phasierung lautet: Einstieg/Motivation, Problematisierung, Erarbeitung, Sicherung und Auswertung sowie Transfer. Dabei muss nicht jede Unterrichtsstunde strikt nach diesem Schema ablaufen. Vielmehr wird Unterricht aus verschiedenen dieser Bausteine in weitgehend variabler Reihenfolge zusammengesetzt. Eine Besonderheit im Chemieunterricht ist die Durchführung von Experimenten. Daher lässt sich die Erarbeitung in eine theoretische und eine praktische (experimentelle) Erarbeitungsphase unterteilen.Footnote 3

Die empirische Befundlage zur Wirkung von Unterrichtsphasierung ist dünn. Generell ist festzuhalten, dass die Phasierung von Unterricht größtenteils auf Erfahrungen und/oder schulpädagogischen und fachdidaktischen Theorien beruht (Petersen et al. 2011). Allerdings ist jede Phase durch bestimmte Charakteristika bezüglich der Unterrichtsgestaltung gekennzeichnet. In Einstiegsphasen werden die Lernenden häufig mit einem neuen Phänomen konfrontiert, in den praktischen Erarbeitungsphasen finden beispielsweise Experimente statt und in Sicherungs- bzw. theoretischen Erarbeitungsphasen wird häufig mehr geschrieben als in den zuerst genannten Phasen. In Verbindung mit den bereits vorgestellten Interessentriggern lässt sich daher vermuten, dass Einstiegsphasen, in denen den Lernenden neue Phänomene oder Fragestellungen vorgestellt werden, eine positive Wirkung auf das situationale Interesse der Lernenden haben, da sie den Trigger „Neuheit“ beinhalten (z. B. Palmer 2009). Diese positive Wirkung konnte von Ruppert (2010) bereits für den Biologieunterricht gezeigt werden, sodass eine Übertragung auf den Chemieunterricht wahrscheinlich ist. Weiterhin gelten theorielastige Phasen (z. B. theoretische Erarbeitungs- oder Sicherungsphasen) als hinderlich für das situationale Interesse von Lernenden (Logan und Skamp 2013). Viele Studien im Bereich der Unterrichtsphasierung fokussieren zudem eher die Seite der Lehrkräfte (z. B. Planungskompetenz, Vergleiche zwischen unterschiedlichen Lehrkräften etc.) und nicht die Lernenden (Zierer und Wernke 2017). Neben der klassischen Unterrichtsphasierung nach Roth gibt es auch weitere Unterrichtskonzeptionen wie die Basismodelle (z. B. Nutzen von Lernstrategien oder problembasiertes Lernen) nach Oser und Baeriswyl (2001). Wackermann et al. (2008) untersuchten die Wirksamkeit der Umsetzung dieses Modells im Rahmen einer Physiklehrkräftefortbildung und arbeiteten heraus, dass eine klare Umsetzung der in diesem Modell formulierten Phasen zu verbesserter Unterrichtswahrnehmung, Leistung und Emotionen bei den Lernenden führt. Je strikter die Lehrkräfte das Basismodell in ihren Unterricht integrierten, desto stärker verbesserten sich die Zuwächse bei den Lernenden. Allerdings ist dieses Modell nur ganzheitlich untersucht worden und nicht in Bezug auf einzelne Phasen.

3 Fragestellungen

Ziel der vorliegenden Studie ist die Analyse der Zusammenhänge von Unterrichtsphasierung sowie von Unterrichtsqualitätsmerkmalen mit dem situationalen Interesse von Lernenden im Chemieunterricht. Zur Analyse sollen die Qualitätsmerkmale von Unterricht, die von Helmke et al. (2010) im Zuge des EMU-Projekts operationalisiert worden sind (s. Abschn. 4.2), sowie eine allgemeine Protokollierung des Unterrichts genutzt werden. Insgesamt soll die übergreifende Frage, inwiefern bestimmte Merkmale unterrichtlicher Qualität in Relation mit dem situationalen Interesse der Lernenden stehen und ob sich grundsätzliche Unterschiede in der Ausprägung des situationalen Interesses in verschiedenen Unterrichtsphasen zeigen, untersucht werden.

FF1

Welche Unterrichtsqualitätsmerkmale sind unter Kontrolle der ZeitFootnote 4 mit dem situationalen Interesse von Lernenden im Chemieunterricht assoziiert?

Anhand der bereits untersuchten Interessentrigger lassen sich einige Hypothesen zur Beantwortung dieser Forschungsfrage formulieren: Ein hohes Klassenmanagement geht vermutlich mit einem niedrigem situationalen Interesse einher, da die Lenkung des Unterrichts sehr stark ist (Stronge et al. 2007). Dieses Ergebnis wurde auch im Mathematikunterricht gefunden (Grünkorn et al. 2020). Es hat sich zudem gezeigt, dass Unterrichtsformen mit einer geringeren Lenkung durch die Lehrkraft einen positiven Effekt auf das situationale Interesse haben (Harackiewicz et al. 2016). In weiteren Studien wurde im Kontrast dazu gezeigt, dass das Klassenmanagement auch positiv mit dem Interesse der Lernenden verknüpft sein kann (z. B. Kunter et al. 2007, 2013). In beiden Studien wird angeführt, dass effektives Klassenmanagement einen positiven Einfluss auf das Interesse der Lernenden hat. In bestimmten Fällen kann aber eine hohe Ausprägung von Klassenmanagement ineffizient sein (z. B. wenn die gesamte Lernzeit für den Unterricht verwendet wird, obwohl die Lernenden konstant von einem anderen Ereignis abgelenkt werden).

Weiterhin wurde gezeigt, dass Lernende auf einer motivational-affektiven Ebene von einer hohen Unterrichtsqualität im Bereich der konstruktiven Unterstützung profitieren (Kunter et al. 2013). Folglich ist davon auszugehen, dass Aspekte, die das Lernen vereinfachen und damit in die Kategorie der konstruktiven Unterstützung fallen, wie bspw. individuelle Förderung und Verständnisorientierung, vermutlich ebenfalls im positiven Zusammenhang mit dem situationalen Interesse stehen.

FF2

Wie unterscheidet sich unter Kontrolle der Zeit die Ausprägung des situationalen Interesses von Lernenden in verschiedenen Unterrichtsphasen?

Es wurde die Phasierung nach Petersen et al. (2011) untersucht. Wenngleich eine Phasierung nicht in allen Unterrichtskonzeptionen (bspw. projektorientiertem Unterricht) die gleiche Rolle spielen dürfte, scheinen spezifische Phasen zumindest im „typischen“ naturwissenschaftlichen Unterricht, wie er in Videostudien (Björkman und Tiemann 2013; Stiller 2016) oder in Einschätzungen von Schülerinnen und Schülern (Schiepe-Tiska et al. 2016) charakterisiert wird, die vorherrschende Organisationsform zu sein. Eine dominante Phase im Chemieunterricht ist die praktische Erarbeitungsphase, in der Experimente von Lernenden aktiv oder von Lehrkräften als Demonstration durchgeführt werden können. Für diese Phasen wird ein positiver Zusammenhang erwartet. Weiterhin wird für theoretische Erarbeitungsphasen eine negative Beziehung zum situationalen Interesse erwartet und für Einstiegsphasen eine positive (s. Abschn. 4.2). Aufgrund des aktuellen Forschungsstandes können für den möglichen Zusammenhang mit den Sicherungsphasen keine Hypothese aufgestellt werden.

FF3

Welcher Zusammenhang besteht zwischen dem individuellen Interesse der Lernenden an typischen naturwissenschaftlichen Tätigkeiten (unter Berücksichtigung der Effekte der Unterrichtsmerkmale und -phasen auf Klassenebene sowie der Zeit) und dem situationalen Interesse der Schülerinnen und Schüler im Chemieunterricht?

Ergänzend zu den Unterrichtsphasen und -merkmalen soll mit dem individuellen Interesse ein zentrales Schülermerkmal berücksichtigt und dessen Zusammenhang zum situationalen Interesse untersucht werden. Grundsätzlich wird in dem Vier-Phasen-Modell formuliert, dass situational interessierte Lernende individuelles Interesse entwickeln können (Hidi und Renninger 2006). Der umgekehrte Pfad ist theoretisch nicht vorgesehen. In verschiedenen Studien konnte aber bereits gezeigt werden, dass Lernende mit höherem individuellem Interesse auch ein höheres situationales Interesse zeigen (Ainley et al. 2002). Deswegen wird auch hier erwartet, dass individuelles Interesse im positiven Zusammenhang mit dem situationalen Interesse steht.

4 Methodisches Vorgehen

4.1 Studiendesign

Die Studie wurde an fünf Gymnasien Schleswig-Holsteins durchgeführt. Insgesamt haben 240 Lernende in neun Klassen teilgenommen. Die Schulen wurden teilweise aufgrund der Teilnahme an einem Vorgängerprojekt („DoLiS“, Development of Learning in Science) akquiriert. Zur Vergrößerung der Stichprobe haben darüber hinaus noch zwei weitere Schulen teilgenommen. Die Stichprobe stellt demnach eine Gelegenheitsstichprobe dar. Alle Lernenden besuchten während der Durchführung die achte Jahrgangsstufe. Da die Studie parallel in allen Klassen durchgeführt wurde, wurde der gleiche Fachinhalt (Einführung in „Salze“) unterrichtet. Diese Jahrgangsstufe wurde ausgewählt, da der Chemieunterricht hier beginnt. Für die Erhebung wurde ein Thema ausgewählt, welches bereits über den klassischen Anfangsunterricht hinausgeht.

Die Erhebungsleiterin hospitierte in jeder Klasse im Chemieunterricht, wobei die Anzahl der Hospitationen zwischen drei und sechs Schulstunden variierteFootnote 5. Bei 13 der 22 Hospitationen war eine zweite Person anwesend. Beide wurden zuvor durch das Codieren und Protokollieren von Unterrichtsvideos geschult. Während der Hospitationen wurde die Ausprägung verschiedener Unterrichtsqualitätsmerkmale erhoben, der Unterricht protokolliert und die Arbeitsmaterialien erfasst. Außerdem wurde zu verschiedenen Zeitpunkten das situationale Interesse der Lernenden erhoben (s. Abschn. 6.2).

Um das individuelle Interesse der Lernenden zu erfassen, wurde eine Teilstichprobe gewählt, die sowohl an dieser Studie als auch an dem DoLiS-Projekt teilgenommen hat (s. Tab. 2), in dem längsschnittlich kognitive und motivational-affektive Variablen in der Sekundarstufe erfasst wurden (Höft et al. 2019). Der letzte Messzeitpunkt des Vorgängerprojekts lag ca. zwei Monate vor der Durchführung dieser Studie. Aufgrund der zeitlichen Nähe zwischen den Erhebungszeitpunkten und der angenommenen relativen Stabilität des Konstruktes werden die vorhandenen Daten zum individuellen Interesse in das Modell integriert.

Tab. 2 Zusammenfassung der Stichprobenzusammensetzung

4.2 Erhebungsinstrumente

Zur Erfassung des situationalen Interesses wurden die Lernenden nach jeder Unterrichtsphase (z. B. nach einem Einstieg) von der Lehrkraft aufgefordert, über ein Tablet auf einer vierstufigen Likert-Skala (1 = uninteressant bis 4 = sehr interessant) anzugeben, wie interessant sie die vorangegangene Unterrichtsphase fanden (adaptiert nach Palmer 2009). Vor der Unterrichtsstunde erfolgte eine Absprache mit der Lehrkraft bezüglich der Abgrenzung zwischen den Unterrichtsphasen, welche während der Unterrichtsstunde von der Lehrkraft angekündigt wurden. Es wurde eine inhaltliche Einordnung der Unterrichtsphasen in Phasen wie Einstiegs‑, Sicherungs- und theoretische oder praktische Erarbeitungsphasen unternommen.Footnote 6

Das situationale Interesse wurde anhand eines Items erfragt, um die zeitliche Instabilität des situationalen Interesses zu berücksichtigen und möglichst wenig in den Unterricht einzugreifen. Wenngleich die Verwendung von Einzelitems keine Prüfung der Messgenauigkeit erlaubt, konnte Palmer (2009) durch zusätzliche Interviews und anschließende Datentriangulation Belege für die Validität dieser Methode vorlegen. Insgesamt wurden N = 2104 Messungen von situationalem Interesse (M = 2,82, SD = 0,85) vorgenommen (inkl. fehlender Werte, s. Abschn. 6.3). Das entspricht ca. 17 Messungen je Lernenden.

Ferner wurden für jede Unterrichtsphase Unterrichtsqualitätsmerkmale mithilfe des Beobachtungsbogens aus dem EMU-Projekt erfasst (adaptiert nach Helmke et al. 2010)Footnote 7. Durch die Anpassungen wurde der Beobachtungsbogen für den Chemieunterricht spezifiziert. Die Items wurden auf einer 4‑stufigen Likert-Skala geratet. Die Abstufungen der Items wurden vor der Anwendung diskursiv validiert und mithilfe von Unterrichtsvideos verfeinert und erprobt.Footnote 8 Für die Übereinstimmung mit dem zweiten Rater wurde eine Interraterreliabilität (Cohens κ) berechnet, welche mit κ = 0,88 in einem sehr guten Bereich liegt (Wirtz und Caspar 2002).

Da die Reliabilitäten (Cronbachs α) einzelner SkalenFootnote 9 nicht zufriedenstellend waren und die ursprünglichen Skalen nach Helmke et al. (2010) auch in faktorenanalytischen Verfahren nicht bestätigt werden konnten, wurde eine explorative Faktorenanalyse mit non-orthogonaler Rotation (Oblimin) anhand der 23 Likert-Items durchgeführt. Die mündliche Beteiligung, welche im ursprünglichen Fragebogen durch Zählen der Wortmeldungen enthalten ist, wurde nicht berücksichtigt. Der Bartlett-Test auf Sphärizität zeigte nach der Löschung von zwei Items, dass die Korrelationen zwischen den Items annehmbar sind (χ2(210) = 994,06, p < 0,001). Der Kaiser-Meyer-Olkin-Wert liegt mit KMO = 0,67 [0,34; 0,90] im annehmbaren Bereich, wobei einige Einzelitems sehr niedrige Werte aufweisen (Field et al. 2013). Der Verlauf der Eigenwerte und des Scree-Plots weisen bei Anwendung des Kaiser-Kriteriums auf eine sechs-faktorielle Struktur hin. Auf zwei Faktoren lädt allerdings jeweils nur ein Item, weswegen diese Faktoren nicht weiter berücksichtigt wurden. Ein Item zeigt Querladungen auf mehreren Faktoren, ein weiteres Item wurde aus inhaltlichen Gründen nicht weiter berücksichtigt. Die verbleibende vier-faktorielle Lösung wurde unter Ausschluss der o. g. Items wiederholt durchgeführt, wobei die Faktorzuordnung repliziert werden konnteFootnote 10. Die Varianzaufklärung liegt bei 67 %. Die Kommunalitäten zeigen ebenfalls, dass eine vier-faktorielle Struktur angemessen ist. Die Faktoren und der Range der Einzelladungen sind in Tab. 3 zusammengefasst. Im digitalen Anhang befindet sich der Beobachtungsbogen mit den verwendeten 17 Items (Tab. 3). Diese sind den entsprechenden Skalen (Klassenmanagement etc.) zugeordnet. Einige Items sind nicht für alle Phasen gleichermaßen relevant und wurden dementsprechend ausgelassen, wenn diese für die jeweilige Phase nicht bestimmt werden konnten.

Tab. 3 Zusammenfassung der deskriptiven Statistik und der Ergebnisse der explorativen Faktorenanalyse. (Die Items wurden adaptiert nach Helmke et al. 2010)

Die Erfassung des individuellen Interesses wurde während eines Vorgängerprojekts (s. oben) für eine Teilstichprobe erhoben. Hierbei wurde ein tätigkeitsbezogener Ansatz gewählt, welcher auf dem RIASEC+N-Modell beruhtFootnote 11 (Blankenburg et al. 2016; Dierks et al. 2014). Auf Basis dieses Modells wurden die Lernenden zu ihrem Interesse an der Durchführung typischer naturwissenschaftlicher Unterrichtstätigkeiten befragt. Die Gesamtskala auf der Basis von 29 Items (M = 2,84, SD = 0,46), welche auf einer 4‑stufigen Likert-Skala geratet wurden, weist eine Reliabilität von α = 0,92 auf.

4.3 Datenauswertung

Um adäquat mit fehlenden Werten auf der Ebene des situationalen und individuellen Interesses umzugehen, wurden multiple Imputationen durchgeführt, da dieses Vorgehen herkömmlichen Methoden wie listen- oder paarweisem Fallausschluss überlegen ist (Newman 2014). Fehlende Werte entstanden hauptsächlich durch vollständiges Fehlen einzelner Lernender in einer Unterrichtsstunde (z. B. durch Krankheit) oder durch das zufällige Verpassen einzelner Abstimmungen für das situationale Interesse, sodass kein Zusammenhang mit anderen Konstrukten vermutet wird. Daher wurden die multiplen Imputationen unter der Annahme MAR (missing at random) in der Statistiksoftware R mit den Paketen „mitml“ und „mice“ durchgeführt (Grund et al. 2019; R Core Team 2018; van Buuren und Groothuis-Oudshoorn 2011). Die Imputationen wurden nach dem Prinzip des joint modelling durchgeführt. Das dazugehörige Imputationsmodell entspricht für MLA 1 der detailliertesten Version der Mehrebenenanalyse, welche im Ergebnisteil dargestellt wird (Tab. 6, Mod1.3). Für die Teilstichprobe liegen weitere Daten aus dem DoLiS-Projekt vor. Da nur ein Teil der Stichprobe an diesen Erhebungen teilgenommen hat, konnte keine globale Imputation für alle Forschungsfragen durchgeführt werden. Daher wurde für diese Imputation über die detaillierteste Mehrebenenanalyse (Tab. 8, Mod2.4) hinaus das naturwissenschaftliche Selbstkonzept, die Chemienote, das Geschlecht und die generelle Lernfreude als Hilfsvariablen im Imputationsmodell berücksichtigt. Durch die Verwendung eines überlappenden Sets an Hilfsvariablen (Skalen der Unterrichtsqualität usw.) folgen beide Imputationen einer inklusiven Strategie, sodass die Annahme „MAR“ nicht verletzt wird (Collins et al. 2001). Die enge Passung zwischen Forschungsfrage und Imputationsmodell wiederum entspricht der Empfehlung aktueller Studien, auch wenn dann mehrfache Imputationen notwendig werden (vgl. Enders et al. 2020; Lüdtke et al. 2020). Der prozentuale Anteil der fehlenden Werte liegt für das situationale Interesse in der Mehrebenenanalyse mit der vollständigen Stichprobe bei 22,8 %. Für die Teilstichprobe liegt der Anteil bei 23,6 % und der Anteil der fehlenden Werte für das individuelle Interesse bei 6,3 %. Die fehlenden Werte wurden auf Skalenebene imputiert. Die FMI-Werte (fraction of missing information) geben den Anteil der Informationen für eine Variable an, die aufgrund der Imputation verloren geht (Enders 2010). Sie liegen für diese Imputation im Bereich von 0,005 bis 0,301. Die potential scale reduction entspricht 1. Beide Werte liegen damit im gutem bis sehr gutem Bereich (Grund et al. 2016).Footnote 12

Um die Koeffizienten der Mehrebenenanalyse miteinander vergleichen zu können, wurden die Skalen der Unterrichtsqualität, des situationalen und des individuellen Interesse standardisiert. Nach der Imputation wurden die Werte zunächst anhand des Gruppenmittelwertes mit der Klasse als Gruppierungsvariable zentriert und anschließend der Mittelwert für das individuelle Interesse gebildet. Durch dieses Vorgehen konnte die Clusterung der Lernenden in verschiedenen Klassen berücksichtigt werden, obwohl die Stichprobe auf Klassenebene für eine explizite Implementierung in die Mehrebenenanalysen zu klein ist (Enders und Tofighi 2007; Snijders und Bosker 2012). Da die Erhebung über mehrere Unterrichtsstunden an verschiedenen Schultagen erfolgte, wurde die Zeit als Kontrollvariable eingefügt.

Um die hierarchisch geschachtelte Struktur (Abb. 1) zu berücksichtigen, wurden Mehrebenenanalysen mit dem Paket „lme4“ in R durchgeführt (Bates et al. 2015). Mehrebenenanalysen sind lineare Regressionen, die verschiedene Level von Daten (Abb. 1) berücksichtigen und somit Fehlinterpretationen vermeiden können. Aufgrund der verhältnismäßig geringen Stichprobengröße wurden Random-Intercept-Modelle gerechnet (Snijders und Bosker 2012). Die ICC liegt für die erste Mehrebenenanalyse (Forschungsfragen 1 und 2) bei 0,123 und für die zweite Mehrebenenanalyse (Forschungsfrage 3) bei 0,139, d. h. 12,3 % bzw. 13,9 % der Varianz liegen zwischen den Personen, was für eine Berücksichtigung der Mehrebenen-Struktur spricht.

Abb. 1
figure 1

Leveleinteilung für die Mehrebenenanalyse; da die Stichprobe auf Level 3 zu klein ist, wird die Klassenebene nicht explizit modelliert, sondern durch Zentrierung der Variablen auf den Klassenmittelwert (group-mean centering) berücksichtigt

Nach der multiplen Imputation wurden zudem die Korrelationen zwischen dem situationalen Interesse der Lernenden, den Unterrichtsmerkmalen und den Unterrichtsphasen berechnet. Bei der Untersuchung der Unterrichtsphasen wurden nur diejenigen Phasen untersucht, die mehr als acht Mal beobachtet werden konnten. Das betrifft die Phasen Einstieg, theoretische Erarbeitungsphase, praktische Erarbeitungsphase und Sicherung; die drei Phasen Problematisierung, Transfer und Wiederholung wurden entsprechend von den Analysen ausgeschlossen. In Tab. 4 sind die Korrelationen zusammengefasst.

Tab. 4 Pearson-Korrelationen (r) der erhobenen Variablen; in Klammern ist der Standardfehler (SE) angegeben

5 Ergebnisse

5.1 Zusammenhang zwischen situationalem Interesse und Unterrichtsmerkmalen

Die Ergebnisse der Mehrebenenanalyse sind in Tab. 6 zusammengefasst: Mod1.0 und Mod1.1 dienen der Kontrolle: Mod1.0 entspricht dem Nullmodell ohne Prädiktoren, während Mod1.1 die Kontrollvariable Zeit als Prädiktor enthält. Die Zeit wurde als Sequenz der Unterrichtshospitationen (d. h. erster Hospitationstermin = 1, zweiter Hospitationstermin = 2 usw.) codiert. Die Zeit weist dabei einen negativen Zusammenhang zum situationalen Interesse auf. Mit Blick auf Forschungsfrage 1 wurde untersucht, in welchem Zusammenhang die Unterrichtsmerkmale Klassenmanagement, Verständnisorientierung, Strukturierung und Förderung zum situationalen Interesse der Lernenden stehen (Mod1.2). Entsprechend der Erwartung zeigt sich beim Klassenmanagement ein negativer Zusammenhang zum situationalen Interesse (γ10 = −0,29, p < 0,001). Ein weiterer negativer Zusammenhang zum situationalen Interesse liegt, entgegen der Hypothese, bei der Verständnisorientierung vor (γ40 = −0,21, p < 0,001). Positive Zusammenhänge wurden für die Skalen Förderung (γ30 = 0,20, p < 0,05) und Strukturierung (γ20 = 0,12, p < 0,05) gefunden.

Die Varianzaufklärung R2(SB) ist speziell für die Anwendung in Mehrebenenanalysen entwickelt und gibt die Gesamtaufklärung des Modells unter Berücksichtigung der verschiedenen Level an (Snijders und Bosker 2012). Die Varianzaufklärung liegt in diesem Modell bei R2(SB) = 0,060, also ca. 6,0 %. Bei Betrachtung der Varianzaufklärung auf Levelebene ergibt sich auf Level 1 eine Aufklärung von ca. 8,0 %. Auf Level 2 ist eine negative Varianzaufklärung zu beobachten, welche bei Mehrebenenanalysen darauf zurückzuführen ist, dass keiner der Prädiktoren auf Level 2 wirkt (Snijders und Bosker 2012). Der Wald-Test zeigt, dass Mod1.2 signifikant besser auf die Daten passt als das Mod1.0 und Mod1.1 (s. Tab. 5).

Tab. 5 Ergebnisse des Wald-Tests zum Vergleich des Modell-Fits für Modell 1. Genaue Spezifikationen der Modelle können der Tab. 6 entnommen werden

5.2 Zusammenhänge von inhaltlichen Unterrichtsphasen und dem situationalen Interesse

Bei Ergänzung der berücksichtigten Unterrichtsphasen (s. Abschn. 6.3) als einzelne Dummy-Variablen im Modell ändern sich teilweise die Zusammenhänge der Unterrichtsmerkmale (s. Tab. 6, Mod1.3). Besonders stark ändert sich der Zusammenhang zwischen Klassenmanagement und situationalem Interesse, welcher von γ10 = −0,29, p < 0,001 auf γ10 = −0,16, p < 0,001 sinkt. Daher variiert der Zusammenhang zwischen Klassenmanagement und situationalem Interesse der Lernenden in Abhängigkeit von der Unterrichtsphase. Die eingangs dargestellten Korrelationen zwischen Unterrichtsmerkmalen und -phasen (s. Tab. 4) zeigen, dass das Klassenmanagement in Sicherungsphasen höher ausgeprägt ist (r = 0,31, p < 0,001), während es in den praktischen Erarbeitungsphasen tendenziell am schwächsten ausgeprägt ist (r = −0,53, p < 0,001).

Tab. 6 Ergebniszusammenfassung der Mehrebenenanalyse (Mod1.0–Mod1.3) auf Basis der Gesamtstichprobe (N = 240)

Mit Blick auf Zusammenhänge der einzelnen Unterrichtsphasen zum situationalen Interesse zeigt sich erwartungskonform, dass für theoretische Erarbeitungsphasen ein negativer Zusammenhang (γ60 = −0,19, p < 0,05) vorliegt, während für praktische Erarbeitungsphasen ein großer positiver Zusammenhang (γ50 = 0,44, p < 0,001) besteht. Die übrigen Unterrichtsphasen (Sicherungen und Einstiege) weisen keine signifikanten Zusammenhänge zum situationalen Interesse auf. Die Varianzaufklärung vergrößert sich durch das Berücksichtigen der Unterrichtsphasen insgesamt (R2(SB) = 0,076) und auf Level 1 (\(R_{\text{Level}\,1}^{2}\) = 0,120). Insgesamt werden auf Level 1 somit 12,0 % der Varianz durch die Unterrichtsqualitätsmerkmale und -phasen aufgeklärt. Auf Level 2 vergrößert sich das negative R2. Für Mod1.3 zeigt der Wald-Test bessere Fit-Werte als für Mod1.2 (s. Tab. 5).

5.3 Zusammenhänge zwischen individuellem und situationalem Interesse

Die zweite Mehrebenenanalyse gleicht der ersten im Kern. Es wurde nur eine Teilstichprobe berücksichtigt. Die Prädiktoren wurden in der gleichen Reihenfolge eingefügt wie bei der ersten Mehrebenenanalyse zur Beantwortung der Forschungsfragen 1 und 2 (s. Mod1.0 bis Mod1.3). Es zeigen sich tendenziell ähnliche Zusammenhänge. Generell sind die Zusammenhänge niedriger bzw. bleiben teilweise nicht signifikant (Tab. 8). Letzteres trifft auf die Zusammenhänge zwischen dem Klassenmanagement (γ10 = −0,09, p = 0,271), der Förderung (γ30 = −0,08, p = 0,464) bzw. der praktischen Erarbeitungsphase (γ50 = 0,18, p = 0,081) und dem situationalen Interesse der Lernenden zu. Für die Verständnisorientierung bleibt der Zusammenhang hingegen gleich (γ40 = −0,40, p > 0,001). Die Varianzaufklärung ist ähnlich zu der in Mod1.3. Bei Einfügen des individuellen Interesses als Level 2-Variable zeigt sich ein großer Zusammenhang zum situationalen Interesse (γ02 = 0,27***, p < 0,001). Durch die Aufnahme dieser Variable nimmt die Varianzaufklärung deutlich zu: Insgesamt werden 10,9 % der Varianz aufgeklärt (R2(SB) = 0,109) und auf Level 2 21,4 % (\(R_{\text{Level}\,2}^{2}\) = 0,214). Die Varianzaufklärung auf Level 1 wird wie erwartet etwas kleiner (\(R_{\text{Level}\,1}^{2}\) = 0,093). Der Wald-Test zeigt bessere Fit-Werte für Mod2.4 (s. Tab. 7).

Tab. 7 Ergebnisse des Wald-Tests zum Vergleich des Modell-Fits für die zweite Mehrebenenanalyse. Genaue Spezifikationen der Modelle können der Tab. 8 entnommen werden
Tab. 8 Ergebniszusammenfassung der zweiten Mehrebenenanalyse; es wurde die Teilstichprobe analysiert, die an dem DoLiS-Projekt teilgenommen hat (N = 124)

6 Diskussion

Die erste Zielsetzung dieser Studie war es, Aspekte der Unterrichtsqualität zu identifizieren, die in einem engen Zusammenhang zum situationalen Interesse der Lernenden stehen. Während für die Merkmale Strukturierung und Förderung eine positive Beziehung zum situationalen Interesse der Lernenden festgestellt wurde, wurde für Klassenmanagement und Verständnisorientierung eine negative Beziehung diagnostiziert. Die zweite Zielsetzung adressierte die additive Analyse der Zusammenhänge zwischen Unterrichtsphasen und situationalem Interesse der Lernenden. Dabei zeigten sich für praktische Erarbeitungsphasen positive und für theoretische Erarbeitungsphasen negative Zusammenhänge zum situationalen Interesse der Lernenden. Für die übrigen analysierten Unterrichtsphasen (Einstieg und Sicherung) konnten im Rahmen der hier beobachteten Unterrichtsstunden keine bedeutsamen Relationen festgestellt werden.

Die dritte Zielsetzung war es, zu untersuchen, inwiefern motivational-affektive Variablen, welche bereits dispositional vorliegen, auf Individualebene einen Einfluss auf die Ausprägung des situationalen Interesses im Unterricht haben. Es wurde erwartungskonform ein substanzieller positiver Zusammenhang festgestellt. Als Kontrollvariable wurde die Zeit als Sequenz der Hospitationstermine berücksichtigt. Die negative Beziehung deutet auf ein grundsätzlich nachlassendes situationales Interesse über den Verlauf der Termine hin. Zurückzuführen ist dieses vermutlich auf einen nachlassenden Reiz des zu Beginn noch neuen Themas „Salze“ oder auf eine Gewöhnung an die Erhebungsmethode des situationalen Interesses über die Tablets. Beide Faktoren zielen im Endeffekt auf den möglichen Interessentrigger „Neuheit“, der aber nur für die ersten Begegnungen mit Thema oder Methode gelten kann (Lin et al. 2013; Palmer 2009).

6.1 Unterrichtsmerkmale und -phasen

Die untersuchten Zusammenhänge des situationalen Interesses mit Merkmalen der Unterrichtsqualität entsprechen für Klassenmanagement, Förderung und Strukturierung den eingangs formulierten Hypothesen. Konträr zu den Erwartungen ist der Befund, dass Verständnisorientierung eine negative Beziehung zu dem situationalen Interesse hat. Unter Verständnisorientierung wurden Aspekte wie eine angemessene Schwierigkeit und das Feedback-Geben an die Lernenden subsumiert. Auch wenn Forschungsbefunde zum Feedback zeigen, dass dieses einen positiven Einfluss auf Interesse hat (Harks et al. 2013), muss einschränkend festgehalten werden, dass die Qualität und Art des Feedbacks über sein Potenzial zur Interessenförderung entscheiden (Hattie und Timperley 2007). Beides wurde in der vorliegenden Studie nicht erfasst. Daher ist es möglich, dass die relevanten Aspekte zum Feedback hoch geratet wurden, weil sie im Unterricht häufig vorkamen, aber die Qualität dieser Aspekte nicht hoch genug war, um das situationale Interesse der Lernenden zu fördern.

Die beobachteten Zusammenhänge zwischen dem situationalen Interesse der Lernenden und den Unterrichtsphasen fallen überwiegend erwartungskonform aus und entsprechen den Ergebnissen anderer Studien. Holstermann et al. (2010) haben bspw. die Wirkung von praktischen Aufgaben im Biologieunterricht untersucht und festgestellt, dass insbesondere die Qualität der Aufgaben einen positiven Effekt auf das Interesse von Lernenden hat. In der vorliegenden Studie scheinen die praktischen Aufgaben von einer ausreichenden Qualität gewesen zu sein, dass sie interessefördernd wirkten. Eine weitere Differenzierung von Experimenten in eine rezeptartige Durchführung und eine Durchführung nach eigenständiger Planung konnte nicht vorgenommen werden, da erstere deutlich überwogen. Auch wenn Höft et al. (2019) eine hohe Korrelation zwischen den Interessen der Lernenden an diesen beiden Arten der Experimente beschreiben, stellten Walpuski und Hauck (2017) fest, dass Experimente mit einem hohen Anteil an eigener Aktivität (z. B. beim Planen und Auswerten) als interessanter wahrgenommen werden als Experimente mit rezeptartiger Anleitung.

Theoretische Erarbeitungsphasen gehen in der vorliegenden Studie eher mit einem niedrigen situationalen Interesse einher. Hier scheint aus unterrichtspraktischer Perspektive noch besonderes Potenzial zu bestehen, um den Unterricht für Lernende motivierender zu gestalten. Um diese Potenziale zu konkretisieren, müssen diese Phasen jedoch in weiterführenden Studien detaillierter inhaltlich analysiert werden (vgl. Ochsen et al. 2020).

Für Einstiegsphasen wurde kein systematischer Zusammenhang zum situationalen Interesse der Lernenden gefunden, obwohl eine positive Beziehung zum situationalen Interesse denkbar gewesen wäre, wenn in diesen Phasen den Lernenden z. B. unbekannte Phänomene oder Probleme präsentiert werden (Palmer 2009; Ruppert 2010). Das dadurch induzierte situationale Interesse kann im Verlauf des weiteren Unterrichts wieder abfallen, da die anfangs unbekannten Phänomene sukzessive mit neuem Wissen aufgeklärt werden. Diese Beobachtung haben Rotgans und Schmidt (2017) in der „knowledge-deprivation-hypothesis“ formuliert. Die Voraussetzung zur Entstehung von situationalem Interesse ist demnach ein (mit dem aktuellen Wissensstand) unlösbares Problem bzw. eine unerklärbares Phänomen. Eine mögliche Ursache für das vorliegende Ergebnis könnte also sein, dass die Einstiegsproblematiken entweder nicht motivierend genug waren oder den Lernenden nicht als Problem bewusst wurden. Merritt et al. (2017) betonen in ihrem Review ebenfalls, dass die Strukturierung und Präsentation des Problems ein wesentlicher Gelingensfaktor von problembasiertem Unterricht darstellen. Einstiegsphasen müssen aber nicht zwangsläufig ein unerklärbares Phänomen präsentieren. Sie können auch das Wiederholen der letzten Unterrichtsinhalte forcieren. Diese reine Wiederholung adressiert keinen bekannten Interessentrigger und kann demzufolge als weniger interessefördernd eingestuft werden. Für die beobachteten Einstiegsphasen könnte gelten, dass sie eher diesem Muster gefolgt sind.

Bei kombinierter Berücksichtigung von Unterrichtsmerkmalen und -phasen in den Modellen halbiert sich der Zusammenhang zwischen Klassenmanagement und situationalem Interesse fast. Dies deutet auf eine Wechselwirkung mit den Unterrichtsphasen hin. Deskriptiv sind relativ hohe Korrelationen (Tab. 5) zwischen Klassenmanagement und Sicherungsphasen bzw. praktischen Erarbeitungsphasen zu finden, wobei letztere Korrelation negativ ist. Die Ausprägung des Klassenmanagements scheint somit abhängig von der Unterrichtsphase zu sein und insbesondere in praktischen Erarbeitungsphasen niedriger auszufallen.

Die Varianz, welche durch das Modell insgesamt aufgeklärt wird, ist eher niedrig. Sie weist darauf hin, dass weitere Faktoren das situationale Interesse beeinflussen, die über die untersuchten Merkmale des Unterrichts hinausgehen. Dazu könnten die Sozialform (z. B. Gruppenarbeit als interessefördernde Sozialform, Jack und Lin 2017), bestimmte Methoden wie bspw. Quizze (Bicen und Kocakoyun 2018) oder schülerzentrierte Ansätze wie Think-Pair-Share (Renninger et al. 2019) sowie weitere zeitliche und organisatorische Rahmenbedingungen (u. a. Klausuren oder Probefeueralarm) gehören.

6.2 Individuelles Interesse

Der hier festgestellte positive Zusammenhang zwischen dem individuellen und dem situationalen Interesse wird von weiteren Studien bestätigt (z. B. Ainley et al. 2002). Es gibt allerdings Anzeichen dafür, dass eine differenzierte Analyse der Beziehung zwischen situationalem und individuellem Interesse angebracht sein könnte: Rotgans und Schmidt (2018) haben festgestellt, dass der Effekt nur zu Beginn einer Unterrichtseinheit besonders stark ist und im Verlauf nachlässt. Im Rahmen der vorgenommenen Modellierung wäre es denkbar, den Einfluss der Zeit als Interaktion mit dem individuellen Interesse zu berücksichtigen, um herauszufinden, inwiefern der Fortgang einer Unterrichtseinheit den Einfluss des individuellen Interesses auf das situationale Interesse beeinflusst. Dazu wäre jedoch eine größere Stichprobe notwendig gewesen, weswegen diese These hier nicht geprüft werden konnte. Dennoch konnte mit der vorliegenden Studie gezeigt werden, dass das individuelle Interesse auch nach Berücksichtigung unterrichtlicher Faktoren inkrementell einen großen Anteil der Varianz im situationalen Interesse der Lernenden aufklärt und somit nicht vernachlässigt werden sollte.

Durch die Aufnahme des individuellen Interesses in das Modell wird die Varianzaufklärung deutlich erhöht. Dies ist ein weiteres Indiz dafür, dass individuelles Interesse in einem starken Zusammenhang mit dem situationalen Interesse steht. Dennoch ist dieser Zusammenhang kein Hinweis darauf, dass die Unterrichtsgestaltung eine untergeordnete Rolle bei gleichzeitiger Betrachtung des individuellen Interesses einnimmt. Da dieses aus dem situationalen Interesse entsteht, betont es vielmehr die Wichtigkeit, durch eine externale Unterstützung situationales Interesse hervorzurufen (Hidi und Renninger 2006). Somit wird die Rolle der Lehrkraft bei der Unterrichtsgestaltung betont, denn es besteht die unmittelbare Möglichkeit, durch den Unterricht nachhaltig das Interesse am Fach zu fördern.

7 Limitationen und Fazit

Vor der Betrachtung der Implikationen dieser Studie soll zunächst auf einige Limitationen hingewiesen werden. Zum einen betrifft dies die begrenzte Stichprobenziehung und -größe. Die Stichprobe beschränkt sich auf Gymnasien in Schleswig-Holstein und stellt in erster Linie eine Gelegenheitsstichprobe dar. Durch die begrenzte Stichprobengröße war es nicht sinnvoll möglich, Interaktionseffekte zwischen verschiedenen Prädiktoren, bspw. zwischen individuellem Interesse bzw. Unterrichtsqualitätsmerkmalen und Unterrichtsphasen, zu analysieren. Insofern wurden alle Prädiktoren im Modell in erster Linie additiv betrachtet und im Hinblick auf ihren individuellen Beitrag zur Aufklärung der Varianz des situationalen Interesses der Lernenden untersucht. Wechselwirkungen zwischen diesen Prädiktoren, die insbesondere aus theoretischer Sicht relevante Moderationsannahmen in den Blick genommen hätten, konnten entsprechend nicht untersucht werden. Dies wäre aber ein wünschenswerter Fokus für weiterführende Studien, die auf eine umfangreichere Stichprobe zurückgreifen können.

Auch auf die Stichprobengröße zurückzuführen ist die Begrenzung auf Random-Intercept-Modelle. Weiterhin wurde nur eine Variable (individuelles Interesse) auf Individualebene untersucht. Die Einbeziehung weiterer individueller Konstrukte wie dem naturwissenschaftlichen Selbstkonzept oder Leistungsmaßen, aber auch dem Geschlecht wären sinnvolle Ergänzungen, um detailliertere Einsichten in die interindividuelle Wahrnehmung von Interessentrigger zu gewinnen. Auf intraindividueller Ebene ist die Einbeziehung weiterer Prädiktoren potenziell interessant (bspw. Lernfreude, s. Abschn. 8.1), um die geringe Varianzaufklärung zu erhöhen.

Mit Blick auf die Erhebungsmethode ist festzuhalten, dass das situationale Interesse nur mithilfe eines Items erfragt wurde. Diese methodische Entscheidung wurde insbesondere mit dem Ziel getroffen, das situationale Interesse möglichst direkt im Unterrichtsgeschehen zur erfassen und den Unterrichtsablauf nur geringfügig zu stören. Dennoch wurde damit in den Unterricht eingegriffen und eine künstliche Pause geschaffen. Weiterhin konnte für dieses Messinstrument keine Messgenauigkeit bestimmt werden. In der Studie von Palmer (2009), aus der diese Erhebungsmethode adaptiert wurde, konnte die Validität der Ergebnisinterpretation jedoch mittels qualitativer Interviews bestätigt werden.

Letztlich ist auch die Unterrichtsbeobachtung (anstelle bspw. einer Videographie) kritisch zu reflektieren. Eine Videographie hätte mehr Analysepotenzial am Unterrichtsgeschehen ermöglicht, aber auch den zeitlichen und organisatorischen Aufwand insbesondere mit Blick auf die Teilnahme der Lernenden deutlich erhöht. Limitierend sind die fehlenden Werte für das situationale Interesse zu benennen, welche jedoch mithilfe multipler Imputationen angemessen berücksichtigt wurden.

Um die begonnene Mikroanalyse von Unterricht konsequent weiterzuführen, ist es notwendig, eine differenziertere Analyse der Unterrichtsqualitätsmerkmale vorzunehmen, die neben der Quantität auch die Qualität der einzelnen Faktoren stärker berücksichtigt. Diese Untersuchung kann als qualitative Fortsetzung zur Auswertung dieser Studie durchgeführt werden. Im Rahmen des Chemieunterrichts gibt es bereits viele Unterrichtskonzeptionen (z. B. Oser und Baeriswyl 2001; Parchmann et al. 2006; Schiepe-Tiska et al. 2016), in denen die Phasen teilweise inhaltlich anders gestaltet sind. Da in der vorliegenden Studie allerdings keine dieser Konzeptionen stringent im Unterricht durchgeführt wurde, gelten unsere Ergebnisse nicht für die Phasierungen innerhalb dieser Konzeptionen. Weitere Untersuchungen zeigen, dass die genannten Konzeptionen generell wenig im Unterricht eingesetzt werden (Jannack et al. 2019), sodass die vorliegende Studie durchaus repräsentativ sein könnte. Eine weitere Limitation dieser Studie ist die Begrenzung auf den Chemieunterricht. Dieser kann vermutlich aufgrund seiner strukturellen Ähnlichkeit als Repräsentant naturwissenschaftlicher Unterrichtsfächer gelten. Für andere Unterrichtsfächer ist die Übertragbarkeit jedoch explizit zu prüfen.

Als Implikationen für Schulpraxis und Forschung lassen sich Hinweise aufzeigen, an welchen Stellschrauben Potenzial zur weiteren Interessenförderung besteht, wie bspw. im Bereich des Klassenmanagements oder durch eine Umgestaltung der Einstiegsphasen. Auch die theoretische Erarbeitungsphase wirkt in der vorliegenden Studie nicht interessefördernd. Eine Möglichkeit, diesem Befund zu begegnen, wäre eine stärkere aktive Einbindung der Lernenden in dieser Phase. Dies könnte durch theoretische Aufgaben wie Recherchen etc. erreicht werden (Hidi et al. 2015). Genauso scheint für das Unterrichtsmerkmal Verständnisorientierung die Möglichkeit zu bestehen, Unterricht zu verändern und interessanter für Lernende zu gestalten. Gleichzeitig stellt sich auch heraus, dass bereits einige Aspekte erfolgreich implementiert sind, die eine positive Auswirkung auf Interesse haben. Hierzu gehören die praktischen Erarbeitungsphasen und Unterrichtsqualitätsmerkmale wie Strukturierung. Ein weiterer Schritt kann bspw. eine qualitative Analyse der vorliegenden Daten sein, um konkrete Ansatzpunkte zu identifizieren, die situationales Interesse von Lernenden fördern können (vgl. Ochsen et al. 2020).