Mit der quasi-experimentellen Studie soll das beschriebene Unterrichtsprojekt wissenschaftlich begleitet und dessen Wirkung auf emotionale und motivationale Parameter sowie die Entwicklung der Mathematikleistung bei den ProjektteilnehmerInnen überprüft werden. In diesem Kapitel werden dazu zunächst die Forschungsfragen und entsprechende Hypothesen, welche sich aus den theoretischen Ausführungen der vorherigen Kapitel ableiten lassen, herausgestellt. Die umfassende empirische Begleitung des Projekts wird mithilfe von verschiedenen Datenerhebungsinstrumenten durchgeführt, welche anschließend beschrieben werden. Danach wird im Forschungsdesign der Aufbau der empirischen Studie erläutert. Darauf folgen die Beschreibung der Probandengruppe sowie der Auswertungsmethoden und abschließend werden die Ergebnisse der empirischen Erhebung dargestellt.

6.1 Forschungsfragen

Das Forschungsinteresse, welches in der Einleitung beschrieben wurde, findet in diesem Kapitel in der Formulierung der Forschungsfragen Ausdruck. In den theoretischen Ausführungen (vgl. Kapitel 2 & 3) wurde eine Vielzahl an affektiven und motivationalen Konstrukten erläutert und deren Entstehungs- und Wirkmechanismen zueinander und hinsichtlich kognitiver Parameter insbesondere im Rahmen von Schule und Unterricht dargestellt. Das beschriebene Unterrichtsprojekt (vgl. Kapitel 5) soll in Bezug auf die in der Theorie aufgeführten Entstehungs- und Wirkmechanismen von Emotionen und Motivation sowie die Lernentwicklung untersucht werden. Im Folgenden werden die Forschungsfragen und die auf Grundlage der theoretischen Ausführungen abgeleiteten Hypothesen vorgestellt. Diese beziehen sich zum einen auf emotionale sowie motivationale Aspekte und zum anderen auf lern- und leistungsspezifische Faktoren.

6.1.1 F1 motivationale Aspekte: Projekt und Frontalunterricht im Vergleich

Mithilfe der drei Forschungsfragen hinsichtlich der Evaluation des Projekts im Vergleich zu frontal ausgerichtetem Mathematikunterricht soll zum einen die Erfüllung der psychologischen Grundbedürfnisse Autonomie- (u.a Reeve, 2012) und Kompetenzerleben (u. a. Elliot & Dweck, 2005; Malmivouri, 2006), die im Unterrichtskontext besonders bedeutsam sind, untersucht werden. Zum anderen soll das Erleben intrinsischer Motivation, welche „als besonders wünschenswerte Art der Lernmotivation“ (Spinath, 2011, S. 47) gilt, während des Projekt und während einer Mathematikstunde verglichen werden.

Fragestellungen

F1.1:

Ist ein Unterschied der intrinsischen Motivation der teilnehmenden SchülerInnen während der Arbeit im Projekt im Vergleich zu regulärem Mathematikunterricht zu verzeichnen? Gibt es dahingehend Unterschiede zwischen der Entwicklungs- und Feldgruppe?

F1.2:

Unterscheidet sich das Autonomieerleben der SchülerInnen während des Projekts im Vergleich zu regulärem Mathematikunterricht? Gibt es diesbezüglich Unterschiede zwischen der Entwicklungs- und Feldgruppe?

F1.3:

Unterscheidet sich das Kompetenzerleben der Lernenden während des Projekts im Vergleich zu regulärem Mathematikunterricht? Gibt es in diesem Zusammenhang Unterschiede zwischen der Entwicklungs- und Feldgruppe?

Auf Grundlage insbesondere der Selbstbestimmungstheorie und den daraus abgeleiteten motivationsfördernden Handlungs- und Gestaltungsmerkmalen, wie Autonomiegewährung, Kooperation und Wertinduktion (vgl. Kapitel 3), an welchen das Projekt ausgerichtet ist, werden folgende Annahmen getroffen:

Hypothesen

H1.1:

Es wird ein Unterschied der intrinsischen Motivation der teilnehmenden SchülerInnen während der Arbeit im Projekt im Vergleich zu regulärem Mathematikunterricht verzeichnet. Feld- und Entwicklungsgruppe weisen Unterschiede im Hinblick auf die intrinsische Motivation auf.

H1.2:

Die teilnehmenden SchülerInnen erleben eine größere Autonomie während des Projekts im Vergleich zu regulärem Mathematikunterricht. Dies bezieht sich auf Veränderungen des (i) Drucks bzw. der Spannung und des (ii) subjektiven Werts bzw. der Nützlichkeit, die von den Lernenden im Vergleich wahrgenommen werden. Feld- und Entwicklungsgruppe weisen Unterschiede im Hinblick auf den (i) subjektiven Wert bzw. die Nützlichkeit und den (ii) Druck bzw. die Spannung auf.

H1.3:

Die Lernenden fühlen sich kompetenter während des Projekts im Vergleich zu regulärem Mathematikunterricht. Feld- und Entwicklungsgruppe weisen Unterschiede im Hinblick auf die erlebte Kompetenz auf.

6.1.2 F2 emotionale und motivationale Aspekte: Entwicklung von Appraisals, Lern- und Leistungsemotionen sowie Interesse

Mit den folgenden fünf Forschungsfragen soll der Einfluss des Projekts auf das langfristige Erleben von Emotionen und Motivation im Mathematikunterricht untersucht werden. In Bezug auf das affektive Erleben werden sowohl die subjektiven Bewertungsprozesse, welche in Appraisaltheorien, wie der Kontroll-Wert-Theorie, als Determinanten für die Entstehung von Emotionen gelten (vgl. u. a. Frenzel, Götz & Pekrun, 2020), als auch das Erleben von Emotionen selbst über den Untersuchungszeitraum überprüft. Dabei werden lern- und leistungsförderliche sowie lern- und leistungsmindernde Emotionen (vgl. u. a. Pekrun & Linnenbrink-Garcia, 2014) differenziert betrachtet. Zudem wird die Wirkung des Projekts auf die längerfristige Entwicklung motivationaler Aspekte wie Interesse und Motivation (vgl. u. a. Pekrun, 2018b) hinsichtlich der Mathematik und dem Mathematikunterricht erfasst.

Fragestellungen

F2.1:

Wird eine Veränderung der subjektiven Bewertungsprozesse, der sogenannten Appraisals, über die drei Messzeitpunkte vor, nach und drei Monate nach der Projektdurchführung bei den teilnehmenden SchülerInnen verzeichnet? Gibt es dahingehend Unterschiede zwischen der Entwicklungs- und Feld- und Kontrollgruppe?

F2.2:

Inwieweit werden lernförderliche Lern- und Leistungsemotionen bezüglich des Fachs Mathematik durch die Teilnahme am Projekt gefördert? Gibt es in diesem Zusammenhang Unterschiede zwischen der Entwicklungs- und Feld- und Kontrollgruppe?

F2.3:

Inwieweit werden lernmindernde Lern- und Leistungsemotionen bezüglich des Fachs Mathematik durch die Teilnahme am Projekt reduziert? Gibt es diesbezüglich Unterschiede zwischen der Entwicklungs- und Feld- und Kontrollgruppe?

F2.4:

Wird das Interesse bezüglich der Mathematik bzw. des Mathematikunterrichts durch die Teilnahme am Projekt gesteigert? Gibt es bezüglich des Interesses Unterschiede zwischen der Entwicklungs- und Feld- und Kontrollgruppe?

F2.5:

Inwieweit wird die Motivation bezüglich der Mathematik bzw. des Mathematikunterrichts durch das Mitarbeiten im Projekt gesteigert? Gibt es dahingehend Unterschiede zwischen der Entwicklungs- und Feldgruppe?

Diese zu untersuchenden Konstrukte sind, insbesondere nach der Kontroll-Wert-Theorie, hinsichtlich der reziproken Wirkung von Emotionen und kognitiv-motivationalen Aspekten wie Kontroll- und Wertkognitionen sowie Lernmotivation bedeutsame Parameter (vgl. Kapitel 2). Auf der Grundlage der daraus abgeleiteten emotions- und motivationsfördernden Ausrichtung der Lernumgebung dieses Projekts (vgl. Kapitel 5.3) werden folgende Annahmen getroffen:

Hypothesen

H2.1:

Die subjektiven Bewertungsprozesse, die sogenannten Appraisals, verändern sich über die drei Messzeitpunkte. Dies bezieht sich zum einen auf die Kontrollkognitionen (i) Selbstwirksamkeit sowie (ii) akademische Selbstkonzept und zum anderen auf die Wertkognitionen (iii) intrinsische, (iv) extrinsische sowie (v) ganzheitliche Valenz. Feld-, Entwicklungs- und Kontrollgruppe weisen Unterschiede im Hinblick auf die beschriebenen Kontroll- (i-ii) und Wertkognitionen (iii-v) auf.

H2.2:

Es werden Unterschiede in Bezug auf das Erleben der lernförderlichen Lern- und Leistungsemotionen (i) Lernfreude und (ii) Stolz in Bezug auf das Fach Mathematik bei den SchülerInnen über die drei Messzeitpunkte nachgewiesen. Feld-, Entwicklungs- und Kontrollgruppe weisen Unterschiede im Hinblick auf die lernförderlichen Lern- und Leistungsemotionen (i-ii) auf.

H2.3:

Über die drei Messzeitpunkte werden Unterschiede hinsichtlich des Erlebens der lernmindernden Lern- und Leistungsemotion (i) Langeweile sowie der negativ-aktivierenden Lern- und Leistungsemotion (ii) Ärger, (iii) Angst und (iv) Scham in Bezug auf das Fach Mathematik bei den SchülerInnen ermittelt. Feld-, Entwicklungs- und Kontrollgruppe weisen Unterschiede bezüglich der lernmindernden Lern- und Leistungsemotion (i) Langeweile sowie der negativ-aktivierenden Lern- und Leistungsemotion (ii-iv) auf.

H2.4:

Das Interesse an Mathematik bzw. dem Mathematikunterricht ändert sich über den Erhebungszeitraum. Die Untersuchung bezieht sich dabei sowohl auf (i) Sachinteresse als auch auf (ii) Fachinteresse. Feld-, Entwicklungs- und Kontrollgruppe weisen Unterschiede im Hinblick auf das Interesse (i-ii) bei den SchülerInnen auf.

H2.5:

Über die drei Messzeitpunkte unterscheidet sich die (i) intrinsische Motivation und die (ii) Kompetenzmotivation bezüglich der Mathematik bzw. dem Mathematikunterricht bei den Lernenden. Feld-, Entwicklungs- und Kontrollgruppe weisen Unterschiede im Hinblick auf die (i) intrinsischen Motivation und die (ii) Kompetenzmotivation auf.

6.1.3 F3 kognitive Leistung: Entwicklung der kompetenzorientierten Lernleistung

Fragestellung

F3:

Wird durch die Teilnahme am Projekt eine Steigerung der Leistung hinsichtlich der Kompetenzen im Inhaltsbereich Raumgeometrie verzeichnet? Gibt es diesbezüglich Unterschiede zwischen der Entwicklungs- und Feld- und Kontrollgruppe?

Das Projekt bezieht sich inhaltlich auf die mathematischen Leitideen Raum und Form sowie Messen. Dabei werden insbesondere die geometrischen Körper, welche im Mathematikunterricht in der Sekundarstufe I am Gymnasium in NRW behandelt werden, thematisiert. Die methodische Ausrichtung des Unterrichtsvorhabens soll dabei neben Effekten auf das emotionale und motivationale Erleben auch eine lernförderliche Wirkung auf die teilnehmenden SchülerInnen haben. Die in Kapitel 5.3 beschriebene Gestaltung des Unterrichtsvorhabens soll demnach zu elaboriertem Lernen führen. Die kompetenzorientierte Ausrichtung der Lernumgebung soll dieses insbesondere durch den alternativen Zugang zu den mathematischen Inhalten und den Perspektivwechsel, den die SchülerInnen durch das Erklären ihres Themas vollziehen, fördern. Daher werden folgende Annahmen bezüglich der Lernwirksamkeit des Projektes getroffen:

Hypothese

H3:

Über den Erhebungszeitraum wird ein Unterschied der Testleistung hinsichtlich des mathematischen Themenbereichs Raumgeometrie ermittelt. Feld-, Entwicklungs- und Kontrollgruppe weisen Unterschiede im Hinblick auf die Testleistung auf.

6.2 Erhebungsinstrumente

In diesem Abschnitt werden die Erhebungsinstrumente, die in dieser Studie genutzt werden, vorgestellt. Zunächst werden die Fragebögen mit ausgewählten Skalen des Intrinsic Motivation Inventory, welche sich auf die Selbstbestimmungstheorie (vgl. Deci & Ryan, 1985) beziehen, und ausgewählte Skalen zu Mathematikemotionen, die auf Grundlage der Kontroll-Wert-Theorie (vgl. Pekrun, 2006) entwickelt wurden, näher betrachtet. Dazu werden jeweils die Skalen, die sich auf spezifische Konstrukte beziehen, mit Itembeispielen beschrieben sowie die Überprüfung der Reliabilität anhand der internen Konsistenz und Itemtrennschärfe dargestellt. Abschließend wird der Test zur Überprüfung der Leistungsentwicklung zum mathematischen Teilgebiet der Raumgeometrie mithilfe von Beispielitems beschrieben und die Reliabilitätsprüfung anhand der internen Konsistenz des Tests aufgezeigt.

6.2.1 Intrinsic Motivation Inventory

Zur Erfassung der motivationalen Wirkung des Projekts im Vergleich zu einer regulären Unterrichtsstunde werden Konstrukte mithilfe von Skalen erfasst, die in ähnlicher Form im Intrinsic Motivation InventoryFootnote 1 (vgl. Ryan & Deci, 1994) formuliert sind. Die Skalen wurden von der englischen in die deutsche Sprache übersetzt und die Formulierung „Mathe-Stunde“ wurde in Bezug auf die Evaluation des Projekts, bei t2 und t3, in „Mathe-Projekt“ geändert. Diese Änderungen wurden von Experten der Abteilung Psychologie der Fakultät für Psychologie und Sportwissenschaft der Universität Bielefeld begutachtet. Die Skalen beziehen sich zum einen direkt auf intrinsische Motivation und dem damit verbundenen Interesse bzw. der Freude (vgl. Ryan & Deci, 1994) an der jeweiligen Mathematikstunde (t1) oder dem Projekt (t2, t3). Zum anderen werden durch die Skalen Wert/ Nützlichkeit und Spannung/ Druck die Auswirkungen der Mathematikstunde (t1) und des Projekts (t2, t3) auf das psychologische Grundbedürfnis der Autonomie untersucht. Darüber hinaus wird die Wirkung des Projekts auf das psychologische Grundbedürfnis der wahrgenommenen Kompetenz in der Mathematikstunde (t1) und im Projekt (t2, t3) erfasst. Das dritte Grundbedürfnis der sozialen Bezogenheit wurde in dieser Studie nicht untersucht, da einerseits die Items des IMI inhaltlich nicht zufriedenstellend auf die Untersuchung des Projekts übertragen werden können und andererseits unterschiedliche Sozialformen in den regulären Mathematikstunden angewendet werden, wodurch die Vergleichbarkeit eingeschränkt wird. Zudem ist die soziale Bezogenheit eng an die Lehrperson geknüpft, welche als Variable in dieser Erhebung nicht betrachtet wird.

Die verwendeten Skalen des IMI setzen sich aus mehreren Items zusammen, die als Aussagen über das jeweilige Konstrukt formuliert sind. Die SchülerInnen geben ihre Einschätzungen auf einer siebenstufigen Likert-Skala von stimme gar nicht zu (1) bis stimme sehr zu (7) an. In Tabelle 6.1 sind die Skalen mit jeweils einem Beispielitem aufgeführt. Der komplette Fragebogen ist im elektronischen Zusatzmaterial hinterlegt (vgl. Anhang 1.3.1, 1.3.2 im elektronischen Zusatzmaterial).

Tabelle 6.1 Skalen und Beispielitems des IMI

Die Anzahl der Items zu einer Skala, die interne Konsistenz anhand von Cronbachs α der jeweiligen Skalen sowie die Itemtrennschärfe ist in Tabelle 6.2 dargestellt.

Tabelle 6.2 Interne Konsistenz der IMI Skalen

Um die interne Konsistenz der Skala Druck / Spannung zu verbessern (vorher fünf Items; Cronbachs α = .43–.66), wurden zwei Items von der Auswertung ausgeschlossen. Dies betraf die reversed formulierten Items „Es machte mich nicht nervös in der Mathe-Stunde mitzuarbeiten“ und „Ich fühlte mich entspannt beim Mitarbeiten in der Mathe-Stunde“. Die interne Konsistenz an den drei Messzeitpunkten liegen, mit einer Ausnahme α = .69, jeweils im akzeptablen bis guten Bereich und auch die Trennschärfe der verwendeten Items innerhalb der Skalen befinden sich, bis auf vereinzelte Ausnahmen, oberhalb des kritischen Werts (vgl. Weiber & Mühlhaus, 2014; Blanz, 2015).

6.2.2 Skalen zu Mathematikemotionen

Um die Auswirkung des Projekts auf motivationale und emotionale Faktoren der SchülerInnen im Hinblick auf das Fach Mathematik und die Mathematik im Allgemeinen zu untersuchen, werden Skalen aus der Langzeitstudie PALMA (vgl. Pekrun et al., 2002a) genutzt. Die Skalen setzen sich aus mehreren Items zusammen, die als Aussagen über das jeweilige Konstrukt formuliert sind. Die SchülerInnen geben ihre Einschätzungen auf einer fünfstufigen Likert-Skala von stimmt gar nicht (1) bis stimmt genau (5) an. Die verwendeten Skalen beziehen sich jeweils auf die Aspekte Appraisals, Mathematikemotionen sowie Interesse und Motivation der Kontroll-Wert-Theorie (vgl. Pekrun, 2006). Diese Aspekte werden im Folgenden mit den dazugehörigen Skalen beschrieben und eine Überprüfung der Reliabilität mithilfe der Prüfung auf interne Konsistenz anhand von Cronbachs α und der Trennschärfen der Items wird dargestellt (vgl. Weiber & Mühlhaus, 2014; Blanz, 2015).

Selbst- und fachbezogene Kognitionen: Appraisals (vgl. Kapitel 2.1.3)

Mit den Skalen bezüglich der selbst- und fachbezogenen Kognitionen soll die Auswirkung des Projekts auf die subjektiven Bewertungsprozesse, den sog. Appraisals (vgl. Pekrun, 2006), hinsichtlich der Mathematik untersucht werden. Dabei beziehen sich die Skalen Selbstwirksamkeit und akademisches Selbstkonzept auf Kontrollkognitionen und die Skalen intrinsische, extrinsische und ganzheitliche Valenz auf Wertkognitionen (vgl. Tab. 6.3).

Tabelle 6.3 Skalen und Beispielitems zu selbst- und fachbezogenen Kognitionen

Diese Skalen wurden bereits in der PALMA-Studie (vgl. Pekrun et al., 2002a) genutzt. Die interne Konsistenz lag bezüglich Selbstwirksamkeit bei α = .85, akademisches Selbstkonzept bei α = .88, intrinsische Valenz bei α = .72, extrinsische Valenz bei α = .62 sowie ganzheitliche Valenz bei α = .68 und somit im fragwürdigem bis gutem Bereich (vgl. Blanz, 2015). In der vorliegenden Studie liegen die internen Konsistenzen an den drei Messzeitpunkten ebenfalls in diesem Bereich und auch die Trennschärfe der verwendeten Items innerhalb der Skalen befinden sich, bis auf vereinzelte Ausnahmen, oberhalb des kritischen Werts (vgl. Weiber und Mühlhaus, 2014; vgl. Tab. 6.4).

Tabelle 6.4 Interne Konsistenz der Skalen zu selbst- und fachbezogenen Kognitionen

Mathematikemotionen (vgl. Kapitel 2.1.1; 2.1.2)

Mit den Skalen bezüglich der Mathematikemotionen soll die Auswirkung des Projekts auf die Emotionen hinsichtlich der Mathematik untersucht werden (vgl. Tab 6.5). Die Skalen beziehen sich dabei auf die positiv-aktivierenden Emotionen Freude und Stolz, die negativ-aktivierenden Emotionen Angst, Ärger und Scham sowie die negativ-deaktivierende Emotion Langeweile (vgl. Pekrun, 2006; 2018).

Tabelle 6.5 Skalen und Beispielitems zu Mathematikemotionen

In der PALMA-Studie (vgl. Pekrun et al., 2002a) lag die interne Konsistenz der unterrichtsbezogenen Skalen hinsichtlich Freude bei α = .90, Stolz bei α = .80, Angst bei α = .71, Ärger bei α = .78, Langeweile bei α = .77 sowie Scham bei α = .60 und somit im fragwürdigem bis gutem Bereich (vgl. Blanz, 2015). In der vorliegenden Studie befinden sich die interne Konsistenz an den drei Messzeitpunkten im akzeptablen bis guten Bereich und auch die Trennschärfe der verwendeten Items innerhalb der Skalen liegen, bis auf vereinzelte Ausnahmen, oberhalb des kritischen Werts (vgl. Weiber und Mühlhaus, 2014; vgl. Tab. 6.6).

Tabelle 6.6 Interne Konsistenz der Skalen zu Mathematikemotionen

Interesse und Motivation (vgl. Kapitel 2.2.1; 2.2.2)

Mit den Skalen bezüglich des Interesses und der Motivation soll die Auswirkung des Projekts auf diese Konstrukte hinsichtlich des Fachs Mathematik und der Mathematik im Allgemeinen untersucht werden. Die Skalen (vgl. Tab. 6.7) beziehen sich dabei auf (Sach-) Interesse an Mathematik sowie (Fach-) Interesse am Unterrichtsfach Mathematik und intrinsische Motivation sowie Kompetenzmotivation (vgl. Pekrun et al., 2002b; 2003).

Tabelle 6.7 Skalen und Beispielitems zu Interesse und Motivation

Die interne Konsistenz der verwendeten Skalen in der PALMA-Studie (vgl. Pekrun et al., 2002a) lag hinsichtlich Sachinteresse bei α = .79, Fachinteresse bei α = .76, intrinsische Motivation bei α = .87 sowie Kompetenzmotivation bei α = .67 und somit im fragwürdigem bis gutem Bereich (Blanz, 2015, S. 256). In der vorliegenden Studie liegen die internen Konsistenz an den drei Messzeitpunkten ebenfalls im fragwürdigen bis guten Bereich und die Trennschärfe liegt bei allen Items innerhalb der Skalen über dem kritischen Wert von 0.5 (vgl. Weiber und Mühlhaus, 2014; vgl. Tab. 6.8).

Tabelle 6.8 Interne Konsistenz der Skalen zu Interesse und Motivation

In Bezug auf den Fragenbogen mit Skalen zu Mathematikemotionen werden alle angegebenen Skalen akzeptiert, da sie wie in der PALMA Studie mindestens im fragwürdigen Bereich (>.60) eingestuft werden können und nur wenige Einzelfälle den kritischen Wert der Itemtrennschärfe knapp unterschreiten (vgl. Weiber & Mühlhaus, 2014; Blanz, 2015).

6.2.3 Test

In der vorliegenden Studie wird die Wirkung des Projekts auf die mathematische Kompetenzentwicklung mithilfe von kognitiven Tests untersucht (vgl. Anhang 1.4 im elektronischen Zusatzmaterial). Die Konstruktion der Tests wurde in Anlehnung an die in der Längsschnittstudie PALMA verwendeten Test-Items sowie in den Bildungsstandards formulierten Anforderungsniveaus im Hinblick auf die Leitideen Raum und Form sowie Messen durchgeführt. Zudem wurden die Test-Items von mathematikdidaktischen Experten begutachtet.

Um die Vorkenntnisse der SchülerInnen zu den geometrischen Körpern festzustellen und den Lernzuwachs sowohl direkt nach dem Projekt als auch nach drei Monaten zu erfassen, werden drei Tests in einem Pre, Post und Follow-up Design angeordnet. Im Hinblick auf die Vergleichbarkeit der Ergebnisse bestehen Pre, Post und Follow-up Test aus parallelisierten Items. In einer Pilotierung wurden annähernd gleiche Lösungshäufigkeiten sowie Itemschwierigkeiten nachgewiesen (vgl. Abb. 6.1).

Abbildung 6.1
figure 1

Lösungshäufigkeiten der Testitems in der PilotierungFootnote

Aufgrund mangelnder Trennschärfe wurden die Items 1_5 und 1_3 (a-c) so geändert, dass die Lösungshäufigkeiten in der Hauptstudie zwischen 50 % und 80 % lagen. Das Item 3_3 d wurde nach der Pilotierung aus dem Datensatz ausgeschlossen (vgl. Anhang 1.4 im elektronischen Zusatzmaterial; Aufgaben 3.3.2 Begründung), da diese Aufgaben zu jedem Messzeitpunkt von weniger als 50 % der SchülerInnen bearbeitet wurde und die Reliabilität der Tests negativ beeinflusste.

Die Items unterscheiden sich lediglich durch unterschiedliche Zahlenwerte oder Anordnungen bzw. unterschiedliche Maße der geometrischen Körper. Die Test-Items setzten sich aus sieben geschlossenen Aufgaben (Single-Choice), drei Berechnungsaufgaben, vier halboffenen, drei Schätz- und vier offenen Begründungsaufgaben zusammen, welche jeweils mit 0 oder 1 für falsch oder richtig codiert werden. Mit den geschlossenen (Single-Choice) und halboffenen Aufgaben soll sich ein Überblick über den Wissenstand der SchülerInnen bezüglich der geometrischen Körper im Sinne des Erkennens und Zuordnens von Formeln zur Körperberechnung sowie Merkmalen und Netzdarstellungen von geometrischen Körpern verschafft werden (vgl. bspw. Abb. 6.2).

Abbildung 6.2
figure 2

Beispiel für eine geschlossene Aufgabe im Leistungstest

In den Berechnungsaufgaben sollen die Formeln zugeordnet und korrekt angewendet werden. Damit sollen die Fähigkeit der korrekten Zuordnung der Variablen sowie rechnerischen Umsetzung überprüft werden (vgl. Abb. 6.3).

Abbildung 6.3
figure 3

Berechnungsaufgabe im Leistungstest

Mit den Begründungsaufgaben soll tiefergehendes Wissen überprüft sowie die Lösungswege nachvollzogen werden (vgl. Abb. 6.4). Bezüglich der offenen Begründungsaufgaben wurde ein Bewertungsraster mit zulässigen Begründungen erstellt. Die Bewertung der offenen Items wurde von zwei unabhängigen Ratern durchgeführt und Cohens Kappa wurde als Maß der Übereinstimmung berechnet. Die Werte betrugen dabei κ > 0.79 und liegen nach Landis und Koch (1977) im Rahmen einer substantiellen bis fast vollkommenen Übereinstimmung.

Abbildung 6.4
figure 4

Beispiel für Begründungsaufgabe im Leistungstest

Die Überprüfung der Reliabilität wurde mithilfe der Prüfung auf interne Konsistenz anhand von Cronbachs α durchgeführt. Dieses beträgt hinsichtlich des Pre Tests bei α = .75, des Post Tests bei α = .74 und des Follow-up Test bei α = .74, wonach die Reliabilität der drei Tests jeweils im akzeptablen Bereich liegen (vgl. Weiber & Mühlhaus 2014; Blanz, 2015).

6.3 Forschungsdesign

Die Gesamtstudie besteht aus zwei Teilstudienphasen. In der ersten Phase, der Entwicklungsstudie, wurden zum einen die Durchführbarkeit des Projekts und zum anderen mögliche Auswirkungen auf affektiv-motivationale und kognitive Parameter überprüft. Dabei führte die Projektleitung das beschriebene Unterrichtsprojekt in drei 9. Klassen eines Gymnasiums in NRWFootnote 3 durch (vgl. Kapitel 6.4). In der zweiten Studienphase, der Feldstudie, wurde nach der Durchführung der Entwicklungsstudie, die Durchführbarkeit des Projekts für Mathematiklehrkräfte mit ihrer Klasse in einer regulären Unterrichtskonstellation untersucht. Dabei wurden wiederum emotionale und motivationale Effekte sowie Lerneffekte in vier 9. Klassen eines Gymnasiums in NRWFootnote 4 geprüft (vgl. Kapitel 6.4). Zudem wurden Daten von drei weiteren neunten Klassen erhoben, die in der Gesamtstudie als Kontrollgruppe fungierten. Die beiden Studienphasen und auch die Datenerhebung der Kontrollgruppe wurden jeweils nach Abschluss der Unterrichtseinheit zu den geometrischen Körpern in der Sekundarstufe I durchgeführt. Bei der Kontrollgruppe wurden demzufolge nach Abschluss der Unterrichtsreihe die ersten Daten (t1) und drei Monate danach (t3) weitere Daten erhoben, um die Entwicklung der affektiv-motivationalen Parameter (vgl. Kapitel 6.2.2) sowie die Leistung in diesem Themengebiet (vgl. Kapitel 6.2.3) ohne Intervention zu überprüfen.

Die Datenerhebung in den Interventionsgruppen wurde hinsichtlich der zu untersuchenden Konstrukte (vgl. Kapitel 6.2) an verschiedenen Zeitpunkten vor, während und nach dem Projekt durchgeführt. In Abbildung 6.5 sind die Messzeitpunkte im und um das Projekt in beiden Studienphasen entsprechend der verschiedenen Erhebungsinstrumenten dargestellt.

Abbildung 6.5
figure 5

Datenerhebung: IMI (Intrinsic Motivation Inventory); SMe (Skalen zu Mathematikemotionen); Leistungstest

Die Daten zum Fragebogen IMI (vgl. Kapitel 6.2.1) wurden an drei Messzeitpunkten erhoben. Hinsichtlich dieses Fragebogens dienen die Daten des ersten Messzeitpunkts als Referenzwerte. Die Fragen zu motivationalen Aspekten an diesem Messzeitpunkt wurden explizit zur Mathematikstunde vor dem Projekt gestellt. Diese Mathematikstunde folgte keiner projektorientierten Ausrichtung und gliederte sich in lehrerzentrierter Input-, Übungs- und Sicherungsphase, da Daten zu einer regulären Mathematikstunde erfasst werden sollten. Hinsichtlich der verschiedenen Klassen in den unterschiedlichen Studienphasen wurden insgesamt Daten aus sieben Mathematikstunden gesammelt. Die zweite Erhebung wurde am Ende des ersten und die dritte Erhebung am Ende des zweiten Projekttags durchgeführt (vgl. Abb. 6.5). Die erhobenen Werte des ersten Messzeitpunktes können dann mit den Werten des zweiten und dritten Messzeitpunktes, welche sich explizit auf das Projekt beziehen, verglichen werden.

Der zweite Fragebogen SMe (vgl. Kapitel 6.2.2) wurde in einem Pre, Post und Follow-up Design eingesetzt, um die Entwicklung der emotionalen und motivationalen Parameter auch über den Projektzeitraum hinaus zu untersuchen. Die erste Datenerhebung (Pre) wurde zu Beginn des Unterrichtsprojekts durchgeführt, um den Ist-Zustand zu ermitteln. Die Daten zum zweiten Messzeitpunkt wurde nach der Projektdurchführung erhoben, um den kurzfristigen Einfluss des Projekts aufzuzeigen (Post). Die Follow-up Datenerhebung wurden drei Monate nach dem Projekt durchgeführt, um mögliche langfristige Effekte ermitteln zu können (vgl. Abb. 6.5).

Auch hinsichtlich der Überprüfung von Lerneffekten durch das Projekt wurden Daten (vgl. Kapitel 6.2.3) an drei Messzeitpunkte in einem Pre, Post und Follow-up Design erhoben. Der Pre Test wurde unmittelbar vor dem Projekt, der Post Test unmittelbar nach und der Follow-up Test drei Monate nach dem Projekt durchgeführt.

6.4 ProbandInnen

An der Gesamtstudie nahmen 253 SchülerInnen (Alter: 14,48 Jahre; weiblich: 133; männlich: 120) aus zehn Klassen der 9. Jahrgangsstufe an nordrhein-westfälischen Gymnasien teil. Dabei setzt sich die Gesamtanzahl aus drei Untergruppen zusammen: Entwicklungsgruppe (EG), Feldgruppe (FG) und Kontrollgruppe (KG).

Die einzelnen Gruppen setzten sich wiederum aus verschiedenen 9. Klassen zusammen. Die Entwicklungsgruppe (EG) bestand aus drei parallelen Klassen (EG1–3) und umfasste 69 SchülerInnen (Alter: 14,55 Jahre; weiblich: 36; männlich: 33). Diese Klassen haben das Projekt angeleitet durch die wissenschaftliche Projektleitung nacheinander im Zeitraum zwischen dem 29.01.2018 und dem 12.02.2018. durchgeführt (vgl. Abb. 6.6).

Abbildung 6.6
figure 6

Zeitrahmen der Projektdurchführung [P] und Follow-up Erhebung [FU] der Entwicklungsgruppe (EG)

Die Feldgruppe setzte sich aus vier parallelen Klassen (FG1–4) der 9. Jahrgangsstufe mit 95 SchülerInnen eines weiteren Gymnasiums aus NRW zusammen (Alter: 14,43 Jahre; weiblich: 50; männlich: 45). Das Projekt wurde in je zwei Klassen parallel unter der Leitung der jeweiligen Mathematiklehrkraft im Zeitraum zwischen dem 27.01.2020 und dem 30.01.2020 durchgeführt (vgl. Abb. 6.7).

Abbildung 6.7
figure 7

Zeitrahmen der Projektdurchführung [P] und Follow-up Erhebung [FU] der Feldgruppe (FG)

Neben der Entwicklungs- und Feldgruppe, die jeweils das Treatment in Form des Projekts durchliefen, wurde zudem eine Kontrollgruppe (KG), welche das Projekt nicht durchführte, zum Vergleich möglicher langfristiger Effekte untersucht. Die Kontrollgruppe (N = 89; Alter: 14,47 Jahre; weiblich: 47; männlich: 42) bearbeitete lediglich den Fragebogen (SMe) und den Leistungstest im Januar/ Februar 2019 sowie im April/ Mai 2019, um eine langfristige Entwicklung von emotionalen und motivationalen Parametern sowie der Leistung hinsichtlich des inhaltlichen Schwerpunkts ohne Treatment aufzuzeigen.

6.5 Auswertungsmethode

In diesem Unterkapitel werden die Auswertungsmethoden der erhobenen Daten sowie deren Voraussetzungen und Korrekturmaßnahmen beschrieben.

Für die Auswertung der Daten wurden die inferenzstatistischen Methoden der ein- und zweifaktoriellen Varianzanalyse mit Messwiederholungen in unterschiedlichen Ausprägungen durchgeführt. Die Voraussetzungen für die Anwendung von Varianzanalysen mit Messwiederholung wurden vor der Berechnung geprüft (vgl. Field, 2018; Rasch, Friese, Hofmann & Naumann, 2014). Extreme Ausreißer, Werte, die mehr als den dreifachen Interquartilsabstand aufwiesen, wurden mithilfe von Box-Plots in SPSS ermittelt und aus dem entsprechenden Datensatz entfernt (vgl. Field, 2018; Rost, 2013). Die Eliminierung einzelner Daten wird bei der Ergebnisdarstellung jeweils berichtet. Sphärizität, die Gleichheit der Varianzen zwischen den einzelnen Gruppen, wurde jeweils durch den Mauchly-Test überprüft und Korrekturmaßnahmen, wie die Greenhouse-Geisser oder Huynh-Feldt-Korrektur wurden bei Verletzung dieser angewendet. Die Verwendung der genannten Korrekturmaßnahmen wird bei der Darstellung der Ergebnisse jeweils berichtet. Die Wahl des Korrekturverfahrens richtete sich dabei nach dem Greenhouse-Geisser-Epsilon. Bei einem ε < .75 wurde die Greenhouse-Geisser-Korrektur genutzt, während bei einem ε > .75 die Huynh-Feldt-Korrektur angewendet wurde. Die Überprüfung auf Homogenität der Fehlervarianz zwischen den Gruppen wurde mithilfe des Levene-Tests und auf Gleichheit der Kovarianzenmatrizen mit dem Box-Test durchgeführt. Auf die Prüfung der Normalverteilung wurde aufgrund der ausreichend großen Stichprobe (mind. N > 64 für jede der Gruppen) verzichtet, da nach dem zentralen Grenzwertsatz eine annähernde Normalverteilung angenommen werden kann (vgl. Bortz & Schuster, 2010; Kähler, 2004). In der Auswertung der erhobenen Daten wurden multiple statistische Signifikanztests wie Varianzanalysen oder Post-hoc Vergleiche ausgeführt. Um eine α-Fehlerkumulierung zu vermeiden wurden hinsichtlich der verschiedenen Testverfahren Bonferroni-Korrekturen vorgenommen. Mit der Bonferroni-Korrektur wird das α-Niveau, welches üblicherweise bei 0.05 liegt, durch die Anzahl der durchgeführten Tests geteilt, um eine α-Fehlerwahrscheinlichkeit, welche 5 % nicht übersteigt, zu gewährleisten (vgl. Steland, 2004; Sachs & Hedderich, 2006). Die Bonferroni-korrigierten α-Werte werden in Bezug auf die spezifischen Methoden und Datensätze jeweils im Ergebnisteil angegeben und die Befunde hinsichtlich dieser interpretiert.

Im Folgenden werden die verschiedenen Auswertungsmethoden bezüglich aller zu untersuchenden Konstrukte dargestellt.

Zur Erfassung der Motivation sowie der Erfüllung grundlegender psychologischen Bedürfnisse im Hinblick auf motiviertes Verhalten (F1) wurden die drei Messzeitpunkte, während einer regulären Mathematikstunde (t1) sowie während des Projekt (t2 und t3), mithilfe von Post-hoc Tests sowohl bei der Entwicklungs- (EG) als auch Feldgruppe (FG) miteinander verglichen (vgl. Abb. 6.8).

Abbildung 6.8
figure 8

Post-hoc Analyse

Konstrukte

Freude/ Interesse

Druck / Spannung

Wert / Nützlichkeit

Kompetenzerleben

Zur Untersuchung von Unterschieden zwischen der Entwicklungs- (EG) und Feldgruppe (FG) wurden zweifaktorielle Varianzanalysen mit Messwiederholungen (vgl. Abb. 6.9) mit dem Zwischensubjektfaktor Untersuchungsgruppe durchgeführt (vgl. Field, 2018; Rasch, Friese, Hofmann & Naumann, 2014).

Abbildung 6.9
figure 9

rmANOVA – Gruppenvergleich Freude/Interesse, Druck/Spannung, Wert/Nützlichkeit, Kompetenzerleben

Konstrukte

Freude / Interesse

Druck / Spannung

Wert / Nützlichkeit

Kompetenzerleben

Innersubjektfaktor

Lernumgebung

Zwischensubjektfaktoren

Untersuchungsgruppe

Zur Überprüfung der Entwicklung von Appraisals, Emotionen sowie Motivation und Interesse gegenüber der Mathematik bzw. dem Mathematikunterricht im Allgemeinen (F2) wurden einfaktorielle Varianzanalysen mit Messwiederholung über die drei Messzeitpunkten bei der Entwicklungs- (EG) und Feldgruppe (FG) durchgeführt (vgl. Abb. 6.10).

Abbildung 6.10
figure 10

rmANOVA – Entwicklung Appraisals, Lern- und Leistungsemotionen und Motivation

Konstrukte

AppraisalsFootnote 5

Lern- und LeistungsemotionenFootnote 6

MotivationFootnote 7

Innersubjektfaktor

Zeit

Potenzielle Unterschiede im Gruppenvergleich (EG, FG und KG) wurden zudem mittels zweifaktorieller Varianzanalysen mit zwei (EG im Vergleich zur FG; Abb. 6.11) oder einer weiteren Messung (EG/FG im Vergleich zur KG; Abb. 6.12) mit Zwischensubjektfaktor Untersuchungsgruppe überprüft.

Abbildung 6.11
figure 11

rmANOVA – Gruppenvergleich Appraisals, Emotionen und Motivation

Abbildung 6.12
figure 12

ANOVA – Gruppenvergleich (Kontrollgruppe) Appraisals, Emotionen und Motivation

Konstrukte

Appraisals

Lern- und Leistungsemotionen

Motivation

Innersubjektfaktor

Zeit

Zwischensubjektfaktor

Untersuchungsgruppe

Die Daten der mathematischen Leistungsentwicklung (F3) über die drei Messzeitpunkte wurden ebenso mithilfe von Varianzanalysen mit Messwiederholung und Zwischensubjektfaktor Untersuchungsgruppe (vgl. Abb. 6.13) in den Ausprägungen Entwicklungsgruppe (EG), Feldgruppe (FG) und Kontrollgruppe (KG) und Post-hoc Tests zur Untersuchung der Leistungsentwicklung und Überprüfung von Unterschieden zwischen den Gruppen ausgewertet (vgl. Abb. 6.14, 6.15).

Abbildung 6.13
figure 13

rmANOVA – Entwicklung Mathematikleistung

Abbildung 6.14
figure 14

Post-hoc Analyse Gruppenvergleich Mathematikleistung

Abbildung 6.15
figure 15

Post-hoc Analyse Gruppenvergleich (Kontrollgruppe) Mathematikleistung

Konstrukt

Mathematikleistung

Innersubjektfaktor

Zeit

Zwischensubjektfaktor

Untersuchungsgruppe

6.6 Ergebnisse zu Forschungsfrage 1

In diesem Abschnitt werden die Ergebnisse zur ersten Forschungsfrage (F1) in Bezug auf Autonomie- und Kompetenzerleben sowie dem Erleben intrinsischer Motivation während der Teilnahme am Projekt im Vergleich zum regulären Mathematikunterricht skizziert. Dabei werden zunächst die Ergebnisse der Entwicklungs- und Feldgruppe separat dargestellt und anschließend miteinander verglichen.

Bei der zur Überprüfung der F1 eingesetzten Varianzanalyse mit Messwiederholung wurde das Signifikanzniveau aufgrund mehrfacher Durchführungen Bonferroni-korrigiert und liegt bei αkorr = 0.025 (vgl. Steland, 2004; Sachs & Hedderich, 2006)Footnote 8. Die Anpassung des Signifikanzniveaus wird hinsichtlich der paarweisen Vergleich durch das Statistikprogramm SPSS obligatorisch berechnet und verbleibt bei α = 0.05.

6.6.1 Ergebnisse zu F1 – intrinsische Motivation

F1.1 Entwicklungsgruppe: Intrinsische Motivation

In Tabelle 6.9 werden die Ergebnisse der Entwicklungsgruppe im Hinblick auf intrinsische Motivation bezüglich regulärem Unterricht (t1) und dem Projekt (t2, t3) dargestellt.

Tabelle 6.9 Deskriptive Statistik der EG zu intrinsischer Motivation (Interesse / Freude)

Zum ersten Messzeitpunkt (t1) zeigte sich ein niedrigerer Mittelwert im Vergleich zu den Messungen am Ende des ersten (t2) und zweiten (t3) Projekttages. In Abbildung 6.16 werden die Ergebnisse verdeutlicht. Die Box-Plots hinsichtlich t2 und t3 sind entsprechend nach oben verschoben.

Abbildung 6.16
figure 16

Verteilung der Werte zu Interesse / Freude in der EG

In der Varianzanalyse mit Messwiederholung konnte ein signifikanter Haupteffekt der Lernumgebung nachgewiesen werden (Greenhouse-Geisser F(1.29,86.45) = 153.40, p < .001, partielles η2 = 0.70). Dabei können 70 % der Varianz der intrinsischen Motivation durch diesen Faktor erklärt werden. Nach Cohen (1988) ist der Effekt als groß einzuschätzen (vgl. Field, 2018). Der signifikante Unterschied zeigte sich zudem durch den paarweisen Vergleich in Unterschieden zwischen t1 und t2 (Mdiff. = 1.95, p < .001) sowie t1 und t3 (Mdiff. = 1.98, p < .001). Im Vergleich zu einer regulären Mathematikstunde waren die SchülerInnen der Entwicklungsstudie während des Projekts demnach intrinsisch motivierter.

F1.1 Feldgruppe: Intrinsische Motivation

Die Ergebnisse der Feldgruppe in Bezug auf die intrinsische Motivation hinsichtlich regulären Unterrichts (t1) und des Projektes (t2, t3) werden in Tabelle 6.10 dargestellt.

Tabelle 6.10 Deskriptive Statistik der FG zu intrinsischer Motivation (Interesse / Freude)

Aufgrund von zwei extremen Ausreißern wurden die Daten von zwei ProbandInnen aus dem Datensatz eliminiert. Auch bezüglich der Untersuchungsgruppe in der Feldstudie zeigte sich ein Anstieg der Mittelwerte an t2 und t3 im Vergleich t1. In Abbildung 6.17 wird die Verteilung der Werte zum Konstrukt Interesse bzw. Freude dargestellt.

Abbildung 6.17
figure 17

Verteilung der Werte zu Interesse / Freude in der FG

Die Greenhouse-Geisser korrigierte Varianzanalyse mit Messwiederholung zeigte auch hier einen signifikanten Haupteffekt Lernumgebung (F(1.28,111.40) = 74.67, p < .001, partielles η2 = .46). Dabei werden 46 % der Varianz der intrinsischen Motivation durch den Faktor Lernumgebung erklärt. Der Effekt ist als groß einzuschätzen. Signifikante Unterschiede zeigten sich durch den paarweisen Vergleich zwischen t1 und t2 (Mdiff. = 1.20, p < .001) sowie t1 und t3 (Mdiff. = 1.38, p < .001). Die ProbandInnen der Feldgruppe wiesen demzufolge eine höhere intrinsische Motivation während des Projekts im Vergleich zu einer regulären Mathematikstunde auf.

F1.1 Vergleich von Entwicklungs- und Feldgruppe: Intrinsische Motivation

Abbildung 6.18 zeigt den Vergleich der Ergebnisse von Entwicklungs- (EG) und Feldgruppe (FG) hinsichtlich der intrinsischen Motivation in Bezug auf die verschiedenen Lernumgebungen zu den Messzeitpunkten t1, t2 und t3.

Abbildung 6.18
figure 18

Entwicklung der intrinsischen Motivation in der EG und FG

Es konnte ein Interaktionseffekt zwischen dem Innersubjektfaktor Lernumgebung und dem Zwischensubjektfaktor Untersuchungsgruppe mithilfe der rmANOVA mit Greenhouse-Geisser Korrektur gezeigt werden (F(1.29,197.83) = 9.76, p < .001, partielles η2 = .06). Die Entwicklungsgruppe (EG) wies zwischen dem erstem und zweitem Messzeitpunkt demnach eine größere Steigerung der intrinsischen Motivation als die Feldgruppe (FG) auf. Der Effektstärke ist als mittel zu beurteilen.

6.6.2 Ergebnisse zu F1 – Autonomieerleben

F1.2 Entwicklungsgruppe: Autonomieerleben

Die Mittelwerte der Entwicklungsgruppe im Hinblick auf erlebten Druck bzw. Spannung bezüglich des regulären Mathematikunterrichts (t1) und des Projektes (t2, t3) sind in Tabelle 6.11 dargestellt.

Tabelle 6.11 Deskriptive Statistik der EG zu Druck / Spannung

Zum ersten Messzeitpunkt (t1) wurde ein höherer Mittelwert im Vergleich zu den Messungen am Ende des ersten (t2) und zweiten (t3) Projekttages nachgewiesen. Die Ergebnisse zeigen sich in Abbildung 6.19, indem die Box-Plots hinsichtlich t2 und t3 nach unten verschoben sind.

Abbildung 6.19
figure 19

Verteilung der Werte zu Druck / Spannung in der EG

Mithilfe der Varianzanalyse mit Messwiederholung konnte ein signifikanter Haupteffekt der Lernumgebung in Bezug auf das Konstrukt Druck bzw. Spannung (Greenhouse-Geisser F(1.48,99.49) = 8.03, p = .002, partielles η2 = 0.11) ermittelt werden. Es können 11 % der Varianz des erlebten Drucks bzw. der erlebten Spannung durch diesen Faktor erklärt werden. Der Effekt weist demnach eine mittlere Effektstärke auf. Der paarweise Vergleich zeigte signifikante Unterschiede zwischen t1 und t2 (Mdiff. = 0.61, p = .003) sowie t1 und t3 (Mdiff. = 0.48, p = .038). Die SchülerInnen der Entwicklungsgruppe erlebten somit geringeren Druck bzw. Spannung während des Projekts im Vergleich zu einer regulären Mathematikstunde.

Im Hinblick auf das Konstrukt Wert bzw. Nützlichkeit werden die Mittelwerte der Entwicklungsgruppe bezüglich des regulären Mathematikunterrichts (t1) und des Projektes (t2, t3) in Tabelle 6.12 aufgeführt.

Tabelle 6.12 Deskriptive Statistik der EG zu Wert / Nützlichkeit

Aus diesem Datensatz musste aufgrund von zwei extremen Ausreißern Daten von zwei ProbandInnen entfernt werden. In Abbildung 6.20 werden die dazugehörigen Box-Plot Diagramme dargestellt.

Abbildung 6.20
figure 20

Verteilung der Werte zu Wert / Nützlichkeit in der EG

In der Varianzanalyse mit Messwiederholung konnte kein signifikanter Haupteffekt der Lernumgebung bezüglich des subjektiven Werts bzw. der Nützlichkeit bei der Entwicklungsgruppe festgestellt werden (Huynh-Feldt F(1.86,120.60) = .21, p = .793). Die SchülerInnen der Entwicklungsgruppe schätzten den Wert bzw. die Nützlichkeit des Projekts im Vergleich zu einer regulären Mathematikstunde als gleich ein.

F1.2 Feldgruppe: Autonomieerleben

Tabelle 6.13 zeigt die Mittelwerte der Feldgruppe bezüglich erlebten Drucks bzw. Spannung im Vergleich von regulärem Mathematikunterricht (t1) zum Projekt (t2, t3).

Tabelle 6.13 Deskriptive Statistik der FG zu Druck / Spannung

In Abbildung 6.21 wird die Verteilung der Werte in Box-Plots zu den drei Messzeitpunkten dargestellt.

Abbildung 6.21
figure 21

Verteilung der Werte zu Druck / Spannung in der FG

In der Varianzanalyse mit Messwiederholung wurde bei der Feldgruppe kein signifikanter Haupteffekt der Lernumgebung nachgewiesen (Huynh-Feldt F(1.80,158.55) = 3.89, p = .026). Der Befund weist darauf hin, dass es keinen Unterschied hinsichtlich des erlebten Drucks bzw. der erlebten Spannung bei den SchülerInnen der Feldgruppe während des Projekts im Vergleich zu einer regulären Mathematikstunde gab.

Die Mittelwerte der ProbandInnen der Feldstudie im Hinblick auf das Konstrukt subjektiver Wert bzw. Nützlichkeit im Vergleich von regulärem Mathematikunterricht (t1) und dem Projekt (t2, t3). werden in Tabelle 6.14 dargestellt.

Tabelle 6.14 Deskriptive Statistik der FG zu Wert / Nützlichkeit

Die Verteilung der Werte zum Konstrukt subjektiver Wert bzw. Nützlichkeit bei der Feldgruppe in Bezug auf die drei Messzeitpunkte wird in Abbildung 6.22 mithilfe von Box-Plots skizziert.

Abbildung 6.22
figure 22

Verteilung der Werte zu Wert / Nützlichkeit in der FG

Die rmANOVA mit Huynh-Feldt-Korrektur zeigte einen signifikanten Haupteffekt der Lernumgebung (F(1.53,134.79) = 11.06, p < .001, part. η2 = .11). Durch diesen Faktor können 11 % der Varianz des erlebten Drucks bzw. der erlebten Spannung erklärt werden. Es wurde eine mittlere Effektstärke nachgewiesen. Der paarweise Vergleich zeigte signifikante Unterschiede zwischen t1 und t2 (Mdiff. = 0.47, p < .001) sowie t1 und t3 (Mdiff. = 0.49, p = .003). Das Projekt wies bei den SchülerInnen der Feldstudie somit einen geringeren subjektiven Wert bzw. eine niedrigere subjektive Nützlichkeit als eine reguläre Mathematikstunde auf.

F1.2 Vergleich von Entwicklungs- und Feldgruppe: Autonomieerleben

In den Abbildungen 6.23 und 6.24 werden der Vergleich der Ergebnisse von Entwicklungs- (EG) und Feldgruppe (FG) hinsichtlich des erlebten Drucks bzw. Spannung (vgl. Abb. 6.23) sowie des subjektiven Werts bzw. der Nützlichkeit (vgl. Abb. 6.24) in Bezug auf die verschiedenen Lernumgebungen dargestellt.

Abbildung 6.23
figure 23

Entwicklung von Druck / Spannung in der EG und FG

In der Varianzanalyse mit Messwiederholung konnte kein signifikanter Interaktionseffekt zwischen dem Innersubjektfaktor Lernumgebung und dem Zwischensubjektfaktor Untersuchungsgruppe ermittelt werden (Huynh-Feldt F(1.67, 285.81) = .99, p = .362). Die Entwicklungs- (EG) und Feldgruppe (FG) wiesen somit keine Unterschiede in Bezug auf erlebten Druck bzw. Spannung in den verschiedenen Lernumgebungen auf. Die SchülerInnen beider Gruppen erlebten während des Projekts ein geringeres Maß an Druck bzw. Spannung.

Abbildung 6.24
figure 24

Entwicklung von Wert / Nützlichkeit in der EG und FG

Die Varianzanalyse mit Messwiederholung hinsichtlich des Vergleich von Entwicklungs- (EG) und Feldgruppe in Bezug auf den subjektiven Werts bzw. Nützlichkeit ergab einen signifikanten Interaktionseffekt zwischen dem Innersubjektfaktor Lernumgebung und dem Zwischensubjektfaktor Untersuchungsgruppe (Huynh-Feldt F(1.65, 252.90) = 4.60, p  = .016, partielles η2 = .03). Nach Cohen (1988) ist der Effekt als klein einzuschätzen. Es bestand demnach ein Unterschied zwischen Entwicklungs- (EG) und Feldgruppe bezüglich des Konstrukts subjektiver Wert bzw. Nützlichkeit in den verschiedenen Lernumgebungen. Die SchülerInnen der Feldstudie sahen einen größeren Wert bzw. Nützlichkeit im regulären Mathematikunterricht im Vergleich zum Projekt als die SchülerInnen der Entwicklungsstudie.

6.6.3 Ergebnisse zu F1 – Kompetenzerleben

F1.3 Entwicklungsgruppe: Kompetenzerleben

Die Tabelle 6.15 zeigt die Mittelwerte des Konstrukts Kompetenzerleben der SchülerInnen in der Entwicklungsstudie hinsichtlich einer regulären Mathematikunterricht (t1) und des Projekts (t2, t3).

Tabelle 6.15 Deskriptive Statistik der EG zu Kompetenzerleben

Die Verteilung der Werte wird in Abbildung 6.25 durch die Box-Plots dargestellt. In Bezug auf die reguläre Mathematikstunde (t1) zeigte sich ein niedrigerer Mittelwert und somit einer Verschiebung des Box-Plots nach unten im Vergleich zu den Messungen am Ende des ersten (t2) und zweiten (t3) Projekttages.

Abbildung 6.25
figure 25

Verteilung der Werte zu Kompetenzerleben in der EG

In der Varianzanalyse mit Messwiederholung konnte ein signifikanter Haupteffekt der Lernumgebung hinsichtlich des Konstrukts Kompetenzerleben der Entwicklungsgruppe nachgewiesen werden (Greenhouse-Geisser F(1.49,99.91) = 24.80, p < .001, partielles η2 = 0.27). Nach diesem Befund können 27 % der Varianz des Kompetenzerlebens durch diesen Faktor erklärt werden. Die Effektstärke ist als groß zu erachten. Der signifikante Unterschied zeigte sich zudem durch den paarweisen Vergleich zwischen t1 und t2 (Mdiff. = 0.69, p < .001) sowie t1 und t3 (Mdiff. = 0.76, p < .001). Im Vergleich zu einer regulären Mathematikstunde erlebten sich die SchülerInnen der Entwicklungsstudie während des Projekts demnach als kompetenter im Vergleich zu einer regulären Mathematikstunde.

F1.3 Feldgruppe: Kompetenzerleben

Die Mittelwerte des Konstrukts Kompetenzerleben der ProbandInnen der Feldstudie hinsichtlich einer regulären Mathematikunterricht (t1) und des Projekts (t2, t3) werden in Tabelle 6.16 dargestellt.

Tabelle 6.16 Deskriptive Statistik der FG zu Kompetenzerleben

Die Box-Plots in der Abbildung 6.26 zeigen die Verteilung der Werte des Kompetenzerlebens der Feldgruppe (FG) bezüglich der drei Messzeitpunkte.

Abbildung 6.26
figure 26

Verteilung der Werte zu Kompetenzerleben in der FG

Mithilfe der Varianzanalyse mit Messwiederholung und Greenhouse-Geisser-Korrektur wurde auch ein signifikanter Haupteffekt der Lernumgebung bei der Feldgruppe ermittelt (F(1.48,130.33) = 9.30, p < .001, partielles η2 = .10). Es können 10 % der Varianz des Kompetenzerlebens durch diesen Faktor erklärt werden, wobei der Effekt eine mittlere Effektstärke aufweist (vgl. Cohen, 1988). Somit bestand ein Unterschied im Kompetenzerleben der SchülerInnen der Feldgruppe in den verschiedenen Lernumgebungen, welcher auch durch den paarweisen Vergleich mit Bonferroni-Korrektur zwischen t1 und t2 (Mdiff. = 0.40, p = .008) sowie t1 und t3 (Mdiff. = 0.45, p = .003) gezeigt wurde. Sie erlebten sich weniger kompetent im regulären Mathematikunterricht im Vergleich zum Projekt.

F1.3 Vergleich von Entwicklungs- und Feldgruppe: Kompetenzerleben

In Abbildung 6.27 wird der Vergleich der Ergebnisse von Entwicklungs- (EG) und Feldgruppe (FG) hinsichtlich des Konstrukts Kompetenzerleben in Bezug auf die Lernumgebungen dargestellt.

Abbildung 6.27
figure 27

Entwicklung von Kompetenzerleben in der EG und FG

Die Varianzanalyse mit Messwiederholung und Greenhouse-Geisser-Korrektur zeigte in Bezug auf das Kompetenzerleben keinen signifikanten Interaktionseffekt zwischen dem Innersubjektfaktor Lernumgebung und dem Zwischensubjektfaktor Untersuchungsgruppe (F(1.49, 230.54) = 2.13, p = .135). Die Entwicklungs- (EG) und Feldgruppe wiesen somit keinen Unterschied in Bezug auf das Kompetenzerleben in den verschiedenen Lernumgebungen auf. Die SchülerInnen beider Gruppen erlebten sich während des Projekts als kompetenter.

6.7 Ergebnisse zu Forschungsfrage 2

In diesem Abschnitt werden die Ergebnisse zur zweiten Forschungsfrage (F2) dargestellt. Diesbezüglich wird der Einfluss des Projekts auf das Erleben von Emotionen und Motivation im Mathematikunterricht betrachtet. In diesem Zusammenhang werden subjektive Bewertungsprozesse, sogenannte Appraisals, sowie lern- und leistungsförderliche und lern- und leistungsmindernde Emotionen (vgl. u. a. Pekrun & Linnenbrink-Garcia, 2014) differenziert betrachtet und die längerfristige Entwicklung motivationaler Aspekte wie Interesse und Motivation (vgl. u. a. Pekrun, 2018b) hinsichtlich der Mathematik und dem Mathematikunterricht erfasst. Diese affektiv-motivationalen Variablen werden mithilfe verschiedener Skalen untersucht. Bei der zur Überprüfung der F2 eingesetzten Varianzanalyse mit Messwiederholung wurde das Signifikanzniveau aufgrund mehrfacher Durchführung Bonferroni-korrigiert und liegt bei αkorr = 0.0167 (vgl. Steland, 2004; Sachs & Hedderich, 2006)Footnote 9. Die Anpassung des Signifikanzniveaus wird hinsichtlich der paarweisen Vergleich durch das Statistikprogramm SPSS obligatorisch berechnet und verbleibt somit bei α = 0.05.

Die Darstellung der Ergebnisse in Bezug auf die untersuchten Variablen erfolgt folgendermaßen: Zunächst wird die Entwicklung der Werte zu den jeweiligen Konstrukten in der Entwicklungsgruppe dargestellt. Danach wird der Langzeitvergleich der Entwicklungsgruppe mit der Kontrollgruppe gezeigt. Darauf wird die Entwicklung der Werte in der Feldgruppe dargestellt und diese anschließend mit der Kontrollgruppe verglichen. Abschließend werden die Ergebnisse von Entwicklungs- und Feldgruppe miteinander verglichen.

6.7.1 Ergebnisse zu F2 – Appraisals

F2.1 Entwicklungsgruppe: Appraisals

In Tabelle 6.17 werden die Mittelwerte sowie Standardabweichungen der Skalen in Bezug auf subjektive Bewertungsprozesse, die sogenannten Appraisals, der SchülerInnen der Entwicklungsgruppe über die drei Messzeitpunkte gezeigt. Die Skalen zu Kontrollkognitionen sind Selbstwirksamkeit und akademisches Selbstkonzept und die Skalen zu Wertkognitionen sind intrinsische, ganzheitliche und extrinsische Valenz (vgl. Pekrun et al., 2002a, 2003).

Tabelle 6.17 Deskriptive Statistik der EG zu Selbstwirksamkeit, akademisches Selbstkonzept, intrinsische Valenz, ganzheitliche Valenz und extrinsische Valenz

In Abbildung 6.28 wird die Verteilung der Werte hinsichtlich der Kontroll- und Wertkognitionen an den drei Messzeitpunkten dargestellt.

Abbildung 6.28
figure 28

Verteilung der Werte zu Selbstwirksamkeit, akademisches Selbstkonzept, intrinsische Valenz, ganzheitliche Valenz und extrinsische Valenz in der EG

Mithilfe von einfaktoriellen Varianzanalysen mit Messwiederholung wurde die Entwicklung der Konstrukte über die drei Messzeitpunkte untersucht (vgl. Tab. 6.18). Dabei konnten statistisch signifikante Haupteffekte der Zeit sowohl bezüglich der Kontrollkognitionen, Selbstwirksamkeit und akademisches Selbstkonzept, als auch bei der Wertkognition hinsichtlich intrinsischer Valenz nachgewiesen werden. Keine statistisch signifikanten Haupteffekte der Zeit wurden hingegen in Bezug auf ganzheitliche und extrinsische Valenz ermittelt werden.

Tabelle 6.18 Ergebnisse der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu Selbstwirksamkeit, akademisches Selbstkonzept, intrinsische Valenz, ganzheitliche Valenz und extrinsische Valenz in der EG

Der größte Effekt wurde dabei hinsichtlich des Konstrukts Selbstwirksamkeit (partielles η2 = .12) festgestellt. Diesbezüglich kann 12 % der Varianz durch den Faktor Zeit erklärt werden, wobei die Effektstärke nach Cohen (1988) als mittel bewertet werden kann. Bezüglich des Konstrukts intrinsische Valenz (partielles η2 = .09) kann 9 % der Varianz durch den Faktor Zeit erklärt und die Effektstärke als mittel eingeschätzt werden. Der Effekt bezüglich des Konstrukts akademisches Selbstkonzept (partielles η2 = .07) ist als mittel zu bewerten (vgl. Cohen, 1988).

In der Abbildung 6.29 ist die Entwicklung der oben genannten Konstrukte der SchülerInnen der Entwicklungsstudie graphisch dargestellt.

Abbildung 6.29
figure 29

Entwicklung von Selbstwirksamkeit, akademisches Selbstkonzept, intrinsische Valenz, ganzheitliche Valenz und extrinsische Valenz in der EG

Die Selbstwirksamkeit (t1–2, p = .025; t1–3, p < .001) stieg signifikant über die drei Messzeitpunkte, das akademische Selbstkonzept (t1–3, p = .025) und die intrinsische Valenz (t1–3; p = .006) wiesen einen signifikanten Anstieg vom ersten im Vergleich zum dritten Messzeitpunkt auf, wobei hinsichtlich der ganzheitlichen (p = .014) und extrinsischen Valenz (p = .025) eine Steigerung zwischen t1 und t2 ermittelt wurde.

F2.1 Vergleich von Entwicklungs- und Kontrollgruppe: Appraisals

Im Vergleich von der Entwicklungs- (EG) mit der Kontrollgruppe (KG) zeigte sich durch Varianzanalysen ein statistisch signifikanter Interaktionseffekt des Zwischensubjektfaktor Untersuchungsgruppe mit der Zeit hinsichtlich der Selbstwirksamkeit (F(1,141) = 21.51, p < .001, partielles η2 = .13) und des akademischen Selbstkonzepts (F(1,140) = 21.21, p < .001, partielles η2 = .12) mit jeweils mittleren Effektstärken. In Bezug auf den Haupteffekt des Zwischensubjektfaktors wurden jeweils signifikante Unterschiede bei t3 (Selbstwirksamkeit mit .4, p = .009; akademisches Selbstkonzept mit .38, p = .015) festgestellt. Sowohl die Selbstwirksamkeit als auch das akademischen Selbstkonzept stiegen bei der Entwicklungsgruppe (EG) im Vergleich zur Kontrollgruppe (KG) über den Messzeitraum signifikant (vgl. Abb. 6.30).

Abbildung 6.30
figure 30

Entwicklung von Selbstwirksamkeit und akademisches Selbstkonzept. Vergleich EG und KG

Hinsichtlich der ganzheitlichen Valenz (vgl. Abb. 6.31, links) konnte kein signifikanter Interaktionseffekt von Inner- und Zwischensubjektfaktor zwischen Entwicklungs- (EG) und Kontrollgruppe (KG) festgestellt werden (F(1,140) = 4.55, p = .035). Es zeigte sich über den Messzeitraum demnach kein statistischer Unterschied in der ganzheitlichen Valenz bei der Entwicklungsgruppe (EG) im Vergleich zur Kontrollgruppe (KG).

Abbildung 6.31
figure 31

Entwicklung von ganzheitlicher Valenz und extrinsische Valenz. Vergleich EG und KG

Auch in Bezug auf die extrinsische Valenz konnte kein signifikanter Unterschied zwischen Entwicklungs- (EG) und Kontrollgruppe (KG) mittels Varianzanalyse und Zwischensubjektfaktor Untersuchungsgruppe (F(1,140) = 0.01, p = .931) ermittelt werden. Die Gruppen unterschieden sich über den Messzeitraum hinsichtlich der Entwicklung der extrinsischen Valenz demnach nicht (vgl. Abb. 6.31, rechts).

Die Ergebnisse der Varianzanalyse mit Zwischensubjektfaktor Untersuchungsgruppe können bezüglich des Konstrukts intrinsische Valenz aufgrund einer Verletzung der Voraussetzung Homogenität der Fehlervarianzen (vgl. Abschnitt 6.5) nicht interpretiert werden. Es konnte jedoch ein Haupteffekt des Zwischensubjektfaktor bei t3 (.049, p < .001) durch den paarweisen Vergleich nachgewiesen werden. Die Gruppen unterschieden sich hinsichtlich der intrinsischen Valenz bei t3 statistisch signifikant voneinander. Die Entwicklungsgruppe (EG) wies bei t3 eine höhere intrinsische Valenz als die Kontrollgruppe (KG) auf (vgl. Abb. 6.32).

Abbildung 6.32
figure 32

Entwicklung von intrinsischer Valenz. Vergleich EG und KG

F2.1 Feldgruppe: Appraisals

In Tabelle 6.19 werden die Mittelwerte sowie Standardabweichungen der Skalen in Bezug auf subjektive Bewertungsprozesse der SchülerInnen, die an der Feldstudie teilgenommen haben, an den drei Messzeitpunkten dargestellt.

Tabelle 6.19 Deskriptive Statistik der FG zu Selbstwirksamkeit, akademisches Selbstkonzept, intrinsische Valenz. ganzheitliche Valenz und extrinsische Valenz

In Abbildung 6.33 wird die Verteilung der Werte hinsichtlich der Appraisal Skalen an den drei Messzeitpunkten gezeigt.

Abbildung 6.33
figure 33

Verteilung der Werte zu Selbstwirksamkeit, akademisches Selbstkonzept, intrinsische Valenz, ganzheitliche Valenz und extrinsische Valenz in der FG

Die Entwicklung der genannten Variablen über die drei Messzeitpunkte wurde mithilfe einfaktorieller Varianzanalysen mit Messwiederholung untersucht. Dabei konnten statistisch signifikante Haupteffekte der Zeit sowohl bei den Skalen Selbstwirksamkeit und akademisches Selbstkonzept als auch bei den Skalen ganzheitliche und extrinsische Valenz festgestellt werden. Hinsichtlich der intrinsischen Valenz konnte kein signifikanter Haupteffekt der Zeit bei den SchülerInnen der Feldstudie nachgewiesen werden (vgl. Tab. 6.20).

Tabelle 6.20 Ergebnisse der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu Selbstwirksamkeit, akademisches Selbstkonzept, intrinsische Valenz. ganzheitliche Valenz und extrinsische Valenz in der FG

Der größte Effekt wurde dabei hinsichtlich Selbstwirksamkeit (partielles η2 = .12) nachgewiesen. Es können 12 % der Varianz der Selbstwirksamkeit durch den Faktor Zeit erklärt und die Effektstärke als mittel bewertet werden. Hinsichtlich des Konstrukts extrinsische Valenz (partielles η2 = .09) kann 9 % der Varianz durch den Faktor Zeit, bei einer mittleren Effektstärke, erklärt werden. Die Effektstärke des Konstrukts akademisches Selbstkonzept (partielles η2 = .07) ist als mittel und der ganzheitlichen Valenz (partielles η2 = .05) als klein zu bewerten.

In der Abbildung 6.34 ist die Entwicklung der Werte hinsichtlich der genannten Skalen der SchülerInnen der Feldstudie graphisch dargestellt.

Abbildung 6.34
figure 34

Entwicklung von Selbstwirksamkeit, akademisches Selbstkonzept, intrinsische Valenz, ganzheitliche Valenz und extrinsische Valenz in der FG

Mithilfe des paarweisen Vergleichs können die Änderungen zwischen den einzelnen Messzeitpunkten untersucht werden (vgl. Tab. 6.20). Die Selbstwirksamkeit stieg signifikant zwischen den Messzeitpunkten t1 und t2 (.19, p < .001) sowie t1 und t3 (.23, p = .002), ebenso wie das akademische Selbstkonzept (t1–2, .1, p  = .029; t1–3, .15, p = .007). Die ganzheitliche Valenz (t1–3, .2, p = .029) wies einen signifikanten Anstieg vom ersten im Vergleich zum dritten Messzeitpunkt auf. Der paarweise Vergleich mit Bonferroni-Korrektur hinsichtlich der extrinsischen Valenz zeigte eine signifikante Steigerung zwischen t1 und t2 (.27, p < .001) allerdings auch einen Abfall zwischen t2 und t3 (.25, p = .002). In Bezug auf die intrinsische Valenz der SchülerInnen der Feldstudie wurde keine signifikanten Änderungen zwischen den Messzeitpunkten ermittelt.

F2.1 Vergleich von Feld- und Kontrollgruppe: Appraisals

Um die langfristigen Effekte des Projekts in der Feldgruppe (FG) mit der Kontrollgruppe (KG) zu vergleichen wurden Varianzanalysen mit Zwischensubjektfaktor Untersuchungsgruppe durchgeführt. Dabei wurde ein statistisch signifikanter Interaktionseffekt zwischen den Untersuchungsgruppen und der Zeit hinsichtlich der Selbstwirksamkeit (F(1,166) = 16.61, p < .001, partielles η2 = .09) und des akademischen Selbstkonzepts (F(1,165) = 24.00, p < .001, partielles η2 = .13) mit jeweils mittleren Effektstärken (vgl. Cohen, 1988) festgestellt. Hinsichtlich des Haupteffekts des Zwischensubjektfaktors zeigten sich jeweils signifikante Unterschiede bei t3 (Selbstwirksamkeit mit .49, p < .001; akademisches Selbstkonzept mit .34, p = .010). Sowohl die Selbstwirksamkeit (vgl. Abb. 6.35, links) als auch das akademischen Selbstkonzept (vgl. Abb. 6.35, rechts) stiegen bei der Feldgruppe (FG) im Vergleich zur Kontrollgruppe (KG).

Abbildung 6.35
figure 35

Entwicklung von Selbstwirksamkeit und akademisches Selbstkonzept. Vergleich FG und KG

In Bezug auf die ganzheitliche Valenz konnte hingegen kein statistisch signifikanter Interaktionseffekt von Inner- und Zwischensubjektfaktor zwischen Feld- (FG) und Kontrollgruppe (KG) festgestellt werden (F(1,165) = 4.94, p = .028). Am Messzeitpunkt t3 kann jedoch ein signifikanter Unterschied in Bezug auf den Haupteffekt des Zwischensubjektfaktors ermittelt werden (.34, p = .047). Die Werte bezüglich des Konstrukts ganzheitliche Valenz (vgl. Abb. 6.36, links) lagen bei der Feldgruppe (FG) an diesem Messzeitpunkt somit statistisch signifikant über denen der Kontrollgruppe (KG).

Abbildung 6.36
figure 36

Entwicklung von ganzheitlicher Valenz und extrinsischer Valenz. Vergleich FG und KG

Hinsichtlich der extrinsische Valenz konnte kein statistisch signifikanter Unterschied zwischen Feld- (EG) und Kontrollgruppe mittels Varianzanalyse mit Zwischensubjektfaktor Untersuchungsgruppe (F(1,165) = 0.00, p = .997) nachgewiesen werden (vgl. Abb. 6.36, rechts).

Aufgrund einer Verletzung der Voraussetzung Homogenität der Kovarianzmatrizen (vgl. Kapitel 6.5) kann das Ergebnis der Varianzanalyse bezüglich des Konstrukts intrinsische Valenz nicht interpretiert werden. Es konnte jedoch ein statistisch signifikanter Haupteffekt des Zwischensubjektfaktor bei t3 (.32, p = .037) durch den paarweisen Vergleich nachgewiesen werden. Die Feldgruppe (FG) wies bei t3 eine höhere intrinsische Valenz als die Kontrollgruppe (KG) auf (vgl. Abb. 6.37).

Abbildung 6.37
figure 37

Entwicklung von intrinsischer Valenz. Vergleich FG und KG

F2.1 Vergleich von Entwicklungs- und Feldgruppe: Appraisals

Im Vergleich der Entwicklungsgruppe (EG) mit der Feldgruppe (FG) zeigten sich durch die Huynh-Feldt korrigierte Varianzanalysen mit Messwiederholung und Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe keine statistisch signifikanten Interaktionseffekte hinsichtlich der Selbstwirksamkeit (F(1.91,293.35) = .70, p = .49) der ganzheitlichen (F(1.89,290.73) = .38, p = .67) sowie extrinsischen Valenz (F(1.95,300.25) = .02, p = .98). In Bezug auf diese Konstrukte (vgl. Abb. 6.38, 6.39) bestand über den Erhebungszeitraum kein Unterschied zwischen Entwicklungs- (EG) und Feldgruppe (FG).

Abbildung 6.38
figure 38

Entwicklung von Selbstwirksamkeit und ganzheitliche Valenz. Vergleich EG und FG

Abbildung 6.39
figure 39

Entwicklung von extrinsischer Valenz. Vergleich EG und FG

Die Ergebnisse der Varianzanalysen mit Messwiederholung können im Hinblick auf die Konstrukte akademisches Selbstkonzept und intrinsische Valenz aufgrund einer Verletzung der Voraussetzung Homogenität der Kovarianzmatrizen sowie bei intrinsische Valenz auch zusätzlich wegen Ungleichheit der Fehlervarianzen (vgl. Kapitel 6.5) nicht interpretiert werden. Der paarweise Vergleich zeigte allerdings keinen Haupteffekt des Zwischensubjektfaktor. Hinsichtlich dieser Konstrukte konnte an den Messzeitpunkten kein Unterschied zwischen Entwicklungs- (EG) und Feldgruppe (FG) ermittelt werden (vgl. Abb. 6.40).

Abbildung 6.40
figure 40

Entwicklung von akademisches Selbstkonzept und intrinsische Valenz. Vergleich EG und FG

6.7.2 Ergebnisse zu F2 – Lernförderliche Lern- und Leistungsemotionen

F2.2 Entwicklungsgruppe: Lernförderliche Lern- und Leistungsemotionen

Die Mittelwerte sowie Standardabweichungen der lernförderlichen Emotionen Freude und Stolz der SchülerInnen der Entwicklungsstudie an den drei Messzeitpunkten werden in Tabelle 6.21 dargestellt.

Tabelle 6.21 Deskriptive Statistik der EG zu Freude und Stolz

Die Verteilung der Werte in der Entwicklungsstudie an den drei Messzeitpunkten zu den Skalen Freude und Stolz wird mithilfe von Box-Plots in Abbildung 6.41 gezeigt.

Abbildung 6.41
figure 41

Verteilung der Werte zu Freude und Stolz in der EG

Mithilfe einfaktorieller Varianzanalysen mit Messwiederholung und jeweiliger Huynh-Feldt Korrektur wurden die Entwicklungen der Konstrukte über die drei Messzeitpunkte der Entwicklungsstudie untersucht. Dabei konnten statistisch signifikante Haupteffekte der Zeit hinsichtlich des Konstruktes Stolz festgestellt werden. In Bezug auf das Konstrukt Freude konnte über den Messzeitraum kein statistisch signifikanter Effekt nachgewiesen werden (vgl. Tab. 6.22).

Tabelle 6.22 Ergebnisse der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu Freude und Stolz in der EG

Bezüglich des Konstrukts Stolz (partielles η2 = .09) kann 9 % der Varianz durch den Faktor Zeit erklärt werden, wobei eine mittlere Effektstärke ermittelt wurde.

In der Abbildung 6.42 ist die Entwicklung der Werte hinsichtlich der genannten Variablen der Entwicklungsstudie graphisch dargestellt.

Abbildung 6.42
figure 42

Entwicklung von Freude und Stolz in der EG

Die Änderungen zwischen den Messzeitpunkten wurden mithilfe paarweiser Vergleiche untersucht (vgl. Tab. 6.22). Die Freude stieg statistisch signifikant zwischen den Messzeitpunkten t1 und t2 (.15, p = .047), ebenso wie bei Stolz (.31, p < .001).

F2.2 Vergleich von Entwicklungs- und Kontrollgruppe: Lernförderliche Lern- und Leistungsemotionen

Es wurden Varianzanalysen mit Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe durchgeführt, um die langfristigen Effekte des Projekts in der Entwicklungsgruppe (EG) mit der Kontrollgruppe (KG) zu vergleichen. Dabei wurde ein statistisch signifikanter Interaktionseffekt hinsichtlich Freude (F(1,141) = 12.18, p < .001, partielles η2 = .08) mit mittlerer Effektenstärke nachgewiesen. In Bezug auf das Konstrukt Stolz (F(1,137) = 5.61, p = .019) konnte kein signifikanter Interaktionseffekt ermittelt werden. Im Hinblick auf den Haupteffekt des Zwischensubjektfaktors zeigten sich jeweils signifikante Unterschiede bei t1 (Freude mit .36, p = .029; Stolz mit .35 p  = .043). Freude und Stolz steigerte sich bei der Entwicklungsgruppe (EG) im Vergleich zur Kontrollgruppe (KG), sodass an t3 kein Unterschied zwischen den Gruppen bestand (vgl. Abb. 6.43).

Abbildung 6.43
figure 43

Entwicklung von Freude und Stolz. Vergleich EG und KG

F2.2 Feldgruppe: Lernförderliche Lern- und Leistungsemotionen

In Tabelle 6.23 werden die Mittelwerte sowie Standardabweichungen zu den Variablen Freude und Stolz der SchülerInnen, die an der Feldstudie teilgenommen haben, an den drei Messzeitpunkten dargestellt.

Tabelle 6.23 Deskriptive Statistik der FG zu Freude und Stolz

Die Verteilung der Werte an den drei Messzeitpunkten der Feldstudie zu den genannten Variablen wird mithilfe von Box-Plots in Abbildung 6.44 gezeigt.

Abbildung 6.44
figure 44

Verteilung der Werte zu Freude und Stolz in der FG

Die Entwicklung der lernförderlichen Emotionen Freude und Stolz über die drei Messzeitpunkte in der Feldstudie wurde mithilfe einfaktorieller Varianzanalyse mit Messwiederholung untersucht (vgl. Tab. 6.24). Dabei konnten statistisch signifikante Haupteffekte der Zeit bei beiden Konstrukten ermittelt werden.

Tabelle 6.24 Ergebnisse der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu Freude und Stolz in der FG

Es kann 5 % der Varianz der Freude durch den Faktor Zeit erklärt werden (partielles η2 = .05). Die Effektstärke ist in der Feldstudie als klein zu bewerten. Hinsichtlich des Konstrukts Stolz (partielles η2 = .06) kann 6 % der Varianz durch den Faktor Zeit erklärt werden. Die Effektstärke ist als mittel einzuschätzen.

In der Abbildung 6.45 ist die Entwicklung der Werte hinsichtlich der genannten Skalen der SchülerInnen der Feldstudie graphisch dargestellt.

Abbildung 6.45
figure 45

Entwicklung von Freude und Stolz in der FG

Mithilfe paarweiser Vergleiche konnten die Änderungen zwischen den Messzeitpunkten untersucht werden (vgl. Tab. 6.24). Freude wies einen statistisch signifikanten Anstieg vom ersten im Vergleich zum dritten Messzeitpunkt auf (.18, p = .010). Stolz stieg signifikant zwischen den Messzeitpunkten t1 und t2 (.18, p = .023) sowie t1 und t3 (.25, p = .017).

F2.2 Vergleich von Feld- und Kontrollgruppe: Lernförderliche Lern- und Leistungsemotionen

Um die langfristigen Effekte des Projekts in der Feldgruppe (FG) mit der Kontrollgruppe (KG) zu vergleichen, wurden Varianzanalysen und Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe durchgeführt. Dabei wurde ein statistisch signifikanter Interaktionseffekt zwischen der Zeit und den Untersuchungsgruppen hinsichtlich Freude (F(1,166) = 13.27, p < .001, partielles η2 = .07) und Stolz (F(1,162) = 5.93, p = .016, partielles η2 = .04) festgestellt. Die Effekte sind bezüglich Freude als mittel und hinsichtlich Stolz als klein einzuschätzen. Im Hinblick auf den Haupteffekt des Zwischensubjektfaktors zeigte sich bezüglich Freude ein statistisch signifikanter Unterschied zwischen den Untersuchungsgruppen bei t3 (.42, p = .005). Sowohl hinsichtlich Freude (vgl. Abb. 6.46, links) als auch Stolz (vgl. Abb. 6.46, rechts) zeigte sich bei der Feldgruppe (FG) im Vergleich zur Kontrollgruppe (KG) ein Anstieg.

Abbildung 6.46
figure 46

Entwicklung von Freude und Stolz. Vergleich FG und KG

F2.2 Vergleich von Entwicklungs- und Feldgruppe: Lernförderliche Lern- und Leistungsemotionen

Um die Entwicklung der Konstrukte Freude und Stolz der Entwicklungsgruppe (EG) mit der Feldgruppe (FG) zu vergleichen, wurden jeweils Huynh-Feldt-korrigierte Varianzanalysen mit Messwiederholung und Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe genutzt. Dabei zeigten sich keine statistisch signifikanten Interaktionseffekte bezüglich Freude (F(1.95,300.61) = .22, p = .80) und Stolz (F(1.86,285.80) = .83, p = .43). Es bestand demnach statistisch kein signifikanter Unterschied in der Entwicklung von Freude und Stolz in den Untersuchungsgruppen über die Messzeitpunkte (vgl. Abb. 6.47).

Abbildung 6.47
figure 47

Entwicklung von Freude und Stolz. Vergleich EG und FG

6.7.3 Ergebnisse zu F2 – Lernmindernde Lern- und Leistungsemotionen

F2.3 Entwicklungsgruppe: Lernmindernde Lern- und Leistungsemotionen

In Tabelle 6.25 werden die Mittelwerte sowie Standardabweichungen zu den Variablen Angst, Ärger, Langeweile und Scham der SchülerInnen, die an der Entwicklungsstudie teilgenommen haben, an den drei Messzeitpunkten dargestellt.

Tabelle 6.25 Deskriptive Statistik der EG zu Angst, Ärger, Langeweile und Scham

Die Verteilung der Werte in der Entwicklungsstudie zu den dargestellten Skalen an den drei Messzeitpunkten wird mithilfe von Box-Plots in Abbildung 6.48 gezeigt.

Abbildung 6.48
figure 48

Verteilung der Werte zu Angst, Ärger, Langeweile und Scham in der EG

Zur Untersuchung der Entwicklung der Variablen über die drei Messzeitpunkte wurden einfaktorielle Varianzanalysen mit Messwiederholung durchgeführt. Dabei konnten statistisch signifikante Haupteffekte der Zeit bezüglich der negativen bzw. lern- und leistungsmindernden Emotionen Angst, Ärger und Langeweile ermittelt werden (vgl. Tab. 6.26).

Tabelle 6.26 Ergebnisse der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu Angst, Ärger, Langeweile und Scham in der EG

Die größten Effekte wurden dabei hinsichtlich der Konstrukte Angst (partielles η2 = .11) und Ärger (partielles η2 = .11) nachgewiesen. Es können jeweils 11 % der Varianzen durch den Faktor Zeit erklärt werden. Die Effektstärken sind dabei jeweils als mittel einzuschätzen. In Bezug auf die Variable Langeweile (partielles η2 = .10) kann 10 % der Varianz durch den Faktor Zeit, bei mittlerer Effektstärke (vgl. Cohen, 1988), begründet werden.

In der Abbildung 6.49 ist die Entwicklung der Werte hinsichtlich der Skalen Angst, Ärger, Langeweile und Scham der SchülerInnen der Entwicklungsstudie graphisch dargestellt.

Abbildung 6.49
figure 49

Entwicklung von Angst, Ärger, Langeweile und Scham in der EG

Mithilfe des paarweisen Vergleichs können die Änderungen zwischen den Messzeitpunkten einer Variablen untersucht werden (vgl. Tab. 6.26). Angst sank in der Entwicklungsgruppe signifikant zwischen den Messzeitpunkten t1 und t2 (.25, p = .003) sowie t1 und t3 (.26, p = .004). Ärger (.29, p = .002) wies einen statistisch signifikanten Abfall vom ersten auf den dritten Messzeitpunkt auf, ebenso wie Langeweile (.03, p = .003). Der paarweise Vergleich hinsichtlich des Konstruktes Scham zeigte einen signifikanten Abfall zwischen t1 und t2 (.26, p = .003).

F2.3 Vergleich von Entwicklungs- und Kontrollgruppe: Lernmindernde Lern- und Leistungsemotionen

Um langfristige Effekte des Projekts auf die Entwicklungsgruppe (EG) mit der Kontrollgruppe (KG) zu vergleichen wurden Varianzanalysen mit Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe durchgeführt. Dabei wurden statistisch signifikante Interaktionseffekte zwischen den Untersuchungsgruppen und der Zeit hinsichtlich Angst (F(1,140) = 14.91, p < .001, partielles η2 = .10) und Langeweile (F(1,140) = 20.13, p < .001, partielles η2 = .13) mit jeweils mittleren Effekten nachgewiesen. Sowohl Angst (vgl. Abb. 6.50, links) als auch Langeweile (vgl. Abb. 6.50, rechts) sanken bei der Entwicklungsgruppe (FG) im Vergleich zur Kontrollgruppe (KG). In Bezug auf Haupteffekte des Zwischensubjektfaktors zeigten sich jeweils keine signifikanten Unterschiede an den Messzeitpunkten t1 und t3.

Abbildung 6.50
figure 50

Entwicklung von Angst und Langeweile. Vergleich EG und KG

Die Ergebnisse der Varianzanalyse hinsichtlich der Konstrukte Ärger und Scham (vgl. Abb. 6.51) können aufgrund einer Verletzung der Voraussetzung Homogenität der Kovarianzmatrizen sowie bei intrinsische Valenz auch zusätzlich Ungleichheit der Fehlervarianzen (vgl. Kapitel 6.5) nicht interpretiert werden. Der paarweise Vergleich zeigte allerdings jeweils einen Haupteffekt des Zwischensubjektfaktors. In Bezug auf das Konstrukt Ärger wurde ein statistisch signifikanter Unterschied zwischen der Entwicklungs- (EG) und Kontrollgruppe (KG) an t3 (0.53, p < .001) nachgewiesen. Die Entwicklungsgruppe (EG) wies an diesem Messzeitpunkt einen signifikant geringeren Mittelwert als die Kontrollgruppe (KG) auf, wobei an t1 kein statistisch signifikanter Unterschied zwischen den Gruppen bestand (vgl. Abb. 6.51, rechts). Hinsichtlich des Konstruktes Scham wurde ein statistisch signifikanter Unterschied zwischen der Entwicklungs- (EG) und Kontrollgruppe (KG) an t1 (0.58, p < .001) ermittelt. Die Entwicklungsgruppe (EG) wies am ersten Messzeitpunkt einen signifikant höheren Mittelwert auf als die Kontrollgruppe (KG). An t3 glichen sich die Mittelwerte zwischen den Gruppen an (vgl. Abb. 6.51, links).

Abbildung 6.51
figure 51

Entwicklung von Scham und Ärger. Vergleich EG und KG

F2.3 Feldgruppe: Lernmindernde Lern- und Leistungsemotionen

Die Mittelwerte sowie Standardabweichungen der lernmindernden Emotionen Angst, Ärger Langeweile und Scham an den drei Messzeitpunkten der Feldstudie werden in Tabelle 6.27 dargestellt.

Tabelle 6.27 Deskriptive Statistik der FG zu Angst, Ärger, Langeweile und Scham

In Abbildung 6.52 wird die Verteilung der Werte hinsichtlich der genannten Variablen zu den lernmindernden Emotionen an den drei Messzeitpunkten präsentiert.

Abbildung 6.52
figure 52

Verteilung der Werte zu Angst, Ärger, Langeweile und Scham in der FG

Zur Untersuchung der Entwicklung der negativen bzw. lern- und leistungsmindernden Emotionen über die drei Messzeitpunkte wurden einfaktorielle Varianzanalysen mit Messwiederholung durchgeführt. Dabei konnten statistisch signifikante Haupteffekte der Zeit bezüglich der Variablen Angst und Langeweile festgestellt werden. Hinsichtlich des Konstrukts Ärger und Scham konnten keine statistisch signifikanten Effekte der Zeit ermittelt werden (vgl. Tab. 6.28).

Tabelle 6.28 Ergebnisse der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu Angst, Ärger, Langeweile und Scham in der FG

Der größte Effekt wurde in Bezug auf das Konstrukt Angst (partielles η2 = .06) ermittelt. Diesbezüglich sind 6 % der Varianz durch den Faktor Zeit zu begründen, wodurch die Effektstärke als mittel einzuschätzen ist. Hinsichtlich des Effekts auf die Variable Langeweile (partielles η2 = .05) lassen sich 5 % der Varianz durch den Innersubjektfaktor Zeit erklärt. Die Effektstärke wird als klein betrachtet.

In der Abbildung 6.53 ist die Entwicklung der genannten Variablen bei den SchülerInnen der Feldstudie graphisch dargestellt.

Abbildung 6.53
figure 53

Entwicklung von Angst, Ärger, Langeweile und Scham in der FG

Mithilfe paarweiser Vergleiche mit Bonferroni-Korrektur können die Änderungen zwischen den Messzeitpunkten einer Variable ermittelt werden (vgl. Tab. 6.28). Langeweile wies in der Feldgruppe einen statistisch signifikanten Abfall vom ersten im Vergleich zum dritten Messzeitpunkt auf (.21, p = .003). Der paarweise Vergleich mit Bonferroni-Korrektur hinsichtlich des Konstruktes Angst zeigte einen signifikanten Anstieg zwischen t2 und t3 (.18, p = .006).

F2.3 Vergleich von Feld- und Kontrollgruppe: Lernmindernde Lern- und Leistungsemotionen

Um die Feldgruppe (FG) mit der Kontrollgruppe (KG) in Bezug auf langfristige Effekte des Projekts auf die lernmindernden Emotionen zu vergleichen wurden Varianzanalysen und Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe durchgeführt. Dabei wurde hinsichtlich Angst (F(1,165) = .27, p = .605) und Scham (F(1,163) = .18, p = .674) kein statistisch signifikanter Interaktionseffekt ermittelt. In der Entwicklung dieser Konstrukte lag demnach kein statistischer Unterschied zwischen Feld- (FG) und Kontrollgruppe (KG) vor (vgl. Abb. 6.54).

Abbildung 6.54
figure 54

Entwicklung von Angst und Scham. Vergleich FG und KG

Aufgrund einer Verletzung der Voraussetzung Homogenität der Kovarianzmatrizen sowie Homogenität der Fehlervarianzen (vgl. Kapitel 6.5) können die Ergebnisse der Varianzanalyse bezüglich der Konstrukte Ärger und Langeweile nicht interpretiert werden. Der paarweise Vergleich zeigte allerdings jeweils einen Haupteffekt des Zwischensubjektfaktors. In Bezug auf die Konstrukte Ärger (0.32, p = .012) und Langeweile (0.32, p = .013) wurde jeweils ein statistisch signifikanter Unterschied zwischen der Entwicklungs- (EG) und Kontrollgruppe (KG) an t3 nachgewiesen (vgl. Abb. 6.55).

Abbildung 6.55
figure 55

Entwicklung von Ärger und Langeweile. Vergleich FG und KG

F2.3 Vergleich von Entwicklungs- und Feldgruppe: Lernmindernde Lern- und Leistungsemotionen

Um die Entwicklung lernmindernder Emotionen der Entwicklungsgruppe (EG) mit der Feldgruppe (FG) zu vergleichen, wurden Varianzanalysen mit Messwiederholung und Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe durchgeführt. Dabei zeigte sich kein statistisch signifikanter Interaktionseffekt bezüglich Ärger (F(2,308) = 4.15, p = .017). Es bestand demnach kein Unterschied zwischen der Entwicklungsgruppe (EG) und der Feldgruppe (FG) hinsichtlich der Variable Ärger. In Bezug auf das Konstrukt Langeweile (F(2,308) = .48, p = .620) konnte ebenso kein statistisch signifikanter Interaktionseffekt zwischen der Untersuchungsgruppen und der Zeit nachgewiesen werden. In der Entwicklung dieser Variable lag über den Erhebungszeitraum demnach kein statistischer Unterschied zwischen Entwicklungs- (EG) und Feldgruppe (FG) vor (vgl. Abb. 6.56).

Abbildung 6.56
figure 56

Entwicklung von Ärger und Langeweile. Vergleich EG und FG

Die Ergebnisse der Varianzanalysen hinsichtlich der Konstrukte Angst und Scham können aufgrund einer Verletzung der Voraussetzung Homogenität der Kovarianzmatrizen sowie Homogenität der Fehlervarianzen (vgl. Kapitel 6.5) nicht interpretiert werden. Die paarweisen Vergleiche zeigten allerdings jeweils Haupteffekte des Zwischensubjektfaktors. Bezüglich der Variablen Angst (0.39, p = .003) und Scham (0.47, p = .001) wurde jeweils ein statistisch signifikanter Unterschied zwischen der Entwicklungs- (EG) und Feldgruppe (FG) an t1 festgestellt. Die Werte glichen sich im weiteren Verlauf an (vgl. Abb. 6.57).

Abbildung 6.57
figure 57

Entwicklung von Angst und Scham. Vergleich EG und FG

6.7.4 Ergebnisse zu F2 – Interesse

F2.4 Entwicklungsgruppe: Interesse

In Tabelle 6.29 werden die Mittelwerte sowie Standardabweichungen der Variablen Sachinteresse und Fachinteresse der SchülerInnen, die an der Entwicklungsstudie teilgenommen haben, an den drei Messzeitpunkten dargestellt.

Tabelle 6.29 Deskriptive Statistik der EG zu Sach- und Fachinteresse

In Abbildung 6.58 wird die Verteilung der Werte hinsichtlich der Skalen Sach- und Fachinteresse an den drei Messzeitpunkten gezeigt.

Abbildung 6.58
figure 58

Verteilung der Werte zu Sach- und Fachinteresse in der EG

Die Entwicklung des Sach- und Fachinteresse über die drei Messzeitpunkte wurden mithilfe einfaktorieller Varianzanalysen mit Messwiederholung untersucht. Dabei wurde ein statistisch signifikanter Haupteffekt der Zeit bezüglich des Konstrukts Sachinteresse ermittelt (vgl. Tab. 6.30).

Tabelle 6.30 Ergebnisse der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu Sach- und Fachinteresse in der EG

Demnach können 9 % der Varianzen (partielles η2 = .09) durch den Faktor Zeit erklärt werden, wobei die Effektstärke als mittel einzuschätzen ist. Hinsichtlich des Konstrukts Fachinteresse konnte kein statistisch signifikanter Haupteffekt der Zeit nachgewiesen werden.

In der Abbildung 6.59 ist die Entwicklung der Mittelwerte in Bezug auf die genannten Variablen der SchülerInnen der Entwicklungsstudie graphisch dargestellt.

Abbildung 6.59
figure 59

Entwicklung von Sach- und Fachinteresse in der EG

Die Änderungen zwischen den Messzeitpunkten können mithilfe paarweiser Vergleiche untersucht werden (vgl. Tab. 6.30). Fachinteresse stieg signifikant zwischen den Messzeitpunkten t1 und t2 (.15, p = .033). Das Sachinteresse (.22, p = .007) wies einen statistisch signifikanten Anstieg vom ersten im Vergleich zum dritten Messzeitpunkt auf.

F2.4 Vergleich Entwicklungs- und Kontrollgruppe: Interesse

Der langfristige Vergleich der Effekte des Projekts bezüglich der Entwicklungsgruppe (EG) und Kontrollgruppe (KG) wurde mithilfe von Varianzanalysen und Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe durchgeführt. Dabei wurde ein statistisch signifikanter Interaktionseffekt hinsichtlich des Sachinteresses (F(1,141) = 6.99, p = .009, partielles η2 = .05) nachgewiesen. Es bestand demnach ein statistischer Unterschied in der langfristigen Entwicklung des Sachinteresses in der Entwicklung- (EG) im Vergleich zur Kontrollgruppe (KG). Der Effekt ist allerdings als klein einzuschätzen. Hinsichtlich der Variable Fachinteresse (F(1,141) = 1.44, p = .232) wurde kein statistisch signifikanter Interaktionseffekt nachgewiesen. In der Entwicklung des Fachinteresses lag demnach kein statistischer Unterschied zwischen Entwicklungs- (EG) und Kontrollgruppe (KG) vor (vgl. Abb. 6.60).

Abbildung 6.60
figure 60

Entwicklung von Sachinteresse und Fachinteresse. Vergleich EG und KG

F2.4 Feldgruppe: Interesse

Die Mittelwerte sowie Standardabweichungen hinsichtlich des Sach- und Fachinteresses an den drei Messzeitpunkten der Feldstudie werden in Tabelle 6.31 dargestellt.

Tabelle 6.31 Deskriptive Statistik der FG zu Sach- und Fachinteresse

Die Verteilung der Werte bezüglich der genannten Skalen an den drei Messzeitpunkten der Feldstudie wird mithilfe von Box-Plots in Abbildung 6.61 gezeigt.

Abbildung 6.61
figure 61

Verteilung der Werte zu Sach- und Fachinteresse in der FG

Mittels einfaktorieller Varianzanalysen mit Messwiederholung wurden die Entwicklung des Sach- und Fachinteresses bei den SchülerInnen der Feldstudie über die drei Messzeitpunkte untersucht. Dabei konnte ein statistisch signifikanter Haupteffekt der Zeit hinsichtlich der Variable Fachinteresse nachgewiesen werden. Hinsichtlich des Sachinteresses konnte kein statistisch signifikanter Effekt festgestellt werden (vgl. Tab. 6.32).

Tabelle 6.32 Ergebnisse der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu Sach- und Fachinteresse in der FG

Das Fachinteresse stieg demnach über die drei Messzeitpunkte statistisch signifikant. Es kann 5 % der Varianz des Fachinteresses durch den Faktor Zeit erklärt werden (partielles η2 = .05). Diesbezüglich ist die Effektstärke in der Feldstudie als klein zu bewerten.

In der Abbildung 6.62 ist die Entwicklung der Mittelwerte hinsichtlich der genannten Skalen der SchülerInnen der Feldstudie graphisch dargestellt.

Abbildung 6.62
figure 62

Entwicklung von Sach- und Fachinteresse in der FG

Der paarweise Vergleich (vgl. Tab. 6.32) bezüglich des Konstruktes Fachinteresse zeigte einen signifikanten Anstieg zwischen t1 und t2 (.14, p = .046) sowie an t3 im Vergleich zu t1 (.18, p = .021).

F2.4 Vergleich von Feld- und Kontrollgruppe: Interesse

Es wurden Varianzanalysen mit Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe durchgeführt, um die langfristigen Effekte des Projekts in der Feldgruppe (FG) mit der Kontrollgruppe (KG) zu vergleichen. Dabei wurde ein statistisch signifikanter Interaktionseffekt hinsichtlich des Fachinteresses (F(1,166) = 11.55, p < .001, partielles η2 = .07) mit mittlerer Effektstärke nachgewiesen. Bezüglich des Haupteffekts des Zwischensubjektfaktors zeigte sich ein signifikanter Unterschied bei t3 (.43, p = .002). Das Fachinteresse stieg in der Feldgruppe (FG) im Vergleich zur Kontrollgruppe (KG) über den Messzeitraum (vgl. Abb. 6.63, rechts). Hinsichtlich des Sachinteresses wurde kein statistisch signifikanter Interaktionseffekt (F(1,166) = 3.74, p = .055) ermittelt. Die Feld- (FG) und die Kontrollgruppe (KG) wiesen somit statistisch keinen Unterschied in der Entwicklung des Sachinteresses über den Erhebungszeitraum auf (vgl. Abb. 6.63, links).

Abbildung 6.63
figure 63

Entwicklung von Sachinteresse und Fachinteresse. Vergleich FG und KG

F2.4 Vergleich von Entwicklungs- und Feldgruppe: Interesse

Im Vergleich der Entwicklungsgruppe (EG) mit der Feldgruppe (FG) zeigte sich durch Varianzanalysen mit Messwiederholung mit Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe kein statistisch signifikanten Interaktionseffekt hinsichtlich des Fachinteresses (F(2,308) = 3.29, p = .039, partielles η2 = .02) über den Erhebungszeitraum. Im Hinblick auf den Haupteffekt des Zwischensubjektfaktors zeigten sich jedoch signifikante Unterschiede bei t1 (.26, p = .046) und t3 (.46, p = .001). Es bestanden demnach Unterschiede der Untersuchungsgruppen bezüglich des Fachinteresses an diesen Messzeitpunkten (vgl. Abb. 6.64, rechts). Das Fachinteresse in der Feldgruppe (FG) war an diesen Messzeitpunkten stärker ausgeprägt als bei der Entwicklungsgruppe (EG). In Bezug auf das Sachinteresse wurde kein statistisch signifikanter Interaktionseffekt (Huynh-Feldt F(1.82,280.27) = 1.38, p = .253) ermittelt. Die Gruppen wiesen demnach statistisch keine Unterschiede in der Entwicklung des Sachinteresses auf (vgl. Abb. 6.64, links).

Abbildung 6.64
figure 64

Entwicklung von Sachinteresse und Fachinteresse. Vergleich EG und FG

6.7.5 Ergebnisse zu F2 – Motivation

F2.5 Entwicklungsgruppe: Motivation

In Tabelle 6.33 werden die Mittelwerte sowie Standardabweichungen zu den Variablen intrinsische Motivation und Kompetenzmotivation an den drei Messzeitpunkten der Entwicklungsstudie (vgl. Kapitel 6.3) dargestellt.

Tabelle 6.33 Deskriptive Statistik der EG zu intrinsischer Motivation und Kompetenzmotivation

Die Verteilung der Werte zu den dargestellten Skalen an den drei Messzeitpunkten wird mithilfe von Box-Plots in Abbildung 6.65 gezeigt.

Abbildung 6.65
figure 65

Verteilung der Werte zu intrinsischer Motivation und Kompetenzmotivation in der EG

Die Untersuchung der Entwicklung der intrinsischen Motivation sowie Kompetenzmotivation wurde mithilfe von Varianzanalysen mit Messwiederholung und Huynh-Feldt Korrektur über die drei Messzeitpunkte durchgeführt. Dabei konnte kein statistisch signifikanter Haupteffekt der Zeit bezüglich intrinsischer Motivation bei der Entwicklungsgruppe (EG) nachgewiesen werden (vgl. Tab. 6.34).

Tabelle 6.34 Ergebnisse der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu intrinsischer Motivation und Kompetenzmotivation in der EG

Auch hinsichtlich der Kompetenzmotivation konnte kein signifikanter Haupteffekt der Zeit ermittelt werden. Der paarweise Vergleich (vgl. Tab. 6.34) zeigte allerdings eine statistisch signifikante Änderung zwischen den Messzeitpunkten t1 und t3 (.23, p = .028) hinsichtlich der intrinsischen Motivation bei den SchülerInnen der Entwicklungsgruppe (EG).

In Abbildung 6.66 wird die Entwicklung dieser Konstrukte dargestellt.

Abbildung 6.66
figure 66

Entwicklung von intrinsischer Motivation und Kompetenzmotivation in der EG

F2.5 Vergleich Entwicklungs- und Kontrollgruppe: Motivation

Um die Entwicklungsgruppe (EG) mit der Kontrollgruppe (KG) in Bezug auf langfristige Effekte des Projekts auf die intrinsische sowie Kompetenzmotivation zu vergleichen wurden Varianzanalysen mit Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe durchgeführt. Dabei wurde hinsichtlich intrinsischer Motivation (F(1,140) = 16.08, p < .001, partielles η2 = .10) ein statistisch signifikanter Interaktionseffekt nachgewiesen. Die intrinsische Motivation stieg über die Zeit bei der Entwicklungsgruppe (EG), während sie bei der Kontrollgruppe (KG) sank (vgl. Abb. 6.67, links). Es kann diesbezüglich eine mittlere Effektstärke nachgewiesen werden. Der paarweise Vergleich mit Bonferroni-Korrektur zeigte einen Haupteffekt des Zwischensubjektfaktors bei t1 (.33, p = .036). Bezüglich der Variable Kompetenzmotivation wurde kein statistisch signifikanter Interaktionseffekt (F(1,138) = 0.48, p = .488) nachgewiesen. Die Entwicklungs- (EG) und die Kontrollgruppe (KG) wiesen somit statistisch keinen Unterschied in der Kompetenzmotivation über die Zeit auf (vgl. Abb. 6.67, rechts).

Abbildung 6.67
figure 67

Entwicklung von intrinsischer Motivation und Kompetenzmotivation. Vergleich EG und KG

F2.5 Feldgruppe: Motivation

Die Mittelwerte sowie Standardabweichungen der intrinsischen Motivation sowie Kompetenzmotivation der ProbandInnen der Feldstudie an den drei Messzeitpunkten werden in Tabelle 6.35 dargestellt.

Tabelle 6.35 Deskriptive Statistik der FG zu intrinsischer Motivation und Kompetenzmotivation

In Abbildung 6.68 wird die Verteilung der Werte hinsichtlich der Skalen an den drei Messzeitpunkten in der Feldstudie gezeigt.

Abbildung 6.68
figure 68

Verteilung der Werte zu intrinsischer Motivation und Kompetenzmotivation in der FG

Mithilfe einfaktorieller Varianzanalysen mit Messwiederholung wurde die Entwicklung der Variablen über die drei Messzeitpunkte der Feldstudie untersucht. Dabei konnten keine statistisch signifikanten Haupteffekte der Zeit sowohl hinsichtlich des Konstruktes intrinsische Motivation als auch Kompetenzmotivation festgestellt werden (vgl. Tab. 6.36).

Tabelle 6.36 Ergebnisse der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu intrinsischer Motivation und Kompetenzmotivation in der FG

In der Feldgruppe (FG) änderte sich die intrinsische Motivation und Kompetenzmotivation demnach nicht über die drei Messzeitpunkte.

Die Entwicklung der Mittelwerte hinsichtlich der genannten Skalen der SchülerInnen der Feldgruppe über die drei Messzeitpunkte ist in der Abbildung 6.69 graphisch dargestellt.

Abbildung 6.69
figure 69

Entwicklung von intrinsischer Motivation und Kompetenzmotivation in der FG

Auch mithilfe des paarweisen Vergleichs konnten keine Unterschiede zwischen den Messzeitpunkten der Variablen ermittelt werden (vgl. Tab. 6.36).

F2.5 Vergleich Feld- und Kontrollgruppe: Motivation

Um Effekte des Projekts auf die Feldgruppe (FG) mit der Kontrollgruppe (KG) zu vergleichen, wurden Varianzanalysen mit Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe durchgeführt. Dabei wurde ein statistisch signifikanter Interaktionseffekt hinsichtlich intrinsischer Motivation (F(1,165) = 08.24, p = .005, partielles η2 = .05) mit kleinem Effekt nachgewiesen. Die intrinsische Motivation der Kontrollgruppe (KG) sank, während die intrinsische Motivation der Feldgruppe (FG) über die Zeit konstant bleibt (vgl. Abb. 6.70, links). In Bezug auf das Konstrukt Kompetenzmotivation wurde kein statistisch signifikanter Interaktionseffekt ermittelt (F(1,163) = .55, p = .460). Es bestand demnach kein statistischer Unterschied der Gruppen bezüglich der Kompetenzmotivation über den Messzeitraum (vgl. Abb. 6.70, rechts).

Abbildung 6.70
figure 70

Entwicklung von intrinsischer Motivation und Kompetenzmotivation. Vergleich FG und KG

F2.5 Vergleich Entwicklungs- und Feldgruppe: Motivation

Um die Entwicklung der Variablen intrinsische Motivation und Kompetenzmotivation der Entwicklungsgruppe (EG) und der Feldgruppe (FG) zu vergleichen, wurden Varianzanalysen mit Messwiederholung mit Innersubjektfaktor Zeit sowie Zwischensubjektfaktor Untersuchungsgruppe durchgeführt. Dabei zeigten sich keine statistisch signifikanten Interaktionseffekte sowohl bezüglich intrinsischer Motivation (Huynh-Feldt F(1.85,284.13) = 1.42, p = .243) als auch Kompetenzmotivation (Huynh-Feldt F(1.86,285.91) = .42, p = .951). Hinsichtlich dieser Konstrukte lag demnach kein statistischer Unterschied zwischen den SchülerInnen der Entwicklungs- (EG) und der Feldgruppe (FG) vor (vgl. Abb. 6.71).

Abbildung 6.71
figure 71

Entwicklung von intrinsischer Motivation und Kompetenzmotivation. Vergleich EG und FG

6.8 Ergebnisse zu Forschungsfrage 3

F3 Entwicklungsgruppe: Testleistung

In Tabelle 6.37 werden die Mittelwerte sowie Standardabweichungen der Testleistung an den drei Messzeitpunkten der SchülerInnen, die an der Entwicklungsstudie teilgenommen haben, dargestellt.

Tabelle 6.37 Deskriptive Statistik der EG zur Testleistung

Die Verteilung der Werte zur Testleistung an den drei Messzeitpunkten wird mithilfe von Box-Plots in Abbildung 6.72 gezeigt.

Abbildung 6.72
figure 72

Verteilung der Werte zur Testleistung in der EG

Zur Untersuchung der Leistungsentwicklung über die drei Messzeitpunkte wurde die einfaktorielle Varianzanalyse mit Messwiederholung angewendet. Dabei konnte ein statistisch signifikanter Haupteffekt der Zeit bezüglich der Testleistung nachgewiesen werden (vgl. Tab. 6.38).

Tabelle 6.38 Ergebnis der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu Testleistung in der EG

Der Effekt auf die Testleistung (partielles η2 = .51) ist als groß einzuschätzen (vgl. Cohen, 1988). Es können 51 % der Varianz durch den Faktor Zeit erklärt werden.

In der Abbildung 6.73 ist die Entwicklung der mittleren Testwerte der SchülerInnen der Entwicklungsstudie graphisch dargestellt.

Abbildung 6.73
figure 73

Entwicklung der Testleistung in der EG

Die Änderungen zwischen den Messzeitpunkten wurden mithilfe des paarweisen Vergleichs untersucht (vgl. Tab. 6.38). Die Testleistung stieg statistisch signifikant zwischen den Messzeitpunkten t1 und t2 (4.22, p < .001), sowie im Vergleich zwischen t1 und t3 (1.53, p < .001) und fiel zwischen t2 und t3 (2.69, p < .001). Die SchülerInnen der Entwicklungsstudie verbesserten sich demnach zwischen t1 und t2 und verzeichneten einen Leistungsabfall zwischen t2 und t3. Insgesamt verbesserten sie sich jedoch über den Messzeitraum (t1–t3).

F3 Vergleich Entwicklungs- und Kontrollgruppe: Testleistung

Die Unterschiede zwischen den Testleistungen der Entwicklungs- (EG) und der Kontrollgruppe (EG) wurden mithilfe des paarweisen Vergleichs untersucht. Hinsichtlich dieses Haupteffekts des Zwischensubjektfaktors zeigte sich ein signifikanter Unterschied bei t3 (2.26, p < .001). Die Testleistung stieg in der Entwicklungsgruppe (EG), während sie in der Kontrollgruppe (KG) über den Messzeitraum sank (vgl. Abb. 6.74).

Abbildung 6.74
figure 74

Entwicklung der Testleistung. Vergleich EG und KG

F3 Feldgruppe: Testleistung

Die Mittelwerte sowie Standardabweichungen der Testleistung an den drei Messzeitpunkten der SchülerInnen der Feldstudie werden in Tabelle 6.39 dargestellt.

Tabelle 6.39 Deskriptive Statistik der FG zur Testleistung

In Abbildung 6.75 wird die Verteilung der Leistungswerte an den drei Messzeitpunkten der Feldstudie gezeigt.

Abbildung 6.75
figure 75

Verteilung der Werte zur Testleistung in der FG

Die Leistungsentwicklung hinsichtlich des Tests über die drei Messzeitpunkte wurden mithilfe einer Varianzanalyse mit Messwiederholung untersucht. Dabei wurde ein statistisch signifikanter Haupteffekt der Zeit bezüglich der Testleistung in der Feldgruppe (FG) festgestellt (vgl. Tab. 6.40).

Tabelle 6.40 Ergebnis der Varianzanalyse mit Messwiederholung und des paarweisen Vergleichs zu Testleistung in der FG

Der Effekt auf die Testleistung (partielles η2 = .14) ist als mittel einzuschätzen. Es können 14 % der Varianz durch den Faktor Zeit erklärt werden.

In der Abbildung 6.76 ist die Entwicklung der Testleistung der SchülerInnen der Feldstudie graphisch dargestellt.

Abbildung 6.76
figure 76

Entwicklung der Testleistung in der FG

Mithilfe des paarweisen Vergleichs wurden die Änderungen zwischen den Messzeitpunkten untersucht (vgl. Tab. 6.40). Die Testleistung stieg statistisch signifikant zwischen den Messzeitpunkten t1 und t2 (1.45, p < .001) und fiel statistisch signifikant zwischen t2 und t3 (1.36, p < .001). Zwischen den Messzeitpunkten t1 und t3 bestand kein statistisch signifikanter Unterschied. Die SchülerInnen der Feldstudie verbesserten sich demnach zwischen t1 und t2 und verzeichneten einen Leistungsabfall zwischen t2 und t3, sodass sie an t3 eine statistisch gleiche Testleistung wie an t1 erzielten.

F3 Vergleich Feld- und Kontrollgruppe: Testleistung

Die Unterschiede zwischen den Testleistungen der Feld- (FG) und der Kontrollgruppe (KG) wurden mithilfe des paarweisen Vergleichs mit Bonferroni-Korrektur untersucht. Hinsichtlich dieses Haupteffekts des Zwischensubjektfaktors zeigte sich ein signifikanter Unterschied sowohl bei t1 (2.18, p < .001) als auch t3 (3.08, p < .001). Die Testleistung in der Feldgruppe (FG) blieb an den Messzeitpunkten auf gleichem Niveau, während sie in der Kontrollgruppe (KG) geringfügig fiel und somit der Unterschied zwischen den Gruppen bei t3 größer war als bei t1 (vgl. Abb. 6.77).

Abbildung 6.77
figure 77

Entwicklung der Testleistung. Vergleich FG und KG

F3 Vergleich Entwicklungs- und Feldgruppe: Testleistung

Um die Effekte des Projekts in der Entwicklungsgruppe (EG) mit der Feldgruppe (FG) zu vergleichen wurden paarweise Vergleiche durchgeführt. Es zeigten sich statistisch signifikante Haupteffekte des Zwischensubjektfaktors bei t1 (2.56, p < .001) und t3 (1.12, p = .029). Die Testleistung in der Entwicklungsgruppe (EG) stieg bei t2 stark an und sank anschließend bei t3. Die Feldgruppe (FG) zeigte eine ähnliche Entwicklung wie die Entwicklungsgruppe (EG), wobei sowohl der Anstieg als auch der Abfall geringer ausfielen (vgl. Abb. 6.78).

Abbildung 6.78
figure 78

Entwicklung der Testleistung in der EG und FG