In diesem Kapitel werden die Auswertungen des parallelisierten Vor- und Nachtests dargestellt. Dazu wird zunächst auf Grundlage des Vortests das Vorwissen der Schülerinnen und Schülern beschrieben. Dieser Charakterisierung wird auf quantitativer Ebene die Lösungshäufigkeit der Testitems und Itemgruppen zugrunde gelegt. Die quantitativen Darstellungen werden durch die Diskussion ausgewählter Aufgabenlösungen der Schülerinnen und Schüler ergänzt, um die Testergebnisse vor dem Hintergrund der Entwicklung von Grundvorstellungen einzuordnen. Die Auswertungen des Vortests werden im Anschluss mit den dichotomisierten Auswertungen des Nachtests abgeglichen, um die Leistungsentwicklung der Schülerinnen und Schüler zu beschreiben. Abschließend wird die Zusammensetzung der Paare für die Partnerarbeiten während der Arbeitssitzungen zur Datenerhebung dargestellt.

4.1 Vorwissen der Lernenden

Die Ergebnisse der Schülerinnen und Schüler zeigen eine hohe Heterogenität. Die Spannweite der Testergebnisse reicht von 15 % bis 90 % und im arithmetischen Mittel bearbeiten die Schülerinnen und Schüler 60 % der Aufgaben im Vortest korrekt (vgl. Abb. 4.2).

Abbildung 4.1
figure 1

Quartilzuordnung der Ergebnisse im Vortest

Die Aufteilung der Testergebnisse in Quartile (vgl. Abb. 4.1) ergibt, dass sechs Schülerinnen und Schüler weniger als 40 % der Aufgaben im Vortest korrekt gelöst haben. Der mittleren Leistungsgruppe (Quartile 2 und 3) lassen sich 15 Testergebnisse zuordnen, deren Lösungshäufigkeiten zwischen 40 und 84 % liegen. Neun Schülerinnen und Schüler haben mehr als 85 % der Testaufgaben korrekt beantwortet und bilden die stärkste Leistungsgruppe.

Abbildung 4.2
figure 2

Ergebnisse der Schülerinnen und Schüler im Vortest in Prozent

Vorwissen der Lernenden nach inhaltlichen Kategorien

Die parallelisierten Items im Vortest verteilen sich auf fünf inhaltliche Kategorien (siehe Abschnitt 3.3.1). Der Überblick über die Testergebnisse in den einzelnen Kategorien zeigt eine große Streuung in allen Kategorien (vgl. Abb. 4.3). Die breite Streuung der Ergebnisse in den einzelnen Kategorien wird einerseits in der Größe der Boxen deutlich, die die mittleren 50 % der Testergebnisse repräsentieren, sowie in den Abständen der Whiskern, die in der vorliegenden Darstellung die niedrigsten und höchsten Testergebnisse kennzeichnen und somit die Spannweite der individuellen Ergebnisse darstellen.

Nachfolgend werden die Vortestergebnisse in den einzelnen Kategorien näher beschrieben und anhand charakteristischer Lösungen diskutiert.

Abbildung 4.3
figure 3

Ergebnisse im Vortest nach inhaltlichen Kategorien

Ergänzen von Multiplikations- und Divisionsoperatoren:

In dieser Kategorie sollten die Schülerinnen und Schüler die Rechenoperationen in Operatorpfeil-Darstellungen ergänzen (vgl. Abb. 4.4)

Abbildung 4.4
figure 4

Items in der Kategorie Ergänzen von Multiplikations- und Divisionsoperatoren

Das erste Item betrifft das Rechnen mit natürlichen Zahlen und die Schülerinnen und Schüler sollten eine Rechenoperation eintragen, mit der die Zahl 16 auf die Zahl 96 abgebildet werden kann. Hier wurden die Lösungen über die Addition \(+80\) sowie über die Multiplikation \(\cdot 6\) akzeptiert und als korrekt bewertet. Dieses Item wurde von den meisten Schülerinnen und Schülern korrekt beantwortet, wobei 23 Schülerinnen und Schüler die Multiplikation mit 6 und lediglich zwei Schülerinnen und Schüler die Addition mit 80 angaben. Drei Schülerinnen und Schüler haben dieses Item nicht bearbeitet und es wurden insgesamt nur zwei falsche Lösungen abgegeben (\(\cdot 4\) und \(\cdot 7\)), die als Rechenfehler charakterisiert werden können.

Das zweite Item beinhaltet eine Bruchzahl und es soll eine Rechenoperation angegeben werden, die die natürliche Zahl 4 auf die Bruchzahl \(\frac{1}{2}\) abbildet. Dieses Item wurde lediglich von neun Schülerinnen und Schülern korrekt beantwortet, wobei ein Schüler die Subtraktion \(-3{,}5\) und acht Schülerinnen und Schüler die Division  : 8 als korrekte Lösungen angaben. Acht Schülerinnen und Schüler haben keine Angabe gemacht und die häufigsten falschen Nennungen sind  : 2 (7 Nennungen) und  : 3, 5 (4 Nennungen).

Ablesen von Bruchteilen aus unterschiedlichen ikonischen Repräsentationen:

Der Vortest enthält insgesamt sechs Items zum Ablesen von Brüchen aus ikonischen Repräsentationen, die auf zwei Aufgaben verteilt sind. Die maximale Spannweite der Ergebnisse von 100 % bringt zum Ausdruck, dass einige Schülerinnen und Schüler alle Brüche korrekt ablesen konnten, während andere Schülerinnen und Schüler gar keinen Bruch korrekt abgelesen haben. Der Interquartilsabstand, der in Abb. 4.3 durch den Anfang und das Ende der Box repräsentiert ist, beträgt ca. 65 %, was bedeutet, dass die Hälfte der Schülerinnen und Schüler zwischen 18 und 83 % der Brüche korrekt abgelesen haben, was ein starkes Kennzeichen für die hohe Heterogenität des Vorwissens zum Ablesen von Brüchen ist. Im Durchschnitt konnten die Schülerinnen und Schüler etwa die Hälfte der Brüche korrekt ablesen (Median: 50 %, arithmetisches Mittel: 48,9 %).

Abbildung 4.5
figure 5

Anna Lenas (oben) und Johannas (unten) Lösungen beim Ablesen von Brüchen

Eine Analyse der fehlerhaften Antworten beim Ablesen von Brüchen zeigt ein prototypisches Fehlermuster, bei dem die Zahlen in Zähler und Nenner die Anzahlen der gefärbten und nicht-gefärbten Teile der ikonischen Repräsentation repräsentieren. Dieses Fehlermuster ist in den Lösungen Anna Lena und Johanna (siehe Abb. 4.5) sehr deutlich zu erkennen. Während Anna Lena im Zähler die Anzahl der nicht-gefärbten Teile und im Nenner die Anzahl der gefärbten Teile notiert, verfährt Johanna genau umgekehrt. Das zweite erkennbare systematische Fehlermuster ist die Orientierung an bekannten (Alltags-) Brüchen, wie z. B. Vierteln. Dieses systematische Fehlermuster ist deutlich in den Lösungen von Laura zu erkennen (siehe Abb. 4.6).

Abbildung 4.6
figure 6

Orientierung an Vierteln in Lauras Lösungen zum Ablesen von Brüchen aus ikonischen Repräsentationen

Der Zahl von zwölf Schülerinnen und Schülern der Lerngruppe, die keinen bis maximal einen von sechs Brüchen korrekt ablesen konnten, stehen genau so viele Schülerinnen und Schüler gegenüber, die fünf oder sechs der sechs Brüche korrekt ablesen konnten. Diese Verteilung der minimalen und maximalen Ergebnisse beim Ablesen von Brüchen deutet darauf hin, dass etwa die Hälfte der Lerngruppe bereits sehr gute Erfahrungen im Ablesen von Brüchen hat, während die andere Hälfte nahezu kein Vorwissen in diesem Bereich mitbringt.

Einzeichnen und Einfärben von Bruchteilen in ikonischen Darstellungen:

Der Pretest enthält sechs Items zum Einzeichnen von Brüchen in ikonische Darstellungen. Von diesen sind vier Repräsentationen bereits durch eine Einteilung strukturiert. Zwei Figuren sind ohne eine Einteilung vorgegeben.

Die Ergebnisse der Schülerinnen und Schüler beim Einzeichnen von Brüchen zeigen eine ähnliche Heterogenität wie in den vorhergehenden Itemgruppen, doch können die mittleren 50 % der Lernenden Brüche besser in ikonischen Darstellungen einzeichnen als Brüche aus diesen ablesen. Im Median konnten die Lernenden drei von vier Brüche in strukturierten Repräsentationen einzeichnen und einen von zwei in Repräsentationen ohne eine vorgegebene Einteilung. Insgesamt liegt die durchschnittliche Lösungshäufigkeit bei 60,6 %. Zehn Schülerinnen und Schüler konnten fünf oder sechs der sechs Brüche korrekt einzeichnen, während lediglich vier Schülerinnen und Schüler keinen oder nur einen der sechs Brüche einzeichnen konnten.

Die beobachteten typischen Fehler beim Einzeichnen von Brüchen in Repräsentationen mit einer vorgegebenen Einteilung deuten darauf hin, dass die Lernenden mit niedrigen Lösungshäufigkeiten auf wenig bis keine früheren Erfahrungen zum Einzeichnen von Brüchen zurückgreifen konnten und versucht haben die Zahlen in den symbolischen Bruchangaben plausibel zu deuten.

Abbildung 4.7
figure 7

Julias Zeichnungen der Brüche \(\frac{1}{4}\) und \(\frac{3}{4}\) (oben) und Aishas Zeichnungen der Brüche \(\frac{1}{6}\) und \(\frac{1}{3}\) (unten)

Während Julia scheinbar den Zähler eines Bruchs als ordinale Angabe interpretiert und von je vier Segmenten das erste Segment für den Bruch \(\frac{1}{4}\) und das dritte Segment für den Bruch \(\frac{3}{4}\) markiert, interpretiert Aisha die Zahl im Nenner als Anzahl der zu färbenden Teile (siehe Abb. 4.7).

Abbildung 4.8
figure 8

Josephines Zeichnungen der Brüche \(\frac{3}{4}\) und \(\frac{1}{3}\)

Die Fehler der Lernenden zum Einzeichnen von Brüchen in ikonischen Repräsentationen ohne vorgegebene Einteilung lassen erkennen, dass die Schülerinnen und Schüler mit niedrigen Lösungshäufigkeiten noch über wenige Erfahrungen und Strategien zum Einteilen eines Ganzen verfügen und versuchen nach Größenabschätzung einen entsprechenden Teil des Ganzen abzutrennen (siehe Abb. 4.8).

Ein- und mehrschrittige Sachaufgaben:

Der Vortest enthält drei ein- und zweistufige Sachaufgaben zum Berechnen von Anteilen. Dabei sollten in den einstufigen Sachaufgaben die Hälfte einer 12 km langen Strecke und drei Viertel von 80 € berechnet werden. In einer zweistufigen Sachaufgabe sollte berechnet werden, wie viel Euro noch zu 120 € fehlen, wenn man bereits zwei Drittel des Geldbetrags gespart hat. Insgesamt konnten von den Lernenden im Vortest im Durchschnitt 63,3 % der Aufgaben korrekt lösen, das bedeutet, dass die Schülerinnen und Schüler im Median zwei der drei Aufgaben korrekt gelöst haben. Zehn Schülerinnen und Schülern, die alle drei Sachaufgaben richtig lösen konnten, stehen 13 Schülerinnen und Schüler gegenüber, die lediglich eine Aufgabe richtig lösen konnten. Bei dieser einen gelösten Aufgabe handelt es sich in allen Fällen um die Berechnung der Hälfte einer zwölf Kilometer langen Strecke.

Als charakteristische Fehler bei der Berechnungen von Anteilen in einem Sachkontext konnten Fehler beim Rechnen mit natürlichen Zahlen und die Wahl der falschen Rechenoperation festgestellt werden. Charakteristisch für den Fehlertyp der Wahl der falschen Rechenoperation waren bei der Aufgabe zur Berechnung von drei Vierteln von 80 €, dass 80 € nicht durch 4, sondern durch 3 geteilt wurden (siehe Abb. 4.9) und bei der zweistufigen Aufgabe zur Berechnung von einem Drittel bzw. zwei Dritteln von 120 € die wiederholte Division, d. h. dass für \(\frac{2}{3}\) von 120 € \(120:3=40\) gerechnet wurde und das Zwischenergebnis nicht mit 2 multipliziert, sondern durch 2 dividiert wurde (vgl. Abb. 4.10).

Abbildung 4.9
figure 9

Glens Lösung von Aufgabe 9

Abbildung 4.10
figure 10

Enyas Lösung von Aufgabe 11 des Vortests

Größenvergleich von Bruchteilen:

In drei Vortest-Items sollten die Schülerinnen und Schüler Brüche der Größe nach vergleichen und aus je zwei vorgegebenen Brüchen den größeren auswählen. Dabei sollten die Alltagsbrüche \(\frac{3}{4}\) und \(\frac{1}{2}\) sowie zwei Paare von Brüchen mit gleichen Zählern miteinander verglichen werden (\(\frac{1}{4}\) und \(\frac{1}{8}\) sowie \(\frac{2}{5}\) und \(\frac{2}{3}\)).

Insgesamt kreuzten 16 Schülerinnen und Schüler in allen drei Fällen korrekt den größeren der zu vergleichenden Brüche an, acht Schülerinnen und Schüler konnten nur im Vergleich der Alltagsbrüche \(\frac{3}{4}\) und \(\frac{1}{2}\) den größeren Bruch richtig identifizieren. Für die Wertung der Aufgabenlösungen als richtig oder falsch wurde lediglich die Kennzeichnung des größeren Bruchs gewählt. Die Begründungen der Auswahlen der Schülerinnen und Schüler wurden nicht bewertet. Insgesamt wurden somit in dieser Itemgruppe im Schnitt 76,6 % korrekte Antworten gegeben und im Median konnten die Lernenden in allen drei Fällen den größeren Bruch bestimmen.

Charakteristische Fehler, die in den Bearbeitungen der Lernenden unter Einbezug der notierten Begründungen beobachtet werden konnten, folgten in allen Fällen der Argumentation, dass von zwei Brüchen derjenige der größere Bruch ist, in dessen Nenner die größere Zahl steht (vgl. Abb. 4.11)

Abbildung 4.11
figure 11

Julias Lösungen von Aufgabe 10 des Vortests

Ergebnisse der ergänzenden Testitems zum Umgang mit natürlichen Zahlen:

Die Ergebnisse der ergänzenden Testitems zum Umgang mit natürlichen Zahlen zeigen, dass keine Lernenden auffällige Schwierigkeiten im Umgang und im Rechnen mit natürlichen Zahlen haben. Die Aufgaben zum Ordnen zwei- bis fünfstelliger natürlicher Zahlen, wurden, mit Ausnahme einer einzelnen Nichtbearbeitung einer Teilaufgabe, von allen Schülerinnen und Schülern korrekt gelöst. Ebenso konnten alle Schülerinnen und Schüler eine Sachaufgabe zum Aufteilen von 240 € auf sechs Personen korrekt lösen. Lediglich in den Bearbeitungen einer sehr komplexen mehrschrittigen Sachaufgabe liegt die Lösungshäufigkeit bei 53 %. Fehleranalysen der Bearbeitungen dieser Aufgabe weisen hierbei jedoch darauf hin, dass die Hauptfehlerquelle im vollständigen Textverständnis und dem Einbezug aller im Aufgabentext vorgegebenen Daten zur Berechnung liegen.

4.2 Leistungsentwicklung

Der Vergleich der Leistungen im parallelisierten Vor- und im Nachtest (vgl. 3.3.1) gibt Aufschluss über die globale Leistungsentwicklung der Lerngruppe.

Abbildung 4.12
figure 12

Vergleich von Vor- und Nachtestergebnis der untersuchten Lerngruppe

Die Repräsentation der Vor- und Nachtestergebnisse in einem Boxplot (Abb. 4.12) veranschaulicht, dass die Leistungen der Schülerinnen und Schüler im Nachtest näher zusammen rücken und im Allgemeinen wesentlich höher sind als die Leistungen im Vortest. Die Spannweite der Ergebnisse verringert sich von 75 % auf 45 % mit einer niedrigsten Testleistung von 55 % und den höchsten Testleistungen mit 100 %. Das untere Quartil ist um 35 Prozentpunkte höher als im Vortest und auch das obere Quartil liegt fünf Prozent höher als im Vortest. Der Medianwert der erreichten Testergebnisse liegt im Vergleich zum Vortest 20 Prozentpunkte höher bei 85 %.

Insgesamt ist zu erkennen, dass die mittleren 50 % der Testergebnisse in einem Rahmen von 75 % bis 90 % liegen, wohingegen sie im Vortest noch zwischen 40 % und 85 % lagen.

Der Vergleich der Kennwerte der beiden Boxplots zeigt eine deutliche Homogenisierung der Testergebnisse im Vergleich zum Vortest und eine insgesamt höhere Testleistung der gesamten Lerngruppe. Die Steigerung der Testleistungen der Lernenden kann durch einen t-Test mit paarweise verbundenen Stichproben zum Vergleich der durchschnittlichen Testleistungen der Lerngruppe in Vor- und Nachtest bestätigt werden. Bei Annahme der Gleichheit des Mittelwerts in Vor- und Nachtest und einem Signifikanzniveau von 5 % ergibt sich bei 29 Freiheitsgraden eine Testgröße von \(t_{29}=5,2789\) und ein entsprechender p-Wert kleiner als 0, 001. Somit kann aufgrund des festgelegten Signifikanz-Niveaus von \(\alpha =0,05\) die Nullhypothese, d. h. die Annahme der Gleichheit des Mittelwerts, abgelehnt werden. Die Verbesserungen der Testleistungen im Vergleich zum Vortest sind somit statistisch signifikant.

Abbildung 4.13
figure 13

Vergleich der Vor- und Nachtestergebnisse der einzelnen Schülerinnen und Schüler

Die individuellen Veränderungen der Testleistungen der einzelnen Schülerinnen und Schüler sind im Streudiagramm in Abb. 4.13 dargestellt. Jeder Kreis repräsentiert eine Schülerin oder einen Schüler der Klasse, die x-Koordinate wird durch das prozentuale Ergebnis im Vortest und die y-Koordinate durch das prozentuale Ergebnis im Nachtest bestimmt. Die Kreise oberhalb der Winkelhalbierenden im Koordinatenursprung repräsentieren demnach Lernende, die im Nachtest ein höheres Ergebnis erzielt haben als im Vortest. Entsprechend repräsentieren Kreise unterhalb der Winkelhalbierenden Lernende, deren Testleistung im Nachtest niedriger als im Vortest waren und Kreise auf der Winkelhalbierenden repräsentieren Lernende mit gleicher Vor- und Nachtestleistung.

Das Streudiagramm zeigt, dass mit Ausnahme von fünf Lernenden alle Schülerinnen und Schüler eine deutliche Verbesserung der Testergebnisse erreicht haben, drei Lernende die gleiche Testleistung erreicht haben und zwei Lernende im Nachtest ein minimal schlechteres Ergebnis als im Vortest erzielt haben. Es ist zu erkennen, dass vier der fünf niedrigeren bzw. stagnierenden Ergebnisse in einem insgesamt hohen Leistungsbereich mit einer Testleistung von über 85 % liegen. Da insgesamt 20 Items für die Berechnung der dichotomisierten Testleistungen einbezogen wurden, entspricht eine Abweichung um fünf bzw. zehn Prozent der korrekten Beantwortung eines bzw. zweier Testitems.

Bei Betrachtung der Testergebnisse in den einzelnen Inhaltsbereichen zeigt sich, dass die Lernenden im Mittel 100 % (Median) der Items zum Ablesen (arithmetisches Mittel: 97 %) und Einzeichnen (arithmetisches Mittel: 91 %) von Brüchen korrekt lösen. Die Ergebnisse in den Itemgruppen zum Ergänzen von Rechenoperatoren (Median: 50 %, arithmetisches Mittel: 42 %) und den ein- und mehrschrittigen Sachaufgaben (Median: 67 %, arithmetisches Mittel: 62 %) sind minimal rückläufig bzw. stagnierend. Es ist anzunehmen, dass diese Ergebnisse auf die veränderten Brüche in den Sachaufgaben im Nachtest zurückzuführen sind. Während im Vortest vor allem die Alltagsbrüche \(\frac{1}{2}\), \(\frac{3}{4}\) und \(\frac{1}{3}\) in Sachkontexte eingebunden waren, enthielten die Sachaufgaben im Nachtest die Brüche \(\frac{3}{4}\), \(\frac{3}{5}\) und \(\frac{2}{5}\). Da das Ergänzen von Rechenoperatoren in der Unterrichtseinheit nicht explizit behandelt wurde, sind die leicht niedrigeren Testergebnisse in diesem Bereich wenig aussagekräftig. Die Analyse der einzelnen Lösungen zeigt jedoch, dass die Lernenden im Nachtest vor allem Multiplikations- und Divisionsoperatoren ergänzt haben, während sie im Vortest auch Additions- und Subtraktionsoperatoren ergänzt haben. Die meisten Fehler in diesem Bereich des Nachtests lassen sich auf Rechenfehler zurückführen.

Auch die Testergebnisse zum paarweisen Größenvergleich von Brüchen zeigen einen geringfügig negativen Trend (arithmetisches Mittel im Vortest: 77 %, 67 % im Nachtest). Als Grund dafür lassen sich erneut die Unterschiede zwischen den Testitems vermuten. Während zwei der drei zu vergleichenden Bruchpaare im Vor- und Nachtest sehr ähnlich bzw. identisch waren, enthielt der Nachtest zusätzlich das Bruchpaar \(\frac{4}{7}\) und \(\frac{5}{8}\), das aufgrund der unterschiedlichen Zahlen in Zähler und Nenner eine höhere Schwierigkeit darstellt als die Vergleiche im Vortest.

Auf eine qualitative Darstellung von typischen Fehlern im Nachtest wird an dieser Stelle verzichtet, da diese sehr ähnlich zu den im Vortest dokumentierten Fehlern sind und entsprechend der beschriebenen Leistungsentwicklung wesentlich seltener aufgetreten sind.

4.3 Zusammensetzung der Lernenden-Paare

Die Paare für die Arbeitssitzungen zur Datenerhebung sind in Bezug auf ihr Vorwissen sehr heterogen zusammengesetzt. Dem Bubbleplot in Abb. 4.14 liegt eine Einteilung entsprechend der Quartile der Testleistungen im Vortest zugrunde. Die Leistungen im unteren Bereich liegen zwischen 15 % und 39 %. Weitere Leistungsstufen sind 40 % bis 64 %, 65 % bis 84 % und in den höchsten Bereich fallen Leistungen zwischen 85 % bis 100 %. Alle Lernenden können entsprechend ihres Ergebnisses im Vortest einer der vier Stufen zugeordnet werden. Die Zahlen in den Kreisen des Bubbleplots entsprechen den Anzahlen der Paare, in denen Lernende mit den entsprechenden Vortestleistungen zusammenarbeiten. In der Abbildung wurden die Lernenden mit der besseren Vortestleistung auf der vertikalen Achse angeordnet und die Lernenden mit den niedrigeren Vortestergebnissen auf der horizontalen Achse.

Abbildung 4.14
figure 14

Zusammensetzung der Paare hinsichtlich ihrer Leistungen im Vortest und im Nachtest

Mit Ausnahme von zwei möglichen Kombinationen finden sich alle möglichen Zusammensetzungen der Lernenden-Paare in der Untersuchungsgruppe wieder. Fünf Paare setzen sich aus Schülerinnen und Schülern mit demselben Vortest-Niveau zusammen, bei ebenfalls fünf Paaren unterscheiden sich die Vortestergebnisse der Schülerinnen und Schüler um eine Stufe. Bei drei Paaren unterscheiden sich die Vortestergebnisse um zwei Stufen und bei zwei Paaren sogar um drei Niveau-Stufen.

Für einen Vergleich der Leistungsniveaus der Paarzusammensetzungen am Anfang und am Ende der Unterrichtseinheit wurden in der rechten Darstellung (Abb. 4.14, rechts) die Nachtestergebnisse der Lernenden den gleichen Kategorien auf Basis des Vortests zugeordnet. Die Abbildung zeigt, dass am Ende der Unterrichtseinheit die Leistungsniveaus mit Ausnahme eines Paares um maximal eine Stufe voneinander abweichen, was als weiteres Zeichen für eine deutliche Homogenisierung der Leistungen der Schülerinnen und Schüler interpretiert werden kann.