„Machen wir wieder diese Rätselhefte?“ (ein Erstklässler vor Beginn der Testung mit dem CFT 1-R, 13.03.2019)

Im Rahmen meiner durchgeführten Mixed Methods-Studie zur individuellen mathematischen Kreativität von Erstklässler*innen (vgl. Kap. 7, insbesondere Abb. 7.13) wird nun zunächst die Durchführung des Sampling-Verfahrens präsentiert. Dieses diente zum einen dazu, auf Basis ihrer individuellen Voraussetzungen kriteriengeleitet Erstklässler*innen für die qualitative Studie auszuwählen. Dadurch, dass die dafür eingesetzten Kriterien aus der Theorie zur individuellen mathematischen Kreativität entwickelt bzw. abgeleitet wurden (vgl. Abschn. 2.3.3.2), konnten die Erkenntnisse aus dem Sampling-Verfahren insbesondere für die Beantwortung der fünften Forschungsfrage nach dem Zusammenhang der individuellen Voraussetzungen der Kinder und ihrer individuellen mathematische Kreativität genutzt werden (vgl. Kap. 11).

Nachfolgend werden dem methodischen Vorgehen entsprechend die verschiedenen, sukzessive aufeinander aufbauenden Schritte des Sampling-Verfahrens dargestellt. Dabei wird zunächst die Auswahl von Lernenden über ihre unterrichtlichen Voraussetzungen (vgl. Abschn. 8.1) sowie ihre intellektuellen und mathematischen Voraussetzungen (vgl. Abschn. 8.2) dargestellt, die als bedeutsame Grundlage für die endgültige Auswahl repräsentativer Erstklässler*innen (Subsample) dienten (vgl. Abschn. 8.3). Die dafür notwendigen quantitativen Datenanalysen, d. h. vor allem die Berechnung der Clusteranalyse, wurde mit dem Programm IBM SPSS Statistics (IBM Corp. Released, 2020) durchgeführt, weshalb die meisten folgenden Tabellen und Grafiken aus diesem Programm entnommen wurden. Zur Wahrung des Datenschutzes jeden Kindes wurde allen Erstklässler*innen eine anonymisierte Identifikationsnummer (ID) zugeordnet. Diese setzt sich aus einer fortlaufenden Zahl (1 bis 78), einem Kürzel für das verwendete Lehrwerk (D für Denken & Rechnen; W für Welt der Zahl) und dem Geschlecht (m für männlich; w für weiblich) zusammen. So steht bspw. die ID 11-W-m für das elfte Kind des Grundsamples, das zum Erhebungszeitraum in der Schule mit dem Lehrwerk Welt der Zahl arbeitete und männlich ist.

1 Deskriptive Statistik: das quantitative Sample

„Wissenschaftliches Arbeiten zielt auf die Verdichtung von Einzelinformationen und Beobachtungen zu allgemein gültigen Aussagen ab. Hierbei leitet die deskriptive Statistik zu einer übersichtlichen und anschaulichen Informationsaufbereitung an […]“ (Bortz & Schuster, 2010, S. 2)

Im Rahmen der deskriptiven Statistik wurde deutlich, dass sich das Sample mit \(N=78\) Erstklässler*innen ausgeglichen aus 39 Jungen und 39 Mädchen zusammensetzte. Während von den 29 Kindern, die im Mathematikunterricht mit dem Lehrwerk Welt der Zahl arbeiteten, es 13 Jungen und 16 Mädchen waren, verteilten sich die 49 Kinder, die im Unterricht mit Denken & Rechnen lernten, auf 26 Jungen und 23 Mädchen (vgl. Abb. 8.1).

Abb. 8.1
figure 1

Geschlechterverteilung (N = 78 Erstklässler*innen) bezogen auf die beiden Lehrwerke

Bezogen auf das Alter der 78 Erstklässler*innen lässt sich festhalten, dass zum Testzeitpunkt mit dem ersten standardisierten Test im März 2019 (Testdaten waren der 07.03., 08.03., 13.03., 14.03. und 15.03.19) das jüngste Kind 6;0 Jahre und das älteste 7;7 Jahre alt war. Es ergibt sich ein Altersdurchschnitt von 6;11 Jahren, wobei alle bis auf ein Kind im ersten Schulbesuchsjahr waren und nur ein Kind mit Deutsch als Zweitsprache aufgewachsen ist, dieses aber alltagssprachlich altersangemessen sprechen und auch (mathematische) Bildungssprache jahrgangsentsprechend verstehen konnte. Da diese Faktoren in Anlehnung an die dargestellten Studien von Sak und Maker (2006) und M. Leikin und Tovli (2019) (vgl. Abschn. 5.1) höchstwahrscheinlich keinen Einfluss auf die individuelle mathematische Kreativität der Lernenden nehmen, wurden sie in der weiteren Datenanalyse vernachlässigt. Die nachfolgende Abbildung 8.2 zeigt die Altersstruktur des Samples nach Geschlecht getrennt, wobei auffällt, dass besonders viele Kinder 6;7 Jahre alt waren und eine Alters-Spannweite von 1;7 Jahren bestand.

Abb. 8.2
figure 2

Alter der Stichprobe (N=78) nach Geschlecht

Alle 78 Erstklässler*innen wurden mit zwei standardisierten Tests, dem MBK 1 + zur Erfassung der mathematischen Basiskompetenzen und dem CFT 1-R Teil 2 zur Erfassung der Grundintelligenz der Kinder, getestet. Beide sorgfältig ausgesuchten Testinstrumente sind in der Auswertung durch T-Werte skaliert (Mittelwert 50, Standardabweichung 10) und konnten deshalb optimal, d. h. ohne eine weitere Transformation bzw. Standardisierung, aufeinander bezogen werden (vgl. Abschn. 7.1.2). Dabei sind zwei Auffälligkeiten im Sample dieser Studie festzustellen (vgl. Tab. 8.1):

  1. 1.

    Die tatsächlichen Mittelwerte der T-Werte wichen mit 50,1 im CFT 1-R Teil 2 und 50,31 im MBK 1 + leicht nach oben ab. Die Standardabweichungen lagen dagegen mit 9,609 für den CFT 1-R Teil 2 und 9,710 für den MBK 1 + leicht unter dem Normwert von 10.

  2. 2.

    Während im CFT 1-R Teil 2 die T-Werte theoretisch in einem Bereich von 20 bis 80 hätten liegen können, zeigte sich in diesem Sample eine Spannweite von 27 bis 74. Ähnlich wären beim MBK 1 + die T-Werte von 0 bis 63 möglich gewesen, es wurden aber nur T-Wert zwischen 22 und 63 erzielt.

Tab. 8.1 Deskriptive Statistik des gesamten Datensatzes

Die nachfolgenden Histogramme zeigen die Verteilung der T-Werte beider Testverfahren auf das gesamte Grundsample von 78 Erstklässler*innen (vgl. Abb. 8.3 und Abb. 8.4). An dem Histogramm zum CFT 1-R Teil 2 wird deutlich, dass die Verteilung der T-Werte mit einer Schiefe von \({\gamma }_{m}=-,112\) nur sehr leicht linksschief (vgl. Bortz & Schuster, 2010, S. 86–87) waren. Das Histogramm zeigt eine annähernde Normalverteilung der T-Werte, was auch aus der Konzeption des Testinstruments zu erwarten war (vgl. Abschn. 7.1.2.1).

Abb. 8.3
figure 3

Histogramm T-Werte CFT 1-R Teil 2

Bei der Verteilung der T-Werte des MBK 1 + zeigte sich ein deutlich stärker von der Normalverteilung abweichendes Bild (vgl. Abb. 8.4). Hier lag eine starke Links-Schiefe mit einem Wert von \({\gamma }_{m}=-\mathrm{1,071}\) ab einem T-Wert von etwa 55 vor.

Abb. 8.4
figure 4

Histogramm T-Werte MBK 1 + 

Da der MBK1 + vor allem im unteren Leistungsbereich zur Ermittlung von Kindern mit einem Risiko für die Entwicklung einer Rechenschwäche differenzieren soll (vgl. Ennemoser et al., 2017b, S. 10, 20), können im oberen Leistungsbereich Deckeneffekte (vgl. Krüger, Parchmann & Schecker, 2014, S. 399) (im Englischen: Ceiling Effect (vgl. Vogt, 2005, S. 40)) auftreten, die eine adäquate Differenzierung erschweren. Diese zeigten sich hier deutlich und müssen in der weiteren Datenauswertung sensibel berücksichtigt werden. Aufgrund der Auswahl der beiden Grundschulen (vgl. Abschn. 7.1.1) sowie dem für quantitative Stichproben kleinen Sample von 78 Erstklässler*innen war davon auszugehen, dass die mathematischen Basisfertigkeiten nicht normalverteilt auftreten würden (vgl. Moosbrugger & Kelava, 2012, S. 95). Dennoch wurde ohne eine weitere Transformierung der Daten mit diesen weiter gerechnet, da beide Merkmale (intellektuellen und mathematischen Fähigkeiten) über die T-Wert-Skalen einheitlich intervallskaliert waren und damit das zweithöchste Skalenniveau aufwiesen, sodass die Voraussetzung für die Durchführung einer Clusteranalyse gegeben war (vgl. Bortz & Schuster, 2010, S. 454). Es fiel insgesamt auf, dass viele Testergebnisse der Erstklässler*innen im durchschnittlichen und überdurchschnittlichen Leistungsbereich lagen.

Wie bereits in Abschnitt 7.1.2.2 theoretisch begründet, war zwischen den T-Werten des MBK 1 + und des CFT 1-R Teil 2 (im Sinne von zwei Variablen) eine mittlere positive Korrelation (\(Pearson; r= .506\)) festzustellen, die auf einem Niveau von \(p<\mathrm{0,01}\) signifikant wurde. Dadurch ließ sich die Anordnung der 78 Erstklässler*innen über deren beide T-Wert-Ergebnisse in dem folgenden Streudiagramm erklären (vgl. Abb. 8.5).

Abb. 8.5
figure 5

Streudiagramm des gesamten Datensatze

Sowohl anhand der eingezeichneten Ursprungsgeraden (rot) als auch anhand der aus den Mittelwerten des CFT 1-R Teil 2 und MBK 1 + berechneten linearen Regressionsgerade mit \(y=\mathrm{24,899} + \mathrm{5,01}x\) (blau) kann verdeutlicht werden, dass eine Streuung der Lernenden beim CFT 1-R Teil 2 bei einem T-Wert von unter 50 zu verzeichnen war. Im Bereich über dem T-Wert von 50 liegen die Kinder näher zusammen und auch näher an den Geraden. Somit kann auch anhand der deskriptiven Ergebnisse des Grundsamples dieser Studie zur individuellen mathematischen Kreativität von Erstklässler*innen die Datenanalyse mittels Clusterbildung begründet werden. Diese wird im folgenden Abschnitt dargestellt.

2 Schließende Statistik: Clusteranalyse

„Die durch einen festen Satz von Merkmalen beschriebenen Objekte [hier Erstklässler*innen] werden nach Maßgabe ihrer Ähnlichkeit in Gruppen (Cluster) eingeteilt, wobei die Cluster intern möglichst homogen und extern möglichst gut voneinander separierbar sein sollen.“ (Bortz & Schuster, 2010, S. 453)

Da die Voraussetzung zur Durchführung einer Clusteranalyse aufgrund der Intervallskala der Testergebnisse gegeben war (vgl. Abschn. 8.1), wurde nun im Rahmen der schließenden Statistik eine Clusteranalyse, wie im methodischen Abschnitt 7.1.2.2 beschrieben, durchgeführt. Dementsprechend wurden zunächst agglomerativ-hierarchische Verfahren genutzt, um zum einen Ausreißer innerhalb des Datensets zu identifizieren (Single-Linkage-Verfahren) und zum anderen eine erste Zuordnung von Erstklässler*innen zu Clustern über ihre Testergebnisse im MBK 1 + und CFT 1-R Teil 2 zu bilden (Ward-Methode). In einem notwendigen zweiten Schritt wurde die entstandene Zuordnung verbessert bzw. optimiert (k-Means-Methode). Ziel dieser Analyse war es, die 78 Erstklässler*innen über ihre Testergebnisse im MBK 1 + und dem CFT 1-R Teil 2 verschiedenen Gruppen (Clustern) zuzuordnen, um aus diesen repräsentative Lernende als Subsample für die qualitative Studie auszuwählen. Die Cluster selbst stellen demnach sogenannte Fähigkeitsprofile der Erstklässler*innen bezogen auf ihre mathematischen und intellektuellen Fähigkeiten dar.

2.1 Agglomerativ-hierarchische Clusteranalyse

„Bei intervallskalierten Merkmalen wird die Distanz zweier Objekte üblicherweise durch das euklidische Abstandsmaß beschrieben.“ (Bortz & Lienert, 2008, S. 456)

In einem ersten Schritt musste das Datenset, also die T-Wert-Ergebnisse der 78 Erstklässler*innen aus dem MBK 1 + und CFT 1-R Teil 2, bereinigt werden, indem statistische Ausreißer ermittelt wurden. Dafür wurde eine hierarchische Clusteranalyse mit dem Single-Linkage-Verfahren auf Grundlage des quadrierten euklidischen Distanzmaß (s. Eingangszitat) durchgeführt (vgl. Abschn. 7.1.2.2). Obwohl mit Hilfe dieses Verfahrens besonders gut homogene Cluster gebildet werden können, werden diese mit zunehmender Fusionierungsstufe heterogener, da immer öfter die weit entfernten Objekte dazu gefasst werden. Daher gilt es, ebendiese als Ausreißer bezeichneten Objekte herauszufiltern. Auf Basis des Dendrogramms wurden in dieser Studie diejenigen Erstklässler*innen gesucht, die erst sehr spät zu einem Cluster fusioniert wurden. Dementsprechend wurden die drei Erstklässler*innen mit der ID 61-D-w, 6-W-w und 37-D-m aus dem Datenset gelöscht, die auch im zuvor erstellten Streudiagramm (vgl. Abschn. 8.1) durch ihre exponierte Lage aufgefallen waren (vgl. rot markiert in Abb. 8.6). Das Sample umfasste daher weiterhin noch \(N=75\) Erstklässler*innen.

Abb. 8.6
figure 6

Streudiagramm mit Markierung der Ausreißer

In einem zweiten Schritt wurde für das bereinigte Datenset (\(N=75\)) eine Clusteranalyse mit der Ward-Methode auf Basis der quadrierten euklidischen Abstände (Distanzmaß) gerechnet (vgl. Abschn. 7.1.2.2), das ebenfalls in einem Dendrogramm abgebildet wurde (vgl. Abb. 8.7).

Abb. 8.7
figure 7

Dendrogramm Clusteranalyse mit Ward-Methode

Zusätzlich zum Dendrogramm wurde die Zuordnungsübersicht der Erstklässler*innen zu den gebildeten Clustern betrachtet, in der für jeden Fusionierungsschritt ein Koeffizient angegeben wird, der die Ähnlichkeit der zusammengeführten Cluster angibt (vgl. Abschn. 7.1.2.2). Die letzten 15 Koeffizienten der Fusionierungsschritte wurden in einem Liniendiagramm (vgl. Abb. 8.8) dargestellt, um mittels des Elbow-Kriteriums eine optimale Clusteranzahl zu bestimmen. Bei diesem kann anhand eines sprunghaften Anstiegs des Koeffizienten auf eine große Heterogenität der Cluster zurückgeschlossen werden, was wiederum ein Indikator für die geeignete Anzahl an Clustern für dieses Sample darstellt (vgl. Abschn. 7.1.2.2). Damit eignete sich diese Methode für die vorliegende Studie zur individuellen mathematischen Kreativität von Erstklässler*innen, da es das Ziel der Clusteranalyse war, differente Gruppen an Erstklässler*innen über ihre mathematischen und intellektuellen Fähigkeiten zu bilden.

Im untenstehenden Liniendiagramm konnte ein Anstieg unter anderem bei zwei, vier und fünf Clustern verzeichnet werden (vgl. Abb. 8.8). Da eine 2-Cluster-Lösung das Sample wenig differenziert abgebildet hätte, wurde eine 4- oder 5-Cluster-Lösung bevorzugt. Um zu beurteilen, welche Clusteranazahl für die Typisierung der Erstklässler*innen in dieser Studie zur individuellen mathematischen Kreativität passend war, wurden die Zuordnung der Lernenden zu den Clustern bei beiden Clusterlösungen betrachtet. Dabei musste berücksichtigt werden, dass aus jedem der gebildeten Cluster nach Möglichkeit vier Erstklässler*innen ausgewählt werden sollten, die sowohl beide Lehrwerke als auch Geschlechter widerspiegelten (vgl. Abschn. 7.1.2.2 und 7.1.2.3).

Abb. 8.8
figure 8

Liniendiagramm – Koeffizienten der Fusionsschritte bei Ward-Methode

Aufgrund der zuvor genannten Auswahlkriterien konnte an dieser Stelle bereits die Vermutung geäußert werden, dass sich eine 4-Cluster-Löung als praktikabler herausstellen könnte. Bei 75 Erstklässler*innen, die auf fünf Cluster verteilt werden, lag die Vermutung nahe, dass zu einigen Clustern nur wenige Kinder zugeordnet werden würden, sodass aus diesen keine repräsentative Auswahl erfolgen konnte. Um diese Hypothese statistisch zu belegen, wurde die folgende, bereinigende Analyse mit einem nicht-hierarchischen Clusterverfahren für beide Lösungen gerechnet, um sich begründet für die 4- oder 5-Cluster-Lösung zu entscheiden.

2.2 Nicht-hierarchische Clusteranalyse

„Diese [nicht-hierarchische] Clusterstrategie wäre damit im Prinzip geeignet, für eine vorgegebene Anzahl von \(k\) Clustern die tatsächlich beste Aufteilung der Objekte zu finden.“ (Bortz & Lienert, 2008, S. 461)

Mit Hilfe einer nicht-hierarchischen Analyse wurden die zuvor mit der Ward-Methode (vgl. Abschn. 8.2.1) gebildeten Cluster und Zuordnungen von Erstklässler*innen zu diesen Clustern jeweils für die 4- und 5-Cluster-Lösung verbessert (s. Eingangszitat). Dazu dienten die Clusterzentren (T-Wert des MBK 1 + und CFT 1-R Teil 2) und die Anzahl der Cluster als Ausgangspunkt, um diese dann mit der \(k\)-Means-Methode schrittweise zu optimieren. Auf diese Weise konnten alle 75 Erstklässler*innen über den geringsten Abstand zum Clusterzentrum eindeutig einem der Cluster zugeordnet werden (vgl. Abschn. 7.1.2.2).

Die nachfolgende Tabelle 8.2 enthält die Ergebnisse dieser Analyse für beide Cluster-Lösungen im Vergleich. In dieser werden die ursprünglichen Clusterzentren aus der vorherigen agglomerativ-hierarchischen Analyse, die Iterationsprotokolle, die endgültigen Clusterzentren sowie die Anzahl der zu einem Cluster zugeordneten Erstklässler*innen dargestellt. Diese bildeten die Entscheidungsgrundlage für bzw. gegen eine der beiden Cluster-Lösungen.

Tab. 8.2 \(\mathrm{k}\)-Means-Analyse der 5- und 4-Cluster-Lösung

Durch die \(k\)-Means-Methode veränderten sich die Clusterzentren und damit auch die Zuordnungen der Erstklässler*innen zu diesen deutlich. Es bestätigte sich, dass bei der 5-Cluster-Lösung einem Cluster nur sechs Lernende zugeordnet wurden, aus denen nur schwer vier repräsentative Erstklässler*innen nach den weiteren Kriterien (Lehrwerk und Geschlecht) ausgewählt werden konnten. Neben diesem rein quantitativen Argument für die Wahl der 4-Cluster-Lösung in dieser Studie lassen sich auch inhaltliche Gründe anführen, die sich vor allem auf die Zuordnung der Erstklässler*innen zu den Clustern und dadurch auf die entstehenden Fähigkeitsprofile bezogen:

  • Im Vergleich der beiden Streudiagramme für die 4- und 5-Cluster-Lösung (vgl. Abb. 8.9 und Abb. 8.10) fiel auf, dass der Unterschied zwischen den beiden Cluster-Lösungen vor allem darin lag, wie die große Anzahl an Erstklässler*innen, die sich um die Mittelwerte beider T-Werte anordneten, zu Clustern zugeordnet wurden. So zeigt sich bei der 5-Cluster-Lösung eine nahezu horizontale Trennung zwischen denjenigen Lernenden mit einem T-Wert im MBK 1 + über 50 (Cluster 2) und solchen mit einem T-Wert unter 50 (Cluster 3). Durch diese Trennung bzw. Unterscheidung der Cluster wurden jedoch keine stark differenzierten Fähigkeitsprofile erzeugt, da die T-Werte des CFT 1-R Teil 2 der beiden Cluster im gleichen Bereich lagen. Deshalb wurde hier die 4-Cluster-Lösung mit einer großen Gruppe (Cluster 2) an Erstklässler*innen, die in beiden Tests einen T-Wert um den Mittelwert zeigten, bevorzugt.

  • Zudem zeigten die zugeordneten Erstklässler*innen bei der 5-Cluster-Lösung in ihren Fähigkeitsprofilen starke Überschneidungen der T-Wert Bereiche im MBK 1 + und CFT 1-R Teil 2, weshalb hier nicht mehr von äußerlich heterogenen Gruppen bzw. Fähigkeitsprofilen gesprochen werden konnte. Bspw. bildete das Cluster 5 überwiegend die gleichen T-Werte des MBK 1 + ab wie die Cluster 2, 3 und 4 und den etwa gleichen T-Wert Bereich des CFT 1-R Teil 2 wie Cluster 4. Bei der 4-Cluster-Lösung fielen solche gravierenden Überlappungen in den einzelnen Fähigkeitsprofilen der Kinder nicht auf, sodass alle einzelnen Cluster inhaltlich getrennte Gruppen bildeten.

Abb. 8.9
figure 9

Streudiagramm 5-Cluster-Lösung nach \(\mathrm{k}\)-Means-Methode

Abb. 8.10
figure 10

Streudiagram 4-Cluster-Lösung nach \(\mathrm{k}\)-Means-Methode

Aus den zuvor erläuterten Gründen wurde sich an dieser Stelle für die 4-Cluster-Lösung entschieden. Daher wurden in einem nächsten Schritt die gebildeten Cluster hinsichtlich der abgebildeten Fähigkeitsprofile auf Basis der mathematischen und intellektuellen Fähigkeiten der Erstklässler*innen charakterisiert. Dazu wurde zunächst ein Boxplot-Diagramm erstellt, das die T-Werte des CFT 1-R Teil 2 und MBK 1 + von den Erstklässler*innen aus jedem der vier Cluster darstellt (vgl. Abb. 8.11).

Abb. 8.11
figure 11

Boxplots der T-Werte von MBK 1 + und CFT 1-R Teil 2 in den vier Clustern

Aus dieser Darstellung konnte abgelesen werden, dass die Erstklässler*innen aus dem ersten Cluster in beiden Tests überdurchschnittliche Fähigkeiten erzielten. Die Lernenden aus Cluster 2 bildeten eine große Gruppe, die durchschnittliche mathematische und intellektuelle Fähigkeiten zeigten. Diesem Muster entsprechend, zeigten die Kinder aus Cluster 3 sowohl im MBK 1 + als auch im CFT 1-R Teil 2 eher unterdurchschnittliche Ergebnisse. Konträr zu den vorherigen Clustern unterschieden sich im verbliebenden, vierten Cluster die Fähigkeiten der Erstklässler*innen in den beiden Tests deutlich. So wiesen diese Lernenden eine eher unterdurchschnittliche Intelligenz aber gleichzeitig hohe mathematische Basisfertigkeiten auf. Gleichzeitig war bei der Betrachtung der gebildeten vier Cluster auffällig, dass es kein solches gab, dem Erstklässler*innen mit einem hohen Testergebnis im CFT 1-R Teil 2 und geringen mathematische Fähigkeiten im MBK 1 + zugeordnet wurden. Dieser Umstand kann sowohl auf die Zusammensetzung des Grundsamples aufgrund der unterrichtlichen Voraussetzungen der Lernenden (vgl. Abschn. 7.1.1) als auch auf die Konzeption der beiden standardisierten Tests zurückgeführt werden (vgl. Abschn. 7.1.2.1).

Zur Charakterisierung der verschiedenen Fähigkeitsprofile innerhalb der Cluster wurde eine Darstellung gewählt, die die Abweichung der Clusterzentren vom Mittelwert in Standardabweichungen angibt (vgl. Abb. 8.12).

Abb. 8.12
figure 12

Cluster-Profile mittels Standardabweichungen zu den Clusterzentren

Aus dieser Darstellung konnte abgelesen werden, dass bspw. das Clusterzentrum des vierten Clusters bei dem T-Wert des CFT 1-R Teil 2 von 40 und des MBK 1 + von 55 lag. Durch die Normierung der T-Wert-Skala liegt der Mittelwert bei 50, sodass die Differenz (D) zwischen dem Clusterzentrum für den CFT 1 + R Teil 2 und diesem \({D}_{CFT\:1-R\:Teil\:2}=40-50=-10\) betrug. Dadurch, dass die Standardabweichung auf zehn T-Werte normiert ist, entsprachen diese exakt einer negativen Standardabweichung (linker/blauer Balken bei Cluster 4 in der Abb. 8.12). Entsprechend betrug die Differenz zwischen dem Clusterzentrum im MBK1 + und dem Mittelwert von 50 \({D}_{MBK\:1+}=55-50=5\). Dies entsprach 0,5 Standardabweichungen (rechter/roter Balken bei Cluster 4 in der Abb. 8.12). Im vollständigen Diagramm war zu erkennen, dass das Profil von Cluster 2 sehr stark am Mittelwert mit einer ganz leichten Tendenz nach oben lag. Obwohl das Clusterzentrum des ersten Clusters kaum eine Standardabweichung zum Mittelwert erreichte, konnte diese Abweichung dennoch als charakterisierend bezeichnend werden, da die maximal möglichen T-Werte im CFT 1-R Teil 2 maximal drei Standardabweichungen und im MBK 1 + nur 1,3 Standardabweichungen entfernt waren (vgl. Abschn. 8.1). Das Profil des Clusters 3 zeigte signifikante Standardabweichungen im Clusterzentrum in beiden Tests. Zwar erreichten die konträren Abweichungen beim vierten Cluster nicht eine volle Standardabweichung, jedoch wurde an dieser Darstellung die Charakterisierung dieses Clusters durch die beiden unterschiedlich ausgeprägten Fähigkeiten im MBK 1 + und CFT 1-R Teil 2 deutlich.

Damit ergaben sich insgesamt vier unterschiedliche Fähigkeitsprofile aus einer Kombination der mathematischen und intellektuellen Fähigkeiten der Erstklässler*innen, denen die 75 Kinder dieser Studie zugeordnet wurden:

Fähigkeitsprofile

  1. 1.

    überdurchschnittlich gleiche Fähigkeiten: überdurchschnittliche intellektuelle Fähigkeiten und im oberen Bereich durchschnittliche mathematische Basisfertigkeiten (Cluster 1)

  2. 2.

    durchschnittlich gleiche Fähigkeiten: durchschnittliche intellektuelle Fähigkeiten und durchschnittliche mathematische Basisfertigkeiten (Cluster 2)

  3. 3.

    unterdurchschnittlich gleiche Fähigkeiten: im unteren Bereich durchschnittliche intellektuelle Fähigkeiten und unterdurchschnittliche mathematische Basisfertigkeiten (Cluster 3)

  4. 4.

    durchschnittlich differente Fähigkeiten: im unteren Bereich durchschnittliche intellektuelle Fähigkeiten und im oberen Bereich durchschnittliche mathematische Basisfertigkeiten (Cluster 4)

Das folgenden Streudiagramm (vgl. Abb. 8.13) zeigt die Zuordnung aller Erstklässler*innen zu den vier Clustern als Ergebnis der Clusteranalyse, wobei die Clusterzentren eingezeichnet und die Cluster farblich umrandet wurden.

Abb. 8.13
figure 13

Zuordnung der 75 Erstklässler*innen zu den vier Clustern (Streudiagramm)

3 Auswahl der Erstklässler*innen für die qualitative Studie

„Da zu jedem Einzelfall umfassendes Material gesammelt wird, beschränkt man sich in der qualitativen Forschung auf kleine Stichproben, die sich aus bewusst – gemäß ihrem Informationsgehalt – ausgewählten Fällen zusammensetzen (zu Typen qualitativer Stichproben […]).“ (Döring & Bortz, 2016, S. 26)

Im Sinne eines selektiven Sampling-Verfahrens sollten aus den 78 Erstklässler*innen, die im Abschnitt zuvor über ihre mathematischen und intellektuellen Fähigkeiten zu vier Fähigkeitsprofilen zugeordnet wurden (vgl. Abb. 8.13), Kinder ausgewählt werden, die repräsentativ für alle Lernenden mit diesem Fähigkeitsprofil standen (vgl. Abschn. 8.2.2). Wie bereits im methodischen Abschnitt 7.1.2.3 zur Bildung des endgültigen Subsamples erläutert, wurde davon ausgegangen, dass etwa 12 bis 20 Kinder von den ursprünglich 78 getesteten Erstklässler*innen ausgewählt würden, da aus jedem der Cluster über weitere Kriterien nach Möglichkeit vier Lernende ausgesucht werden sollten. Dies entsprach bei den gebildeten vier Clustern einer Anzahl von \(N= 4\cdot4=16\) Erstklässler*innen.

Die Auswahl der Lernenden erfolgte über drei hierarchisch angeordnete Kriterien (vgl. dazu auch Abschn. 7.1.2.3): Es sollten aus jedem Cluster immer zwei Kinder von jedem Lehrwerk ausgewählt werden und diese nach Möglichkeit eine Geschlechterparität aufweisen. Daher wurde das Kriterium des Lehrwerks (K1) vorrangig vor dem Kriterium des Geschlechts (K2) angewendet. Als weiteres, erneut nachrangig zu betrachtendes Kriterium wurde dann die Repräsentativität (K3) des einzelnen Kindes für sein Fähigkeitsprofil (Cluster) betrachtet. Es wurde versucht, über die Auswahl der Erstklässler*innen möglichst das ganze Spektrum an T-Werten des MBK 1 + und CFT 1-R Teil 2 abzubilden. So sollte vermieden werden, dass einzelne T-Wert-Bereiche der beiden standardisierten Tests vielfach und andere gar nicht ausgewählt würden, um alle Fähigkeitsprofile vollständig zu repräsentieren. Praktisch betrachtet war für dieses Kriterium die Entfernung des Kindes zum Clusterzentrum seines Fähigkeitsprofils ausschlaggebend. Die ausgewählten Erstklässler*innen eines Fähigkeitsprofils sollten möglichst nah am Clusterzentrum und zugleich ähnlich weit entfernt von diesem liegen.

In der folgenden Tabelle 8.3 sind alle Erstklässler*innen nach ihrem Fähigkeitsprofil und ihrer Entfernung zum Clusterzentrum sortiert aufgelistet. Durch die ID ist das von den Kindern verwendete Lehrwerk (W – Welt der Zahl, D – Denken & Rechnen) sowie das Geschlecht (w, m) ersichtlich.

Tab. 8.3 Zuordnung der Kinder zu den vier Fähgekitsprofilen

Nun musste anhand der zuvor definierten Kriterien eine Auswahl der Kinder erfolgen:

  1. K1

    Das erste Kriterium des Lehrwerks konnte gänzlich erreicht werden, da in jedem Fähigkeitsprofil beide Lehrwerke durch mindestens zwei Erstklässler*innen vertreten waren. Dabei erfüllten die Erstklässler*innen des Fähigkeitsprofils 3 (unterdurchschnittlich gleiche Fähigkeiten) gerade so diese Minimalanforderung.

  2. K2

    Das zweite Auswahlkriterium, das Geschlecht, konnte in allen Clustern abgesehen von dem Fähigkeitsprofil 3 angewendet werden. Diesem wurden nur zwei Erstklässler*innen mit dem Lehrwerk Welt der Zahl zugeordnet und diese beiden waren Mädchen (14-W-w und 21-W-w). Um jedoch innerhalb der ausgewählten Erstklässler*innen aus allen Fähigkeitsprofil eine Geschlechtergleichheit herzustellen, mussten aus diesem dritten Cluster zwei Jungen, die mit dem Lehrwerk Denken & Rechnen im Mathematikunterricht arbeiteten, ausgewählt werden.

  3. K3

    Um bei der Auswahl der Erstklässler*innen das Kriterium der Repräsentativität zu erfüllen, wurde das Streudiagramm genutzt, das die Position aller Lernenden in den vier Clustern zeigte (vgl. Abb. 8.13). Daran wurde deutlich, dass die Erstklässler*innen mit dem Fähigkeitsprofil 1 im MBK 1 + hauptsächlich T-Werte von über 50 und die Kinder mit dem Fähigkeitsprofil 4 im MBK 1 + zumeist T-Werte von unter 40 aufwiesen. Daher war es sinnvoll, solche Erstklässler*innen mit dem Fähigkeitsprofil 2 auszuwählen, die beim MBK 1 + in einem T-Wert Bereich von 40 bis 50 lagen (vgl. Abb. 8.14). Dadurch kamen 16 (von 34) Kinder aus dem zweiten Cluster zur Auswahl für das Subsample in Frage. In allen anderen T-Werten unterschieden sich die vier Fähigkeitsprofile so ausreichend, als dass die zugeordneten Erstklässler*innen das gesamte Spektrum an T-Werten in beiden Tests abbildeten. Auf Basis dieser Einschränkung wurde dann durch die Nähe der einzelnen Erstklässler*innen zu ihrem Clusterzentrum eine Auswahl getroffen. Diese Auswahl wurde in dem nachfolgenden Streudiagramm veranschaulicht (vgl. Abb. 8.14).

Abb. 8.14
figure 14

Streudiagramm der endgültigen Auswahl der Kinder

Auf diese Art und Weise konnten 16 Erstklässler*innen aus den vier Fähigkeitsprofilen für die qualitative Studie zur individuellen mathematischen Kreativität ausgewählt werden. Zusätzlich zu diesen Kindern wurden zudem zwei der drei Ausreißer, die im Rahmen der Clusteranalyse aus dem Datenset entfernt wurden (vgl. Abschn. 8.2.1), in das Subsample aufgenommen (vgl. Abb. 8.14). Aus einer qualitativen Perspektive können diese Lernenden die Analyse der individuellen mathematischen Kreativität bereichern, da sie das Spektrum an individuellen Voraussetzungen erweitern. Dabei wurde sich für die Erstklässlerinnen mit der ID 61-D-w und 6-W-w entschieden, da diese bezogen auf ihre Fähigkeiten die beiden Extremfälle darstellten (vgl. für die Fallauswahl als Sampling-Methode Hussy et al., 2013, S. 197). Während die Erstklässlerin 61-D-w in ihren intellektuellen als auch mathematischen Fähigkeiten weit überdurchschnittlich abgeschnitten hatte, zeigte die Erstklässlerin 6-W-w in beiden Fähigkeiten weit unterdurchschnittliche Fähigkeiten.

Die für die nachfolgende Studie zur individuellen mathematischen Kreativität ausgewählten 18 Erstklässler*innen unterschieden sich nicht nur hinsichtlich ihres Fähigkeitsprofils, sondern auch in Bezug auf ihr Alter zu Beginn der Datenerhebung Mitte März 2019. Die nachfolgende Tabelle 8.4 zeigt eine Übersicht der ausgewählten Erstklässler*innen. Dabei wurde bei der Vergabe eines anonymisierten, neuen Vornamens neben dem Geschlecht auch der Namensursprung und der Anfangsbuchstabe des Namens der Erstklässler*innen berücksichtigt (z. B. wurde bei einem altdeutschen Vornamen auch weiterhin ein altdeutscher Vorname gewählt).

Tab. 8.4 Übersicht der 18 ausgewählten Erstklässler*innen für die qualitative Studie

Im methodischen Kapitel dieser Arbeit wurde das weitere Vorgehen in der qualitativen Datenerhebung und -auswertung ausführlich dargestellt (vgl. Abschn. 7.2 und 6.3). So wurden mit den 18 ausgewählten Erstklässler*innen jeweils zwei Unterrichtsepisoden durchgeführt. Diese waren zwar durch einen Unterrichtsleitfaden (vgl. Abschn. 7.2.2) und definierte Lernprompts (vgl. Abschn. 7.2.3) vorstrukturiert, dennoch konnte die Interaktionen zwischen den Schüler*innen und mir als Lehrende-Forschende in Anlehnung an die Teaching Experiment-Methodologie individuell gestaltet werden (vgl. Abschn. 6.1.3). In jeder dieser Lernsituationen bearbeiteten die Erstklässler*innen eine arithmetisch offene Aufgabe, wobei zunächst die Aufgabe A1 und vier Wochen später die Aufgabe A2 bearbeitet wurde. Die beiden arithmetisch offenen Aufgaben sollen noch einmal wiederholt werden (vgl. ausführlich Abschn. 7.2.2):

  1. A1

    Finde verschiedene AufgabenFootnote 1 mit der Zahl 4.

  2. A2

    Finde verschiedene Aufgaben mit dem Ergebnis 12.

Die nachfolgende Tabelle 8.5 listet für alle Erstklässler*innen die genauen Daten ihrer Unterrichtsepisoden im Jahr 2019 auf, wobei der Abstand von vier Wochen großteils eingehalten werden konnte. Dabei wurden alle Unterrichtsepisoden wie bereits beschrieben videografiert (vgl. Einführung zu Abschn. 7.2):

Tab. 8.5 Zeitliche Durchführung der Unterrichtsepisoden in 2019

4 Kapitelzusammenfassung

In diesem Kapitel wurden die Ergebnisse des quantitativen Sampling-Verfahrens der vorliegenden Mixed Methods-Studie zur individuellen mathematischen Kreativität von Erstklässler*innen beim Bearbeiten arithmetisch offener Aufgaben präsentiert. Dabei wurde das Ziel verfolgt, Erstklässler*innen auf Grundlage ihrer individuellen Voraussetzungen, d. h. ihrer unterrichtlichen, mathematischen und intellektuellen Fähigkeiten, für die Teilnahme an der qualitativen Studie dieser Arbeit auszuwählen (vgl. methodische Ausführung in Abschn. 7.1).

Dafür wurden mit Hilfe einer Clusteranalyse (vgl. Abschn. 7.1.2.2) die 78 teilnehmenden Erstklässler*innen auf Basis ihre Ergebnisse in zwei standardisierten Test zu den mathematischen Fähigkeiten (MBK 1 + ) und Grundintelligenz (CFT 1-R Teil 2) (vgl. Abschn. 8.1) in zueinander heterogene Gruppen aufgeteilt. Das Ergebnis dieser Datenanalyse mündete in der Bildung von vier Clustern, die verschiedene Fähigkeitsprofile der Erstklässler*innen darstellten (vgl. Abschn. 8.2):

  1. 1.

    überdurchschnittlich gleiche Fähigkeiten: überdurchschnittliche intellektuelle Fähigkeiten und im oberen Bereich durchschnittliche mathematische Basisfertigkeiten (Cluster 1 mit 20 Kindern)

  2. 2.

    durchschnittlich gleiche Fähigkeiten: durchschnittliche intellektuelle Fähigkeiten und durchschnittliche mathematische Basisfertigkeiten (Cluster 2 mit 34 Kindern)

  3. 3.

    unterdurchschnittlich gleiche Fähigkeiten: im unteren Bereich durchschnittliche intellektuelle Fähigkeiten und unterdurchschnittliche mathematische Basisfertigkeiten (Cluster 3 mit 11 Kindern)

  4. 4.

    durchschnittlich differente Fähigkeiten: im unteren Bereich durchschnittliche intellektuelle Fähigkeiten und im oberen Bereich durchschnittliche mathematische Basisfertigkeiten (Cluster 4 mit 10 Kindern)

Aus diesen Fähigkeitsprofilen wurden dann insgesamt 18 Erstklässler*innen kriteriengeleitet ausgewählt, die an den Unterrichtsepisoden zum Zeigen ihrer individuellen mathematischen Kreativität beim Bearbeiten arithmetisch offener Aufgaben teilgenommen haben. Dabei wurden aus jedem der vier Fähigkeitsprofile vier Lernenden (zwei Jungen und zwei Mädchen) ausgewählt, wobei zwei der Kinder mit dem Lehrwerk Denken & Rechnen und zwei mit Welt der Zahl in ihrem Mathematikunterricht arbeiteten. Zudem wurden zwei Erstklässlerinnen zu dem Subsample dazu genommen, die bezogen auf ihre intellektuellen und mathematischen Fähigkeiten jeweils die beiden Extremfälle (weit unter- und weit überdurchschnittliche Fähigkeiten) darstellten (vgl. Abschn. 8.3).