1 Einleitung

Auch in Deutschland ist nicht zu übersehen, dass die Digitalisierung im Bildungsbereich voranschreitet. Dies betrifft auch die Angebote von digitalen Lernmaterialien und -plattformen für den Unterricht. Noch sind analoge Schulbücher in den meisten Schulen das Leitmedium im Mathematikunterricht, auch wenn das Schulbuch „durch den medienkulturellen Wandel zunehmend seine kulturelle Bedeutung als dominantes schulisches Leitmedium verliert und in einem Mediengefüge diffundiert“ (Rezat 2020, S. 203; Böhme 2015, S. 414 f.).

Während erste digitale Schulbücher allenfalls punktuell Verwendung finden (Rezat 2020), halten digitale Lernplattformen mit systematisch entwickelten, thematisch geordneten und redaktionell betreuten Aufgabenangeboten verstärkt Einzug in den Mathematikunterricht (z. B. Bettermarks, Anton). So haben mehrere Bundesländer bereits vor der Corona-Pandemie Generallizenzverträge mit Betreiber:innen von solchen digitalen Lernplattformen abgeschlossen (z. B. Hamburg, Berlin; Schmid et al. 2021), die den Schulen einen kostenfreien Zugang mit direkter Einbindung in schuleigene Lern-Management-Systeme (z. B. Moodle) ermöglichen – ein Trend, der sich durch die Corona-Pandemie nochmals verstärkt hat (DeStatis 2020; Schmid et al. 2021).

Während digitale Mathematik-Lernplattformen in Deutschland bei ihrem Aufkommen in den 2000er Jahren (Gründung Bettermarks: 2008, Gründung Mathegym: 2007) vor allem als Ergänzungsmaterial zum Unterricht für häusliches Lernen und „Nachlernen“ konzipiert waren und oftmals auf Basiskompetenzen fokussierten, hat sich dies mittlerweile grundlegend gewandelt. So erheben viele Angebote den Anspruch, alle Anforderungsbereiche zu adressieren und drängen als Standardapplikation in den Regelunterricht. In diesem Kontext lässt sich auch beobachten, dass Lernplattformen zunehmend als Schulbuchalternative beworben, genutzt und thematisiert werden. So werben etwa die Plattformen Bettermarks und Anton mit dem Anspruch, ein Schulbuch zu sein (z. B. Werbeaussage auf der Homepage von Bettermarks: „Wie ein richtig gutes Mathebuch. Nur Besser“; Geßner (2022)) und dabei – als Vorteil im Vergleich zum traditionellen Schulbuch – automatische Auswertungen für Lehrkräfte und Feedback für Lernende bereitzustellen. Eine inhaltliche Nähe von Lernplattformen zum Schulbuch ergibt sich zudem daraus, dass Lernplattformen mittlerweile oftmals nicht nur Aufgaben, sondern auch inhaltliche Erklärungen (ähnlich den Merkkästen in Schulbüchern) anbieten. Auch von Seiten der Bildungsadministration und Hochschulen werden Lernplattformen z. B. etwa im Rahmen von Fortbildungen und Online-Informationsangeboten für Lehrkräfte zunehmend als Schulbuchersatz thematisiert.

Hiervon ausgehend stellt sich die Frage nach der Qualität von Lernplattformen und Schulbüchern. Dabei kommt es nicht darauf an, in welchem Umfang Lernplattformen und Schulbücher gegenwärtig tatsächlich schon ähnlich eingesetzt werden (wozu es auch keine Befunde gäbe) – ausschlaggebend ist vielmehr, dass Lernplattformen als Alternative zum Schulbuch in Erscheinung treten. Aus mathematikdidaktischer Sicht lässt sich die zunächst umfassend gestellte Frage nach der Qualität des jeweiligen Mediums spezifizieren, indem das Konstrukt der kognitiven Aktivierung herangezogen wird, da es in aktuellen Modellen (Lipowsky 2015) als eine von drei Basisdimensionen der Unterrichtsqualität betrachtet wird. Anders als die beiden anderen Basisdimensionen – (a) Klassenführung, Regelklarheit und Struktur sowie (b) unterstützendes Unterrichtsklima – geht es bei kognitiver Aktivierung um die fachliche Tiefenstruktur des Unterrichts, die insbesondere im Mathematikunterricht durch die eingesetzten Aufgaben geprägt wird (Lipowsky 2015). Für den deutschsprachigen Raum existieren jedoch bisher keine Studien zu Lernplattformen und kaum Studien zu Schulbüchern, die das Potenzial zur kognitiven Aktivierung von Aufgaben systematisch untersuchen.

Sowohl Schulbücher als auch Lernplattformen sind stark textlich-visuell geprägte Medien und die Art der visuellen Elemente sowie ihr Zusammenspiel mit dem Text bzw. den Aufgaben ist mitbestimmend für die Qualität der Anregung der gedanklichen Auseinandersetzung mit Mathematik. Während gedruckte Schulbücher auf geschriebenen Text und statische Bilder (sowie ggf. Serien aus statischen Bildern) beschränkt sind, sind bei Lernplattformen darüber hinaus auditive und interaktive dynamische (audio-)visuelle Elemente möglich. Unklar ist bislang, inwieweit diese erweiterten prinzipiellen Möglichkeiten der digitalen Plattformen auch tatsächlich genutzt werden.

Vor diesem Hintergrund sollen mit der vorliegenden Analyse die Medienarten Schulbuch und digitale Lernplattform hinsichtlich des Potenzials zur kognitiven Aktivierung und der Nutzung von Visualisierungen in den zwei Themenbereichen „Multiplikation von Brüchen“ und „Satz des Pythagoras“ miteinander verglichen werden. Die Ergebnisse dieser Studie ermöglichen damit sowohl eine Einschätzung des Ist-Zustands der beiden Medienarten als auch die Diskussion von möglichen Entwicklungslinien für die Zukunft.

2 Theoretischer Hintergrund

2.1 Schulbücher im Mathematikunterricht

Schulbüchern wird in der Schulbuchforschung seit vielen Jahrzehnten (z. B. Lenz et al. 2019; Olsher und Cooper 2021; Prediger et al. 2021) die Rolle als Leitmedium des Mathematikunterrichts zugeschrieben, wobei diese Zuschreibung („Leitmedium“) für die Sekundarstufe zum Teil eher auf gesättigter und geteilter Erfahrung als auf systematischen Erhebungen basiert. Für die Primarstufe konnten Mullis et al. (2012) diese Dominanz nachweisen. Dabei wird die Rolle von Schulbüchern sowohl bei der Unterrichtsentwicklung (Olsher und Cooper 2021; Prediger et al. 2021) als auch bei der Unterrichtsvorbereitung und -durchführung betont. In einem Modell curricularer Ebenen wurden Schulbücher bei TIMSS/III (Baumert et al. 2000) als „potenzielles Curriculum“ in einer vermittelnden Ebene zwischen Lehrplänen („intendiertes Curriculum“) und den im Unterricht realisierten Lerngelegenheiten („implementiertes Curriculum“) gesehen. Durch die fortschreitende Digitalisierung und die leichte Verfügbarkeit verschiedener (digitaler) Medienarten ist jedoch zu beobachten, dass das analoge Schulbuch seine Rolle als dominantes schulisches Leitmedium allmählich verliert (Rezat 2020, S. 203; Böhme 2015, S. 414).

Schulbücher werden von verschiedenen Lehrkräften häufig unterschiedlich genutzt (Olsher und Cooper 2021; Prediger et al. 2021). Insbesondere in Erarbeitungsphasen spielt dabei die unterrichtsmethodische Umsetzung eine Rolle. Als Leitmedium fungiert das Schulbuch unter anderem in Vertiefungs- und Übungsphasen (Lenz et al. 2019), in denen die Aufgaben des Schulbuchs die Lerntätigkeiten der Schüler:innen anregen (sollen). Aktuelle Untersuchungen von Schulbuchaufgaben hinsichtlich des Potenzials zur kognitiven Aktivierung (siehe Abschn. 2.3) existieren für deutsche Schulbücher der Sekundarstufe nicht.Footnote 1 Im Gegensatz dazu wurden Aufgaben in Abschlussarbeiten (Scheja 2017; Scheja et al. 2023) und der von Lehrkräften in Unterricht, Klassenarbeiten und Hausaufgaben eingesetzten Aufgaben bereits hinsichtlich des Potenzials zur kognitiven Aktivierung untersucht (Jordan et al. 2008; Adleff et al. 2023). Hierbei wurde jeweils ein niedriges Potenzial zur kognitiven Aktivierung festgestellt.

Bei Schulbüchern für arabische Schüler:innen der Klasse 8 in Israel hat Hadar (2017) u. a. festgestellt, dass die kognitiven Anforderungen von Aufgaben sich (a) zwischen verschiedenen Schulbüchern bedeutsam unterscheiden und (b) höhere kognitive Anforderungen der Aufgaben mit höheren Leistungen der Schüler:innen einhergehen. Die Wirksamkeit von Schulbüchern bzw. der in ihnen realisierten Gestaltungsprinzipien, insbesondere auf die Leistung der Schüler:innen und die in Tests gezeigten Bearbeitungsstrategien, wurde in Deutschland für die Primarstufe im Rahmen der IPN-Schulbuchstudie für den Bereich des Anfangsunterrichts in der Arithmetik festgestellt (Sievert et al. 2021). Es ist daher insgesamt plausibel, auch für den Bereich der Sekundarstufe in Deutschland von einer entsprechenden lern- und leistungsförderlichen Wirksamkeit von geeignet gestalteten Schulbüchern auszugehen.

2.2 Digitale Lernplattformen

Digitale Lernplattformen werden, wie eingangs dargestellt, zunehmend im Mathematikunterricht verwendet. Insgesamt ist davon auszugehen, dass die Bedeutung von Lernplattformen aufgrund der forcierten Digitalisierung, etwa im Rahmen der Strategie „Bildung in der digitalen Welt“ (KMK 2016), weiter zunehmen wird (SWK 2021; Schmid et al. 2021; Thurm und Graewert 2022).

Der Begriff „Lernplattform“ wird dabei in der Literatur sowie im Sprachgebrauch nicht einheitlich verwendet. Stangl (2021) definiert eine Lernplattform als „ein komplexes Softwaresystem, das der Bereitstellung von Lerninhalten und der Organisation von Lernvorgängen dient […] und eine Schnittstelle zwischen Bildungsanbieter und Lernenden darstellt“. In diesem Sinne werden somit Plattformen, welche an sich noch keine Inhalte bereitstellen, aber inhaltlich gefüllt werden können (z. B. durch Lehrkräfte), als Lernplattformen bezeichnet (z. B. Moodle, itslearning). Oftmals wird diese Art von Lernplattform auch als „Lern-Management-System“ (LMS) bezeichnet. Andererseits wird der Begriff „Lernplattform“ aber auch dann verwendet, wenn konkrete Inhalte (z. B. Aufgaben) von einem Anbieter bereitgestellt und redaktionell betreut werden (z. B. Anton, Bettermarks, Mathegym). Redaktionell betreute Mathematik-Lernplattformen können dabei unterschiedliche Schwerpunkte aufweisen. So fokussieren manche Lernplattformen vor allem die Vermittlung und das Aufarbeiten von Lerninhalten durch Videos (z. B. Sofatutor), während andere Lernplattformen die Bereitstellung und die automatische (Teil‑)Auswertung von Aufgaben in den Blick nehmen (z. B. Anton, Bettermarks, Mathegym). Im vorliegenden Beitrag werden Lernplattformen untersucht, die redaktionell betreute Inhalte anbieten und vor allem die Bereitstellung von Aufgaben fokussieren.

Ansätze zur Entwicklung und Beforschung digitaler Mathematik-Lernplattformen reichen zurück bis in die 1970er-Jahre und haben ihre Wurzeln in der programmierten Instruktion (Skinner 1958). Seit diesen ersten Konzepten hat sich das Feld weiterentwickelt und umfasst heute eine Vielzahl unterschiedlicher Ansätze mit vielfältigen Bezeichnungen wie „Cognitive Tutors“, „Computer-Based Training“, „Intelligent-Tutoring-Systems“ (ITS) oder „Intelligent Mathematics Software“ (Ma et al. 2014). Die Abgrenzung zwischen den unterschiedlichen Begriffen und Ansätzen ist dabei nicht trennscharf (Ma et al. 2014). Im weitesten Sinne versuchen jedoch alle Ansätze durch strukturiertes, technologiegestütztes Bereitstellen von Aufgaben, Feedback, Tipps und Informationen, kognitive, motivationale oder metakognitive Lernprozesse zu unterstützen. Als Vorteile werden dabei insbesondere die Möglichkeit des schnellen Feedbacks auf Basis der Benutzeraktionen, neue Aufgabenformate (z. B. über interaktive dynamische Visualisierungen) sowie eine automatische adaptive Lernprozesssteuerung (z. B. Aufgabenzuweisung) angeführt (Ma et al. 2014; Kerres et al. im Druck). Zudem erhofft man sich, dass automatisiert bereitgestellte Informationen, z. B. bzgl. Wissensbeständen und Fehlvorstellungen, den Lehrkräften helfen, ihren Unterricht im Sinne eines formativen Assessments an die individuellen Bedarfe der Lernenden anzupassen. Ebenso bieten Lernplattformen die Möglichkeit Gamification-Elemente einzubeziehen, die motivationale Aspekte fördern können. Auch besteht bei Lernplattformen die Möglichkeit durch eine Randomisierung von Zahlenwerten (vor allem bei Fertigkeitsaufgaben) eine Vielzahl von „strukturgleichen“ Aufgaben zu generieren. Bis heute ist die Befundlage zur Lernwirksamkeit entsprechender Angebote jedoch sehr heterogen (z. B. Kulik und Fletcher 2016; Kerres et al. im Druck; Thurm und Graewert 2022).

Die Studienlage zu Mathematik-Lernplattformen in Deutschland ist bisher äußerst dünn. So finden sich etwa zu den populären deutschen Mathematik-Lernplattformen Anton, Bettermarks und Mathegym nur sehr wenige Beiträge mit peer-review in wissenschaftlichen Fachzeitschriften (Thurm und Graewert 2022). Insbesondere fehlen wissenschaftliche Untersuchungen zur Qualität entsprechender Angebote aus mathematikdidaktischer Perspektive – etwa hinsichtlich der dargebotenen Aufgaben. Veröffentlichungen zur Qualität bzw. zu Eigenschaften von Lernplattformen haben gegenwärtig stark mediendidaktische (Oberflächen)Merkmale im Blick (z. B. Schmid et al. 2021; Holmes et al. 2018; Kerres et al. im Druck; Weich et al. 2021), ohne vertieft zu untersuchen, welches Potenzial für ein Anregen fachlicher Denkhandlungen vorhanden ist (Thurm und Graewert 2022). Dies ist vor allem daher kritisch zu sehen, da für Lernplattformen, anders als für Schulbücher in vielen Bundesländern, bisher keine institutionellen Qualitätssicherungsverfahren in der Bildungsadministration etabliert sind (SWK 2021).

2.3 Kognitive Aktivierung

Kognitive Aktivierung ist eine von drei sogenannten Basisdimensionen guten Unterrichts (Praetorius et al. 2018).

Doch was genau verbirgt sich hinter kognitiver Aktivierung? Praetorius et al. (2018) haben in einem Review Operationalisierungen zu den drei Basisdimensionen und damit auch zur kognitiven Aktivierung zusammengefasst. Kognitiv aktivierende Aufgaben sind demnach solche, die an das Vorwissen anknüpfen, ein Denken auf hohem Niveau durch herausfordernde Aufgabenstellungen (z. B. Einfordern von Begründungen, Stimulieren kognitiver Konflikte) anregen sowie eine Reflexion der Denkprozesse und Metakognition initiieren. Im Kern geht es demnach um das Anregen gehaltvoller und komplexer Denkhandlungen, so dass kognitive Aktivierung in Abgrenzung zu repetitiven Aufgaben, kleinschrittigen Fragen und klaren Vorgaben zu Lösungsweg und Dokumentation dargestellt wird (Leuders und Holzäpfel 2011).

Als ein zentraler Indikator für kognitive Aktivierung lassen sich die im Unterricht eingesetzten Aufgaben benennen (Jordan et al. 2008). So stellt die Bearbeitung von Aufgaben die wichtigste Schüler:innenaktivität im Mathematikunterricht dar (Bromme et al. 1990). Insbesondere ist die „Aktivität der Schüler:innen eng daran gekoppelt, ob überhaupt und wenn ja, in welcher Abfolge Aufgaben mit adäquatem kognitivem Potenzial als Gelegenheit zum verständnisvollen Lernen von Mathematik in den Unterricht eingebracht werden“ (Jordan et al. 2008, S. 85). In der TIMS-Studie 1995 (Beaton et al. 1996) zeigte sich, dass in Deutschland eher routinemäßige Aufgaben mit festgelegten Lösungsmustern eingesetzt wurden, während in anderen Ländern der Fokus eher auf kognitiv aktivierenden und anspruchsvollen Aufgabenstellungen lag. Seitdem bemüht man sich in Deutschland, die kognitive Aktivierung der Lernenden durch entsprechende curriculare Vorgaben und exemplarische Aufgabenstellungen zu stärken. Kognitive Aktivierung stand auch im Zentrum der COACTIV-Studie (Jordan et al. 2008; Kunter et al. 2011), in der Aufgaben aus Klassenarbeiten und Hausaufgaben hinsichtlich ihres Potenzials zur kognitiven Aktivierung untersucht wurden. Dazu wurde das Potenzial zur kognitiven Aktivierung der Aufgaben mit Hilfe eines operationalisierten Klassifikationsschemas erfasst (Jordan et al. 2006). Als theoretisches Modell des Aufgabenlösens wurde dabei der Kreislauf mathematischen Modellierens zugrunde gelegt, wobei dieser sowohl auf außer- als auch auf innermathematische Situationen angewendet wurde. Im Klassifikationsschema von COACTIV werden Niveaustufen zu den jeweils angeregten prozessbezogenen Kompetenzen (z. B. inner- und außermathematisches Modellieren, Argumentieren) und den Typen von Aufgaben (z. B. technische Aufgaben, rechnerische Aufgaben, begriffliche Aufgaben) operationalisiert (Jordan et al. 2006). Damit wurde eine wichtige Grundlage geschaffen, wie im Detail das Potenzial zur kognitiven Aktivierung von Mathematikaufgaben gefasst werden kann.

Allerdings ist zu beachten, dass das Potenzial zur kognitiven Aktivierung nicht mit der kognitiven Qualität der tatsächlichen Aufgabenbearbeitung übereinstimmen muss (Leuders und Holzäpfel 2011). Vor allem kann die tatsächliche kognitive Aktivierung auch mit der unterrichtsmethodischen Realisation der Aufgaben variieren, welche sich für Schulbücher und Lernplattformen gegebenenfalls unterscheidet. Dennoch bleibt hervorzuheben, dass das Potenzial zur kognitiven Aktivierung der Aufgaben als eine zentrale Voraussetzung von kognitiv aktivierendem Unterricht angesehen werden kann.

2.4 Visualisierungen

Als zweite Perspektive neben der kognitiven Aktivierung werden in der vorliegenden Analyse die Visualisierungen betrachtet, die bei Aufgaben in Schulbüchern und Lernplattformen dargeboten werden.

Es besteht weitgehend Konsens in der Forschung, dass der Einbezug von vielfältigen Darstellungsarten in den Lehr-Lern-Prozess für den Wissenserwerb und die Ausbildung von fachspezifischen Vorstellungen von Schüler:innen bedeutsam ist (z. B. Ainsworth 2006; Heinze et al. 2009). Beim Lehren und Lernen von Mathematik geht es darum, verschiedene Darstellungen zu interpretieren, zu verwenden sowie eigenständig zu konstruieren und so verschiedene Darstellungsarten zu vernetzen (Arcavi 2003).

Im schulischen Kontext wird unter Visualisieren meist der Wechsel zu bzw. das Erzeugen von ikonischen Darstellungen, der „Visualisierung“, gefasst (Gretsch und Holzäpfel 2016). Schnotz hebt hervor, dass die Bedeutung der Visualisierung auf „ihrer (physikalischen oder strukturellen) Ähnlichkeit zum dargestellten Objekt“ (Schnotz 2005, S. 52) gründet. Visualisierungen erfüllen im Lehr-Lernkontext verschiedene Funktionen: „Sie dienen der Veranschaulichung, sind Teil von Aufgabenstellungen, enthalten Zusatzinformationen, dienen der Aktivierung vorherigen Wissens und der Einführung neuen Wissens, erlauben Vergleiche und die Demonstrierung von Verhältnissen, erklären Prozesse und Probleme und vermitteln Werte“ (Wafi und Wirtz 2015, S. 120).

Visualisierungen zu Aufgabenstellungen erfüllen in erster Linie die Funktion der Lernhilfe. Die diversen Möglichkeiten, Lehrinhalte zu visualisieren, lassen sich dabei in drei grundlegende Typen unterscheiden: statische Visualisierungen, dynamische Visualisierungen und interaktive Visualisierungen (z. B. Bodemer 2004; Preuß und Kauffeld 2019). Statische Visualisierungen haben keinen zeitlichen Ablauf und umfassen realistische Bilder (bildliche Darstellungen wie Fotos, Skizzen, Comics), Analogiebilder zum eigentlichen Gemeinten (z. B. Herz für die Liebe) und logische Bilder (z. B. analytische beschreibende Darstellungen wie Baumstrukturen, semantische Netze) (Schnotz 2010). In digitalen Umgebungen (wie etwa auf Lernplattformen) besteht die Möglichkeit auch dynamische und interaktive Visualisierungen zu nutzen (Mayer 2009). Dynamische Visualisierungen umfassen alle Varianten, die aus mehreren Bildern zusammengesetzt sind und einen zeitlichen Ablauf haben wie Videos oder Animationen. Interaktive Visualisierungen erlauben während ihres zeitlichen Ablaufs Möglichkeiten der Einflussnahme durch die Rezipierenden. Gerade solche dynamischen und interaktiven Visualisierungen können in besonderem Maße die zum Verstehen wichtige Darstellungsvernetzung unterstützen, weil wechselseitige Abhängigkeiten auf vielfältige Weise untersucht werden können (Schmidt-Thieme und Weigand 2015).

3 Forschungsfragen

Ausgehend von dem skizzierten Forschungsstand lässt sich festhalten, dass bisher kaum empirisch gesicherte Erkenntnisse zum Potenzial zur kognitiven Aktivierung und von Visualisierungen bei Aufgaben aus Lernplattformen und Schulbüchern in Deutschland vorliegen. Dementsprechend fokussiert der vorliegende Beitrag die folgenden drei Forschungsfragen:

F1

Inwiefern unterscheiden sich Übungsaufgaben aus Mathematik-Lernplattformen und -Schulbüchern hinsichtlich des Potenzials zur kognitiven Aktivierung?

F2

Inwiefern unterscheiden sich Übungsaufgaben aus Mathematik-Lernplattformen und -Schulbüchern hinsichtlich der integrierten Visualisierungen?

F3

Inwieweit finden sich themenspezifische Unterschiede hinsichtlich des Potenzials zur kognitiven Aktivierung und der integrierten Visualisierungen bei Mathematik-Lernplattformen und -Schulbüchern?

Aufgrund fehlender Vorarbeiten lassen sich nur begrenzt begründete Hypothesen für die Forschungsfragen formulieren, so dass die Arbeit einen explorativen Charakter hat. Für Forschungsfrage 2 lässt sich jedoch (schon aus theoretischen Gründen) vermuten, dass Lernplattformen durch die technischen Möglichkeiten auch dynamische bzw. dynamisch-interaktive Visualisierungen in die Aufgabenstellungen mit einbeziehen und sich diesbezüglich von Schulbüchern abheben.

4 Methode

Um die Forschungsfragen zu beantworten, wurden Aufgaben aus zwei Inhaltsbereichen der Sekundarstufe I von jeweils drei verbreiteten Schulbüchern und Lernplattformen hinsichtlich des Potenzials zur kognitiven Aktivierung und der verwendeten Visualisierungen beurteilt.

4.1 Auswahl der Lernplattformen und Schulbüchern

Die Auswahl der Schulbücher konzentrierte sich auf für das Gymnasium (in Nordrhein-Westfalen) zugelassene Werke. Sie orientierte sich zudem daran, dass unterschiedliche Verlage berücksichtigt werden sollten und gleichzeitig eine hohe Verbreitung der Werke vorliegt. Gegenwärtig sind konkrete Zahlen zum Marktanteil unterschiedlicher Mathematikschulbücher leider nicht zugänglich, so dass eine Orientierung an tatsächlichen Absatzzahlen bei der Auswahl der Schulbücher nicht möglich war. Gegenwärtig existieren in Deutschland drei große Schulbuchverlage (Klett, Cornelsen, Westermann), die zusammen ca. 90 % Marktanteil am Schulbuchmarkt besitzen. Eine Anfrage bei den drei Verlagen ergab, dass die Reihen „Lambacher Schweizer“ (Klett Verlag); „Elemente der Mathematik“ (Westermann Verlag) und „Fundamente der Mathematik“ (Cornelsen Verlag) die jeweils meistverkauften gymnasialen Mathematik-Schulbuchreihen sind. Dementsprechend wurden diese Werke in die Analyse einbezogen, wodurch sich eine Repräsentativität zumindest plausibilisieren lässt. Konkret wurden die folgenden Werke berücksichtigt:

  • „Lambacher Schweizer“ (Klett Verlag, Ausgabe Nordrhein-Westfalen)

    6. Schuljahr: Erscheinungsdatum 03.09.2019, ISBN: 978-3127338614

    9. Schuljahr: Erscheinungsdatum 08.08.2022, ISBN: 978-3127338911

  • „Elemente der Mathematik“ (Westermann Verlag, Ausgabe Nordrhein-Westfalen)

    6. Schuljahr: Erscheinungsdatum: 01.07.2019, ISBN: 978-3141012248

    9. Schuljahr: Erscheinungsdatum: 17.08.2022, ISBN: 978-3141012514

  • „Fundamente der Mathematik“ (Cornelsen Verlag, Ausgabe Nordrhein-Westfalen)

    6. Schuljahr: Erscheinungsdatum: 29.07.2019, ISBN: 978-3060402687

    9. Schuljahr: Erscheinungsdatum: 18.10.2021, ISBN: 978-3060401864

Für die Auswahl der Lernplattformen wurden verschiedene Kriterien herangezogen. Aufgrund fehlender Information zu Nutzerzahlen und Marktanteilen war hier – ähnlich wie bei Schulbüchern – eine Auswahl der „populärsten“ Lernplattformen auf Basis konkreter Nutzungszahlen nicht möglich. Es wurde daher eine Sichtung des Marktes unter Rückgriff auf Publikationen (z. B. Schmid et al. 2021; Holmes et al. 2018) und Befragung von ausgewählten Lehrkräften durchgeführt. Hierauf aufbauend wurden die Lernplattformen identifiziert, welche darauf fokussieren redaktionell abgesicherte Aufgaben bereitzustellen, eine Zuweisung von Aufgaben an einzelne Lernende ermöglichen, den Bearbeitungserfolg zurückmelden sowie die wesentlichen Inhalte im Fach Mathematik für die Sekundarstufe I abdecken. Diese Kriterien erfüllten die Anbieter Anton (www.anton.app/de/), Bettermarks (www.bettermarks.de) und Mathegym (www.mathegym.de). Die grundlegende Funktionsweise ist bei allen drei Plattformen ähnlich. Lehrkräfte können Aufgaben an Lernende zuweisen und erhalten nach Bearbeitung Zugang zu übersichtlich aufbereiteten Lösungsquoten. Während der Aufgabenbearbeitung können Lernende sich oftmals Hilfen zu den Aufgaben anzeigen lassen. Neben einer Rückmeldung zum Bearbeitungserfolg einer Aufgabe (meist in der Form richtig/falsch) erhalten die Lernenden teilweise auch adaptives Feedback (z. B. „Subtrahiere nicht die Nenner“). Darüber hinaus gibt es weitere Funktionen, die in diesem Beitrag nicht gewürdigt werden können. Insbesondere nutzen Lernplattformen oftmals auch potenziell motivationsförderliche Aspekte (z. B. Gamification-Elemente), die in diesem Beitrag jedoch keine Rolle spielen.

4.2 Festlegung der Inhaltsbereiche und Analyseeinheiten

Bezüglich der Inhaltsbereiche wurden die Themenbereiche „Multiplikation von Brüchen“ sowie „Satz des Pythagoras“ ausgewählt. Diese Themen wurden als Exempel ausgewählt, da sie einerseits Standardthemen aus dem Unterricht der Sekundarstufe I repräsentieren sowie zwei verschiedene Leitideen (Leitidee Zahl und Leitidee Raum und Form; KMK 2022) abdecken.

Um die unterschiedlichen Medien bzgl. ihres Potenzials zur kognitiven Aktivierung und der verwendeten Visualisierungen zu vergleichen, sollten auch die Ziele und Intentionen dieser Angebote vergleichbar sein. Daher fokussieren wir uns in der vorliegenden Analyse auf Aufgaben, welche für gleiche didaktische Situationen eingesetzt werden können. Hierzu orientieren wir uns an den von Rezat (2009) identifizierten Strukturelementen auf Mikroebene und fokussieren dabei auf diejenigen Aufgaben die zum Üben/Vertiefen genutzt werden können (Strukturelemente: „Weiterführende Aufgaben“, „Übungsaufgaben“, „Aufgaben zur Wiederholung“ und „Testaufgaben“).

Die Festlegung der Analyseeinheiten erfolgte in Anlehnung an COACTIV (Jordan et al. 2008). So wurden etwa Textaufgaben, in denen mehrere Teilinstruktionen enthalten bzw. mehrere Arbeitsschritte zu bewältigen sind, als eine Aufgabe erfasst. In unklaren Fällen wurde die Festlegung der Analyseeinheiten in der Autor:innengruppe konsensual entschieden. Im Folgenden wird der Begriff „Aufgabe“ verwendet, um eine Analyseeinheit zu bezeichnen.

4.3 Kategoriensystem & Rating

Im Folgenden wird das Kategoriensystem zur Erfassung des Potenzials zur kognitiven Aktivierung der Aufgaben sowie der einbezogenen Visualisierungen erläutert.

4.3.1 Kategorien zur Erfassung des Potenzials zur kognitiven Aktivierung

Aus dem COACTIV-Projekt (Jordan et al. 2006, 2008) steht ein viel rezipiertes und mathematik-didaktisch etabliertes Kategoriensystem zur Verfügung, welches den (potenziellen) Beitrag von Aufgaben zur kognitiven Aktivierung erfasst (siehe Abschn. 2.3). Als zentrale Kategorien aus dem COACTIV-Schema (Jordan et al. 2006; Scheja 2017) wurden die Kategorien „C1 – Typ mathematischen Arbeitens“, „C2 – Gebrauch mathematischer Darstellungen“, „C3 – Sprachliche Komplexität“, „C4 – Außermathematisches Modellieren“, „C5 – Innermathematisches Modellieren“, „C6 – Mathematisches Argumentieren“ übernommen (s. Tab. 2). Exemplarisch sind in Tab. 1 Beispiele für die unterschiedlichen Ratingstufen der Kategorie C1 (Typ mathematischen Arbeitens) dargestellt. In Anlehnung an Drüke-Noe (2014) – die herausstellte, dass das COACTIV-Schema den kognitiven Anspruch an das Umgehen mit Kalkülen nicht erfasst – wurde das COACTIV-Klassifikationsschema um die Kategorie „Technisches Arbeiten“ (TA) erweitert. Dabei werden die zur Lösung einer Fertigkeitsaufgabe benötigten Schritte erfasst. Hierdurch wird etwa abgebildet, dass die Berechnung der Hypotenuse im rechtwinkligen Dreieck weniger komplex ist als die Kathetenberechnung, wenn jeweils die beiden anderen Seitenlängen gegeben sind.

Tab. 1 Beispiele für die unterschiedlichen Ratingstufen der Kategorie C1 (Typ mathematischen Arbeitens)
Tab. 2 Übersicht über das Kategoriensystem

4.3.2 Kategorien zur Klassifizierung der genutzten Visualisierungen

Zur Klassifizierung der in den Aufgaben gegebenen Visualisierung wurden ausgehend von den in Abschn. 2.4 dargelegten theoretischen Überlegungen zwei neue Kategorien entwickelt, welche im Folgenden dargestellt werden:

Kategorie „Art der Visualisierung“

In Anlehnung an Schnotz (2010) wurde mit Blick auf mögliche (Zusatz‑)Informationen, die den mathematischen Sachverhalt anbahnen oder komplett visualisieren (vgl. Abschn. 2.4.), die Kategorie „Art der Visualisierung“ konzeptualisiert. In dieser Kategorie werden Visualisierungen entweder als „kontextuell visualisierend“ (KV), „anbahnend mathematisch visualisierend“ (AV) oder „mathematisch visualisierend“ (MV) eingruppiert. Eine Visualisierung ist „kontextuell visualisierend“ (KV), wenn ausschließlich ein gegebener Realkontext illustriert wird (vgl. Abb. 1a). Als „anbahnend visualisierend“ (AV) werden Visualisierungen klassifiziert, die einzelne für die Lösung relevante (Zusatz‑)Informationen enthalten (vgl. Abb. 1b). Visualisierungen sind schließlich „mathematisch visualisierend“ (MV), wenn durch die Visualisierung bereits eine vollständige Mathematisierung vorgenommen wird (vgl. Abb. 1c). Die drei Arten von Visualisierungen können den verschiedenen Schritten des inner- und außermathematischen Modellierungskreislaufs, der die theoretische Grundlage von COACTIV darstellt, zugeordnet werden. So lassen sich kontextuelle Visualisierungen der Ausgangssituation (Realkontext), anbahnende mathematische Visualisierungen tendenziell dem Realmodell und Mathematische Visualisierungen dem mathematischen Modell zuordnen. Anbahnende und mathematische Visualisierungen können dabei sowohl bei außermathematischen als auch bei innermathematischen Aufgaben vorkommen. Von den Schüler:innen werden von Stufe zu Stufe (KV – AV – MV) weniger Eigenleistungen im Sinne des Modellierens eingefordert. In diesem Sinne ist im Beispiel für MV (Abb. 1c) das mathematische Modell in das Bild der Situation gezeichnet worden, da die Schülerinnen so keine eigenständigen Bezüge zwischen dem Modell und dem Bild der Situation herstellen müssen.

Abb. 1
figure 1

Beispiele für kontextuelle, anbahnende und mathematische Visualisierungen (bei einer Aufgabe zur Bestimmung der maximalen Rettungshöhe bei gegebener Leiterlänge (20 m) und gegebenen Fahrzeugmaßen (Länge: 6,5 m, Höhe: 3,2 m)). a Kontextuell visualisierend, b Anbahnend mathematisch visualisierend, c Mathematisch visualisierend

Kategorie „Dynamik“

Schließlich wird über die Kategorie „Dynamik“ die Dimension der Dynamisierung erfasst. Hierbei wurde auf die gängige Unterscheidung in statisch, dynamisch und interaktiv zurückgegriffen (z. B. Bodemer 2004; Preuß und Kauffeld 2019; vgl. 2.4.). Es wurde betrachtet, ob eine Visualisierung statisch (Ausprägung S = statisch) ist, sich dynamisch verändern lässt, ohne interaktiv zu sein (Ausprägung D = dynamisch, z. B. Animation, Video), oder interaktiv ist (Ausprägung I = interaktiv), d. h., dass Veränderungen der Visualisierung abhängig von der Aktion des Nutzenden möglich sind. Die letzten beiden Kategorien können aufgrund der statischen Natur von gedruckten Schulbüchern nur bei Lernplattformen vergeben werden. Eine weitere Ausdifferenzierung des Grades der Interaktivität wäre zwar möglich (z. B. Schulmeister 2002) für die vorliegende Studie jedoch nicht relevant, da überhaupt nur drei interaktive Visualisierungen gefunden wurden (siehe Ergebnisteil Abschn. 5.2.).

4.4 (Weiter‑)Entwicklung des Kodiermanuals und Durchführung des Ratings

Um das Rating der Aufgaben reliabel zu gestalten, wurde ein Kodiermanual erstellt, in dem die Ausprägung aller Kategorien operationalisiert wird. Für die Kategorien C1)–C6), die sich auf das Potenzial zur kognitiven Aktivierung der Aufgaben beziehen, diente dabei das COACTIV-Manual als Ausgangsbasis. Das COACTIV-Manual wurde in mehreren Rating- und anschließenden Diskussionszyklen an ausgewählten Aufgaben von Schulbüchern und Lernplattformen der Inhaltsbereiche „Multiplikation von Brüchen“ und „Satz des Pythagoras“ sukzessive weiter ausgeschärft und konkretisiert.

In der Regel finden sich sowohl in Schulbüchern und auch auf Lernplattformen Aufgaben (vor allem Fertigkeitsaufgaben), die sich ausschließlich durch eine Variation der verwendeten Zahlenwerte unterscheiden (Bsp.: \(\frac{1}{3}\cdot \frac{1}{3}\), \(\frac{1}{4}\cdot \frac{1}{4}\)). Für solche „strukturgleichen“ Aufgaben ergeben sich keine Unterschiede in den Ratings in den KategorienFootnote 2 aus Tab. 2. Für „strukturgleiche“ Aufgaben wurde dementsprechend jeweils nur ein Repräsentant geratet. Tab. 3 zeigt den Anteil der strukturverschiedenen Aufgaben.

Tab. 3 Anzahl der Aufgaben | Anzahl der strukturverschiedenen Aufgaben (prozentualer Anteil der strukturverschiedenen Aufgaben)

Von den insgesamt 633 strukturverschiedenen Aufgaben wurde 427 (67 %) unabhängig von drei Rater:innen geratet. Weitere 66 Aufgaben (10 %) wurden von zwei Ratern geratet. Zur Bestimmung der Interrater-Reliabilität wurde Gwet’s AC1/2 (Gwet 2010) bestimmtFootnote 3. Werte zwischen 0,6 und 0,8 deuten auf eine erhebliche Übereinstimmung und Werte > 0,80 auf eine ausgezeichnete Übereinstimmung hin. Aus Tab. 4 lässt sich entnehmen, dass für die Kategorien C1)–C6) sowie V1) und V2) eine ausgezeichnete Übereinstimmung vorliegt. Für die Kategorie TA ergibt sich eine erhebliche Übereinstimmung.

Tab. 4 Interrater-Reliabilität (Gwet’s AC1/2) für die verschiedenen Ratingkategorien

Trotz substanzieller Interrater-Übereinstimmung verblieben wenige Fälle, bei denen die Ratings der Rater:innen voneinander abwichen. Dabei wurden bei Aufgaben mit zwei Ratings Unterschiede konsensual entschieden. Bei Aufgaben mit drei Ratings wurde bei Übereinstimmung von zwei Ratings und einer Abweichung zum dritten Rating von nur einer Stufe der Mehrheitsentscheid angewandt (z. B. Ratings 1,1,2 ⇒ finales Rating 1.). In anderen Fällen wurde konsensual entschieden.

4.5 Datenauswertung

Für die Ergebnisdarstellung wird die Anzahl der Aufgaben pro Ratingkategorie dargestellt. Aufgrund der deutlich höheren Anzahl an Aufgaben in Schulbüchern im Vergleich zu Aufgaben auf Lernplattformen wird zusätzlich auch eine relative Betrachtung durchgeführt. Dazu wird der Anteil an Aufgaben in einer Ratingkategorie bezogen auf die Gesamtanzahl an Aufgaben im entsprechenden Medium betrachtet.

Beim Vergleich zwischen Schulbüchern und Lernplattformen wird auf Signifikanztests verzichtet. Signifikanztests sind nur dann sinnvoll, wenn die zugrunde liegende Datenmenge eine Stichprobe darstellt, d. h., dass die Daten „durch einen Prozess generiert worden sind, der als zufällige Auswahl einzelner Elemente aus einer weit größeren Anzahl von Elementen, der Grundgesamtheit, modelliert werden kann“ (Behnke 2005, S. 2). In der vorliegenden Studie ist dies jedoch nicht der Fall. Da alle Aufgaben bzgl. der beiden Themenbereiche aus den drei Lernplattformen und Schulbüchern untersucht wurden, handelt es sich vielmehr um eine Vollerhebung der Aufgaben in diesen Inhaltsbereichen aus den einbezogenen Medien. Auch kann die Menge der in dieser Studie untersuchten Aufgaben nicht sinnvoll als zufällige Auswahl aus einer gegebenenfalls fiktiven Grundgesamtheit aller Aufgaben von allen Lernplattformen oder Schulbüchern in Deutschland modelliert werden.

Im Rahmen der Datenauswertung ist die Frage nach Referenzgrößen für erwartbare bzw. „angemessene“ Quantitäten für die Aufgabenmerkmale in den Lernmitteln relevant. Hier lassen sich keine konkreten Zahlen nennen, jedoch kann wie in der COACTIV-Studie (Jordan et al. 2008) und anderen Studien, die das COACTIV-Schema nutzen (z. B. Scheja 2017) das weitgehende Fehlen von Aufgaben der mittleren und vor allem auch hohen Ausprägung als deutliche Diskrepanz zu den Anforderungen der Bildungsstandards und der in der Mathematikdidaktik konsensualen Forderung nach kognitiver Aktivierung interpretiert werden.

5 Ergebnisse

5.1 Ergebnisse bzgl. des Potenzials zur kognitiven Aktivierung

5.1.1 Absolute Betrachtung

Tab. 5 zeigt die Ergebnisse des Ratings der Aufgaben für die Kategorien C1)–C6) und TA). Besonders auffällig ist zunächst, dass Schulbücher deutlich mehr Aufgaben anbieten. Während sich bei Schulbüchern insgesamt 811 Aufgaben finden, werden auf den Lernplattformen insgesamt 224 Aufgaben dargeboten. Insgesamt zeigt sich zudem, dass Schulbücher in allen Kategorien und in allen Ratingstufen durchgängig mehr Aufgaben anbieten. Insbesondere realisieren Schulbücher in allen Kategorien deutlich mehr Aufgaben mit einem höheren Potenzial zur kognitiven Aktivierung.

Tab. 5 Übersicht der Ratings für Kategorien C1)–C6) und TA

Es zeigt sich weiterhin, dass in bestimmten Kategorien höhere Ratingstufen überhaupt nicht erreicht werden. So gibt es in der Kategorie C2 (Gebrauch mathematischer Darstellungen) weder bei Schulbüchern noch bei Lernplattformen Aufgaben, die die höheren Ratingstufen 3 (Wechsel zwischen Darstellungen) oder 4 (Beurteilen/Reflektieren von Darstellungen) erreichen. Für Lernplattformen zeigt sich sogar, dass lediglich für Kategorie C1 (Typ mathematischen Arbeitens) Aufgaben auf der höchsten Ratingstufe erreicht werden. Für die Kategorie C6 (mathematisch argumentieren) wird bei Lernplattformen nicht einmal die dritthöchste Ratingstufe erreicht. Im Gegensatz dazu realisieren Schulbücher in den Kategorien C1, C4, C5, C6 auch Aufgaben auf höheren Ratingstufen (Rating 3 oder 4) (wenn auch nicht immer in beiden Themenbereichen).

Bei der absoluten Betrachtung ist allerdings zu beachten, dass bei Lernplattformen teilweise die Möglichkeit besteht, eine Aufgabe oder eine Aufgabenserie erneut zu bearbeiten, wobei durch eine Randomisierung der Zahlenwerte „neue“ strukturgleiche Aufgaben entstehen. Dies ist oftmals vor allem bei technischen Aufgaben realisiert. So gesehen könnte argumentiert werden, dass Lernplattformen potenziell unendlich viele technische Aufgaben anbieten. Allerdings ist zu beachten, dass bei einer Randomisierung der Zahlwerte nur strukturgleiche Aufgaben entstehen und Schulbücher somit weiterhin mehr strukturverschiedene Aufgaben anbieten. Da eine Randomisierung der Zahlenwerte zudem auch nicht das Potenzial der Aufgabe zur kognitiven Aktivierung ändert, bleibt auch der zuvor beschriebene Befund, dass Lernplattformen in bestimmten Kategorien höhere Ratingstufen überhaupt nicht erreichen, bestehen.

5.1.2 Relative Betrachtung

Neben der absoluten Betrachtung wird im Folgenden der Anteil der Aufgaben in Relation zur Gesamtanzahl der auf einer Lernplattform oder in einem Schulbuch verfügbaren Aufgaben betrachtet. Da in allen Kategorien höhere Ratingstufen selten vorkommen, wird im Folgenden eine Dichotomisierung vorgenommen und nur der Anteil der Aufgaben mit erhöhtem Rating (Rating ≥ 1) betrachtet. Abb. 2 zeigt (über beide Themengebiete hinweg) für jede der sechs Kategorien den Anteil der Aufgaben, welche ein erhöhtes Rating (≥ 1) erhalten haben. Ebenso ist pro Ratingkategorie jeweils der Anteil an Aufgaben mit erhöhtem Rating (rot) für Lernplattformen und Schulbücher eingezeichnet.

Abb. 2
figure 2

Anteil der Aufgaben mit erhöhtem Potenzial zur kognitiven Aktivierung (Rating ≥ 1) in der entsprechenden Kategorie. Die rote Linie repräsentiert den Anteil an Aufgaben mit erhöhtem Potenzial zur kognitiven Aktivierung (Rating ≥ 1) für Lernplattformen bzw. Schulbücher

Bezüglich Kategorie C1 (Typ mathematischen Arbeitens) liegt der Anteil an Aufgaben mit erhöhtem Potenzial zur kognitiven Aktivierung (Rating ≥ 1) bei allen Schulbüchern über dem Anteil aller Lernplattformen.

Bezüglich Kategorie C2 (Gebrauch mathematischer Darstellungen) zeigt sich hingegen ein anderes Bild. Hier liegt der Anteil an Aufgaben, die einen Gebrauch mathematischer Darstellungen einfordern (Rating ≥ 1), bei Lernplattformen im Durchschnitt über dem der Schulbücher. Allerdings ist zu beachten, dass nicht jede Lernplattform einen größeren Anteil an Aufgaben, die einen Gebrauch mathematischer Darstellungen einfordern (Rating ≥ 1) realisiert als jedes Schulbuch. So erfordern bei Lambacher Schweizer 44,17 % der Aufgaben einen Gebrauch mathematischer Darstellungen, während der Anteil bei Mathegym und Bettermarks bei unter 39 % liegt.

Bezüglich Kategorie C3 (Sprachlogische Komplexität) ist der Anteil der Aufgaben mit erhöhter sprachlogischer Komplexität (Rating ≥ 1) im Durchschnitt bei Lernplattformen auf einem ähnlichen Niveau wie bei Schulbüchern. Auffällig ist hier der besonders geringe Anteil an Aufgaben mit erhöhter sprachlogischer Komplexität bei Mathegym.

Bezüglich Kategorie C4 (Außermathematisches Modellieren) liegt der Anteil der Aufgaben, die außermathematische Modellierungsprozesse einfordern (Rating ≥ 1) bei Schulbüchern im Durchschnitt über dem von Lernplattformen. Auffällig ist hier, dass die Lernplattform Anton über beide Themengebiete überhaupt keine außermathematischen Modellierungsaufgaben realisiert. Auch für diese Kategorie ist wieder zu beachten, dass nicht jedes Schulbuch einen größeren Anteil an Aufgaben mit außermathematischer Modellierungsanforderung realisiert als jede Lernplattform.

Bezüglich Kategorie C5 (Innermathematisches Modellieren) liegt der Anteil der Aufgaben mit innermathematischer Modellierungsanforderung (Rating ≥ 1) bei Schulbüchern im Durchschnitt deutlich über dem von Lernplattformen. Hier zeigt sich zudem, dass jedes Schulbuch einen größeren Anteil an Aufgaben mit innermathematischer Modellierungsanforderung realisiert als jede Lernplattform.

Bezüglich Kategorie C6 (Mathematisches Argumentieren) gibt es nur eine Lernplattform (Bettermarks), die überhaupt Aufgaben bereitstellt, in denen mathematisches Argumentieren eingefordert wird während alle Schulbücher Aufgaben realisieren, die mathematisches Argumentieren erfordern (Rating ≥ 1). Für diese Kategorie gilt zudem, dass jedes Schulbuch einen größeren Anteil an Aufgaben mit Anforderung an das mathematische Argumentieren realisiert als jede Lernplattform.

Da die Kategorie TA (technisches Arbeiten) nur für Fertigkeitsaufgaben vergeben wurde, wird für diese Kategorie der Anteil an der Gesamtzahl der Fertigkeitsaufgaben betrachtet. Abb. 3 zeigt den Anteil der Fertigkeitsaufgaben, die in nur einem Bearbeitungsschritt gelöst werden können. Während dieser Anteil bei Lernplattformen bei ca. 55 % liegt, liegt er bei Schulbüchern mit 37 % deutlich niedriger. Der Anteil an Fertigkeitsaufgaben, die ein höheres Niveau des technischen Arbeitens erfordern und nicht nur in einem Bearbeitungsschritt gelöst werden können ist somit bei Schulbüchern höher.

Abb. 3
figure 3

Anteil der Fertigkeitsaufgaben, die in einem Bearbeitungsschritt gelöst werden können. Die rote Linie repräsentiert das arithmetische Mittel

Insgesamt zeigt sich, dass für die Kategorien C1 (Typ mathematischen Arbeitens), C4 (Außermathematisches Modellieren), C5 (Innermathematisches Modellieren), C6 (Mathematisches Argumentieren) und TA (Technisches Arbeiten) Schulbücher tendenziell ein höheres Potenzial zur kognitiven Aktivierung bieten als Lernplattformen. Für die Kategorien C1, C5, C6 und TA ist dieser Unterschied besonders prägnant. Insbesondere realisiert in diesen Kategorien jedes Schulbuch absolut wie auch relativ mehr Aufgaben auf einem höheren Niveau als jede Lernplattform.

5.1.3 Themenspezifische Unterschiede

Es zeigt sich, dass Schulbücher wie auch Lernplattformen für den Themenbereich „Satz des Pythagoras“ (siehe Tab. 5 und Abb. 4) in den meisten Kategorien deutlich mehr kognitiv aktivierende Aufgaben realisieren als für den Themenbereich „Multiplikation von Brüchen“. Dabei ist der Unterschied zwischen den Inhaltsbereichen für die Kategorien C1 (Typ mathematischen Arbeitens), C2 (Gebrauch mathematischer Darstellungen), und C5 (innermathematisches Modellieren) besonders auffällig.

Abb. 4
figure 4

Anteil der Aufgaben mit erhöhtem Potenzial zur kognitiven Aktivierung (Rating ≥ 1) pro Kategorie differenziert nach Themenbereichen

5.2 Ergebnisse bzgl. Visualisierungen

Bezüglich Kategorie V1 (Art der Visualisierung) ergibt sich aus Tab. 6, dass Schulbücher absolut gesehen auf allen Ratingstufen (KV, AV, MV) meist deutlich mehr Visualisierungen anbieten. Da jedoch Schulbücher insgesamt deutlich mehr Aufgaben anbieten als Lernplattformen (SB = 811, LP = 224) ist auch hier eine relative Betrachtung in Bezug zur Gesamtzahl der Aufgaben des jeweiligen Mediums sinnvoll. So lässt sich aus den Werten in Tab. 6 errechnen, dass Schulbücher relativ deutlich mehr Aufgaben ohne Visualisierung realisieren (556/811 ≈ 68,56 %) als Lernplattformen (114/227 ≈ 51 %). Dabei ist zwischen den einzelnen Lernplattformen eine größere Streuung zu beobachten (37–62,5 %) als zwischen den Schulbüchern (64,2–70,7 %).

Tab. 6 Ergebnisse der Ratings der Kategorien V1, V2. Kategorie D und I wurden nur für Lernplattformen vergeben

Abb. 5 gibt einen Überblick über den Anteil kontextueller, anbahnender und mathematischer Visualisierungen in Relation zur Gesamtanzahl der Aufgaben mit Visualisierungen. Hier wird deutlich, dass wenn eine Visualisierung gegeben wird, diese tendenziell häufiger mathematisch visualisierend als anbahnend mathematisch visualisierend ist, während kontextuelle Visualisierungen verhältnismäßig selten vorkommen. Besonders auffällig ist dies für die Lernplattform Anton, welche ausschließlich mathematische Visualisierungen nutzt. Mathegym ist hingegen das einzige Medium, das bei Visualisierungen vor allem anbahnende Visualisierungen nutzt.

Abb. 5
figure 5

Anteil der Aufgaben in den Kategorien KV, AV und MV jeweils in Bezug auf die Gesamtanzahl an Aufgaben in dem entsprechenden Medium, die eine Visualisierung anbieten

Für Kategorie V2 ergibt sich aus Tab. 6, dass Lernplattformen fast ausschließlich statische Visualisierungen implementiert haben. Lediglich Bettermarks bietet drei Aufgaben mit interaktiven Visualisierungen im Themenbereich „Satz des Pythagoras“.

5.2.1 Themenspezifische Unterschiede

Es zeigt sich, dass sowohl auf Lernplattformen als auch in Schulbüchern für den Bereich Multiplikation von Brüchen deutlich mehr Aufgaben ohne jegliche Visualisierung dargeboten werden als für den Satz des Pythagoras (siehe Abb. 6).

Abb. 6
figure 6

Anteil der Aufgaben ohne Visualisierung in den beiden Themenbereichen in Schulbüchern und Lernplattformen

6 Diskussion und Fazit

6.1 Diskussion bezüglich des Potenzials zur kognitiven Aktivierung

Bezüglich des Potenzials zur kognitiven Aktivierung zeigt sich insgesamt ein ausbaufähiges Potenzial zur kognitiven Aktivierung sowohl bei Schulbüchern als auch bei Lernplattformen. So ist klar, dass ein komplettes Fehlen von Aufgaben mit hohem Potenzial zur kognitiven Aktivierung, etwa in der Kategorie C2) – Gebrauch mathematischer Darstellungen, oder beim mathematischen Argumentieren (Kategorie C6) für den Bereich Bruchmultiplikation, eine deutliche Diskrepanz zu den Anforderungen der Bildungsstandards darstellt. Bei Lernplattformen muss jedoch berücksichtigt werden, dass diese im Gegensatz zu Schulbüchern oftmals darauf fokussieren, Antworten auf Aufgaben automatisch auszuwerten, wodurch etwa Freitextantworten zum Argumentieren gegenwärtig kaum realisierbar sind. Allerdings lassen sich relevante Aspekte von allgemeinen mathematischen Kompetenzen auch über automatisch auswertbare Multiple-Choice-Fragen realisieren (Besser et al. 2020). Insgesamt stellt sich in Anbetracht der Befunde die Frage nach dem Grad der Forschungs- und Theoriebasierung bei der Entwicklung von Schulbüchern und Lernplattformen bzw. nach fundierten Kriterien bei der Aufgabenerstellung.

Weiterhin lässt sich feststellen, dass Schulbücher – bis auf den Bereich Darstellungswechsel – tendenziell ein höheres Potenzial zur kognitiven Aktivierung bieten als Lernplattformen. So bieten Lernplattformen für die höchste Niveaustufen für mehrere Kategorien überhaupt keine Aufgaben an (Kategorien C4, C5, C6), während Schulbücher hier tendenziell (nicht jedes Einzelwerk!) zumindest einige wenige Aufgaben bereithalten. Generell zeigt sich darüber hinaus, dass Schulbücher – bis auf den Bereich Darstellungswechsel – absolut wie auch relativ gesehen – mehr Aufgaben mit einem höheren Potenzial (Stufe 2 oder 3) zur kognitiven Aktivierung anbieten als Lernplattformen. Bei der Interpretation dieser Befunde ist natürlich zu beachten, dass die realistischerweise zur Verfügung stehende (und in einigen Kerncurricula auch explizit empfohlene) Unterrichtszeit für die beiden untersuchten Themen Bruchmultiplikation und Satz des Pythagoras evtl. nicht mehr als einige wenige Aufgaben etwa auf Level 3 zulässt. Trotzdem wäre ein größeres Aufgabenangebot auch auf höheren Niveaustufen hilfreich, um eine größere Wahlmöglichkeit bezüglich der Aufgaben zu erreichen. Wenn hingegen die Medien nur sehr wenige Aufgaben (z. B. 2–3 Aufgaben) im höheren Bereich anbieten, so ist eine höhere kognitive Aktivierung nur dann erreichbar, wenn diese wenigen Aufgabenangebote von der Lehrkraft auch tatsächlich genutzt werden. D. h. die Lehrkraft muss diese wenigen Aufgaben mit erhöhtem Potenzial zur kognitiven Aktivierung aus der Gesamtmenge der zur Verfügung stehenden Aufgaben im Schulbuch/in der Lernplattform identifizieren und es dürfen keine weiteren Argumente gegen die Nutzung dieser Aufgaben sprechen.

Anzumerken ist schließlich, dass es aus der Perspektive des verwendeten Klassifikationsschemas weder das „beste Schulbuch“ noch die „beste Lernplattform“ unter den ausgewählten Werken gibt (hier ist zu beachten, dass es keinen ausgehandelten Maßstab für erwartbare bzw. „angemessene“ Quantitäten für bestimmte Aufgabenmerkmale gibt). Während manche Werke ein höheres Potenzial zur kognitiven Aktivierung beim mathematischen Argumentieren realisieren, fokussieren andere Werke stärker auf Darstellungswechsel. Diese Unterschiede werfen die Frage auf, ob die Entwickler:innen hier bewusst und systematisch vorgehen (etwa im Sinne unterschiedlicher konzeptioneller Prägungen der Einzelwerke) oder ob es sich um unreflektierte Unterschiede handelt.

6.2 Diskussion bezüglich Visualisierungen

Bezüglich Visualisierungen ist vor allem auffällig, dass digitale Mathematik-Lernplattformen relativ gesehen deutlich mehr Visualisierungen als Schulbücher nutzen, dabei aber fast ausschließlich auf statische Visualisierungen setzen und dynamische und interaktive Visualisierungen kaum integrieren. Die mit dynamischen und interaktiven Visualisierungen verbundenen potenziellen Vorteile (siehe Abschn. 2.4) werden somit noch nicht einmal ansatzweise ausgeschöpft. Während die gedruckten Schulbücher hier an prinzipielle Grenzen stoßen, sollte bei der Weiterentwicklung von digitalen Lernplattformen zukünftig ein besonderes Augenmerk auf lernförderliche, dynamische und interaktive Visualisierungen gerichtet werden. Zudem fällt sowohl bei Schulbüchern als auch bei Lernplattformen auf, dass Visualisierungen meist mathematisch visualisierend sind, also stark vorstrukturiert mathematische Impulse für die Lösung enthalten und somit keine weitere Eigenaktivität der Schüler:innen bezüglich des Erstellens der Visualisierung einfordern. Es lässt sich zwar nicht sagen, dass eine bestimmte Art der Visualisierung per se „besser“ ist als andere, allerdings ist klar, dass Lernende auch selbst Visualisierungen erstellen können sollen. Hier ist in der Gesamtschau kritisch zu hinterfragen, ob Lernende bei dem hohen Anteil an vorgegebenen mathematischen Visualisierungen genügend Lerngelegenheiten für den Aufbau der entsprechenden Kompetenz bekommen. Eine stärkere Nutzung von anbahnenden Visualisierungen als Mittelweg zwischen zu geringer Unterstützung (ohne Visualisierung oder kontextueller Visualisierung) und der bereits vollständigen mathematischen Visualisierung könnte hier angebracht sein.

6.3 Diskussion bezüglich der Themenspezifität

Auffällig ist auch die Themenspezifik der Befunde sowohl hinsichtlich des Potenzials zur kognitiven Aktivierung als auch der Visualisierungen. Anscheinend gehen unterschiedliche Themen praktisch (zumindest im potenziellen Curriculum) sowohl mit unterschiedlichem Potenzial zur kognitiven Aktivierung als auch mit einem unterschiedlichen Einbezug von Visualisierungen einher. Auch hier liegt die (stoffdidaktische) Frage nahe, ob dies den Themen quasi „anhaftet“ oder ob dies an deren traditioneller Inszenierung liegt. Hier ist zu vermuten, dass beide Aspekte eine Rolle spielen. So ist eine Unterrichtsreihe zum Satz des Pythagoras, im Gegensatz zur Bruchmultiplikation, ohne einen substanziellen Anteil von Darstellungswechseln (Geometrische Darstellung und Längen‑/Flächenmessung) kaum denkbar. Eine zeitgemäße Aufgabengestaltung würde jedoch auch bei Themen wie Bruchmultiplikation den Einbezug von verstehensförderlichen Visualisierungen und stärkere kognitive Aktivierung realisieren (Prediger 2009). Zusätzlich ist der Befund von Sievert et al. (2021) für die Primarstufe zu berücksichtigen, dass die Qualität eines Schulbuchs zwischen verschiedenen Kapiteln variieren kann.

6.4 Konsequenzen für Forschung und Entwicklung

Die Themenspezifik der Befunde zeigt, dass für ein angemessenes Bild des Einzelwerks offensichtlich thematisch unterschiedliche Lerneinheiten betrachtet werden sollten. Für die Entwicklung von Lernplattformen und Schulbüchern lässt sich ableiten, dass in Anbetracht des derzeit geringen Potenzials zur kognitiven Aktivierung ein stärkeres Augenmerk auf deren mathematikdidaktische Qualität gelegt werden sollte. Da eine Qualitätsprüfung von Lernplattformen im Rahmen von Zulassungsverfahren, anders als in vielen Bundesländern für Schulbücher, derzeit nicht vorgesehen ist, sollten die Bundesländer zudem beim Abschluss von Generallizenzverträgen mit Lernplattformen mathematikdidaktische Qualitätsstandards hinsichtlich kognitiver Aktivierung spezifizieren. Zudem machen die Ergebnisse der vorliegenden Studie deutlich, dass Siegel, Preise und Auszeichnungen, die von verschiedenen Institutionen an Lernplattformen vergeben werden (z. B. Comenius-EduMedia-Medaille 2023 für Mathegym) mehr über Oberflächenmerkmale (Bedienerfreundlichkeit, äußere Gestaltung, Funktionalitäten) und weniger über die Tiefenstruktur, d. h. die Qualität hinsichtlich des Lernens und Verstehens von Mathematik aussagen.

Auf Basis des Befundes, das Lernplattformen tendenziell weniger Aufgaben mit erhöhtem Potenzial zur kognitiven Aktivierung anbieten als Schulbücher (und bezüglich der Kategorien C2)–C6) überhaupt keine Aufgaben auf der höchsten Niveaustufe bereithalten), lässt sich aus dem Blickwinkel des Kriteriums der kognitiven Aktivierung die Empfehlung ableiten, dass sich die untersuchten Schulbücher (bei allem Verbesserungspotenzial) gegenwärtig besser als Grundlage für einen kognitiv aktivierenden Unterricht und eine Förderung von prozessbezogenen Kompetenzen wie Problemlösen, Modellieren oder Argumentieren eignen. Jedoch lässt sich vor dem Hintergrund der Befunde auch hinterfragen, inwiefern das Schulbuch als alleiniges Leitmedium im Unterricht geeignet ist. Insbesondere gilt für beide Medienarten, dass die eher geringe Anzahl von Aufgaben auf höheren Niveaustufen für die Kategorien C2)–C6) der Lehrkraft kaum Auswahlmöglichkeit hinsichtlich der Aufgaben bietet, um eine höhere kognitive Aktivierung zu realisieren. Um das Repertoire an Aufgaben mit höherem Potenzial zur kognitiven Aktivierung zu erhöhen (vor allem bzgl. Kategorien, die auf höherem Niveau überhaupt nicht adressiert werden, z. B. C2) – Gebrauch mathematischer Darstellungen), sollten Lehrkräfte aktuell gegebenenfalls weitere Ressourcen für die Unterrichtsplanung heranziehen (z. B. Maaß und Siller 2014; Prediger et al. 2021).

6.5 Limitationen

Bezüglich der Limitationen ist zunächst festzuhalten, dass nur zwei Themenbereiche und drei Lernplattformen beziehungsweise (gymnasiale) Schulbücher berücksichtigt wurden. Es bleibt zu prüfen, inwieweit die Ergebnisse auf andere Themenbereiche und Schulbücher (z. B. nicht-gymnasiale) generalisiert werden können. Zudem müssen Visualisierungen bezüglich der fachdidaktischen Ziele angemessen gestaltet werden (siehe Abschn. 2.4) – ein Aspekt, welcher in der vorliegenden Studie bei der Beurteilung der Visualisierungen nicht berücksichtigt wurde. Ebenso ist zu beachten, dass in dieser Studie nur auf die kognitive Aktivierung und die Art der Visualisierungen fokussiert wurde, während andere Aspekte unberücksichtigt blieben. So bieten Lernplattformen im Gegensatz zu Schulbüchern (teils adaptives) Feedback an, das bei hinreichend guter Feedbackqualität wesentlich zum Verständnis von Lerninhalten beitragen kann. Um die Medienarten in der Gesamtheit zu beurteilen, sind weitere Studien nötig, nicht nur zu Feedbackqualität, sondern auch zu möglichem individuellem Unterstützungspotenzial.

6.6 Fazit

Insgesamt zeigt die vorliegende Studie, dass Schulbücher tendenziell ein höheres Potenzial zur kognitiven Aktivierung anbieten als Lernplattformen. Dabei offenbart sich jedoch sowohl für Lernplattformen als auch Schulbücher ein deutlicher Entwicklungsbedarf. Dieser besteht unter anderem darin, (mehr) Aufgaben zu integrieren, die anspruchsvolle Denkhandlungen anregen und die Möglichkeiten von Visualisierungen in ihrer ganzen Bandbreite (kontextuell, anbahnend-mathematisch, mathematisch; siehe Abschn. 4.3) einbeziehen.

Weiterhin stellt sich die Frage, warum sich die seit langem vorhandenen wissenschaftlichen Erkenntnisse zur kognitiven Aktivierung und die langjährigen Forderungen aus Bildungsforschung und Bildungsadministration nach verstärkter kognitiver Aktivierung nur in so geringem Maße in den untersuchten gymnasialen Schulbüchern und auf Lernplattformen widerspiegeln. Es zeigt sich somit einmal mehr die Notwendigkeit, dass fachdidaktische Forschung, die Konzepte für den Unterricht entwickelt (z. B. Prediger et al. 2021), möglichst auch bis zum realen Unterricht vordringen sollte. Dazu bedarf es auch eines Überdenkens aktueller Entscheidungswege, welche Materialien im Unterricht genutzt werden. Bislang liegt dies allein und durchaus gut begründet in der Hand der Lehrkräfte, so dass das Kriterium der Passung zu den eigenen Idealen und zum eigenen Unterricht im Vordergrund steht. So plausibel dieses Vorgehen zunächst scheint, ist damit jedoch die Gefahr verbunden, dass wissenschaftlich begründete Innovationen bei der Wahl von Unterrichtsmaterialien nur eine nachrangige Rolle spielen. Hier gilt es zukünftig, Lehrkräfte intensiver über die Ergebnisse fachdidaktischer Forschung zu informieren und in die Arbeiten einzubeziehen. Hierzu könnten zum Beispiel Entwicklungsarbeiten sowie Wirkungsstudien von Unterrichtsmaterialien ko-konstruktiv in die Hand von Wissenschaft und Schulpraxis (z. B. Lehrkräfteverbände) gelegt werden. Damit könnte auch das altbekannte Problem des Theorie-Praxis-Transfers bewusst angegangen werden.

In der Gesamtschau und vor dem Hintergrund der skizzierten Limitationen der Studie ist klar, dass die vorgelegte Studie nur ein erster Beitrag dazu sein kann, die Qualität von Lernplattformen und Schulbüchern zu erfassen, zu beurteilen und zu vergleichen. Hier gilt es, im Verbund von Wissenschaft und Praxis klare Kriterien für gute Lernmedien zu generieren, um die Vorgaben der KMK-Bildungsstandards in der Breite zu realisieren. Dies ist vor dem Hintergrund der zunehmenden Bedeutung von Lernplattformen und der Rolle von Schulbüchern als gegenwärtiges Leitmedium dringend geboten.