1 Einleitung

Aus der zunehmenden Digitalisierung aller Lebensbereiche, der sich rasant entwickelnden technologischen Möglichkeiten und den damit einhergehenden substanziellen gesellschaftlichen Veränderungen erwächst für das Schulsystem die Verantwortung, digitale Medien in den (Grundschul‑)Unterricht zu integrieren. Diese Integration ist größtenteils an funktionale Erwartungen geknüpft (z. B. bei Irion 2018; nicht so bei Krommer 2018), die in zwei Hauptargumentationssträngen zum Ausdruck kommen: Auf der einen Seite steht das Heranführen an einen kritischen Umgang mit digitalen Medien, um den „Anforderungen der digitalen Welt zu genügen“ (Kultusministerkonferenz [KMK] 2016, S. 5; vgl. auch Bos et al. 2014). Das betrifft die sechs Kompetenzbereiche in der digitalen Welt (KMK 2016), die spätestens seit dem Schuljahr 2018/2019 in Grundschulen anzubahnen sind. Die technischen Voraussetzungen der Grundschulen werden im Zuge des DigitalPakt Schule geschaffen und es gibt Bemühungen, die medienspezifische Ausbildung von Lehrkräften curricular in den Studiengängen zu verankern (z. B. Digitalisierung in der Lehrerbildung, Qualitätsoffensive Lehrerbildung des Bundesministeriums für Bildung und Forschung).

Auf der anderen Seite steht die Nutzung digitaler Medien als Lernunterstützung, etwa zur individuellen Förderung im Fach (KMK 2016, S. 5). Jedoch werden die Möglichkeiten für das „Lernen aus der Perspektive des jeweiligen Faches […] vielfach zu partiell diskutiert“ (Brandt und Dausend 2018, S. 8), wodurch fachübergreifende Potenziale für den Unterricht nur fragmentarisch herausgestellt werden können. Insbesondere mit Blick auf die Primarstufe ist ein grundschulspezifisch-metadisziplinärer Diskurs nötig, da hier grundlegende Bildung etwa hinsichtlich des Erwerbs von grundlegenden Lernmethoden und Monitoring-Strategien zu einem großen Teil auch fachübergreifend stattfindet (vgl. Götz et al. 2019).

Dieser Beitrag zielt darauf, einen Einblick in den diesbezüglichen Forschungsstand zu geben. Lernunterstützung wird dabei als Gestaltung von Unterrichtsszenarien unter Zuhilfenahme von digitalen Medien im Sinne der Mikroadaption verstanden, mit der das Ziel verfolgt wird, jede Schülerin und jeden Schüler optimal zu fördern (vgl. z. B. Martschinke 2015). Ein besonderes Augenmerk liegt auf inhaltlich ausgerichteten Applikationen, da diese als Werkzeuge für derartige Unterstützungen fungieren können.

2 Wirkung digitaler Medien

2.1 Von der generellen zur differenziellen Wirkung digitaler Medien

Auch wenn digitalen Medien großes Potenzial für die Lernunterstützung zugeschrieben wird (z. B. Eickelmann und Vennemann 2013; Herzig 2014), sieht die Befundlage zu deren lernförderlichen Wirkung derzeit eher ernüchternd aus. Allerdings sind aus den bisherigen Studien zur Wirkung von digitalen Medien – insbesondere was die Grundschule angeht – noch wenig tragfähige Rückschlüsse möglich. Insgesamt scheint der Einsatz digitaler Medien keine oder nur kleine Effekte zu haben (z. B. Zwingenberger 2009; einen Überblick gibt Schaumburg 2015). So weist Hattie (2009) beispielsweise darauf hin, dass konventionelle Unterrichtsmethoden zu ähnlichen Erfolgen führen. Spitzer (2012) und andere teils einseitig kritische bzw. populärwissenschaftliche Stimmen sehen eher noch mehr Risiken als potenziellen Nutzen, da die „Lernverhinderungsmaschinen“ (S. 89) etwa zu oberflächlicher Beschäftigung mit Informationen führten und zu Lasten der eigenen geistigen Tiefenverarbeitung gingen. Nach Renkl und Atkinson (2007) sind potenzielle Unterschiede im Lernzuwachs jedoch nicht auf das Medium selbst, sondern auf die kognitiven Prozesse, die durch das Medium herbeigeführt werden, zurückzuführen. Dies spiegelt auch das praxisorientierte SAMR-Modell (Puentedura 2006; für eine kritische Würdigung des bislang nicht redigierten Modells siehe Hamilton et al. 2016) wider, das hier als Systematisierungs- und Reflexionsgrundlage herangezogen wird. Es stellt eine basale hierarchische Ordnung bereit, nach der Einsatz und Gestaltung von digitalen Medien zu je größerer Veränderung in den Lernprozessen beitragen können. SAMR bezieht sich auf die Begriffe Ersetzung (Substitution), Erweiterung (Augmentation), Änderung (Modification) und Neubelegung (Redifinition). Ersetzung verweist auf das reine Austauschen des Mediums, ohne dabei die Aufgabe oder die Art der Auseinandersetzung mit der Aufgabe zu verändern. Ein Beispiel ist die Verwendung einer Dokumentenkamera statt der Tafel zur Veranschaulichung eines Sachverhalts. Unter Erweiterung fallen zusätzliche Funktionen, die durch das digitale Medium für dieselbe Aufgabe und denselben Aufgabentyp dargeboten werden, die mit analogen Medien nicht oder nur eingeschränkt realisiert werden könnten. Hierunter fallen z. B. animierte Bilder, die in Kombination mit gesprochenem und/oder geschriebenem Text dargeboten werden, um etwa Prozesse konkreter darzustellen. Änderung meint die Neugestaltung von Aufgaben unter Berücksichtigung der digitalen Möglichkeiten, die potenziell zu einer veränderten Art der Auseinandersetzung mit der Aufgabe führen. Ein Beispiel sind intelligente Lernapplikationen, die das Potenzial haben, auf die individuellen Bedarfe aller Lernenden zu reagieren. Bei der Neubelegung handelt es sich um Aufgabenstellungen, die ohne digitale Medien nicht eingebracht werden könnten. Darunter fällt das Game-based Learning, bei dem die Schülerinnen und Schüler in eine spielerische (immersive) Umgebungen eintauchen und ein Spielziel verfolgen, das idealerweise dem Lernziel entspricht.

Nach dem Ansatz von Renkl und Atkinson (2007) ist bei der Ersetzung mit keinem (längerfristigen) Unterschied in den Lernzuwächsen zu rechnen, weswegen auf diese Ebene im weiteren Verlauf nicht näher eingegangen wird.

Bei der Erweiterung ist tendenziell von geringen Effekten auszugehen, da sich die Art der Informationsverarbeitung nicht (zwangsläufig) verändert. Am ehesten sind Effekte auf der Ebene der Änderung und Neubelegung zu erwarten. Betrachtet man verschiedene Formen der digitalen Mediennutzung, können erwartungskonform solche differenziellen Effekte festgestellt werden: So ist etwa bei visuellen und audiovisuellen Medien (wie Fernsehen oder Tonaufnahmen), die je nach Inhalt und Ziel der Ebene der Ersetzung oder Erweiterung zuzuordnen sind, eine Effektstärke von d = 0,22 zu finden. Im Vergleich dazu liegt diese bei interaktiven Lernvideos (je nach Elaborationsgrad und Aufgabenstellung, Ebene der Änderung oder Neubelegung) bei d = 0,54 (Hattie 2009; für eine Kritik siehe Wecker et al. 2017).

Nach der Kognitiven Theorie des multimedialen Lernens (Cognitive Theory of Multimedia Learning, CTML; Mayer 2009) ist – anders als Puentedura (2014) argumentiert – ein hierarchiehöherer Technologieeinsatz nicht zwingend mit einer höheren Lernleistung assoziiert. Denn auch auf den hierarchiehöheren Ebenen sind konkrete Arrangements von Funktionen und Gestaltungsmerkmalen sowie deren Wirkungen im Kontext des jeweils vorgesehenen Lernziels genauer zu betrachten.

2.2 Wirkung zentraler Funktionen und Gestaltungsmerkmale digitaler Medien

In der CTML, die in Anlehnung an die Theorie der kognitiven Belastung (Cognitive Load Theory, CLT; Sweller et al. 1998) entwickelt wurde, werden drei kognitive Anforderungen unterschieden: (1) Die inhaltsbedingte kognitive Verarbeitung (essential cognitive processing) bezieht sich auf die Auswahl und das kohärenzdienliche Aktivhalten von Informationen im Arbeitsgedächtnis, wobei die Belastung mit zunehmender Komplexität des Lerninhalts steigt. (2) Die sachfremde kognitive Verarbeitung (extraneous cognitive processing) ist vom Lerninhalt losgelöst und bezieht sich auf den Umfang kognitiver Ressourcen, den gestalterische Elemente des Lernmaterials binden. (3) Die lernrelevante kognitive Verarbeitung (generative cognitive processing) bezieht sich auf alle Vorgänge, die mit der Organisation und Integration von Wissen verbunden sind und etwa durch Motivation mediiert werden. Nach der CTML besteht das Ziel darin, medienunterstützt die inhaltsbedingte kognitive Verarbeitung zu steuern, die sachfremde kognitive Verarbeitung zu reduzieren und die lernrelevante kognitive Verarbeitung zu fördern. Digitale Medien bieten dabei die Möglichkeit, komplex arrangierte multimediale Lernmaterialien mit Kombinationen von Darstellungsmitteln zu erstellen, die schriftliche und/oder mündliche Texte und Signale, statische und/oder bewegte Bilder sowie taktile Signale umfassen. Funktionen und Gestaltungsmerkmale von digitalen Medien beziehen sich hier auf solche Elemente mit Auswirkung auf mindestens einen der o. g. Verarbeitungsprozesse. Darunter fällt z. B. der Einsatz von transient-mündlichen oder persistent-schriftlichen Texten (1), von Bildern mit dekorativem Charakter (2) sowie von Belohnungssystemen wie sog. Badges (3).

Die Ebenen des SAMR-Modells weisen ihrer Hierarchie nach potenziell zunehmend mehr Funktionen und Gestaltungsmerkmale auf, wobei die hierarchiehöheren Ebenen auch solche niedrigerer Ebenen umfassen können. Daher wird nachfolgend die Wirkung zentraler Funktionen und Gestaltungsmerkmale auf den unterschiedlichen Ebenen anhand ausgewählter Beispiele und in Bezug auf die jeweiligen Bereiche der CTML beschrieben sowie empirische Befunde dazu berichtet.

2.2.1 Funktionen und Gestaltungsmerkmale auf der Ebene der Erweiterung am Beispiel von Bild-Text-Kombinationen

Aufgaben, die mit digitalen Medien auf der Ebene der Erweiterung realisiert werden, weisen nur geringe funktionale und gestalterische Veränderungen im Vergleich zu analogen Medien auf. Der Fokus liegt hier auf Bild-Text-Kombinationen, da diese im Vergleich zum Einsatz in analogen Medien durch digitale Medien geringfügig verändert werden. Aus der CTML wurden eine Reihe von Prinzipien abgeleitet und auf Lernförderlichkeit hin überprüft. Zentrale Prinzipien, die einen Bezug zu Bild-Text-Kombinationen aufweisen und von Bedeutung für digitale Medien sind, werden im Folgenden analysiert.

Das Multimediaprinzip besagt, dass Text-Bild-Kombinationen ein tieferes Verständnis erzielen als reine Texte (Mayer 2009). Der Effekt konnte u. a. für das Grundschulalter repliziert werden (z. B. Firat 2017; siehe auch Moreno und Valedez 2005; einen Überblick geben Mayer und Moreno 2002). Die Überlegenheit der Kombination scheint jedoch von der Notwendigkeit der bildlichen Information für die Lernenden abzuhängen (Prinzip der Effektumkehrung, expertise reversal principle, Kalyuga 2014): Mit hohem Vorwissen hebt sich der Vorteil auf (Herrlinger 2011, Studie in einer vierten Jahrgangsstufe) oder kehrt sich gar ins Gegenteil um (Kalyuga et al. 2016, Studie mit Erwachsenen; einen Überblick gibt Kalyuga 2014). Es wird angenommen, dass solche Bilder sachfremde kognitive Verarbeitungsprozesse erhöhen und Kapazitäten für lernrelevante Verarbeitungsprozesse blockieren (Mayer 2009). Gleichermaßen verhält es sich gemäß des Kohärenzprinzips bei Bildern mit dekorativem Charakter. Diese können der Motivation zuträglich sein, steigern den Lernerfolg jedoch nicht, da sie keine erforderlichen Informationen enthalten (vgl. Herrlinger et al. 2017). Zur Reduktion der inhaltsbedingten und/oder lernrelevanten Belastung können Bilder mit repräsentativem Charakter (zur Konkretisierung), organisierendem Charakter (zur Herstellung höherer Kohärenz), interpretativem Charakter (zur Analogiebildung und der Erhöhung der Verständlichkeit) und transformativem Charakter (zur Rekodierung, Kontextualisierung und zum vereinfachten Wiederabruf) beitragen (in Anlehnung an Levin et al. 1987). Auch Kontraste und Farbgebungen scheinen für die Aufmerksamkeitslenkung in der Grundschule von Bedeutung zu sein (Navarro et al. 2015). Für Leseanfängerinnen und -anfänger finden sich allerdings auch Hinweise auf einen Effekt der Aufmerksamkeitsverlagerung (shift-of-attention-effect; Herrlinger 2011; Herrlinger et al. 2017) hin zur bildlich dargestellten Information.

Bei der Text-Bild-Kombination scheint es nach dem Modalitätsprinzip effektiver zu sein, wenn der Text mündlich dargeboten wird. Mayer (2009) argumentiert, dass die Informationsverarbeitung auf die beiden Verarbeitungskanäle visuell und verbal aufgeteilt wird, während es bei der schriftlichen Textdarbietung in Kombination mit der bildlichen Darstellung zur kognitiven Überlastung kommen kann. Auch dieser Effekt wurde mehrfach bei verschiedenen Altersgruppen nachgewiesen (für die Grundschule z. B.: Herrlinger et al. 2017; Metaanalyse: Ginns 2005); er scheint jedoch an Bedingungen geknüpft zu sein (siehe Diskussionsbeitrag von Schüler et al. 2011). So konnte Herrlinger (2011) den Effekt nicht replizieren und mutmaßt, dass dies an den unterschiedlich langen Sequenzen und dem für die Lernenden unterschiedlich anspruchsvollen Inhalt liegt: Nach dem Transienzprinzip müssen mündliche Texte zur weiteren Verarbeitung im Arbeitsgedächtnis aktiv gehalten werden, wodurch sich die inhaltsbedingten kognitiven Verarbeitungsprozesse erhöhen und Kapazitäten für die lernrelevante kognitive Verarbeitung blockieren. Deshalb eigenen sich für längere und komplexe Sachverhalte eher schriftliche Texte (Primarstufe: Leahy und Sweller 2011; Sekundarstufe: Wong et al. 2012). Bei kurzen Segmenten scheinen Animationen hingegen vorteilhaft zu sein (für die Primarstufe siehe z. B. Barak und Dori 2011), eventuell weil sie eine authentische Abbildung der Realität bereitstellen (zur Bedeutung von Re‑/Kontextualisierung vgl. z. B. Lohrmann 2011), sodass weniger kognitive Kapazitäten für Schlussfolgerungen erforderlich sind. Das Segmentierungsprinzip spricht zudem dafür, animierte Bild-Text-Kombinationen in inhaltlich sinnvolle Abschnitte zu unterteilen, sodass sie individuell abrufbar sind und die inhaltsbedingte kognitive Verarbeitung erleichtert wird (Hasler et al. 2007). Dabei sollten für Grundschulkinder Pausen forciert werden (ebd.) sowie Bild und Text zeitgleich miteinander dargeboten werden (Ginns 2005).

Hinweise ohne stabile empirische Befundlage gibt es für das Redundanzprinzip. Demnach ist der Lernerfolg größer, wenn Texte in Kombination mit Bildern nicht schriftlich und mündlich, sondern nur mündlich dargeboten werden. Mayer (2009) begründet dies einerseits mit der Überlastung des visuellen Kanals (siehe Modalitätsprinzip) und andererseits mit dem unnötigen Versuch der Lernenden, die visuellen und auditiven Textinformationen miteinander in Verbindung zu bringen. Im Grundschulbereich gehen die Befunde auseinander: So zeigte sich in Studien von Leahy et al. (2003) sowie Acha (2009) bei (hoher) Redundanz im Material ein (deutlich) negativer Effekt. Bei Linebarger (2001) bildete sich bei ebenfalls hoher Redundanz hingegen ein leicht positiver Effekt ab. Die Metaanalyse von Adesope und Nesbit (2012) legt nahe, dass auch hier das Vorwissen sowie das Verhältnis zwischen geschriebenem und gesprochenem Text von Bedeutung ist: Während Lernende mit geringem Vorwissen von einer audiovisuellen Darbietung zu profitieren scheinen, gilt dies nicht für solche mit hohem Vorwissen. Nach dem Signalisierungsprinzip finden sich Hinweise, dass Hervorhebungen visueller, akustischer oder taktiler Art die Aufmerksamkeit der Lernenden lenkt (für die Primar- und Sekundarstufe siehe z. B. Rouet et al. 2011), wodurch weniger kognitive Ressourcen für die lernrelevante Verarbeitung aufgewandt werden (einen Überblick gibt Mayer 2014). Abhängig ist dies jedoch vom Lerninhalt: Während Signalisierungen mit aufmerksamkeitslenkender Funktion bei der Förderung kognitiver Strategien unterstützen, können sie bei der Förderung metakognitiver Strategien behindern. Unter Rückbezug auf die genannten Prinzipien ist speziell bei einfachen akustischen oder taktilen Signalen davon auszugehen, dass sie zur Förderung der lernrelevanten kognitiven Verarbeitung beitragen, ohne dabei Ressourcen für die sachfremde Verarbeitung aufzuwenden. Dafür muss jedoch die Bedingung des Vortrainingsprinzips erfüllt sein, das für Grundschulkinder und insbesondere für solche mit wenig (digitaler) Medienerfahrung relevant ist. Es ist anzunehmen, dass die spezifischen Funktionen, Gestaltungsmerkmale und Hervorhebungen erst nach deren Einführung wirksam werden können (Mayer 2009).

Die dargestellten Kriterien zur Gestaltung von Text-Bild-Kombinationen betreffen eine Reihe von mediengestützten Unterrichtsszenarien wie etwa den Einsatz von Präsentations- und einfachen interaktiven Lernprogrammen und sind auch mit Blick auf die Ebenen der Änderung und Neubelegung zu berücksichtigen.

2.2.2 Funktionen und Gestaltungsmerkmale auf der Ebene der Änderung am Beispiel von Hypermedia und Intelligenten Tutoriellen Systemen

Aufgaben, die mit digitalen Medien auf der Ebene der Änderung realisiert werden, weisen größere funktionale und teils auch gestalterische Veränderungen im Vergleich zu analogen Medien auf.

Eine bedeutsame und intensiv erforschte Änderung betrifft Hypermedia. Hypermedia zeichnen sich i. d. R. durch nichtsequenzielle Repräsentationen von Informationen und durch dynamische Strukturen aus. Eine Subkategorie sind Hypertexte. Diese können unterschiedlich komplex gestaltet sein und von einfachen linearen, über hierarchische bis hin zu vernetzten Hypertextstrukturen reichen (Unterscheidung nach Engebretsen 2000).

Lineare Strukturen simulieren im Wesentlichen die Struktur von gedruckten Texten, wobei zu einzelnen Textelementen Zusatzinformationen bereitgestellt werden. Um mit der zu bearbeitenden Aufgabe fortzufahren, müssen die Lernenden nach dem Aufruf der Zusatzinformation wieder auf den ursprünglichen Pfad zurückkehren, sodass ein Verlassen des eigentlichen Hypertextes vermieden wird. Im Unterschied zu analogen Informationsquellen wie Lexika, werden bei linearen Hyperlinks zur sachfremden Verarbeitung keine und zur inhaltsbedingten Verarbeitung potenziell weniger kognitive Ressourcen aufgewandt (vgl. Salmerón et al. 2018): Die Lernenden werden direkt und ohne Aufwand zur relevanten Information geleitet, ohne auf ablenkende sachfremde Themen zu stoßen.

Hierarchische und vernetzte Strukturen bieten die Möglichkeit, zu einem Thema zunehmend differenzierte Informationen zu erhalten; sich aber auch stetig vom ursprünglichen Pfad und Inhalt zu entfernen. Während hierarchische Strukturen in einer Baumstruktur geordnet sind, sind vernetzte Strukturen als dezentrale Netzwerke aufgebaut. In beiden Fällen müssen die zu bearbeitenden Informationseinheiten eigenständig ausgewählt und deren Reihenfolge festlegt werden. Dies verändert den Verarbeitungsprozess und wird Navigation genannt (vgl. Voss 2006; Lawless und Schrader 2008). Die Beziehungen zwischen den Informationseinheiten sind nicht sichtbar und halten keinen vorstrukturierten, offensichtlichen Lösungsweg bereit. Die Navigation gleicht deshalb dem Problemlösen (Brand-Gruwel et al. 2009). Bei der Verwendung von Hypertexten dieser Art sind das Lernziel und die Voraussetzungen der Lernenden zwingend zu berücksichtigen. So wird beispielsweise angenommen, dass die Darbietung von Informationen in netzwerkartigen Strukturen von Vorteil ist, wenn ein flexibles, multiperspektivisches Verständnis eines komplexeren Sachverhalts aufgebaut werden soll (z. B. Spiro et al. 1992). In einer Studie (Kornmann et al. 2016) mit Viertklässlerinnen und Viertklässlern erwies sich ein multiperspektivisches Hypermedia-Lernarrangement allerdings nur für die Lernenden mit hoher Arbeitsgedächtniskapazität für das multiperspektivische Denken als förderlich. Für Kinder mit geringerer Kapazität fand sich kein Unterschied zwischen den Lernarrangements. Die Autorinnen und Autoren mutmaßen, dass es bei diesen Lernenden zu erhöhter sachfremder kognitiver Aktivität und dadurch zur Überlastung der lernrelevanten kognitiven Verarbeitungsprozesse kommt. In diesem Kontext scheint speziell für Grundschulkinder die Berücksichtigung des Signalisierungsprinzips von Vorteil zu sein, um ihre Aufmerksamkeit auf die relevanten Aspekte zu lenken (siehe Rouet et al. 2011). Insgesamt kann aber davon ausgegangen werden, dass die Voraussetzung für effektive Navigation der Aufbau von entsprechenden Strategien ist (Naumann und Salmerón 2016), da die kognitiven Ressourcen andernfalls zu stark auf sachfremde Informationen ausgerichtet werden. Salmerón und García (2011) konnten zeigen, dass Kinder einer sechsten Grundschulklasse bereits die als besonders hilfreich einzuschätzende Kohärenzstrategie (siehe auch Salmerón et al. 2006, 2018) anwenden können. Bei der Kohärenzstrategie werden über semantische Kohärenz relevante Informationen ausgewählt, was förderlich für das Textverständnis und das effektive Time-on-Task ist (ebd.). Etwas weniger erfolgreich sind den Autoren zufolge die interessensbezogene-explorative Strategie und noch weniger erfolgreich die Strategie, die der Anordnung der Links chronologisch folgte (first-mentioned strategy). Darüber hinaus scheint das Zeitkontingent bei digitalen Texten eine größere Bedeutung für das Textverständnis (von Sachtexten) zu haben als bei Texten auf Papier (siehe Metastudie von Delgado et al. 2018). Die Autorinnen und Autoren vermuten, dass Personen bei digitalen Texten im Sinne der Navigation eher zu „scannendem“ Lesen tendieren (siehe hierzu auch Kammerer et al. 2019).

Eine weitere zentrale Änderung betrifft Intelligente Tutorielle Systeme (ITS), in denen derzeit vermutlich das größte Potenzial digitaler Medien mit Blick auf die Lernunterstützung liegt (für die Grundschule z. B. Stankov et al. 2008; siehe auch Metaanalyse von Kulik und Fletcher 2016). ITS sind eine Erweiterung von computer-based trainings (CBT) und computer aided instructions (CAI). Es handelt sich um computerbasierte Lernumgebungen, die im Sinne des formative Assessment (vgl. z. B. Black und William 2009; Schmidt und Liebers 2015) eine Verknüpfung und Passung von Lernverlaufsdiagnostik, Feedback und Förderung für alle Lernenden herzustellen versucht: Es können Übungen und Tests dargeboten und automatisch ausgewertet werden, sodass sowohl die Lehrkraft als auch die Schülerinnen und Schüler automatisch das Ergebnis rückgemeldet bekommen (wie auch bei CBT und CAI). Charakteristisch für ITS ist, dass sie darüber hinaus die Eingaben der Lernenden mithilfe von (Machine Learning-)Algorithmen automatisch interpretieren, um so flexibel mit entsprechendem Feedback und einer Anpassung der Aufgabenschwierigkeit, des Formats und des Inhalts reagieren können (für ein Beispiel aus dem Englischunterricht siehe Rudzewitz et al. 2017).

Dies stellt ein großes Potenzial zur Veränderung der Lernsituationen – insbesondere für die Randgruppen des Leistungsspektrums – dar (vgl. Eickelmann und Vennemann 2013; siehe auch Metastudie von Kingston und Nash 2011), da formative Assessment, ohne digitale Unterstützung derzeit nur im Expertensetting bzw. mit Expertencoaching und nicht im ökologisch validen Setting gelingt (Wang et al. 1984; Franke-Braun 2008).

ITS können ferner dabei unterstützen, die zahlreichen und komplex strukturierten Voraussetzungen für die Wirksamkeit von Funktionen und Gestaltungsmerkmalen digitaler Medien zu beachten (vgl. Abschn. 2.2.1). Insofern ist zu vermuten, dass ITS auch im Primarbereich positive Effekte auf die Lernleistung haben, auch wenn die Befundlage noch zu schmal ist.

2.2.3 Funktionen und Gestaltungsmerkmale auf der Ebene der Neubelegung am Beispiel spielbasierten Lernens

Aufgaben, die mit digitalen Medien auf der Ebene der Neubelegung realisiert werden, weisen größere funktionale Veränderungen und neuartige Gestaltungselemente im Vergleich zu analogen Medien auf.Footnote 1

Ein Konzept, das im Kontext der Lernunterstützung in der internationalen Diskussion an Bedeutung gewonnen hat (Slussareff et al. 2016), betrifft das (digitale) spielbasierte Lernen (auch: [digital] Game-based Learning), bei dem – teils unter Zuhilfenahme von ITS – lernrelevante Aufgaben in eine spielerische digitale Umgebung eingebettet werden; die sog. Gamification. Hierunter fallen Ansätze wie Serious Games (jede Form interaktiver Lernspiele), Pervasive Games (interaktive Lernspiele mit räumlicher, temporärer oder sozialer Grenzverschiebung im Sinne von Augmented Reality o. ä.) oder die einfache spielerische Gestaltung von Aufgaben (Playful Design; einen Überblick geben Deterding et al. 2011). Im Sinne pervasiver Games ist es beispielsweise denkbar, ein bestimmtes Stadtbild während des Durchquerens im Lichte einer früheren Zeit erscheinen zu lassen und damit einen Unterrichtsinhalt zu verbinden (hier: Geschichtsunterricht), sodass dieser für Lernende gut zugänglich ist und sie eine bildliche Vorstellung hiervon bekommen (siehe Beispiel für die Sekundarstufe: Huizenga et al. 2009). International finden sich weitere Beispiele für die Primarstufe, u. a. in den Bereichen Fremdspracherwerb (z. B. Abdul Rabu und Talib 2017), Mathematik (z. B. Brezovszky et al. 2019), Geographie (z. B. Tüzün et al. 2009) oder Gesundheitserziehung (z. B. Yien et al. 2011).

Die wesentlichen Ziele von Gamification sind das Erzeugen von Motivation, sich mit dem Lerngegenstand zu befassen, Flow-Erleben (Csikszentmihalyi 1990) und höhere Lernleistung (vgl. Hamari et al. 2016). Warum bei Gamification diese Ziele teils nicht erreicht werden, wird oft mit der Selbstbestimmungstheorie nach Deci und Ryan (1985) begründet: Demnach tragen die Spielelemente zur Befriedigung des Kompetenzerlebens, der Autonomie und der sozialen Eingebundenheit (Basic Human Needs) bei (Ryan et al. 2006; vgl. auch Birk et al. 2016). Das Kompetenzerleben fördern Spielelemente wie Abzeichen (Badges) oder Belohnungen (Rewards), die an Herausforderungen (Challenges) geknüpft sein können und sich idealerweise an den individuellen Fähigkeiten der Lernenden orientieren (vgl. Abschn. 2.2.2). Förderlich für das Autonomieerleben ist z. B. die Möglichkeit der Auswahl einer Identifikationsfigur (Avatar; Birk et al. 2016). Die soziale Eingebundenheit kann wiederum durch die Zusammenstellung von Teams erzeugt werden, die Aufgaben mit- oder in Konkurrenz zueinander lösen.

Für Serious Games insgesamt konnten sowohl für Grundschulkinder als auch für ältere Kinder mehrfach positive Effekte nachgewiesen werden (siehe oben angeführte Beispiele, sowie z. B. Laffey et al. 2003; Miller und Robertson 2010; zsf. in Metastudie von Wouters et al. 2013; Metaanalyse von Clark et al. 2016). Lernspiele scheinen sich insbesondere günstig auf die Selbstwirksamkeit, das Lernen und die Retention auszuwirken. Dabei konnten Vogel et al. (2006) in ihrer Metastudie keine Unterschiede im Alter oder dem Geschlecht der Lernenden finden. Clark et al. (2016) legen jedoch nahe, den Blick auf konkrete Gestaltungsmerkmale zu richten und deren Wirkweisen zu berücksichtigen. So zeigte sich etwa, dass Spielmodi, bei denen einzelne Schülerinnen und Schüler miteinander konkurrieren, nicht lernförderlicher als herkömmliche Unterrichtsmethoden sind. Diesbezüglich ist anzunehmen, dass das Kompetenzerleben einer Schülerin oder eines Schülers mit Einbußen im Kompetenzerleben, in der Motivation und in der Anstrengungsbereitschaft bei der oder dem jeweils anderen einhergeht. Weiterhin erwiesen sich Serious Games mit narrativer und bildlich komplexer bzw. visuell realistischer Gestaltung als weniger effektiv als schematisch aufgebaute Lernspiele. Eine mögliche Interpretation der Autorinnen und Autoren bezieht sich auf die sachfremde kognitive Belastung, die durch komplexere Arrangements erhöht wird und die Lernenden von den lernrelevanten Inhalten ablenken könnte. Eine andere Interpretation bezieht sich auf die Anlage der meisten Primärstudien: Diese fokussieren zumeist auf Lernergebnisse niedriger Ordnung. Das größte Potenzial wird jedoch im Bereich der Lernziele höherer Ordnung gesehen (z. B. Squire 2011), sodass diese bei den Analysen nicht berücksichtigt werden. Dies steht in Übereinstimmung mit einem Befund von Wouters et al. (2013), bei denen situierte Lernspiele höhere positive Effekte auf das Problemlösen hatten als auf Drill-and-Practice-Anwendungen.

Weiterhin konnten Clark et al. (2016) zeigen, dass sowohl einfache Badges (einfache Punktvergabe oder Kennzeichnung der Lernaktivitäten) als auch komplexere Belohnungssysteme der Lernleistung zuträglich sind. Während Deci et al. (2001) insbesondere bei Grundschülerinnen und Grundschülern einen ungünstigen Effekt extrinsischer Anreize auf die intrinsische Motivation feststellen konnten, zeigt sich bei Serious Games, die extrinsische Anreize wie durch die o. g. Badges schaffen, keine negative Entwicklung der intrinsischen Motivation (Wouters et al. 2013; Clark et al. 2016; vgl. auch Ryan et al. 2006).

3 Fazit und Perspektiven

Digitale Medien haben das Potenzial sowohl Lernprozesse als auch Lernergebnisse zu verbessern: Dazu müssen digitale Medien jedoch zum einen die Prozesse der Informationsverarbeitung verändern. Zum anderen muss die Qualität der konkreten Funktionen und Gestaltungsmerkmale den Bedarfen des Lernenden angemessen sein. Aktuelle Befunde lassen vermuten, dass ein Mehr an digital umgesetzten Funktionen und gestalterischen Elementen nicht zwangsläufig zu besserem Lernen führt. Vielmehr sollten für die Entwicklung, den Einsatz und die Beforschung digitaler Unterrichtsmedien einerseits Erkenntnisse der klassischen Lehr-Lernforschung (z. B. konstruktivistischer Lernbegriff, instruktionspsychologische Grundlagen, Unterrichtsqualitätskriterien, Erkenntnisse zu Motivation und Einstellungen) und andererseits Erkenntnisse zum multimedialen Lernen berücksichtigt werden (z. B. strukturelle Analysen zur medienpsychologischen Wirkweise digitaler Medien). Daraus ergibt sich ein komplexes Gefüge an Gelingensbedingungen, für das Intelligente Tutorielle Systeme Unterstützung bieten. Dafür bedarf es jedoch Entwicklungsarbeit und Erforschung adaptiver Applikationen sowie ihres Einsatzes im Klassenzimmer. An diese Desiderata schließen weitere Fragen an, z. B. zur Wirkung von maschinellem Feedback auf die Motivation und das Lernverhalten oder zu den Auswirkungen auf die Interaktions- und Beziehungsqualität (Lehrkraft–Schüler/in sowie Schüler/in–Mitschüler/in). Darüber hinaus könnten neurologische Perspektiven fokussiert werden, z. B. hinsichtlich der Wirkung digitaler Medien auf das Volumen des Nucleus Accumbens, die kognitive Leistung und Gehirnreifung.