Einleitung

Sowohl im schulischen Physikunterricht als auch im Physikstudium müssen Lernende häufig abstrakte Konzepte in mehreren externen Darstellungsformen ausdrücken lernen und miteinander in Beziehung setzen, um Probleme zu lösen oder Zusammenhänge zu verstehen (Dufresne et al. 1997; Treagust et al. 2017; Rosengrant et al. 2007). Typische Beispiele sind (1) die Koordination der verschiedenen Darstellungsformen in der Kinematik (Bewegungsgleichungen, Geschwindigkeitsvektoren, Diagramme, etc.), (2) die äquivalenten Formulierungen der Maxwell-Gleichungen in differentieller und integraler Form samt typischer schematischer Darstellungen mit Leiterschleifen und Magneten oder (3) die Kontinuitätsgleichung für inkompressible Fluide, die insbesondere mit schematischen Skizzen von Geschwindigkeitsvektorfeldern in Rohrsystemen verständlich gemacht wird. Die Naturwissenschaftsdidaktiken befürworten die explizite Berücksichtigung externer Darstellungsformen in Lernprozessen. Die Ergebnisse mehrerer Studien in den letzten Jahrzehnten zeigen die Vorteile von repräsentationsbezogenen Ansätzen, z. B. in der Physik (Docktor and Mestre 2014; Nieminen et al. 2012; Treagust et al. 2017), der Biologie (Tsui and Treagust 2013; Ziepprecht et al. 2017; Nitz et al. 2014; Ubben et al. 2018), der Chemie (Gilbert and Treagust 2009; Taskin et al. 2017) und disziplinübergreifend (Van Someren et al. 1998; Hwang and Hu 2013; Brenner et al. 1997; Tippett 2011). Auch wurden systematische Lernsequenzen entwickelt, bei denen die Verwendung von multiplen Repräsentationen zum physikalischen Problemlösen als integrativer Bestandteil explizit gemacht wurde (McPadden and Brewe 2017; Klein et al. 2018a; Becker et al. 2020).

Abb. 1
figure 1

Ein zweidimensionales Vektorfeld \(\vec{F}(x,y)\) mit Divergenz Null, dargestellt wie in der Instruktion ohne (links) und mit Hilfen (rechts). In der Variante mit Hilfen wird im Diagramm die Vektorkomponentenzerlegung einer Reihe bzw. Spalte von Vektoren hervorgehoben, um die Änderung dieser Komponenten entlang der Koordinatenrichtungen (indiziert durch die farbigen Rahmen) beurteilen zu können. Die Diagramme sind in eine Textumgebung eingebettet (siehe auch Abb. 3), die sich zwischen den Instruktionen nur durch die Bezugnahme auf die visuellen Hilfen unterscheidet (z. B. „siehe grüne Pfeile“). Der mittlere Teil der Abbildung illustriert die Vektorkomponentenzerlegung

Ein konkretes Beispiel, das kürzlich in diesem Zusammenhang untersucht wurde, ist die visuelle Interpretation von zweidimensionalen Vektorfelddiagrammen hinsichtlich ihrer Divergenz oder Rotation (Singh and Maries 2013; Baily and Astolfi 2014; Bollen et al. 2017; Klein et al. 2018b). Vektorfelder sind mathematische Strukturen, die jedem Punkt im Raum (oder einer Teilmenge des Raums) einen Vektor zuordnen. Sie spielen in vielen Themengebieten der Physik eine wichtige Rolle und werden oft diagrammatisch dargestellt (siehe Abb. 1 links). Häufig werden sie damit auch zur Darstellung alltagsrelevanter Informationen verwendet (z. B. Wetterkarte). Das Wissen darüber, wie die Divergenz oder Rotation in dieser Darstellung anschaulich interpretiert werden kann, trägt zu einem besseren konzeptionellen Verständnis bei, sowohl hinsichtlich des Wissens der Lernenden über die Divergenz selbst als auch über wichtige Gesetze und Theoreme, die diesen Operator beinhalten, z. B. die Maxwell-Gleichungen oder die Integralsätze von Gauß und Stokes. Die visuelle Interpretation des Divergenzoperators mit Vektorfelddiagrammen ist ein typisches Beispiel einer Koordinierungsaufgabe, bei der verschiedene Repräsentationsformen (algebraischer Ausdruck des Operators, Vektorfelddiagramm) aufeinander bezogen werden müssen (Ainsworth 2008; Rau 2018; Chang et al. 2016). In allgemeiner Form trägt die Fähigkeit, mathematische Konzepte mit verschiedenen Darstellungen in Beziehung zu setzen, zur Repräsentationskompetenz bei und wie Feynman (1967) treffend formulierte, können dadurch neue Ideen entstehen und neue Entdeckungen ermöglicht werden. Der Erwerb dieser Fähigkeit ist kognitiv anspruchsvoll und erfordert eine Unterstützung durch geeignetes Lernmaterial (Rau 2017). Für die Entwicklung wirksamer Instruktionen zur Förderung der Repräsentationskompetenzen kann auf empirisch validierte Gestaltungsprinzipien zurückgegriffen werden, die auf multimedialen Lerntheorien basieren und beispielsweise die Vermeidung von Split Attention (Chandler and Sweller 1992), die Gewährleistung der Kohärenz (Moreno and Mayer 2000) und die Hervorhebung relevanter Informationen (visuelle Hilfen, Tabbers et al. 2004) einschließen. Das Hinzufügen und Hervorheben von relevanten Informationen zu einer Koordinierungsaufgabe wird als eine der grundlegenden verständnisfördernden Maßnahmen betrachtet (Ohlsson 1992; Madsen et al. 2013).

In diesem Beitrag wird die beschriebene Aufgabenanforderung in den Theorierahmen des Lernens mit multiplen Repräsentationen eingeordnet. Dann wird argumentiert, weshalb visuelle Hilfen bei der Vermittlung dieses Problemtyps hilfreich sein können und wie diese domänenspezifisch konstruiert wurden. Schließlich motivieren wir die Untersuchung der visuellen Aufmerksamkeit durch die Eye-Tracking-Methode. Auf diesem Theorierahmen begründen wir die Wirksamkeit der visuellen Hilfen und operationalisieren dies über die Ausprägung bestimmter Metriken der Augenbewegungen sowie der Testleistung. Anschließend wird die Untersuchungsmethode zur Prüfung dieser Hypothesen dargestellt, gefolgt von den Ergebnissen und deren Diskussion.

Theoretischer Hintergrund

Viele Arbeiten zeigen, dass das Verständnis multipler Repräsentationen wichtig für das Lernen und Problemlösen ist (Ainsworth 1999; Delice and Sevimli 2010; Brenner et al. 1997; Azevedo 2000). Beispielsweise können multiple Repräsentationen komplexe und abstrakte wissenschaftliche Konzepte leichter zugänglich machen (Ainsworth 1999). Um Repräsentationen nutzen zu können, müssen Lernende erst Wissen über die Repräsentation selbst erlangen, was auch als representational dilemma bezeichnet wird (Rau 2017), weil das Lernen mit und das Lernen über Repräsentationen häufig nicht unabhängig voneinander geschieht und sich wechselseitig bedingt. Unterstützende Hinweise über Repräsentationen können Lernenden beim Verständnis der Repräsentationen helfen, um die oben genannten Vorteile verschiedener Darstellungen in vollem Umfang nutzen zu können. Dies ist insbesondere dann wichtig, wenn die Repräsentationen komplex und für Lernende unvertraut sind (Rau 2017).

Domänenspezifischer Lerngegenstand

Die hier thematisierte Problemstellung erfordert eine visuelle Interpretation des Divergenzoperators in kartesischen Koordinaten,

$$\textrm{div }\vec{F}(x,y)=\frac{\partial F_{x}}{\partial x}+\frac{\partial F_{y}}{\partial y}\,,$$
(1)

wobei \(\vec{F}(x,y)\) ein zweidimensionales Vektorfeld mit Komponenten \(F_{x}\) und \(F_{y}\) bezeichnet. Per Definition kann die Divergenz eines Vektorfeldes qualitativ bewertet werden (Null oder ungleich Null), indem die partiellen Komponentenableitungen interpretiert werden (siehe z. B. (Klein et al. 2018b) für eine ausführliche Problemanalyse). Die Koordination zwischen Gleichung (1) und dem graphischen Vektorfelddiagramm in Abb. 1 (links) erfordert die Überprüfung der Veränderung (Kovariation) beider Feldkomponenten bzgl. der \(x\)- bzw. \(y\)-Richtung. Frühere Forschung zeigte, dass eine qualitative Beurteilung der Divergenz von Vektorfeldern nur selten gelingt (Bollen et al. 2015, 2016; Singh and Maries 2013). So wurde zum Beispiel festgestellt, dass selbst graduierte Studierende große Schwierigkeiten hatten, einen Bezug zwischen der Divergenzformel (Gl. 1) und den Diagrammen herzustellen (Singh and Maries 2013). Nur etwa die Hälfte der Studierenden konnte korrekt beurteilen, ob ein Vektorfelddiagramm eine von Null verschiedene Divergenz besitzt. Ähnliche Ergebnisse wurden von Bollen et al. (2015) gefunden und in einer späteren Arbeit bestätigt (Bollen et al. 2016). Auch eine explizite Instruktion zu Aufgaben diesen Typs erhöhte das Verständnis nur unzureichend (Klein et al. 2018b). Die Studierenden hatten hauptsächlich Probleme mit der korrekten Interpretation partieller Ableitungen (Pepper et al. 2012; Klein et al. 2018b).

Visuelle Hilfen

Um Hilfen für eine unterstützende Instruktion zu entwerfen, muss neben der fachlichen Analyse der Aufgabenanforderung entschieden werden, welche Rolle die Hilfe bei der Instruktion spielen soll. Nach De Jong and Lazonder (2014) kann eine Hilfe in verschiedenen Formen erfolgen, z. B. durch direkte Aufforderungen, die den Lernenden vermitteln, was sie tun sollen, Scaffolds, die den Lernenden zusätzliche Informationen bieten, um die Anforderung zu erfüllen, Farbkodierungen zur Erzeugung von Kohärenz oder Zusatzmaterial, das Informationen für Lernende mit unzureichenden Vorkenntnissen bereitstellt (siehe auch Ozcelik et al. 2009). Van Gog (2014) benennt mit (i) „Picture-Based Cues“ und (ii) „Cueing Corresponding Elements in Written Text and Pictures“ die beiden Arten der Hilfen, die wir in dieser Studie nutzen (vgl. Abb. 1 rechts):

  1. 1.

    Mit Einfärbungen und Umrahmungen werden die Vektorkomponentenzerlegung sowie die Richtungen zur Beurteilung der partiellen Ableitungen im Diagramm hervorgehoben.

  2. 2.

    Ein nebenstehender erklärender Text bezieht sich direkt auf diese Hervorhebungen, sodass ein Bezug zwischen Diagramm und Gleichung hergestellt wird.

Zusammengenommen können visuelle Hinweise den Lernenden helfen, konzeptuell relevante Informationen zu beachten und zu verwenden, die sie sonst vielleicht nicht berücksichtigt hätten (siehe Schneider et al. 2018 für einen Überblick). Wie Madsen et al. (2013) betonen, garantiert die Bereitstellung von visuellen Hinweisen keineswegs, dass die Lernenden zu einer korrekten Lösung und zum richtigen Verständnis des Problems gelangen. Visuelle Hinweise können Zusammenhänge zwischen Repräsentationen explizit machen und sie können das Lernen erleichtern, indem sie eine tiefere Auseinandersetzung mit dem Lerninhalt begünstigen und dem Lernenden helfen, oberflächliches Lesen zu vermeiden. Das Einführen visueller Hilfen ist allerdings nicht per se zielführend. So stellten Lopez and Pinto (2017) beispielsweise in halbstrukturierten Interviews über die Wahrnehmung einer Simulation fest, dass die Lernenden Schwierigkeiten hatten, die vielfältigen Darstellungen zu verarbeiten; sie schenkten trivialen Elementen zu viel Aufmerksamkeit oder ließen wichtigen Elemente aus. Um zu verstehen, wie Lernende eine Instruktion verwenden, ist es daher wichtig, zu untersuchen, welchen Elementen sie visuelle Aufmerksamkeit schenken.

Tab. 1 Eye-Tracking-Metriken und kognitive Prozesse bei der Koordination zwischen Text und visueller Repräsentation sowie beim anschließenden Problemlösen

Eye-Tracking beim multimedialen Lernen

Der Einsatz von Eye-Tracking-Methoden zur Untersuchung multimedialer Lernprozesse hat in den letzten Jahrzehnten zugenommen (siehe Meta-Studien von Alemdag and Cagiltay 2018; Jarodzka et al. 2017; Lai et al. 2013). Die Analysen der visuellen Aufmerksamkeit wurden dabei insbesondere deshalb durchgeführt, um einen Einblick in die kognitiven Prozesse beim multimedialen Lernen zu erhalten (Van Gog and Scheiter 2010; Hyönä 2010). Die Verbindung zwischen visueller Aufmerksamkeit und kognitiven Prozessen kann durch zwei Annahmen beschrieben werden (Just and Carpenter 1984). Die Unmittelbarkeitsannahme (immediacy assumption) sagt aus, dass Informationsverarbeitung unmittelbar bei der visuellen Wahrnehmung von äußeren Reizen auftritt. Die Eye-Mind-Hypothese besagt, dass die visuell fixierten Informationen auch mental verarbeitet werden. Mit anderen Worten, die Art und Weise, wie ein Individuum Informationen wahrnimmt, spiegelt die kognitive Informationsverarbeitung wider. Beispielsweise haben frühere Studien gezeigt, dass erfahrene LernerInnen im Gegensatz zu unerfahrenen LernerInnen aufgabenrelevante Bereiche einer Repräsentation häufiger fokussieren als irrelevant Bereiche (Gegenfurtner et al. 2011). Außerdem stehen längere Fixationszeiten beim ersten Betrachten eines Stimulus in Verbindung mit Verständnisschwierigkeiten und sind erwiesenermaßen negativ mit Lernergebnissen korreliert (Mason et al. 2013). Zusammenfassend steht durch die Analyse der visuellen Aufmerksamkeit eine Methode zur Untersuchung von Lernprozessen beim multimedialen Lernen zu Verfügung, mit der auch die Frage beantwortet werden kann, wie Lernende eine Instruktion verwenden (vgl. auch Ubben et al. 2018).

Nichtsdestotrotz wurde das Lernen mit expliziten Instruktionen bisher nur selten mit Eye-Tracking untersucht. Ein in der Instruktionspsychologie in diesem Zusammenhang häufig thematisierter Ansatz sind eye movement modelling examples (EMME), bei denen die Aufmerksamkeit beim Lernen mithilfe von Blickbewegungen eines/r Experten/Expertin gezielt gelenkt wird (Jarodzka et al. 2013). Ergebnisse einer Wirksamkeitsstudie von Jarodzka et al. (2013) zeigten dabei ein zielgerichtetes visuelles Suchverhalten sowie eine verbesserte Interpretation relevanter Informationen infolge einer EMME-Intervention. Im Fall der hier betrachteten Koordinierungsaufgabe wird das Blickverhalten jedoch nicht dynamisch auf relevante Aspekte der Instruktion gelenkt, sondern es obliegt den Lernenden, diese selbstständig zu identifizieren und Zusammenhänge zwischen diesen herzustellen. Dennoch erfüllen die visuellen Hilfen einen ähnlichen Zweck wie die modellierten Augenbewegungen, indem sie beabsichtigen, die visuelle Aufmerksamkeit gezielt zu beeinflussen und so den Lernprozess zu unterstützen. Für ein tieferes Verständnis der Instruktion sowie der kognitiven Prozesse im Umgang mit dieser ist es deshalb wichtig, zu untersuchen, inwiefern die Lernenden alle relevanten dargebotenen Informationen nutzen und wie die Gruppen mit und ohne Hilfen im Vergleich visuell agieren. Gemäß der kognitiven Theorie multimedialen Lernens (Cognitive Theory of Multimedia Learning, CTML; Mayer 2005) sind drei Prozesse (Selektion, Organisation und Integration) beim Koordinieren multipler Repräsentationen relevant, die von der Hervorhebung relevanter Informationen mit visuellen Hinweisen profitieren können (De Koning et al. 2007; Madsen et al. 2013). Die Selektion wird als der Prozess des Zugriffs auf Informationen aus einer Darstellung beschrieben. Durch die Hervorhebung relevanter Informationen in einer visuellen Darstellung, wie z. B. der Vektorzerlegung, ist es für Lernende einfacher, sich dieser Information zu widmen. Erleichterte Auswahlprozesse sind mit einer kürzeren Zeit assoziiert, die für die Fixation auf relevanten Information benötigt wird. Die Zeit bis zur ersten Fixation misst dabei den Zeitpunkt, zu dem die Lernenden mit der Verarbeitung bestimmter relevanter Informationen beginnen (Hyönä 2010). Der zweite Prozess, die Organisation, beschreibt einen Verarbeitungsprozess der ausgewählten Informationen, mit dem Ziel eine kohärente interne Repräsentation aufzubauen. In unserem Beispiel werden die \(x\)- und \(y\)-Richtungen durch Rahmenboxen und die Vektorkomponenten farblich konsistent hervorgehoben, sodass diese Informationen leichter verarbeitet werden können. Organisationsprozesse treten auf, wenn einzelne Teile der Instruktion (z. B. das Vektorfelddiagramm oder der nebenstehende Text) verarbeitet werden. Diese Verarbeitung findet zunächst in verschiedenen Kanälen des Arbeitsgedächtnisses statt (Mayer 2005), um ein mentales Model zu jedem dieser einzelnen Teile zu bilden, bevor diese im nächsten Schritt zusammengefügt und mit dem Vorwissen verknüpft werden (Integration, siehe unten). Die Gesamtfixationsdauer und die Anzahl der Fixationen können hierbei einen Hinweis auf die „Menge der Aufmerksamkeit“ geben, die einem textuellen oder bildlichen Bereich zugewiesen wird (Scheiter and Eitel 2017) und eine tiefergehende Wissensorganisation ist durch eine höhere Anzahl von Fixationen gekennzeichnet (Scheiter and Eitel 2017; Park et al. 2015a). Mit anderen Worten findet beim Betrachten eine lokale Kohärenzbildung statt, indem die Bedeutungselemente innerhalb einer Repräsentation verknüpft und interpretiert werden (Brünken et al. 2005). Park et al. (2015a) nehmen dabei explizit an, dass Organisationsprozesse während der Fixation der verarbeiteten Informationen stattfindet, wobei die Dauer die Güte dieses Prozesses widerspiegelt. Der dritte Prozess, die Integration, stellt die Kombination der Repräsentationen mit aktiviertem Vorwissen dar. Insbesondere müssen die Lernenden Elemente über mehrere Darstellungen hinweg integrieren, z. B. graphische Darstellungen und Gleichungen mit Text koordinieren, um ein mentales Modell zur Lösung eines Problems zu erstellen (globale Kohärenzbildung; Brünken et al. 2005). Integrationsprozesse werden durch Übergänge zwischen relevanten Elementen, sog. Transitionen, quantifiziert (Krejtz et al. 2016; Holsanova et al. 2009; Schmidt-Weigand et al. 2010; Schüler 2017). Zusammenfassend kann durch Analyse von Augenbewegungen die kognitive Verarbeitung beim Lernen aufgrund text- und bildbasierter Informationen untersucht werden, wobei die in Tab. 1 dargestellten Eye-Tracking-Metriken Indikatoren für die kognitiven Lernprozesse sind. In der letzten Tabellenspalte werden die Selektions‑, Organisations- und Integrationsprozesse (SOI-Prozesse) für das hier vorgestellte Anwendungsbeispiel erklärt. Die Operationalisierung der SOI-Prozesse über die aufgeführten Eye-Tracking-Metriken wird durch die Ergebnisse einer Meta-Analyse zu Eye-Tracking beim multimedialen Lernen gestützt (Alemdag and Cagiltay 2018).

Neben den aufgeführten relevanten Untersuchungen im Bereich des multimedialen Lernens liegen auch zwei physikdidaktische Eye-Tracking-Studien zur Interpretation von Vektorfeldern vor (Klein et al. 2018b, 2019). Beide zeigen, dass eine korrekte Anwendung der Strategie zur Beurteilung der Divergenz über die partiellen Ableitungen mit Augenbewegungen verbunden sind, die diese Strategie charakterisieren, nämlich systematische Sakkaden in vertikaler und horizontaler Richtung. Um die Wirkung der visuellen Hilfen auf die Augenbewegungen beim Problemlösen zu untersuchen, wird in dieser Studie bei den Aufgaben im Anschluss an die Instruktion ebenfalls Eye-Tracking zur Analyse der Sakkadenrichtungen eingesetzt (siehe Tab. 1).

Räumliche Fähigkeiten

Unter „räumlichen Fähigkeiten“ wird im Folgenden eine Kombination aus „räumlichem Vorstellungsvermögen“ und „räumlich-visuellem Kurzzeitgedächtnis“ verstanden. Die bei dieser Untersuchung zentrale Aufgabenstellung besteht darin, komplexe Vektorfelddarstellungen visuell zu interpretieren. Dies stellt kognitive Anforderungen an die räumlich-visuelle Verarbeitung der Repräsentationen: Vektoren müssen mental in Komponenten zerlegt, diese Information mental aufrechterhalten und benachbarte Vektoren miteinander verglichen werden. Deshalb ist es naheliegend, dass die kognitiv-räumlichen Fähigkeiten der Studierenden im Zusammenhang mit ihrem Verständnis stehen. Generell spielen visuell-räumliche Fähigkeiten beim physikalischen Problemlösen und Argumentieren eine wichtige Rolle (Scheid et al. 2019; Opfermann et al. 2017; Kozhevnikov et al. 2007). In der Literatur gibt es verschiedene Kategorisierungen von räumlichen Fähigkeiten (Newcombe and Shipley 2015), siehe Cole et al. 2018 für einen Überblick); alle beinhalten die Fähigkeit, mental Objekte räumlich zu manipulieren, z. B. zu rotieren. Bei dem hier verwendeten Aufgabentyp (Divergenz beurteilen) ist neben der mentalen Projektion eines Vektors auf eine Komponente noch das mentale Abspeichern dieser Komponente für den Vergleich wichtig. Tests, die beide Anforderungen abprüfen (mentale Operation und Abspeichern von Informationen) sind sog. duale Spannentests (Della Sala et al. 1995; Shah and Miyake 1996).

Bisherige Forschungsergebnisse deuten darauf hin, dass SchülerInnen mit höheren visuellen Fähigkeiten besser von und mit Visualisierungen lernen können (Castro-Alonso et al. 2019), z. B. bei der Interpretation von Graphen (Stieff 2007; Kozhevnikov et al. 2007). Insbesondere konnte ein Zusammenhang zwischen visueller Aufmerksamkeit und räumlichen Fähigkeiten beim physikalischen Problemlösen nachgewiesen werden (Kozhevnikov et al. 2007). In der Arbeit von Kozhevnikov et al. (2007) wurden fachfremde Studierende dazu in drei Kategorien eingeteilt (niedrige, mittlere und hohe räumliche Fähigkeiten) und es wurde gezeigt, dass Studierende mit hohen räumlichen Fähigkeiten Bewegungen besser kombinieren und Graphen adäquater verarbeiten können. Die vorliegende Untersuchung greift diesen Ansatz zur Unterteilung auf und überträgt die Forschungsfrage zum Einfluss der räumlichen Fähigkeiten auf eine curricular valide Zielgruppe.

Hypothesen und Forschungsfragen

In dieser Studie werden visuelle Hilfen zur Hervorhebung relevanter Informationen bzgl. der Interpretation von Vektorfeldern eingesetzt. Neben der Frage nach der Wirksamkeit der Hilfen bei anschließenden Aufgaben wird insbesondere die Nutzung der Hilfen beim Bearbeiten der Instruktion (VH-Gruppe) im Vergleich zu einer äquivalenten Instruktion ohne Hilfen (OH-Gruppe) untersucht. Es ergeben sich folgende Hypothesen:

Hyp 1a:

(Selektion) Visuelle Hilfen führen zu einer schnelleren Selektion lernrelevanter Informationen, d. h. Studierende in der VH-Gruppe benötigen weniger Zeit bis zur ersten Fixation im lernrelevanten Bereich (Diagramm) als Studierende der OH-Gruppe.

Hyp 1b:

(Organisation) Visuelle Hilfen verbessern die Organisation von Informationen, d. h. Studierende in der VH-Gruppe haben eine höhere Anzahl an Fixationen auf dem lernrelevanten Bereich (Diagramm) als Studierende der OH-Gruppe.

Hyp 1c:

(Integration) Visuelle Hilfen verstärken Integrationsprozesse zwischen relevanten Informationen, d. h. Studierende der VH-Gruppe haben eine höhere Anzahl Transitionen zwischen Text und Diagramm als Studierende der OH-Gruppe.

Die Korrektheit (zumindest einiger) dieser Hypothesen vorausgesetzt, müsste sich in der VH-Gruppe eine bessere Lernleistung bei den instruktionsanschließenden Aufgaben ergeben, die für beide Studierendengruppen identisch sind und – dies ist ein wesentliches Merkmal – keine visuelle Hilfen beinhalten.

Hyp 2a:

Studierende der VH-Gruppe zeigen nach der Instruktion eine höhere Leistung bei Aufgaben, die den in der Instruktion erklärten Repräsentationswechsel erfordern.

Die korrekte Anwendung der instruierten Strategie drückt sich auch in spezifischen Blickmustern aus (Klein et al. 2018b, 2019), sodass Hyp 2a um eine Prozesskomponente ergänzt wird:

Hyp 2b:

Studierende der VH-Gruppe wenden die visuelle Strategie zur Beurteilung der Divergenz häufiger korrekt an, was durch Augenbewegungen in horizontaler und vertikaler Richtung über Vektorfelddiagramme und das Vermeiden obliquer Sakkaden indiziert wird.

Schließlich wird die Forschungsfrage aufgeworfen, inwiefern die Ausprägung der kognitiv-räumlichen Fähigkeiten das in Hyp. 2a sowie 2b formulierte Ergebnis beeinflusst:

FF 1:

Gibt es einen Zusammenhang zwischen den kognitiv-räumlichen Fähigkeiten der Studierenden und deren Leistung?

FF 2:

Wird die Wirksamkeit visueller Hilfen durch kognitiv-räumliche Fähigkeiten beeinflusst?

Einsicht in diese Art von Fragestellung, nämlich welche Zielgruppe von einer bestimmten Hilfsmaßnahme profitiert, liefert einen Beitrag zur Forschung über zugeschnittene Hilfestellungen, die zunehmend häufiger auch im Rahmen adaptiven Testens untersucht werden.

Material und Methoden

Stichprobe

Die Stichprobe wurde aus Studierenden der Ingenieurwissenschaften an der Technischen Universität Kaiserslautern im Rahmen einer großen Studieneingangsvorlesung im Wintersemester 2019/2020 rekrutiert. Insgesamt nahmen 141 Studierende (108 männlich, Durchschnittsalter 20.4 Jahre), überwiegend im ersten Studienjahr, an der Untersuchung teil, was mit Zusatzpunkten zur Klausurzulassung vergütet wurde. Die demographischen Daten und verschiedene Indikatoren der Vorleistung sind in Tab. 2 aufgeführt. Die Normalverteilungen der in Tab. 2 aufgeführten Variablen wurden mit Shapiro-Wilk-Tests separat für beide Gruppen geprüft. Mit Ausnahme der Physik-Vorleistung in der VH-Gruppe können alle Variablen als normalverteilt angenommen werden. Etwaige Unterschiedlichkeiten bzgl. der Vorleistungsindikatoren zwischen den Gruppen können durch zweiseitige t‑Tests ausgeschlossen werden. Bei diesen multiplen paarweisen Vergleichen und Normalverteilungstests wurde eine Bonferroni-Korrektur des \(\alpha\)-Niveaus durchgeführt. Die vier Vorleistungsindikatoren sind nicht unabhängig voneinander; so korreliert beispielsweise die Abiturnote signifikant (\(p<0.01\)) mit der Vorleistung in Physik (\(r=-0.49\)), Mathematik (\(r=-0.47\)) und der räumlichen Fähigkeit (\(r=-0.23\)). Eine multivariate Varianzanalyse sichert das Ergebnis vorleistungshomogener Gruppen ab, \(F(4,121)=0.88,p=0.48\).

Tab. 2 Stichprobendaten (Mittelwert und Standardabweichung)

Studienverlauf

Die Studierenden wurden in Kleingruppen in das Eye-Tracking-Labor gebeten, wo sie zunächst einen Vortest und einen standardisierten Test über räumliche Fähigkeiten bearbeiteten (vgl. Abb. 2). In der anschließenden Eye-Tracking-Phase wurde den Studierenden nach erfolgreicher Kalibrierung aber vor jeglicher Instruktion ein erstes Vektorfelddiagramm gezeigt, das sie hinsichtlich der Divergenz qualitativ beurteilen sollten (VF0), wobei eine zusätzliche Antwortoption „Ich kann keine Aussage treffen“ angeboten wurde. Die Studierenden wurden dann randomisiert in eine von zwei Gruppen eingeteilt und erhielten einen Erklärtext über die Interpretation der Divergenz von Vektorfeldern entweder mit oder ohne Hilfen. Anschließend wendeten die Studierenden die erklärte Strategie an, um die Divergenz von sechs Vektorfelddiagrammen (VF1-VF6) nacheinander zu beurteilen. Nachdem sie das auf einer Seite dargestellte Diagramm hinsichtlich der Divergenz beurteilt hatten, drückten sie eine Taste, um zur Eingabeseite zu gelangen und markierten ihre Antwort. Durch den Seitenwechsel mit Tastendruck und anschließender Antworteingabe wurde sichergestellt, dass die Blickdaten, die dem Problemlöseprozess zugehören, nicht mit denen der Antworteingabe vermischt wurden. Es gab während des Experiments keine zeitlichen Beschränkungen und die Studierenden erhielten kein Feedback. Sie durften keine Hilfsmittel verwenden, Notizen anfertigen oder zurückspringen. Zum Schluss wurden die demographischen Daten sowie die Einschätzung der Instruktionsqualität und der mentalen Beanspruchung durch den Aufgabentyp erhoben.

Abb. 2
figure 2

Studienverlaufsplan. Die Einteilung in Interventions- (mit visuellen Hilfen, VH) und Kontrollgruppe (ohne Hilfen, OH) erfolgte zufällig

Tests und visuelle Stimuli

Räumliche Fähigkeiten

Zur Erfassung der räumlichen Fähigkeiten wurde eine Version der Spatial Span Task (SST) verwendet (Shah and Miyake 1996), die die Fähigkeit misst, räumliche Informationen gleichzeitig zu verarbeiten und im Gedächtnis zu halten. Studierende müssen die räumliche Darstellung präsentierter Buchstabensets beurteilen und erinnern. Ein Buchstabe (F, J, L, P oder R) wird (a) entweder korrekt oder spiegelbildlich dargestellt und (b) um seine vertikale Achse um einen Winkel von 0\({}^{\circ}\), 45\({}^{\circ}\), 90\({}^{\circ}\), 135\({}^{\circ}\), 180\({}^{\circ}\), 225\({}^{\circ}\), 270\({}^{\circ}\) oder 315\({}^{\circ}\) gedreht. Innerhalb von zwei Sekunden müssen die ProbandInnen durch Drücken der entsprechenden Taste auf der Tastatur festlegen, ob die Darstellung des Buchstabens korrekt oder spiegelbildlich ist, sich die räumliche Orientierung des Buchstabens merken und für variierende Testsatzgrößen wiedergeben. Auf Basis des SST-Scores werden Studierende mittels Terzilsplit in eine von drei Kategorien räumlicher Fähigkeiten eingeordnet (vgl. Kozhevnikov et al. 2007).

Instruktionsseite

Die Instruktion umfasst etwa 300 Wörter, eine Formel und eine Abbildung. Der Text leitet in die Problemstellung ein, präsentiert die formale Definition der Divergenz (siehe Abb. 3 und Gl. 1) und erklärt, wie die Divergenz eines Vektorfeldes interpretiert werden kann. Dabei werden die Konzepte der Vektordekomposition und der partiellen Ableitung aufgegriffen. Die Instruktion der Interventionsgruppe unterscheidet sich von der Instruktion der Kontrollgruppe dadurch, dass in dem dargestellten Vektorfeld die Vektorkomponentenzerlegung in einer Spalte bzw. Reihe mit abweichendem Farbton dargestellt ist und diese durch eine farbige Box umrahmt wird. Der nebenstehende Erklärtext nimmt Bezug auf diese Hervorhebungen (z. B. „siehe rote Farbbox“) und ist dadurch in der VH-Gruppe geringfügig länger. Die Instruktion schließt mit fachlichen Hinweisen, die für die Anwendung der Strategie nicht relevant sind. Die fachliche Korrektheit der Instruktion wurde von vier Physik-Dozierenden mit Lehrerfahrung und fünf Physikdidaktikern überprüft.

Abb. 3
figure 3

Instruktionsseite (ohne Hilfen) mit schematischer Darstellung der Einleitung (E), des Textbereichs mit Schritt-für-Schritt Erklärtext (T), des Diagramms (D) und des Hinweises (H) inklusive beispielhafter Blickdaten eines Probanden

Vektorfelddiagramme

Die Vektorfelddiagramme weisen entweder keine Divergenz (\(\text{div }\vec{F}=0\)) oder eine konstante Divergenz ungleich Null auf. Bei den Vektorfeldern ändert sich entweder die Länge oder die Orientierung der Pfeile (oder beides) in Bezug auf eine (oder zwei) Koordinaten. Ein Beispielvektorfeld ist in Abb. 4 gezeigt. Die Vektorfelder wurden in ähnlicher Form bereits eingesetzt (Singh and Maries 2013; Bollen et al. 2016; Klein et al. 2018b).

Kontrollvariablen

Zwei Fragebögen messen die empfundene Aufgabenschwierigkeit (6 Items, Reliabilität nach Cronbach: α = 0.85; Beispiel: „Ich fand es schwierig, die Veränderung von Vektorfeldkomponenten zu beurteilen“) und die Instruktionsqualität (6 Items, \(\alpha=0.88\); Beispiel: „Nach dem Lesen der Instruktion war mir klar, was ich zu tun hatte“). Ein Vortest erfragt mit sechs Items (\(\alpha=0.77\)) das Verständnis der Vektorkomponentenzerlegung, was zum Verstehen der Instruktion vorausgesetzt wird.

Eye-Tracking-Apparatur und Areas Of Interest

Die Texte und Aufgaben wurden auf einem 22-Zoll-Computerbildschirm (\(1920\times 1080\) Pixel Auflösung, 75 Hz Bildfrquenz) präsentiert. Die Augenbewegungen wurden mit dem stationären Eye-Tracking-System Tobii X3-120 aufgezeichnet, das mit einer Genauigkeit von weniger als 0.40\({}^{\circ}\) Sehwinkel und einer Abtastfrequenz von 120 Hz arbeitet. Zur Kalibrierung verfolgten die Studierenden einen Punkt auf einem Computerbildschirm, der nacheinander an neun verschiedenen Positionen des Bildschirms stoppte. Die Übereinstimmung der gemessenen Blickpositionen mit den tatsächlichen Bildpunkten auf dem Bildschirm wurde durch den Versuchsleiter kontrolliert und die Kalibrierung wiederholt, falls das Ergebnis nicht zufriedenstellend war.

Für die Analyse der Blickdaten werden auf der Instruktionsseite vier Interessengebiete (Areas Of Interest; AOIs) definiert, die in Abb. 3 exemplarisch für die OH-Instruktion gezeigt sind (E, T, D, H). Größe und Position der AOIs sind bei beiden Instruktionsseiten (VH, OH) identisch. Bezogen auf die AOIs werden für jede/n Probanden/Probandin die Zeit bis zur ersten Fixation auf AOI (D), die Anzahl der Fixationen auf AOI (D) sowie die Transitionen zwischen den AOIs (D) und (T) berechnet. Zur Erkennung von Fixationen und Sakkaden wurde ein I‑VT-Algorithmus (Identifikation durch Geschwindigkeitsschwelle) verwendet (Andersson et al. 2017). Eine Augenbewegung wurde als Sakkade (d. h. in Bewegung) klassifiziert, wenn die Geschwindigkeit \({30}^{\circ}/\text{s}\) überschritt. Eine Transition ist eine Sakkade von einer AOI (z. B. Diagramm) in eine andere AOI (z. B. Text); dabei wird zwischen den beiden möglichen Richtungen (T‑D oder D‑T) nicht unterschieden. Außerdem wird für jedes Vektorfeld (VF0-VF6) eine AOI über das Vektorfeld gelegt, um die Sakkadenrichtungen zu bestimmen (vgl. Abb. 4).

Abb. 4
figure 4

Eines von 6 Vektorfeldern zur Beurteilung der Divergenz. Dargestellt ist eine exemplarische Abfolge der Fixationen eines Studierenden (orange). Die aufsteigenden Zahlen geben die Reihenfolge der Fixationen an und der Radius der Kreise indiziert die Fixationsdauer. Der absolute Sakkadenwinkel ist für die erste Sakkade eingezeichnet

Ergebnisse

Die hypothesenbezogenen produkt- und prozessbasierten Daten sowie die Ausprägungen bzgl. der Kontrollvariablen sind deskriptiv in Tab. 4 für beide Untersuchungsgruppen dargestellt. Die Ergebnisse aus den inferenzstatistischen Analysen dieser Variablen sind in der Ergebnistabelle 3 zusammengefasst. Außerdem sind im Anhang die Ergebnisse messwiederholter Analysen zu den Blickrichtungen bei der Aufgabenbearbeitung (Tab. 5) sowie diesbezügliche Korrelationsanalysen (Tab. 6) enthalten.

Vorwissen der Studierenden

Wie in Tab. 2 dargestellt ist, zeigen sich keine signifikanten Unterschiede zwischen der Kontroll- und der Interventionsgruppe vor der Instruktion. Beim Vortest zur Vektorkomponentenzerlegung wurde mit durchschnittlich 5.6 von 6 möglichen Punkten ein starker Deckeneffekt erzielt (93 % korrekt), sodass die Eingangsvoraussetzungen zum Verstehen der Instruktion in beiden Gruppen erfüllt sind. Die Aufgabe, vor der Instruktion ein Vektorfeld visuell hinsichtlich Divergenz zu beurteilen (VF0), wurde von 19.9 % der Studierenden korrekt beantwortet, ohne Unterschiede zwischen OH- und VH-Gruppe, \(t(139)=0.12,p=0.90\). Dabei ist auch die Antwortkategorie, keine Aussage treffen zu können, eingeschlossen. Werden nur tatsächlich getroffene Aussagen berücksichtigt (\(N=91\)), beträgt die Antwortkorrektheit 31 %, ebenfalls ohne Unterschied zwischen OH- und VH-Gruppe, \(t(89)=0.10,p=0.92\).

Zur Unterteilung der Stichprobe in drei Kategorien räumlicher Fähigkeiten wurde ein Terzilsplit am SST-Score vorgenommen. Dadurch ergeben sich Gruppen niedriger (SST \(<0.33\), \(N_{\text{N}}=46\)), mittlerer (SST \(=0.33\)\(0.52\), \(N_{\text{M}}=47\)) und hoher räumlicher Fähigkeiten (SST \(> 0.52\), \(N_{\text{H}}=48\)) mit stark diskriminierenden SST-Mittelwerten (\(F(2,138)=406,p<0.001,\eta^{2}=0.86\)).

Tab. 3 Ergebnistabelle zu den univariaten Varianzanalysen (Faktor 1: Gruppe, Faktor 2: Räumliche Fähigkeiten) und anschließenden Post-hoc-Tests

Testleistung und Kontrollvariablen

Eine zweifaktorielle Varianzanalyse bzgl. der Testleistung ergibt einen signifikanten Haupteffekt des ersten Hauptfaktors Gruppe, \(F(1,135)=7.1,p<0.01,\eta^{2}=0.04\), sowie des zweiten Hauptfaktors räumliche Fähigkeiten, \(F(2,135)=16.3,p<0.001,\eta^{2}=0.09\), ohne signifikante Interaktion zwischen Gruppenzugehörigkeit und räumlichen Fähigkeiten, \(F(2,135)=0.9,p=0.39\). Wie in Abb. 5 dargestellt ist, schneidet die Interventionsgruppe mit Hilfen (VH) besser ab als die Kontrollgruppe ohne Hilfen (OH) und ein post-hoc Test ergibt eine mittelgroße Effektstärke nach Cohen (\(d=0.41\))Footnote 1. Aus der Abbildung wird ebenfalls ersichtlich, dass der Einsatz von Hilfen bei Studierenden mit niedrigen räumlichen Fähigkeiten keinen Effekt erzielt (\(d=0.14\); unbedeutend), bei Studierenden mit mittleren und hohen räumlichen Fähigkeiten hingegen mittelstarke Effekte (\(d=0.66\) bzw. \(d=0.59\)).

Die Analyse der Instruktionsqualität ergibt weder bzgl. des Faktors Gruppe noch bzgl. des Faktors räumliche Fähigkeiten signifikante Haupteffekte und auch ein Interaktionseffekt liegt nicht vor. Die Aufgabenschwierigkeit unterscheidet sich hingegen sowohl zwischen den beiden Gruppen (\(F(1,135)=5.6,p=0.02,\eta^{2}=0.04\)) als auch zwischen den Studierenden unterschiedlicher räumlicher Fähigkeiten (\(F(2,135)=6.9,p=0.001,\eta^{2}=0.08\)). Ein Interaktionseffekt liegt nicht vor. Studierende ohne Hilfen beurteilen den Aufgabentypus schwieriger (\(d=0.37\)) als Studierende mit Hilfen und Studierende mit hohen räumlichen Fähigkeiten beurteilen ihn beispielsweise einfacher als Studierende mit niedrigen Fähigkeiten (\(d=0.73\)).

Abb. 5
figure 5

Testergebnis in Studierendengruppen unterschiedlicher räumlicher Fähigkeiten (RF) in beiden Untersuchungsgruppen (OH = Ohne Hilfen, VH = visuelle Hilfen). Die gestrichelte Linie markiert die Mittelwerte der Untersuchungsgruppen, der Fehlerbalken gibt den Standardfehler an

Augenbewegungen während des Lesens der Instruktion

Abb. 6 zeigt die Mittelwerte der Eye-Tracking-Metriken für die Untersuchungsgruppen und für jede Kategorie räumlicher Fähigkeiten. Die Ergebnisse aus den Analysen der Eye-Tracking-Metriken sind ebenfalls in der Ergebnistabelle 3 zusammengefasst. Für die Zeit bis zur ersten Fixation im Diagramm (Abb. 6 links) ergibt eine zweifaktorielle Varianzanalyse einen signifikanten Haupteffekt auf dem Faktor Gruppe, \(F(1,133)=6.0,p=0.01,\eta^{2}=0.04\). Der zweite Hauptfaktor (räumliche Fähigkeiten, \(F(2,133)=0.8,p> 0.40\)) und die Interaktion (\(F(2,133)=0.8,p> 0.4\)) sind nicht signifikant. Für die anderen beiden Metriken ergeben sich ähnliche Ergebnisse: Die Anzahl Fixationen auf dem Diagramm (Abb. 6 mittig) unterscheidet sich signifikant zwischen den Gruppen, \(F(1,133)=37.4,p<0.001,\eta^{2}=0.22\), aber nicht zwischen verschiedenen Ausprägungen räumlicher Fähigkeiten (\(F(2,133)=0.0,p> 0.9\)) und es gibt keinen Interaktionseffekt (\(F(2,133)=0.5,p> 0.6\)). Die Anzahl Transitionen zwischen Diagramm und Text (Abb. 6 rechts) unterscheidet sich ebenso signifikant zwischen den Gruppen, \(F(1,135)=20.4,p<0.001,\eta^{2}=0.13\), aber nicht zwischen verschiedenen Ausprägungen räumlicher Fähigkeiten (\(F(2,135)=0.1,p> 0.8\)) und es gibt keinen Interaktionseffekt (\(F(2,135)=0.2,p> 0.8\)). Der SST-Score zeigt keine signifikante Korrelation mit den Eye-Tracking-Metriken.

Abb. 6
figure 6

Vergleich dreier Eye-Tracking-Metriken zwischen Studierendengruppen unterschiedlicher räumlicher Fähigkeiten (RF) in beiden Untersuchungsgruppen (OH\(=\) Ohne Hilfen, VH\(=\) visuelle Hilfen). Die gestrichelte Linie markiert die Mittelwerte der Untersuchungsgruppen, der Fehlerbalken gibt den Standardfehler an

Abb. 7
figure 7

Gaze-Likelihood-Analyse: Die Lesezeit der Instruktionsseite wurde für jede/n Studierende/n in 30 Zeitintervalle gleicher Breite unterteilt und innerhalb jedes Zeitintervalls wurde die Anzahl Fixationen auf jedem AOI bestimmt. Dargestellt sind die Gruppenmittelwerte mit einem 95 %-Konfidenzintervall

Post-hoc Tests ergeben für die VH-Gruppe eine kürzere Zeit bis zur ersten Fixation auf dem Diagramm (Effektstärke nach Cohen \(d=0.39\)), eine höhere Anzahl Fixationen auf dem Diagramm (\(d=1.08\)) und eine höhere Anzahl Transitionen zwischen Text und Diagramm (\(d=0.80\)). Die Gaze-Likelihood-Analyse in Abb. 7 verdeutlicht den Zeitverlauf der visuellen Aufmerksamkeit und zeigt, dass die OH-Gruppe insgesamt weniger Aufmerksamkeit auf dem Diagramm hat als die VH-Gruppe. Der Zeitverlauf der Aufmerksamkeit selbst ist bei beiden Gruppen ähnlich und entspricht der Abfolge der AOIs auf der Instruktionsseite von oben nach unten.

Augenbewegungen beim Lösen der Aufgaben

Um die Augenbewegungen bei der Beurteilung der Vektorfelder hinsichtlich Divergenz im Anschluss an die Instruktion zu beurteilen, wurden die Sakkadenrichtungen für jede der sechs Aufgaben extrahiert. Eine detaillierte Analyse aller Vektorfelder liegt nicht in der Zielsetzung dieses Manuskripts, weshalb sich hier auf zwei ausgewählte Vektorfelder beschränkt wird: Vektorfeld VF2, das sowohl vor als auch nach der Instruktion eingesetzt wurde und Vektorfeld VF4 als schwierigstes Vektorfeld. Anschließend erfolgt eine aggregierte Analyse der Sakkadenrichtungen über alle Vektorfelder.

Abb. 8
figure 8

Analyse der Antworten und Blickbewegungen bzgl. des Vektorfelds VF2, das vor und nach der Instruktion von den Studierenden beurteilt wurde (a). Gezeigt sind die Anteile korrekter Antworten (b) und die polare Verteilung der Sakkadenrichtungen für beide Gruppen (c/d) zu beiden Zeitpunkten (Index 1/2)

Vektorfeld VF2

Das zweite Vektorfeld (VF2) wurde als einziges Feld auch vor der Instruktion (VF0) gezeigt, wodurch ein Prä-Post-Vergleich sowohl der Antwortkorrektheit als auch der Metriken der Augenbewegungen ermöglicht wird. Die Ergebnisse bzgl. dieses Items sind in Abb. 8 dargestellt. Das Vektorfeld VF2 besitzt lediglich eine Komponente in vertikaler (\(y\)-)Richtung, und die Änderung entlang dieser Richtung ist Null (\(\partial F_{y}/\partial y=0\)). Dadurch verschwindet die Divergenz des Feldes, vgl. Abb. 8a. Zur Beurteilung der Divergenz müssen also übereinanderstehende Vektorpfeile verglichen werden, was sich in vertikalen Augenbewegungen ausdrückt.

Die Leistung der Studierenden steigt zwischen beiden Testzeitpunkten an; in der Gruppe mit Hilfen tendenziell mehr als in der Gruppe ohne Hilfen, vgl. Abb. 8b. Die Verteilungen der Sakkadenrichtungen werden zwischen den beiden Testzeitpunkten symmetrischer; Studierende beider Gruppen bewegen ihre Augen nach der Instruktion bevorzugt in horizontale und vertikale Richtung, während zuvor auch oblique Sakkaden auftraten und die Maxima entlang der horizontalen und vertikalen Richtungen weniger deutlich ausgeprägt waren. Beim Vergleich der Gruppen fällt auf, dass Studierende der VH-Gruppe mehr Sakkaden in vertikale Richtung ausführen als Studierende der OH-Gruppe. Um dies zu quantifizieren wurden für jede/n Studierende/n die Sakkaden in den Winkelbereichen 0\({}^{\circ}\pm 10^{\circ}\) und 180\({}^{\circ}\pm 10^{\circ}\) (Horizontale) sowie 90\({}^{\circ}\pm 10^{\circ}\) und 270\({}^{\circ}\pm 10^{\circ}\) (Vertikale) bestimmt. Eine Varianzanalyse mit Messwiederholung und Innersubjektfaktor Sakkadenrichtung (Stufe 1 \(=\) Anzahl horizontaler Sakkaden, Stufe 2 \(=\) Anzahl vertikaler Sakkaden) sowie Zwischensubjektfaktor Korrektheit (1 \(=\) VF2 korrekt gelöst, 0 \(=\) VF2 inkorrekt gelöst) zeigt durch einen signifikanten Interaktionseffekt zunächst, dass korrekte Lösungen bei Vektorfeld VF2 mit einer höheren Anzahl vertikaler Sakkaden und einer niedrigeren Anzahl an horizontalen Sakkaden assoziiert sind als falsche Lösungen \(F(1,139)=3.90,p<0.05,\eta^{2}=0.03\) (vgl. Tab. 5). Ein signifikanter Haupteffekt auf dem Faktor Sakkadenrichtung zeigt, dass insgesamt mehr horizontale als vertikale Sakkaden vorliegen, \(F(1,139)=70.5,p<0.001,\eta^{2}=0.30\). Zieht man anstelle der absoluten Häufigkeiten der vertikalen bzw. horizontalen Sakkaden deren relative Häufigkeit (gemessen an allen Sakkaden pro Person) heran, wird der gefundene Interaktionseffekt noch deutlicher, \(F(1,139)=11.8,p=0.001,\eta^{2}=0.08\). Da in beiden Untersuchungsgruppen (OH, VH) korrekte und inkorrekte Lösungen vorhanden sind, überträgt sich dieses Ergebnis nicht auf den Gruppenvergleich (siehe Tab. 5).

Es zeigt sich kein Einfluss der räumlichen Fähigkeiten auf die Anzahl vertikaler oder horizontaler Sakkaden bei der Bearbeitung dieser Aufgabe; der SST-Score weist keine Korrelation mit beiden Maßen auf (\(|r|<0.07,p> 0.37\)).

Vektorfeld VF4

Das vierte Vektorfeld (VF4) besitzt Komponenten in \(x\)- und \(y\)-Richtung, die zunächst mental zerlegt und dann mit den daneben- bzw. darüberstehenden Nachbarn verglichen werden müssen (siehe Abb. 9). In dem Fall ist die \(y\)-Komponente konstant, und die \(x\)-Komponente ändert sich entlang der \(y\)-Richtung, nicht jedoch entlang der \(x\)-Richtung. Das Vektorfeld ist nach Gl. 1 divergenzfrei. Die Beurteilung dieses Vektorfeldes fiel den Studierenden am schwierigsten; nur 28.4 % lösten die Aufgabe korrekt, wobei die VH-Gruppe besser abschnitt als die OH-Gruppe, \(F(1,139)=4.91,p<0.05,\eta^{2}=0.03\). Eine Varianzanalyse mit Messwiederholung (Faktor 1: Anzahl vertikaler/horizontale Sakkaden, Faktor 2: Korrektheit der Aufgabe) ergibt einen signifikanten Interaktionseffekt, \(F(1,139)=9.7,p<0.01,\eta^{2}=0.06\). Im Gegensatz zu falschen Lösungen sind korrekte Lösungen bei Vektorfeld VF4 mit einer höheren Anzahl vertikaler Sakkaden und einer niedrigeren Anzahl horizontaler Sakkaden assoziiert, analog zu dem Ergebnis bei VF2. Da es in beiden Untersuchungsgruppen (OH, VH) jeweils richtige und falsche Lösungen gibt, impliziert dieses Ergebnis nicht, dass sich der Interaktionseffekt auch im Vergleich beider Untersuchungsgruppen zeigt. Da der Leistungsunterschied bei diesem Vektorfeld zwischen den beiden Untersuchungsgruppen aber sehr hoch ist, überträgt sich das gefundene Ergebnis – im Gegensatz zu dem Ergebnis bei Vektorfeld VF2 – auch auf den Gruppenvergleich: Studierende der VH-Gruppe betrachten das Vektorfeld VF4 mit mehr vertikalen Sakkaden und weniger horizontalen Sakkaden als Studierende der OH-Gruppe, \(F(1,139)=9.0,p<0.01,\eta^{2}=0.04\).

Abb. 9
figure 9

Analyse der Antworten und Blickbewegungen bzgl. des zweidimensionalen Vektorfelds VF4 (a). Gezeigt sind die Sakkadenrichtungsverteilung für korrekte (c) und inkorrekte Antworten (d) sowie für Interventions- (e) und Kontrollgruppe (f). Teilgrafik (b) stellt die Anzahl horizontaler und vertikaler Sakkaden für beide Gruppen dar

Der SST-Score korreliert positiv mit der Anzahl horizontaler (\(r=0.22,p<0.05\)) und vertikaler Augenbewegungen (\(r=0.21,p<0.05\)) bei dieser Aufgabe.

Aggregierte Analyse (alle Vektorfelder)

Insgesamt zeigen sich signifikante Zusammenhänge zwischen der erreichten Leistung (Testsumme über alle sechs Vektorfelder) und der absoluten Anzahl horizontaler (\(r=0.26,p<0.01\)) und vertikaler Sakkaden (\(r=0.44,p<0.001\)) sowie zum relativen Anteil vertikaler Sakkaden (\(r=0.42,p<0.001\)), siehe Tab. 6. Ferner zeigen sich Gruppenunterschiede zwischen Interventions- und Kontrollgruppe sowohl bzgl. der absoluten Anzahl vertikaler Sakkaden, \(t(139)=2.1,p<0.05,d=0.34\), als auch bzgl. der relativen Häufigkeit vertikaler Sakkaden, \(t(139)=2.5,p<0.1,d=0.44\).

Es zeigt sich im Gesamten kein Zusammenhang zwischen dem SST-Score und der Anzahl vertikaler oder horizontaler Sakkaden (\(p> 0.1\)), auch nicht zwischen dem SST-Score und dem relativen Anteil vertikaler oder horizontaler Sakkaden (\(p> 0.1\)).

Diskussion

Die Instruktion mit visuellen Hilfen ruft stärkere SOI-Prozesse hervor (Hyp. 1)

Der Vergleich der Augenbewegungen zwischen Kontroll- und Interventionsgruppe ergab signifikante Unterschiede bzgl. der drei untersuchten Metriken, die mit Selektions‑, Organisations- und Integrationsprozessen assoziiert sind. Die Hypothesengruppe 1 (1a–1c) wird damit als gültig betrachtet.

Im Einzelnen bedeutet dies, erstens, dass visuelle Hilfen zu einer schnelleren Selektion lernrelevanter Informationen im Bereich Diagramm führten. Die Zeit bis zur ersten Fixation im Diagramm als Maß der Wahrnehmungsverarbeitung liefert dabei Informationen über die Reihenfolge der Fixierungen der Lernenden und über den Zeitpunkt, zu dem die Lernenden mit der Verarbeitung bestimmter relevanter Informationen beginnen (Hyönä 2010). Dieses Maß wurde unter anderem auch von Park et al. (2015b) ausgewertet, um Informationen über den Einfluss interessanter, aber nicht für den Verstehensprozess relevanter („seductive“) Details auf den primären Aufmerksamkeitsfokus von Studierenden zu erhalten. Die Forschergruppe fand heraus, dass eine längere Zeit bis zur ersten Fixation in einem relevanten Bereich vergeht, wenn solche seductive details präsentiert werden und folgerten daraus einen negativen Einfluss solcher Details auf den Lernprozess. Umgekehrt lässt sich aus dem hier vorliegenden Ergebnis kürzerer Zeit bis zur ersten Fixation auf relevanten Bereichen ein positiver Rückschluss auf das Lernen ziehen. Auch Wang et al. (2020) schreiben der Zeit bis zur ersten Fixation eine Bedeutung für den kognitiven Prozess der Informationsselektion zu und fanden heraus, dass visuelle Hinweise in Videos helfen, die Aufmerksamkeit der Lernenden schneller auf wesentliche Informationen zu lenken.

Zweitens konnte nachgewiesen werden, dass visuelle Hilfen die Organisation von Informationen verbesserten, in diesem Fall die Interpretation des Vektorfelddiagramms hinsichtlich des Divergenzkonzepts. Studierende in der Gruppe mit visuellen Hilfen zeigten eine signifikant höhere Anzahl an Fixationen auf dem Diagramm als Studierende in der OH-Gruppe. Auch Ozcelik et al. (2010) zeigten, dass durch visuelle Hilfen die Aufmerksamkeit auf relevante Bereiche gelenkt werden kann und zogen als Maß die Anzahl Fixationen sowie die Gesamtbetrachtungsdauer heran. Da beide Maße typischerweise hoch miteinander korreliert sind (Susac et al. 2019), wurde sich in dieser Studie auf die Anzahl Fixationen beschränkt. Die Arbeit von Boucheix and Lowe (2010) zeigt zunächst, dass eine Erhöhung der bloßen Anzahl an Fixationen durch visuelle Hilfen unbedeutend für das Lernen sein kann, wenn die entsprechenden Regionen keine Relevanz für das zu erlernende Konzept besitzen. In einer zweiten Studie kam der Lerneffekt erst durch das Hervorheben wichtiger funktioneller Elemente zustande, die eine Kohärenzbildung förderten. Im hier vorliegenden Beispiel wurde die Problemstellung einer didaktischen Aufgabenanalyse unterzogen und Literaturergebnisse in Betracht gezogen (Klein et al. 2018b), um die konzeptionell relevanten Bereiche zu identifizieren, die durch Hilfen adressiert werden sollen, nämlich die Zerlegung der Vektoren in Komponenten und die Hervorhebung der horizontalen und vertikalen Richtungen im Diagramm.

Drittens zeigten Studierende in der VH-Gruppe mehr Transitionen zwischen Text und Diagramm, d. h. die visuellen Hilfen förderten Integrationsprozesse zwischen der text-basierten Beschreibung der Strategie und der visuellen Interpretation im Diagramm. Die durch Hilfen dargestellte Kohärenz zwischen Text und Diagramm erleichtert den Lernenden, zusammengehörige Elemente zu identifizieren, indem die Verbindung beider Repräsentationen explizit gemacht wird (De Koning et al. 2009). Die integrationsfördernde Wirkung von Hilfen ist in der Literatur bereits gut dokumentiert (Krejtz et al. 2016; Holsanova et al. 2009; Schmidt-Weigand et al. 2010; Schüler 2017) und wurde kürzlich ebenfalls von Wang et al. (2020) nachgewiesen. Eine höhere Anzahl Transitionen wurde auch im Kontext von chemischen Problemlöseaufgaben mit höherer Expertise in Verbindung gebracht (Rodemer et al. 2020).

Es ergaben sich keine signifikanten Unterschiede zwischen Studierenden unterschiedlicher räumlicher Fähigkeiten beim Lesen der Instruktionsseite. Auch gab es keine Unterschiede bzgl. der Qualitätsbeurteilung der Instruktion zwischen beiden Untersuchungsgruppen. Zusammengefasst erleichtern die visuellen Hilfen es, relevante Bereiche schneller zu identifizieren, diese somit zielgerichtet zu verarbeiten sowie Verbindungen zwischen relevanten Informationen im Text und im Diagramm herzustellen. Die Ergebnisse zur Hypothesengruppe 1 unterstützen damit zunächst die Annahmen der kognitiven Theorie multimedialen Lernens (CTML) durch Blickbewegungen als Prozessmaße in Einklang mit anderen Arbeiten (Boucheix and Lowe 2010; Keller et al. 2006; de Koning et al. 2010; De Koning et al. 2007). Auch wenn die Augenbewegungen zeigen, dass die Wahrnehmung durch den Einsatz visueller Hilfen verbessert wird, indem mehr Aufmerksamkeit auf lernrelevante Bereiche gelegt wird, ist dies noch kein Garant dafür, dass sich dadurch signifikante Gruppenunterschiede bzgl. der Leistung ergeben, was in früheren Studien beobachtet werden konnte. Kriz and Hegarty (2007) unterstreichen dabei die Unterscheidung zwischen den Wahrnehmungsprozessen zum Extrahieren der visuellen Merkmale und den eher konzeptuellen Prozessen (S. 925), indem sie zeigten, dass das Betrachten relevanter Informationen kein erfolgreiches Verständnis garantiert.

Die Instruktion mit visuellen Hilfen führt zu höherer Testleistung (Hyp. 2)

Die Ergebnisse zeigen, dass Studierende der VH-Gruppe nach der Instruktion signifikant höhere Leistungen bei den anschließenden Aufgaben erbrachten, wodurch Hypothese 2a bestätigt wird. Die Studierenden in der VH-Gruppe schätzten die Aufgabenanforderung zudem niedriger ein als Studierende der OH-Gruppe.

Insbesondere wird durch den Vergleich zwischen der messwiederholten Aufgabe deutlich, dass die Instruktionen einen positiven Einfluss auf den Verarbeitungsprozess der Vektorfelder haben. Bei dieser Aufgabe, die sowohl vor (als VF0) als auch nach der Instruktion (als VF2) gestellt wurde, kam es auch zu einer Leistungssteigerung in beiden Gruppen. Es finden nach der Instruktion insgesamt mehr horizontale sowie vertikale und weniger oblique Blickbewegungen statt, was auf eine zielgerichtete Verarbeitung der Repräsentation mit Bezug auf die Aufgabenstellung (Divergenz beurteilen) hindeutet. Auch andere Arbeiten attestierten ExpertInnen ein systematischeres Blickverhalten beim Problemlösen, z. B. generell bei visuellen Aufgabenanforderungen (Gegenfurtner et al. 2011) bzw. speziell bei repräsentationsbezogenen Aufgaben in der Chemie (Rodemer et al. 2020). In der Literatur sind große Probleme von Studierenden bei dieser Aufgabe bekannt und die meisten Studierenden nahmen fälschlicherweise an, dass das gezeigte Vektorfeld ein Quellenfeld sei (Klein et al. 2018b). In Interviews wurde dann festgestellt, dass dieser Fehlschluss auf Schwierigkeiten mit der Richtungsinterpretation partieller Ableitungen zurückzuführen ist (Klein et al. 2018b). Die visuellen Hilfen, die dieses Konzept während der Instruktion adressieren, waren eine Reaktion auf diese Schwierigkeiten und bewirkten eine Verbesserung der studentischen Einschätzung. In folgenden Studien sollten mehr Aufgaben vor der Instruktion gezeigt werden. Insbesondere müssten dabei auch zweidimensionale Vektorfelder eingebunden werden, um die Wirkung der Instruktion, die insbesondere die Komponentenzerlegung adressiert, besser zu erfassen.

Auch bei VF4 ergaben sich deutliche Unterschiede bzgl. der Blickbewegungen zwischen beiden Gruppen. Eine quantitative Analyse der vertikalen und horizontalen Sakkaden ergab zunächst, dass vertikale Sakkaden mit korrekten Antworten assoziiert waren. Solche Sakkaden sind notwendig, um übereinanderliegende Vektorpfeile zu vergleichen und festzustellen, dass die \(y\)-Komponenten der Pfeile sich entlang der Vertikalen nicht ändern. Es wurde festgestellt, dass Studierende der VH-Gruppe die Aufgabe besser lösten und mehr vertikale Sakkaden ausführten als Studierende der OH-Gruppe. Dieses Ergebnis ist konsistent mit der Aufgabenanforderung und spiegelt den positiven Einfluss der visuellen Hilfen während der Instruktion wider. Generell lässt sich auch ein allgemeiner Trend bei den Studierenden feststellen, horizontale Augenbewegungen auszuführen. In anderen Studien wurde festgestellt, dass horizontale Augenbewegungen dominant sind, z. B. beim Betrachten von Bildern oder Landschaftsszenen (Foulsham et al. 2008). Dies lässt sich durch okulomotorische Faktoren des Auges und kulturelle Lesegewohnheiten erklären. Vertikale Augenbewegungen hingegen sind untypisch und lassen sich folglich mit reflektierten Problemlöseprozessen in Verbindung bringen.

Zusammengefasst kann festgehalten werden, dass eine korrekte Anwendung der visuellen Strategie zur Beurteilung partieller Ableitungen durch systematische Augenbewegungen, bevorzugt in vertikaler Richtung und durch Vermeidung obliquer Richtungen, indiziert wird. In bisherigen Studien konnten wegen einer deutlich geringeren Fallzahl (\(N=41\)) lediglich signifikante Unterschiede zwischen den Extremgruppen von Studierenden, nicht aber auf Basis korrekter/inkorrekter Lösungen festgestellt werden (Klein et al. 2018b). Die Gültigkeit dieser Aussage konnte wegen der höheren Datenmenge in dieser Studie \(N=141\) statistisch abgesichert werden.

Es sei darauf hingewiesen, dass es in beiden Untersuchungsgruppen (VH, OH) sowohl korrekte als auch inkorrekte Lösungen gibt, sodass Gruppenunterschiede bzgl. der Sakkadenverteilung nicht zwingend sind. Der signifikante Leistungsunterschied zugunsten der VH-Gruppe spiegelt sich in einer höheren absoluten und relativen Anzahl vertikaler Sakkaden wider, wodurch Hypothese 2b teilweise bestätigt werden kann. Außerdem soll erwähnt sein, dass das Durchführen adäquater Augenbewegungen eine notwendige Voraussetzung für eine korrekte Interpretation sein kann (beispielsweise um Unterschiede im Feldverlauf festzustellen); sie muss im Einzelfall allerdings keineswegs dafür hinreichend sein; so könnten Unterschiede gesehen, aber falsch interpretiert werden. An dieser Stelle ist die Absicherung des Ergebnisses durch weitere Daten, z. B. Verbaldaten oder schriftliche Begründungen, erforderlich.

Räumliche Fähigkeiten beeinflussen die Leistung, aber nur bedingt die Blickbewegungen (FF1, FF2)

Ein Schwerpunkt der Studie lag auf der Untersuchung des Einflusses räumlicher Fähigkeiten auf das Blick- und Antwortverhalten der Studierenden. Die räumlichen Fähigkeiten wurden mit einem standardisierten Instrument psychologischer Forschung (SST) gemessen. Dabei zeigte sich eine signifikante Korrelation zwischen dem SST-Score und der Leistung der Studierenden beim Problemlösen (Forschungsfrage 1). Studierende mit hohen räumlichen Fähigkeiten erzielten gegenüber Studierenden mit geringen räumlichen Fähigkeiten bessere Ergebnisse. Dies deckt sich mit Ergebnisse vorangegangen Studien im MINT-Bereich. Beispielsweise weisen Chen et al. (2015) einen Zusammenhang zwischen der räumlichen Fähigkeit und der Leistung im Kontext dreidimensionaler Orbitalmodelle nach. Kozhevnikov et al. (2002) untersuchten diesen Zusammenhang bei kinematischen Problemlöseprozessen und fanden heraus, dass die Leistung vor allem bei komplexen räumlichen Problemen, z. B. zweidimensionalen Bewegungen, maßgeblich von verschiedenen Aspekten räumlicher Kompetenz bestimmt wird.

Die hier dargestellten Ergebnisse legen nahe, dass vor allem Studierende mit hohen oder mittelstarken räumlichen Fähigkeiten von der visuellen Unterstützung in der Instruktion profitierten (mittlere Effektstärke), während für Studierende mit geringen räumlichen Fähigkeiten weder ein positiver noch ein negativer Effekt der Hilfestellung sichtbar wurde (Forschungsfrage 2). Diese Befunde unterstützen die Ergebnisse von Mayer and Sims (1994), die als Erklärungsansatz ähnlicher Beobachtungen die Ability-as-Enhancer-Hypothese formulierten. Demnach integrieren Lernende mit hohen räumlichen Fähigkeiten vielfältige Repräsentationen in ihr Arbeitsgedächtnis und erzielen durch Rückgriff auf diese bessere Lernergebnisse als Lernende mit geringen räumlichen Fähigkeiten. Letztere benötigen ohne eine vergleichbare Integration mehr kognitive Ressourcen, um Darstellungen im Arbeitsgedächtnis zu halten, sodass ihnen weniger Kapazität zur Verfügung steht, um sie der eigentlichen Verarbeitung dieser Repräsentationen zu widmen. Diese Hypothese ist insbesondere konsistent mit Ergebnissen von Huk (2006), die beim Lernen zellbiologischer Konzepte mit 3D-Visualisierungen von einer Zunahme der empfundenen kognitiven Belastung bei Lernenden mit geringen räumlichen Fähigkeiten berichten. Entsprechend beurteilten die Studierenden mit hohen räumlichen Fähigkeiten in der hiesigen Studie den Aufgabentypus als einfacher im Vergleich zu Studierenden mit niedrigen räumlichen Fähigkeiten. Basierend auf der Ability-as-Enhancer-Hypothese müsste eine zielgerichtete Instruktion für Lernende mit geringen räumlichen Fähigkeiten somit darauf ausgerichtet sein, die kognitive Belastung beim multimedialen Lernen zu verringern, indem sie Problemen, die infolge defizitärer räumlicher Fähigkeiten auftreten, vorbeugt und diese überbrückt. Keehner et al. (2004) heben in diesem Zusammenhang die Interaktivität mit der Lernumgebung hervor, die insbesondere Studierenden mit geringen räumlichen Fähigkeiten zu Gute kommen soll. Möglichkeiten einer solchen interaktiven Instruktion könnten im Fall von Vektorfeldern Video-Instruktionen, Simulationen oder Zeichenaktivitäten sein, bei denen Zwischenschritte zur Problemlösung sequentiell präsentiert bzw. eingeübt werden. Die Ability-as-Enhancer-Hypothese ließe sich künftig mit Moderationsanalysen prüfen, die allerdings hohe Stichproben benötigen (vgl. dazu die viertgenannte Limitation in Mason et al. 2013).

Zusammenfassend besteht ein Zusammenhang zwischen der Leistung von Studierenden bei der graphischen Interpretation von Vektorfeldern und den räumlichen Fähigkeiten. Ebenso konnte ein Zusammenhang zwischen der Leistung und verschiedenen Blickmetriken, z. B. der Anzahl horizontaler und vertikaler Sakkaden bzw. dem Anteil vertikaler Sakkaden gefunden werden. Es zeigte sich jedoch grundsätzlich keine Korrelation der kognitiv-räumlichen Fähigkeiten mit diesen Blickmaßen. Hier konnte weder zwischen dem SST-Score und der Anzahl vertikaler oder horizontaler Sakkaden noch zwischen dem SST-Score und dem relativen Anteil vertikaler oder horizontaler Sakkaden ein Zusammenhang identifiziert werden. Auch bei der Untersuchung einzelner Vektorfeld-Items zeigte sich dieser Zusammenhang nur für VF4, das schwierigste Vektorfeld im Testsatz. Dieses Vektorfeld weist (im Gegensatz bspw. zu VF2) zwei von Null verschiedene Komponenten auf und besitzt somit eine höhere Komplexität (zur Komplexität zweidimensionaler Vektorfelder siehe auch Hahn 2020). Der Zusammenhang zwischen Itemkomplexität und Blickverhalten wurde bereits vielfältig untersucht, so berichten z. B. Rodemer et al. (2020) von einem veränderten Blickverhalten für komplexere nukleophile Substitutionen. Eine Begründung dafür, dass ein Zusammenhang zwischen Blickmetriken und räumlichen Fähigkeiten nur bei dem komplexen Vektorfeld VF4 besteht, könnte darin bestehen, dass erst bei zweidimensionalen Vektorfeldern ausgeprägte kognitiv-räumliche Fähigkeiten tatsächlich für die Problemlösung relevant werden. Für Vektorfelder geringerer Komplexität sind räumliche Kompetenzen somit hilfreich, allerdings nicht zwingend notwendig. Erst wenn eine Zerlegung in Komponenten und der anschließende Vergleich dieser mental aufrechterhaltenen Pfeile gefordert sind, werden top-down Prozesse notwendig, die von guten räumlichen Fähigkeiten profitieren. Bei einem zweidimensionalen Vektorfeld wie VF4 ist insbesondere die mentale Projektion sowie Zwischenspeicherung zentral für eine korrekte Problemlösung; und diese Aufgabenanforderungen werden durch den dualen Spannentest abgeprüft und durch den SST-Score abgebildet. Entsprechend ist der SST ein adäquater Test zur Messung der räumlichen Fähigkeiten, die im Rahmen von zweidimensionalen Vektorfeldern benötigt werden. Die Vermutung liegt nahe, dass Vektorfelder entsprechend ihrer Komplexität unterschiedliche Anforderungen an die räumlichen Fähigkeiten stellen. Um diese Struktur detaillierter zu betrachten, sind weitere Analysen notwendig, die Vektorfelder unterschiedlicher Komplexität und verschiedene Tests zur Messung der räumlichen Fähigkeiten systematisch untersuchen.

Limitationen und Ausblick

In diesem Beitrag wurde eine klinische Eye-Tracking-Studie zur Förderung der Koordination zwischen Vektorfelddiagramm und Formel vorgestellt. Die spezifische Aufgabenstellung, Vektorfelder hinsichtlich Divergenz zu beurteilen, betrifft Studierende der Physik, Mathematik und der Ingenieurwissenschaften im ersten Studienjahr. Die adressatengerechte Akquise und die (für Eye-Tracking-Studien) große Stichprobe sprechen für die Allgemeingültigkeit der getroffenen Aussagen. Die Ergebnisse weisen einen höheren Lerneffekt infolge der Instruktion mit visuellen Hilfen nach, die insbesondere zu Verbesserungen im Verständnis partieller Ableitungen führte. Die Methode Eye-Tracking gab Aufschluss über die Ursache dieses Gruppenunterschieds, indem gezeigt werden konnte, dass Lernende mit visuellen Hilfen relevante Bereiche schneller identifizieren, diese besser organisieren und eine stärkere Verbindungen zwischen relevanten Informationen im Text und im Diagramm herstellen konnten. Damit wurde eine explizite Verbindung zwischen Lernen und Problemlösen nachgewiesen. An dieser Stelle erscheint die Integration weiterer Informationsquellen, z. B. verbaler Daten, aussichtsreich, da diese weiter Aufschluss über den Wissenszuwachs geben können. Für künftige Untersuchungen planen wir ferner, gezielt nach den komponentenweisen Änderungen \(\partial xF_{x}\) oder \(\partial yF_{y}\) zu fragen. Auf diese Weise müsste noch klarer unterscheidbar sein, ob Sakkaden in relevante oder irrelevante Richtungen vorliegen.

Das untersuchte Lernmaterial unterliegt einigen Einschränkungen. So sind die Felder derart konstruiert, dass (i) die Divergenz entweder überall Null oder ungleich Null ist, (ii) der nicht-triviale Fall kompensierender Summanden (\(\partial xF_{x}=-\partial yF_{y}\)) ausgeschlossen wird und (iii) die Felder nicht mit physikalischen Beispielen in Verbindung gebracht werden. Mit Blick auf den ganzen Reichtum der Vektoranalysis in der (einführenden) Physik möchten wir diese Einschränkungen künftig stufenweise aufheben und auch andere Konzepte in den Blick nehmen, z. B. das Verständnis des Rotationsoperators oder die Integralsätze von Gauß und Stokes. Auch die Erweiterung auf drei Dimensionen und die Untersuchung von Anwendungsbeispielen in der Elektrodynamik und Fluidmechanik sind vielversprechende Stoßrichtungen dieser Forschung.

Eine weitere Einschränkung der Studie besteht darin, dass keine Langzeitauswirkungen untersucht wurden, sodass Aussagen über einen nachhaltigen Wissenstransfer nicht möglich sind. Durch Analyse des SST-Scores geht die Studie über die bloße Prüfung des multimedialen Lernmodells hinaus und zeigt Potential für Schwerpunkte nachfolgender Studien sowie didaktische Konsequenzen unter Berücksichtigung kognitiv-räumlicher Fähigkeiten auf. So deuten die Ergebnisse auf Handlungsbedarf bei der Entwicklung von Instruktionen insbesondere für Studierende mit geringen räumlichen Fähigkeiten hin. Solche Defizite müssen durch andere Unterstützung gezielt kompensiert werden. Außerdem scheint es sinnvoll, in nachfolgenden Studien den Zusammenhang zwischen Blickbewegungen und räumlichen Fähigkeiten detaillierter zu untersuchen, da hier Potential für tiefere Einblicke in die Facetten kognitiv-räumlicher Kompetenzen und ihre Verknüpfung mit kognitiv-visuellen Prozessen besteht, und um noch mehr über den Aufgabentypus zu erfahren. Beide Aspekte verbindend könnte Eye-Tracking durch gezieltes Training der Augenbewegungen (z. B. durch modellierte Blickpfade; eye movement modeling examples; Jarodzka et al. 2017) eine Doppelrolle als Analysemethode und Interventionsmaßnahme einnehmen. Ähnlich wie die gezielte Betrachtung relevanter Bereiche innerhalb einer Repräsentation (Jarodzka et al. 2013) ist bei Vektorfeldern die Durchführung horizontaler und vertikaler Sakkaden ein wichtiger Indikator für die Repräsentationskompetenz. Mithilfe von EMME könnte diese Blickbewegung demonstriert und somit geschult werden, was auch ein besseres Verständnis der Komponentenzerlegung unterstützen könnte.