1 Einleitung

Die Rezeption und lernförderliche Informationsentnahme aus grafischen Beschreibungsmitteln, mathematischen Formeln oder anderen externalen Repräsentationen bereitet Schülerinnen und Schülern häufig Schwierigkeiten (vgl. Renkl und Scheiter 2017). Als externale Repräsentation wird dabei jede Darstellungsform bezeichnet, die auf einen Gegenstand verweist oder einen Sachverhalt referiert (vgl. Ainsworth 2008). Dabei treten in Lehr-Lern-Kontexten üblicherweise Kombinationen aus geschriebener oder gesprochener Sprache und einer oder mehreren weiteren externalen Repräsentationen auf. Als empirisch gut gesichert gilt, dass der Einsatz multipler externaler Repräsentationen grundsätzlich lernförderlich ist (Levie und Lentz 1982; Peeck 1993). Dies gilt auch für den Einsatz abstrakter Darstellungen (Eitel 2016). Diese Lernförderlichkeit ist darin begründet, dass die zusätzlichen Repräsentationen, die zum Verstehen notwendigen kognitiven Prozesse gezielt unterstützen, Sachverhalte verdeutlichen und aufklären oder direkt als Ausgangspunkt mentaler Konstruktionstätigkeiten dienen (Ainsworth 2006). Die Fähigkeit, zwischen verschiedenen Darstellungsformen erfolgreich wechseln und solche hinsichtlich enthaltener Zusammenhänge manipulieren zu können, ist in der Literatur unter dem Begriff „Repräsentationale Kompetenz“ (Ainsworth 1999; Kozma und Russell 1997) zu finden. Empirische Untersuchungen haben gezeigt, dass Lernende das Lernpotenzial multipler Repräsentationen nur dann ausschöpfen, wenn bei ihnen die hierfür benötigte Repräsentationskompetenz ausgeprägt ist (vgl. Eitel et al. 2020; Renkl et al. 2013; McElvany et al. 2012).

Empirische Erkenntnisse legen nahe, dass die Förderung von Repräsentationskompetenz einen größeren Einfluss auf den Erwerb von Inhaltswissen hat als inhaltliches Vorwissen in der untersuchten Domäne selbst (Nitz et al. 2014a; vgl. auch Nitz et al. 2014b, 2012). Zugleich ist bekannt, dass inhaltliches Lernen im Fachunterricht nicht zwangsläufig mit einem Erwerb repräsentationaler Kompetenz einhergeht (Bowen und Roth 2002). Aus diesem Grund fordern Nitz et al. (2014a) den Einbezug „eines expliziten repräsentationalen Fokus beim Lehren und Lernen“ als Qualitätsmerkmal von Lehr- und Lernprozessen (Nitz et al. 2014a, S. 14). Sich mit geeigneten Strategien zum Einsatz von Repräsentationen vertieft zu beschäftigen, erscheint somit notwendig. Dies ist umso relevanter, da Lehrkräften oftmals die Schwierigkeiten, welche Lernende bei der Verarbeitung der dargebotenen Repräsentationen erfahren, nicht bewusst sind (McElvany et al. 2012). Für Lehrkräfte ist es demzufolge eine erhebliche Herausforderung, die Text-Bild-Integration bei konkreten Lernmaterialien zu adressieren. Ebenso haben sie Schwierigkeiten, die dafür notwendigen Kompetenzen ihrer Schülerinnen und Schüler einzuschätzen. Zudem erkennen Lehrende mehrheitlich die Fähigkeit, bildliche Darstellungen interpretieren zu können, nicht als ein eigenständiges Lernziel an, noch sind sie für gezielte Maßnahmen ausgebildet, die Text-Bild-Integration zu fördern (McElvany et al. 2009). Dabei sind gerade schwächere Lernende – besonders bei unzureichender Unterstützung durch Lehrende – mit dem sog. „repräsentationalen Dilemma“ konfrontiert. Dieses Dilemma beschreibt die Situation, dass Lernende Wissen aus Repräsentationen erwerben sollen, die sie einerseits aufgrund mangelnden Vorwissens über Funktion, Bedeutung oder vorausgesetzten Inhaltsvorwissen nicht oder nur unzureichend verstehen – und andererseits können sie aufgrund der Tatsache, dass sie die ihnen vorgelegten Repräsentationen nicht verstehen, das benötigte Wissen sich auch nicht selbst erarbeiten oder erschließen (Ainsworth 2008; Rau 2016).

Der Fokus der bisherigen Forschung und Literatur liegt vor allem auf der Untersuchung unterstützender Designentscheidungen für Lehrmaterial (vgl. Mayer 2002; Schnotz 1994) sowie unterstützender didaktischer Interventionen (vgl. Renkl und Scheiter 2017; Scheiter et al. 2018). Insbesondere differenzierende Übersichtsartikel zur Bedeutung des Vorwissens, dessen unterschiedlichen Arten sowie einer Einordnung dieser in den kognitiven Verarbeitungsprozess sind bislang nicht publiziert. Dies stellt angesichts der beschriebenen Probleme im Umgang mit Repräsentationen im unterrichtlichen Kontext eine Lücke dar, schließlich eröffnet insbesondere eine detaillierte Beschreibung der Zusammenhänge zwischen Verstehensprozessen und Vorwissen Lehrenden die Möglichkeit, die sich dem Lernenden ergebenden repräsentationalen Herausforderungen gezielt zu diagnostizieren, Lehrmaterial im Hinblick auf den Einsatz von Repräsentation zielgruppenspezifisch einzuschätzen und anzupassen sowie die eigene Unterrichtspraxis zu reflektieren.

Der Artikel widmet sich daher der Rolle des Vorwissens beim Verstehen statischer, externaler RepräsentationenFootnote 1 und wie dessen Vorliegen bzw. dessen Abwesenheit den Rezeptionsprozess im Detail beeinflusst. Dazu wird das Konstrukt Vorwissen zunächst unter Zuhilfenahme der Theorie kognitive Verarbeitungsprozesse sowie den in der didaktischen Literatur berichteten Aspekten in verschiedene Arten mit unterschiedlichen Funktionen aufgegliedert. Anschließend wird die Frage nach dem Einfluss dieser identifizierten Vorwissensarten auf die Rezeptionsprozesse auf Basis eines Literaturreviews der vorliegenden empirischen Befundlage untersetzt und diskutiert. Im Ausblick werden dann auf Basis der erarbeiteten Erkenntnisse Konsequenzen für die Förderung repräsentationaler Kompetenz abgeleitet.

2 Vorwissen bei der Rezeption von Repräsentationen

Ziel dieses Abschnittes ist, aus den einzelnen kognitiven Prozessschritten bei der Repräsentationsverarbeitung das jeweils benötigte Vorwissen hinsichtlich Art und Inhaltsbereich abzuleiten. Als theoretische Grundlage hierfür bieten sich kognitive Modelle aus der Multimedia-Forschung und der Kognitionspsychologie mit Schwerpunkt auf Text- und Bild-Verstehen an, beispielsweise die Dual Coding Theory (Paivio 1990) oder die Cognitive Theory of Multimedia Learning (Mayer 2014). Im Rahmen dieses Artikels wird auf das integrierte Modell des Text-Bild-Verstehens (Schnotz und Bannert 2003; Schnotz 2014) zurückgegriffen, da dies die Erkenntnisse der genannten Modelle aufgreift und vollständig inkorporiert, beispielsweise getrennte Prozessoren für sprachlich-symbolische und räumlich-bildhafte Informationen des Arbeitsgedächtnis (Baddeley und Hitch 1974), eine parallele (duale) Verarbeitung und Kodierung in sprachlich-symbolische und räumlich-bildhafte Informationen (Paivio 1990) sowie die Erkenntnis der Mehrstufigkeit der Prozesse in beiden Verarbeitungskanälen (Mayer 2014). Darüber hinaus lassen sich durch die ausdifferenzierte Beschreibung der Prozesse innerhalb des ITPC die einzelnen Verarbeitungswege und Übergänge zwischen den beiden Kanälen präzise nachvollziehen und beschreiben, sodass sich im Detail benötigte Vorwissensbestände identifizieren lassen.

2.1 Das Integrierte Modell des Text-Bild-Verstehens (ITPC)

Das Integrierte Modell des Text-Bild-Verstehens (engl.: Integrated Model of Text-Picture Comprehension, ITPC) beschreibt umfassend die Rezeption unterschiedlichster Arten externaler Repräsentationen wie z. B. gesprochener Sprache, Schrifttext, Gleichungen, Tabellen, Diagramme oder Bilder. Das vollständige Modell ist in Abb. 1 dargestellt.

Abb. 1
figure 1

Integriertes Modell des Text-Bild-Verstehens (Schnotz 2014) mit eingezeichnetem Top-Down-Transfer von Vorwissen, (übersetzt und um die Top-Down-Informationsflüsse ergänzt durch die Autoren)

In der linken Hälfte des Modells ist der deskriptionale Verarbeitungskanal zu finden, der symbolisch-kodierte Informationen wie beispielsweise gesprochene oder geschriebene Sprache, sowie mathematische oder chemische Formeln usw. verarbeitet. Symbolische Informationen bestehen aus arbiträren Zeichen, z. B. Buchstaben, Zahlen, Formel- oder Satzzeichen usw., zusammen. Diese sind in einer linearen Aneinanderreihung zu dekodieren und werden in Propositionen, d. h. logisch überprüfbare Einzelaussagen, umgewandelt (Schnotz 2014).

Auf der rechten Seite findet sich im Modell der depiktionale Verarbeitungskanal wieder, der ikonisch-kodierte Informationen verarbeitet, wobei diese aus Form und Topografie der einzelnen Elemente zu erschließen sind. Die daraus erschlossenen Informationen und Bedeutungszusammenhänge werden in ein Mentales ModellFootnote 2 überführt, eine außer-sprachliche Vorstellung der jeweiligen Zusammenhänge.

Die Pfeile im Modell symbolisieren Informationsflüsse. Dabei sind sowohl aufsteigende, datengeleitete (Bottom-Up) als auch absteigende, vorwissensgeleitete (Top-Down) Vorgänge berücksichtigt (Schnotz 2014). Verarbeitende Instanzen in Form von Prozessoren sind als Ellipsen dargestellt, Register und Speicher als Rechtecke.

Von unten nach oben gelesen lässt sich das ITPC drei, in der Literatur beschriebene Verarbeitungsstufen gliedern:

  1. 1.

    Wahrnehmung und perzeptuelle Oberflächenverarbeitung, also die Verarbeitung der aufgenommenen Reize in den Sensorischen Registern zu oberflächenstrukturellen Mustern,

  2. 2.

    tiefenstrukturelle Analyse der repräsentationalen Oberfläche, durch Parsing bzw. Struktur-Mapping zu Propositionalen Repräsentationen bzw. einem Mentalen Modell sowie

  3. 3.

    Kohärenzformation (Brünken et al. 2005; Seufert 2003; Schnotz 2011) in der obersten Ebene der tiefenstrukturellen Verarbeitung, bei der Propositionale Repräsentationen und Mentales Modell abgeglichen und mit Vorwissen aus dem Langzeitgedächtnis integriert werden.

Im Rahmen dieses Artikels wird der weiteren Betrachtung des Rezeptionsprozesses im Folgenden diese Dreiteilung zugrunde gelegt werden.

2.2 Vorwissen und kognitive Rezeptionsprozesse

Für die Frage nach dem Vorwissen sind im Besonderen die in Abb. 1 in blauer Farbe dargestellten Informationsflüsse von Interesse, welche aus dem Langzeitgedächtnis abgerufen werden und Top-Down die Verarbeitung in den jeweiligen Prozessoren der einzelnen Prozessstufen anleiten. Um das notwendig werdende Vorwissen hinsichtlich Art und Inhalt abzuleiten, werden die kognitiven Prozesse auf den zuvor vorgestellten Prozessebenen unter Einbezug theoretischer und didaktischer Literatur detailliert beschrieben.

2.2.1 Wahrnehmung und perzeptuelle Oberflächenverarbeitung

Im Umgang mit Repräsentationen geschieht die Reizaufnahme hauptsächlich über die Sinnesorgane Augen, Ohren sowie den Tastsinn in den Händen. Dabei tragen im Fall klassischer Lernmedien (Lehrbuch, Arbeitsblatt) die Augen durch optische Sinneswahrnehmungen maßgeblich zur Informationsaufnahme bei. Daher wird der visuelle Kanal im Folgenden im Fokus stehen (vgl. Kosslyn 1975).

Die aufgenommenen optischen Reize werden im Sensorischen Register für die Zeitdauer von bis zu einer Sekunde vorgehalten und Informationen, auf die Aufmerksamkeit gerichtet wird, werden ins visuelle Arbeitsgedächtnis überführt (Schnotz 2014). Anschließend erfolgt eine graphemische Analyse, bei der in getrennten Prozessoren verbale sowie nonverbale und visuelle Elemente identifiziert werden. Als präattentive Prozesse entziehen sich beide Prozessschritte weitgehend dem Bewusstsein des Rezipienten (Schnotz 2014), allerdings sind eine bewusste Aufmerksamkeitssteuerung und ein systematisches Erfassen der Repräsentation mithilfe metakognitiver Erschließungsstrategien möglich (Kaiser und Kaiser 2018).

Die auf den Selektionsprozess abzielenden Erschließungsstrategien beinhalten dabei deklaratives Repräsentationswissen über Konventionen zu Form und Struktur der Repräsentation: z. B. Leserichtung und hinweisgebende Präsignale bei Texten sowie Titel, Achsen und Beschriftungen bei Diagrammen. Zur sich anschließenden graphemischen Analyse werden darüber hinaus perzeptuell-prozedurales Repräsentationswissen zu konventionalisierten Zeichen und graphemischen Schemata bedeutsam (Cleveland und McGill 1985). Für das Dekodieren beispielsweise von Schrifttexten oder mathematischen Formeln ist es notwendig, die wahrgenommene Kombination aus Buchstaben bzw. Zahlen und Symbole in Phoneme zu übersetzen und daraus die wörtliche Textoberfläche zu erschließen. Bei bildhaften Inhalten, wie diese beispielsweise in Diagrammen zu finden sind, müssen hingegen Farben und Formen, aber auch deren Lage und Größe erfasst werden, um eine Topologie der depiktionalen Oberflächenstruktur zu erhalten. Grundsätzlich handelt es sich bei der Identifikation von Buchstaben, Symbolen, Formen und Farben in der Regel um hoch-automatisiertes Wissen zur Perzeption, welches daher als perzeptiv-prozedural bezeichnet werden kann.

Zusammenfassend sind zwei wesentliche Prozessschritte von den Lernenden zu leisten: die Selektion und die graphemische Oberflächenanalyse. Für den Selektionsprozess ist Repräsentationswissen hilfreich, welches als Strategie den Inspektionsprozess auf der Handlungsebene steuert, während bei der Oberflächenanalyse sowohl Kenntnisse über basale graphische Schemata und Zeichen als auch das Wissen über strukturelle Konventionen wie z. B. die Leserichtung notwendig sind, um erfolgreich zu einer mentalen Abbildung der repräsentationalen Oberfläche zu gelangen (Hegarty 2014). Diese besteht aus graphemisch-lexikalischen Mustern bei deskriptionalen und visio-spatialen Mustern bei depiktionalen Inhalten.

2.2.2 Tiefenstrukturelle Analyse der repräsentationalen Oberfläche

Anschließend werden die identifizierten Oberflächenmerkmale innerhalb des deskriptionalen Verarbeitungskanals durch Parsing- und innerhalb des depiktionalen Verarbeitungskanal durch Struktur-Mapping-Prozesse tiefenstrukturell analysiert und Bedeutung zugewiesen. Dabei werden unter dem noch im Detail zu beschreibendem Einbezug von Vorwissen Kombinationen von Oberflächenmerkmalen ausgewertet und als bedeutungstragende Informationen in die entsprechenden Speicher des jeweiligen Verarbeitungskanal überführt (Schnotz 2014): Das Parsing führt zu Propositionalen Repräsentationen, das Struktur-Mapping zu einem Mentalen Modell als Ergebnis dieser tiefenstrukturellen Analyse. Sowohl Parsing als auch Struktur-Mapping können dabei parallel ausgeführt werden (Kürschner und Schnotz 2008).

Welches Vorwissen wird dabei notwendig? Allgemein wird für die tiefenstrukturellen Analyseprozesse in beiden Verarbeitungskanälen Wissen über die Funktion der Repräsentation notwendig, durch das Hinweise auf bedeutungstragende Oberflächenmerkmale und Zusammenhänge bereitgestellt wird. Zudem sind bei diesen Prozessen Kenntnisse und Wissen über repräsentationsspezifische Strategien zur Inhaltserschließung hilfreich. Diese Strategien können bei Texten ein bewusstes Achten auf inhaltsverknüpfende Wortarten und Phrasen sein, bei Zahlen ein Umstellen und Re-Arrangieren der Urliste oder bei Bildern das bewusste Aufspüren von bildsprachlichen Elementen wie Metaphern oder Stereotype (Kaiser und Kaiser 2018). Darüber hinaus wird in Abhängigkeit, ob symbolisch- oder ikonisch-kodierte Informationen zu verarbeiten sind, spezifischeres Vorwissen benötigt. Daher werden folgend die jeweiligen Prozesse im deskriptionalen bzw. depiktionalen Verarbeitungskanal getrennt im Detail betrachtet.

Bei deskriptionalen Informationen erfolgt die tiefenstrukturelle Analyse durch den Prozess des Parsing, bei dem mithilfe lexikalischen und konzeptuellen Vorwissens die referierten Begriffe und Konzepte aktiviert, die durch die Repräsentation selbst inhaltlich (noch) nicht geklärt werden (Otten et al. 2007). Darüber hinaus werden unter Hinzuziehen von Repräsentationswissen über bezugserzeugende Konventionen die Aussagen des Textes oder der Formeln rekonstruiert. Diese Konventionen setzen sich bei Texten einerseits aus lexikalischen Einheiten wie Junktionen und Konnektoren zusammen, andererseits aber auch durch die Logik und den Aufbau der Gedankenführung, welche Rückschlüsse auf die Intention des Autors und die Erwartung kommender Aussagen zulassen (Ferreira und Chantavarin 2018; Otten et al. 2007; Verhoeven und Perfetti 2008). Auch für mathematische oder chemische Formeln ist die Kenntnis über bezugserzeugende Konventionen in Form von Operatoren zum Verständnis der Aussage als notwendig zu erachten. Ein einfaches Beispiel hierfür ist die semantische Bedeutung des Plus-Symbols in der Bedeutung einer additiven Hinzufügung.

Ebenso sind für die tiefenstrukturelle Erschließung während des Parsing zusätzliche Informationen bezüglich des Verwendungskontextes miteinzubeziehen, die den Gültigkeitsbereich der enthaltenen Aussagen mitbestimmen. Dies gilt sowohl für Texte als auch für Zahlen und Tabellen. Als Ergebnis des Parsing-Prozesses liegt den Lernenden der Inhalt der Repräsentation in Form von einzelnen Aussagen (Propositionen) vor, die im nächsten Schritt unter Einbezug von Inhaltsvorwissen auf Stimmigkeit hin geprüft werden können (Schnotz 2014; Van Dijk und Kintsch 1983).

Bei der depiktionalen Verarbeitung erfolgt hingegen die tiefenstrukturelle Analyse in Form des Struktur-Mapping. Hierbei werden auf Grundlage der Oberflächenmerkmale und deren Topografie bedeutungstragende Sachverhalte konstruiert und erschlossen. Diese Sachverhalte wiederum tragen zur Bildung eines Mentalen Modells bei, das die Situation und die gesamten erfassten Informationen internal auf nonverbale Weise repräsentiert. Vor allem bei abbildenden Repräsentationsformen wird somit die depiktionale Verarbeitung bedeutsam. Hierbei ist zu unterscheiden, ob es sich um reale oder um logische Bilder (vgl. Schnotz 2002) handelt.

Reale Bilder, wie z. B. Fotos oder Zeichnungen, stellen Sachverhalte erscheinungsaffin (Storz und Wirsing 1987) dar. Neben dem Erkennen von Gegenständen und Sachsystemen werden zumeist situative Wissensbestände zum Verständnis notwendig. So können auf Fotos oder Zeichnungen z. B. abgebildete Handlungen zu identifizieren und in einen Kontext einzuordnen sein (Rey 2012). Diese Vorgänge sind höchst individuelle Prozesse, da nicht auf einen allgemeingültigen Wissenskanon, sondern auf den subjektiven Erfahrungsschatz des Einzelnen zurückgegriffen wird. Repräsentationales Wissen über Bildaufbau und Bildsprache kann bei der Identifikation der Bild-Botschaft unterstützen (Kaiser und Kaiser 2018); es ist somit zwar nicht notwendig, aber hilfreich.

Logische Bilder, wie beispielsweise Balken- oder Liniendiagramme bzw. Schalt- oder Ablaufpläne, hingegen weisen keine Affinität mit der konkreten Erscheinung des Sachverhaltes auf, bilden aber wesentliche Merkmale ab (Storz und Wirsing 1987). Ein Beispiel für die Darstellung quantitativer Zusammenhänge sind Liniendiagramme. In diesem Fall liegt der Fokus der tiefenstrukturellen Analyse auf dem Ablesen und Vergleichen von Einzelwerten sowie dem Auffinden von Trends (Lachmayer et al. 2007). Diese weitgehend automatisierten Vorgänge stellen Beispiele für prozedurales Wissen zum Umgang mit der Repräsentationsform dar. Darüberhinausgehende Ansprüche an die Lernenden stellen hingegen z. B. Scatterplots und Liniennetzdiagramme, bei welchen Wertegruppen klassifiziert und bedeutende Bereiche identifiziert werden müssen. Hierzu wird zusätzlich domänenspezifisches Inhaltsvorwissen über diese Wertegruppen oder Bereiche benötigt.

Ebenso können logische Darstellungen qualitative Zusammenhänge thematisieren, wie dies bei Karten, bei Ablaufdiagrammen oder bei Plänen zum schematischen Aufbau technischer Gerätschaften der Fall ist. Hierzu ist Wissen über die genutzten Konventionen und Symbole entscheidend, um die Konfiguration der graphischen Einzelelemente und deren Bedeutung zu entschlüsseln. Zusätzlich sind in den visuellen Mustern sinntragende Formationen zu erkennen, beispielsweise Bauteile und übergeordnete Baugruppen in technischen Schaltplänen oder Großwetterlagen auf meteorologischen Karten. Diesen Formationen können Experten bestimmte Funktionen oder zusammenhängende Funktionsweisen mental zuordnen (Lowe 1996). Derartige erweiterte Informationen können also aufgrund eines mit den entsprechenden graphischen Einzelelementen assoziierten Inhaltsvorwissens über naturwissenschaftliche Prinzipien sowie komponentenspezifischen Funktionen und Funktionsweisen aus der Abbildung herausgelesen werden.

Für depiktional kodierte Informationen lässt sich somit festhalten, dass während bei der Rezeption logischer Bilder vorzugsweise (aber nicht ausschließlich) Sachwissen zu aktivieren ist (z. B. Wissen über Daten, Bauteile und Baugruppen, Funktionsweise und Funktionen, Naturgesetze), jedoch für reale Bilder oftmals situatives Inhaltsvorwissen bedeutsam wird, welches den Lebenswelten der Rezipierenden, d. h. Schulbildung, Arbeitserfahrung oder dem Alltag, entstammt. Als Ergebnis der tiefenstrukturellen Analyse liegen den Lernenden Mentale Modelle des Sachverhalts vor. Schnotz (2019) weist unter Bezug auf Johnson-Laird (1983) darauf hin, dass Mentale Modelle mehr als nur (visuelle) Vorstellungen darstellen und „eine strukturelle oder funktionale Analogie zum repräsentierten Gegenstand besitzen“ (Schnotz 2019, S. 97) können. Das Mentale Modell ist daher als innere Vorstellung zu verstehen, durch welche die Lernenden ihr Verständnis über den Sachverhalt durch mentale Manipulationen an unterschiedliche Gegebenheiten anpassen oder auf inhaltliche Konsistenz prüfen können.

Das Mentale Modell sowie die Propositionalen Repräsentationen stellen daher zwischenzeitliche Ergebnisse der datengeleiteten Verstehensprozesse in beiden Verarbeitungskanälen dar, welche unabhängig von der ursprünglichen Repräsentation nur an die deskriptionale bzw. depiktionale Kodierung gebunden sind. Der rein strukturelle Charakter erlaubt, unter Einbezug von Inhaltsvorwissen die Informationen im nächsten Verarbeitungsschritt über kodalitätsspezifische Grenzen hinweg auf Konsistenz zu überprüfen, Widersprüche zu identifizieren, Vermutungen und Schlussfolgerungen abzuleiten und die dabei auftretenden, kognitiven Konflikte zu lösen.

2.2.3 Ausbildung einer semantisch-kohärenten Tiefenstruktur

Die Ausbildung einer semantisch-kohärenten Tiefenstruktur, auch als Kohärenzformation (Seufert 2003) bezeichnet, geschieht durch die Interaktion von Propositionalen Repräsentationen, Mentalen Modell und dem Langzeitgedächtnis. Zwischen den Propositionalen Repräsentationen und dem Mentalen Modell geschieht diese Interaktion einerseits durch das Modell-Refinement, andererseits durch den Abgleich der vorliegenden Informationen mit Vorwissen aus dem Langzeitgedächtnis im Rahmen der sogenannten Kohärenzformation.

Beim Modell-Refinement werden zum einen die Propositionale Repräsentationen durch eine Modell-Konstruktion in das Mentale Modell überführt oder integriert. Dabei tragen bereits im Langzeitgedächtnis vorliegende, mit dem Thema assoziierte Bilder und deren Deutungen im Sinne paradigmatischer Bildbezüge (Kaiser und Kaiser 2018) zur Anreicherung des Mentalen Models bei. Zum anderen wird bei der Modell-Inspektion, der Gegenrichtung zur Modell-Konstruktion, das Mentale Modell herangezogen, um Assoziationen zu den vorliegenden Begrifflichkeiten zu erlauben, neue Propositionen auszubilden oder bestehende Propositionen auf deren aussagenlogische Korrektheit zu prüfen (Schnotz 2014). Für beide Prozesse wird damit neben Inhaltsvorwissen auch Wissen bezüglich der Bildung von Implikationen und Kausalketten notwendig. Letzteres bildet automatisiert kognitive Denkmuster ab und wird im Folgenden daher als kognitiv-prozedurales Wissen bezeichnet.

Im Detail wird dieser kohärenzstiftende Prozess zwischen Propositionalen Repräsentationen, Mentalen Modell und Vorwissen dabei durch die fundamentalen Prozesse des Deduzierens, Abduzierens und Induzierens abgebildet (Johnson-Laird et al. 2018). Deduktion beschreibt Vorgänge, bei denen unter gegebenen Bedingungen Schlussfolgerungen gezogen werden, Abduktion die Lösung kognitiver Konflikte unter Hinzuziehen eigenen Vorwissens und Induktion exemplarisches Hinzuziehen von Vorwissen zur Einschätzung einer (numerischen) Wahrscheinlichkeit eines Sachverhaltes (vgl. Johnson-Laird et al. 2018). Um diese Operationen auszuführen, werden inhaltliches (Domäne, Arbeits- und Lebenswelt) und formal-logisches Wissen (kausale Muster, Kausalketten) sowie mental-räumliche Fähigkeiten zur Manipulation (Rotation, Translation, Temporalität, Kausalität) benötigt. Johnson-Laird et al. (2018) legen anhand verschiedener Beispiele dar, dass ein Ge- oder Misslingen dieser Prozesse maßgeblich davon abhängt, inwiefern die jeweils zu bildenden Mentalen Modelle die Problemstellung vollständig abbilden. Während der Abruf und die oberflächliche Anpassung bestehender Mentaler Modelle häufig zu fehlerhaften Schlussfolgerungen führt, ist eine tiefenstrukturell-angeleitete Modellkonstruktion mit einer erhöhten Erfolgswahrscheinlichkeit verbunden (Johnson-Laird et al. 2018; vgl. auch Evans und Stanovich 2013; Kahneman 2011; Tversky und Kahneman 1983).

2.3 Zusammenfassung bezüglich Vorwissens

In den vorangegangenen Abschnitten wurde im Rahmen einer eingehenden Betrachtung der im ITPC beschriebenen kognitiven Prozesse das bei der Rezeption von Repräsentationen benötigte Vorwissen herausgearbeitet. Aus dieser Betrachtung heraus kann das bedeutsame Vorwissen grundsätzlich in zwei Arten unterschieden werden, welchen verschiedene Funktionen im Rezeptionsprozess zukommen: das Inhaltsvorwissen, welches häufig bereichsspezifisch und weitgehend unabhängig von der jeweiligen Darstellungsform, der Repräsentation, vorliegt und ein repräsentationsspezifisches Wissen, welches den Rezeptionsvorgang der konkreten Repräsentation anleitet und somit losgelöst vom Inhalt und zumeist auch dessen Domäne besteht. Während Inhaltsvorwissen bereichsspezifisch ist, ist bei letzterem von einem bereichsübergreifenden Repräsentationswissen zu sprechen. Allerdings ist eine Abgrenzung der beiden Wissensarten keinesfalls trivial und bedarf weiterer Klärung: Zum einen ergeben sich durch die grobe Unterteilung „Inhaltsvorwissen“ vs. „Repräsentationsvorwissen“ missverständliche Aspekte, zum anderen lassen die diese großen Kategorien entsprechend deren funktionalen Bedeutung im Rezeptionsprozess weiter untergliedern.

Es soll an dieser Stelle daher vorgehoben werden, dass Inhaltsvorwissen zwar unabhängig von der einzelnen Repräsentation besteht, ob es aber für den Rezeptionsprozess von Bedeutung und zu aktivieren ist, kann durchaus von der einzelnen Repräsentation abhängen. So wird beispielsweise lexikalisches Wissen zu Fachvokabular bei textuellen Repräsentationen wie einem Fachtext oder einer Tabelle benötigt, bei einer rein graphischen Darstellung des Sachverhaltes möglicherweise jedoch nicht.

Darüber hinaus können zwar einzelne Sachverhalte des Inhaltsvorwissens einer bestimmten Domäne zugeordnet werden, z. B. einer Wissenschaftsdisziplin oder einem lebensweltlichen Bereich, bei der Rezeption einer Repräsentation jedoch können verschiedenste Sachverhalte aktiviert und bedeutsam werden. Diese unterschiedlichen Sachverhalte wiederum können aus verschiedenen Domänen entstammen. Für die Erschließung einer Repräsentation also ist nicht unbedingt nur Wissen aus einer einzigen Domäne notwendig.

Schließlich wird Inhaltsvorwissen sowohl als notwendige Voraussetzung auf der Ebene der tiefenstrukturellen Verarbeitung der Oberflächenstruktur bedeutsam, aber ebenso als hilfreiches Hintergrundwissen während der Kohärenzformation. Bei letzterem Prozess dient dieses zur Einordnung und Anknüpfung neuer Erkenntnisse. Das Inhaltsvorwissen nimmt somit zwischen diesen beiden grundsätzlich unterschiedlichen Verarbeitungsebenen eine funktional andere Bedeutung ein und die dafür aktivierten Sachverhalte können ebenso aus sehr verschiedenen Domänen entstammen.

Etwas anders verhält es sich beim Repräsentationswissen: Repräsentationswissen ist nicht an eine Domäne, sondern vielmehr an die Repräsentationsform gebunden. Zudem ist, anders als Inhaltsvorwissen, nicht jede Form des in der Literatur beschriebenen Repräsentationswissens Rezipierenden grundsätzlich bewusst. Etliche gut eintrainierte Prozesse laufen automatisiert – und somit unbewusst – ab. Andere Vorgänge können als Strategien ausformuliert und als Handlungsplan gesteuert ausgeführt werden. Diese sind bewusstseinsfähig. Eine weitere Form von Repräsentationswissen stellt deklaratives Faktenwissen über die Repräsentation dar. Beispiele dafür sind die Kenntnisse von Namen und Funktionen einzelner Elemente der Repräsentation, wie z. B. Achsenbezeichnungen und Skaleneinteilungen von Diagrammen. Dieses Wissen ist Rezipierenden grundsätzlich bewusst, es handelt sich somit um bewusstseinspflichtige Wissensanteile. Abb. 2 stellt die Klassifizierung in der Übersicht dar.

Abb. 2
figure 2

Klassifizierung des Vorwissens bei der Rezeption von Repräsentationen

An dieser Stelle soll ergänzend betont werden, dass der Grad der Bewusstseinsfähigkeit der jeweiligen Wissensart unmittelbare Implikationen auf die Frage der Vermittelbarkeit mit sich bringt. Aus diesem Grund muss an dieser Stelle diese Einteilung in deklaratives, strategisches und prozedurales Repräsentationswissen aufbereitet werden, wobei die Unterscheidung zwischen strategischem (d. h. Wissen über eine zu befolgende Handlungsweise) von prozeduralem (d. h. Wissen, dass sich in einer automatisierten, unbewussten Handlung ausdrückt) von den jeweiligen Kompetenzständen der Rezipierenden abhängt.

Unter Zuhilfenahme dieser Kategorisierung fasst Tab. 1 die Unterteilung des Vorwissens hinsichtlich der Auseinandersetzung mit den Verarbeitungsprozessen in den verschiedenen Verarbeitungsstufen aus Abschn. 2.2 im Detail zusammen. Tab. 1 stellt somit auch die Antwort auf die erste Teilfrage nach den in der didaktischen Literatur berichteten Vorwissen, dessen Klassifizierung und Einordnung innerhalb des kognitiven Verarbeitungsprozesses dar.

Tab. 1 Wissen für Repräsentationsarbeit (Zusammenfassung) nach Verarbeitungsstufe aufgeschlüsselt

3 Empirische Befunde zum Einfluss von Vorwissen

Offen ist demnach die Frage, welchen Einfluss das Vorwissen auf den Rezeptionsprozess tatsächlich ausübt. Hierzu sollen qualitativen Ergebnisse aus Kap. 2 im Folgenden mithilfe der vorliegenden quantitativen Befundlage untersetzt werden. Dazu wird ein Review des empirischen Forschungsstandes im Hinblick auf die differenziellen Befunde bezüglich vorhandenen oder abwesenden Vorwissens bei der Rezeption externaler Repräsentationen durchgeführt. Da sich die Forschungslandschaft und somit auch die Literatur in Bezug auf die Rezeption von Repräsentationen aktuell als ein stark fragmentiertes Feld darstellt, ist es Ziel des Reviews, die Erkenntnisse bezüglich der im letzten Kapitel herausgearbeiteten Kategorien des Vorwissens sowie im Hinblick auf die verschiedenen Verarbeitungsstufen zusammenzufassen und auf deren Kohärenz hin zu diskutieren.

Da zu dieser Fragestellung keine dedizierten Studien vorliegen, werden Untersuchungen herangezogen, die quantitativ im Vergleich zu einer Kontrollgruppe den Rezeptionserfolg nach einer entweder Inhaltsvorwissen oder Repräsentationswissen adressierenden Intervention erfasst. Diese Intervention muss sich dabei einer der drei Verarbeitungsstufen zuordnen lassen. Unabhängig vom Untersuchungsdesign werden die Aussagen aus den Studien daraufhin derart ausgewertet, dass Vorwissen als unabhängige Variable behandelt wird.

Zunächst wird das methodische Vorgehen beschrieben, im nächsten Schritt auf die Befundlage im Detail eingegangen und diese anschließend zusammengefasst.

3.1 Methode und Literaturauswahl

Als Grundlage dieses Reviews wurde eine explorative sowie systematische Literaturrecherche (vgl. Peters und Dörfler 2014) mit den Schlagworten „representation“, „representational competence“, „diagram“, „inscription“, „visualization“ sowie „visual display“ jeweils in Kombination mit „previous/prior knowledge“, „procedural knowledge“, „spatial abilities“, „strategies“ und „familiarity“ sowie „comprehension“ und „understanding“ durchgeführtFootnote 3. Die Schlagworte wurden dem laufenden Literaturscreening entnommen und bei Bedarf ergänzt. Zur Suche wurden die auf Pädagogik spezialisierten Fachdatenbanken Pädagogik (FIS) und die des Educational Research Information Center (ERIC) sowie die generellen akademischen Suchmaschinen Bielefeld Academic Search Engine (BASE), Web of Science und Google Scholar herangezogen, um sowohl den nationalen als auch den internationalen Raum abzudecken sowie einen über den pädagogisch-psychologisch kuratierten Bereich der Fachdatenbanken hinausreichenden Korpus zu erhalten. Zusätzlich wurden die Publikationslisten der am häufigsten ermittelten Autoren ausgewertet (Abb. 3).

Abb. 3
figure 3

Darstellung des Literaturrecherche und des Auswahlprozesses

In einer ersten Auswahl wurden auf Basis der Überschrift sowie des Abstracts alle Treffer aussortiert, die nicht erkennbar zum Themengebiet der externalen Repräsentationen oder zur Zielgruppe zuzuordnen waren. Als Zielgruppe galten nicht Kleinkinder, Lehrende sowie Personen mit pathologischen Befunden oder Lernschwierigkeiten. Im weiteren Auswahlprozess wurde darauf geachtet, dass ausschließlich quantitative und peer-begutachtete Arbeiten Berücksichtigungen fanden, sofern nicht bereits durch Suchparameter diesbezüglich zu filtern war. Berücksichtigung finden somit Dissertationen mit quantitativen Studiendesigns, Metaanalysen sowie in Fachbüchern, Zeitschriftenartikeln oder Sammelbänden veröffentlichte quantitative Studien in englischer und deutscher Sprache.

Die Studien wurden anschließend bezüglich des Untersuchungsgegenstandes, der adressierten Verarbeitungsstufe, abhängigen und unabhängigen Variablen sowie (potenziellen) Mediatoren kodiert. Im Hinblick auf die übergeordnete Fragestellung nach der Rezeption klassischer Lernmedien, d. h. Lernmedien mit statischen Darstellungen, wurden Studien ausgeschlossen, die vorrangig animierte Darstellungen oder einen produktiven Gebrauch untersuchen.

Der Korpus von insg. 374 auf diese Weise ermittelten Beiträgen wurden auf Grundlage dieser Kodierung anschließend nach Studien gefiltert, welche differenzierte Befunde bzgl. des Einflusses von mindestens einer Vorwissenskategorie auf den Wissenserwerb mit Repräsentationen berichten. Ausgewertet wurden schließlich n = 51 Studien zum Inhalts- und n = 72 Studien zum (deklarativen, strategischen oder prozeduralen) Repräsentationsvorwissen, welche dem in Abb. 4 dargestellten Untersuchungsdesign entsprechen.

Abb. 4
figure 4

Prinzipielles Untersuchungsdesign der ausgewerteten Studien zum Einfluss von Vorwissen auf den Rezeptionsprozess

3.2 Ergebnisse aus den Studien

Im Folgenden werden die Befunde aus den ermittelten Studien getrennt für Repräsentations- und Inhaltsvorwissen dargestellt. Die Befunde werden der jeweiligen kognitiven Verarbeitungsstufe (Perzeption, tiefenstrukturelle Analyse und Kohärenzformation) zugeordnet und im Anschluss werden die Ergebnisse zusammengefasst und diskutiert.

3.2.1 Einfluss von Repräsentationswissen

Die Studienlage für das Repräsentationswissen wird dabei so dargestellt, dass Befunde vergleichbarer Interventionen und Untersuchungen zum selben Konstrukt gemeinsam angeordnet werden. Die Interventionen bzw. Untersuchungsgegenstände wiederum erlauben die Zuordnung zur jeweiligen Verarbeitungsstufe sowie der Art des Repräsentationswissens: deklarativ, strategisch oder prozedural. Aus Gründen einer eher einheitlichen Befundlage kann auf eine textuelle Unterteilung in die genannten Unterkategorien verzichtet werden, sodass im Folgenden die Befunde zum Einfluss von Repräsentationswissen prozesslogisch berichtet werden.

… auf Wahrnehmung und perzeptuelle Oberflächenverarbeitung

Für die Ebene der Wahrnehmung und perzeptuellen Oberflächenverarbeitung lassen sich die Befunde hinsichtlich Lernförderlichkeit von Interventionen, welche auf die Aufmerksamkeits- und Selektionsprozesse fokussieren, einschränken. Dass das Gelingen dieser Prozesse im Lernprozess keine Selbstverständlichkeit darstellt, davon zeugen diejenigen Befunde, nach denen allein ein längeres In-Augenscheinnehmen einer grafischen Zusatz-Repräsentation nicht zwangsläufig zu einem Lernvorteil führt (Antonietti et al. 2015), auch nicht, wenn durch einfache Verweise aus dem Text auf die Darstellungen hingewiesen wird (Schnotz und Mikkilä 1991). Ebenso ist bekannt, dass sich Lernende in Lern- und Problemlöseprozessen nur auf eine der zur Verfügung stehenden Repräsentationen stützen (Ainsworth et al. 2002).

Mit der Strategie einer Aufforderung an die Lernenden, die „verborgene inhaltliche Brücke“ (Renkl et al. 2013, übersetzt) zwischen verschiedenen Repräsentationen zu entdecken, verbessern sich Lernergebnisse signifikant (Jian 2020; Renkl et al. 2013). Auf der Ebene der Perzeption sorgt die Aufforderung dafür, dass die beiden Repräsentationen wahrgenommen, inspiziert und verarbeitet werden (Jian 2018). Dies geht einher mit Befunden, die nahelegen, dass die Aufmerksamkeitssteuerung maßgeblich von der wahrgenommenen Bedeutsamkeit der abgebildeten Informationen abhängt (vgl. Rey 2012; Hinze et al. 2013; Hegarty und Sims 1994). Die Wirkung einer solchen Intervention ist daher nur von sehr begrenzter Dauer (Jian 2021).

Eine zweite mögliche Intervention gilt der Frage der Rezeptionsreihenfolge: Text oder Bild – was sollte zuerst bearbeitet werden? Zwar legen deskriptive Untersuchungen nahe, dass eine vorausgehende Textrezeption zu einer intensiveren Beschäftigung der Probanden mit gegebenem Bildmaterial führt, nachdem ein initiales Mentales Modell erarbeitet wurde (Zhao et al. 2020; Schnotz et al. 2014; Hochpöchler et al. 2013), lernförderlicher jedoch erweist sich eine umgekehrte Rezeptionsfolge: erst Bild, dann Text (van den Eynde et al. 2019; Jian und Wu 2015; Ullrich 2011). Zusätzlich zeigen die Untersuchungen ebenso für diese Reihenfolge eine Erhöhung der Gesamtlesedauer sowie erhöhte Lesezeiten für die Grafik allein.

Als dritte berichtete Intervention zum Aufbau strategischen oder prozeduralem Wissens ist ein Prätraining der Augenbewegung am modellierenden Beispiel durch einen Experten anzusehen (Renkl und Scheiter 2017). Hierbei wird der Aufmerksamkeitsfokus an einem repräsentationalen Beispiel direkt trainiert. Ein solches Treatment übt prozedurales Repräsentationswissen ein und führt zu besseren Verständnisleistungen (Schubert 2016; Skuballa et al. 2015; Skuballa und Renkl 2014).

In der Frage nach dem Einfluss von prozeduralem Wissen auf die Verarbeitungsprozesse in dieser Ebene sind die verbalen als auch die räumlich-visuelle Fähigkeiten zu nennen. Räumlich-visuelle Fähigkeiten (spatial abilities), welche sich für gewöhnlich als wichtige Prädiktoren für den Lernprozess erweisen (Lin und Suh 2021; Cheung et al. 2020; Rau 2016; Lean und Clements 1981), spielen tatsächlich in der der perzeptiven Verarbeitungsebene eine untergeordnete Rolle. Weder bei der globalen Erfassung der Repräsentationsoberfläche (Hegarty und Sims 1994, Studie 2), noch einem erhöhten Aufmerksamkeitsfokus in der graphischen Repräsentation von Lernenden mit höheren räumlichen Fähigkeiten (Hinze et al. 2013, Studie 1) als auch in der Frage der Leserichtung einer Grafik (Winn 1982) ist ein grundsätzlicher Zusammenhang zwischen räumlich-visuellen Fähigkeiten und Verständnisleistung herzustellen. Allerdings wurde in der Frage der Leserichtung bei Grafiken die verbalen Fähigkeiten als Prädiktor identifiziert: Speziell eine Kombination hoher verbaler mit niedrigen räumlich-visuellen Fähigkeiten führt bei ungewohnter Leserichtung zu Leistungseinbrüchen (Winn 1982). Bekannt ist zudem, dass Probanden mit Präferenz für verbale Informationen länger im Text verweilen, früher und häufiger irrelevante Elemente in grafischen Repräsentationen inspizieren und im Verständnistest signifikant schlechter abschneiden als visuell-orientierte Lernende (Koć-Januchta et al. 2017; Koć-Januchta 2016). Letztere Befunde stehen durchweg im Einklang mit denen zur Rezeptionsreihenfolge.

… auf die tiefenstrukturelle Analyse der repräsentationalen Oberfläche

Dennoch ist es gerade die Inspektion der begleitenden Repräsentationen, welche die Grundlage für höhere kognitive Aktivitäten wie eine tiefergehende Interpretation der Informationen, dem Ziehen von Inferenzen und dem Aufbau eines elaborierteren Mentalen Modells darstellt (Cromley et al. 2010; Schnotz et al. 1994). Dies ist im Besonderen für die tiefenstrukturelle Analyse der Oberflächenmerkmale bedeutsam.

Ein bedeutsames Detail dabei stellt das Erkennen der Hauptaussage und der Funktion der jeweiligen Repräsentation dar (Chittleborough und Treagust 2008). Dies geschieht in der Regel bereits bei der ersten Inspektion innerhalb eines Zeitrahmens von 50–250 Millisekunden, in dem auch die globale räumliche Struktur miterfasst wird (Eitel et al. 2012). Für die darüberhinausgehende Bewältigung müssen Lernende die relevanten repräsentationalen Details erfassen sowie über eine adäquate Fachsprache zur Beschreibung der Sachverhalte zu verfügen (Ring et al. 2019).

Dazu haben sich gezielte Trainings repräsentationsspezifischer Konventionen, wie zum Beispiel bei Liniendiagrammen (Kottmeyer et al. 2020; Ring et al. 2019; vgl. Lachmayer et al. 2007), aber auch allgemeinere Trainings zur repräsentationalen Literalität, bei dem explizit repräsentationale Konventionen vermittelt und geübt werden (Koenen et al. 2020; Cromley et al. 2013b; Cleveland und McGill 1986), als erfolgreiche Interventionen erwiesen. Zwar lässt sich ein Transfer der erworbenen Fähigkeiten auf Repräsentationen in andere Kontexten derselben Domäne, nicht aber in jedem Fall auf andere Domänen beobachten (Brückner et al. 2020; Susac et al. 2018; Bergey et al. 2015; vgl. auch Ceuppens et al. 2019) – ein Zeichen dafür, dass dieses Repräsentationswissen von Lernenden nicht als bereichsübergreifend wahrgenommen wird.

Strategisch unterstützt werden kann dieser Prozess durch grafische Hervorhebungen mit zeigender Funktion, Signaling genannt. Dies kann z. B. durch die Farbgestaltung oder durch Pfeile erreicht werden. Neben einer aufmerksamkeitslenkenden Wirkung werden damit das Erkennen von repräsentationalen Zusammenhängen und bedeutsamen Konventionen unterstützt (Berthold und Renkl 2009; Mautone und Mayer 2007). Allerdings wirkt sich diese strukturelle grafische Unterstützung nur auf das Erkennen von korrelativen Zusammenhängen, nicht jedoch auf das von Kausalitäten aus (Mautone und Mayer 2007).

Eine weitere gut erforschte Strategie, die Auseinandersetzung mit Repräsentationen zu vertiefen, sind sogenannte Self-Explaining-Prompts: Dabei werden Lernende aufgefordert, Erklärungen zu den dargebotenen Zusammenhängen zu formulieren und ist sowohl für rein text-basierte Lernarrangements (Roelle et al. 2014) als auch bei Diagrammen (Ainsworth und Loizou 2003) oder multiplen Repräsentationen lernförderlich (Renkl und Scheiter 2017; Rau et al. 2015; Renkl et al. 2013). Prompting wirkt sich dabei besonders auf globales Verstehen, weniger auf lokale Detailwissen aus (Burkhart et al. 2020) und wird als Lernstrategie von Lernenden unabhängig von deren Inhaltsvorwissen nachhaltig auf andere Situationen transferiert (Nagashima et al. 2021). Ähnlich wirkt sich die Aufforderung an die Lernenden, Informationen aus mehreren Repräsentationen zusammenzufassen, positiv auf das Verständnis aus – zumindest, wenn Lernergebnisse auf Korrektheit geprüft werden (Bodemer et al. 2004). Weiterhin ist der Erfolg von darüberhinausgehenden Strategien empirisch belegt, bei denen der Zugriff auf komplementäre Inhalte, die eingehende Interpretation von Informationen oder die Elaboration von Zusammenhängen durch eine Repräsentation unterstützt sowie die Abstraktion und Anwendung der Erkenntnisse auf neue Sachverhalte gefördert werden (Won et al. 2014).

… auf die Ausbildung einer semantisch-kohärenten Tiefenstruktur

Das Wissen über die funktionalen Zusammenhänge zwischen verschiedenen Repräsentationen wirkt sich über die tiefenstrukturelle Analyse hinaus auch auf der Ebene der Kohärenzformation positiv aus. Dies betrifft in erster Linie die Fragen der inter-repräsentationalen Translation und des Transfers von Repräsentationswissen auf neue Darstellungsformen.

Dafür scheint der Grad der Vertrautheit (Ainsworth 2006) in die jeweilige Repräsentation eine maßgebliche Rolle zu spielen und von der verbalen Vertrautheit zum Sachverhalt zu unterscheiden ist (Winn et al. 1991). So wirken leicht zugängliche Repräsentationsformen als Scaffolds und zu erfolgreicheren Translationen zwischen verschiedenen Darstellungsebenen (Stull und Hegarty 2015; Galmbacher 2007, Vorstudie) und repräsentationale Transferleistungen sind bei teil-vertrauten, nicht aber bei unbekannten Darstellungsformen nachzuweisen (Gegenfurtner und Seppänen 2013). Die Vertrautheit des Diagrammformats und damit die wahrgenommene Funktion beeinflussen zudem maßgeblich die gezogenen Interpretationen und Inferenzen (Shah und Freedman 2011), wobei die repräsentationale Inferenz auch trainiert werden kann und ein solches Training speziell für Lernende mit niedrigem Inhaltsvorwissen als lernförderlich erweist (Cromley et al. 2013a; Winn und Sutherland 1989; vgl. Renkl und Scheiter 2017). Zusätzlich wirken sich spezielle Self-Explaining Prompts, bei denen die Lernenden explizit die diagrammatische Repräsentationsform in die von ihnen produzierten Erklärungen einbeziehen, auf Vertrautheit und das Verständnis über die Funktion aus (Nagashima et al. 2020).

Allerdings sei an dieser Stelle darauf hingewiesen, dass die im letzten Abschnitt dargestellten Prompting-Maßnahmen, welche auf die Zunahme von konzeptuellem Wissen ausgerichtet sind, in konkreten Problemlösesituationen zu Behinderung des repräsentationalen Handelns führen kann (Berthold et al. 2011). Möglicherweise hängen diese Interferenzen damit zusammen, dass Effekte der Situierung wie sie beim Problemlösen auftreten der Fähigkeit zur Abstraktion und Ausbildung eines umfassenden Mentalen Modells entgegenstehen (de Bock et al. 2003). Nicht zuletzt liegen starke empirische Hinweise darauf vor, dass Mentale Modelle keinerlei strukturelle Unterschiede mehr bezüglich der konkreten Situation des Problems aufweisen (Shams et al. 2017; Cox et al. 1995; Stenning et al. 1995; Bauer und Johnson-Laird 1993).

Für eine erfolgreiche Ausbildung eines kohärenten Mentalen Modelles ist darüber hinaus auch prozedurales Repräsentationswissen in Form von verbalen und räumlich-visuellen Fähigkeiten notwendig (Al-Balushi 2013; Stenning et al. 1995). Meta-analytisch lässt sich ein Zusammenhang zwischen räumlich-visuellen Fähigkeiten und den erzielten Verständnisleistungen mit mittleren bzw. mittleren bis großen Effektstärken ermitteln (Höffler 2010; C. Chen und Yu 2000). Lernende mit niedrigen räumlich-visuellen Fähigkeiten können dieses Defizit mithilfe dreidimensionaler anstatt zweidimensionaler Darstellungen (Höffler, 2010) oder animierter Repräsentationen statt statischer Abbildungen kompensieren (Höffler und Leutner 2011; Hegarty und Steinhoff 1997; Hays 1996). Im Gegenzug lernen Lernende mit höheren räumlich-visuellen Fähigkeiten besser von statischen Darstellungen als von animierten (Berney et al. 2015).

Ebenso erweist sich räumlich-visuelles Prompting, d. h. Aufforderungen sich die Bewegung des abgebildeten Sachverhaltes vorzustellen, als lernförderlich für Lernende mit mittleren, nicht aber für Lernende sowohl mit sehr niedrigen als auch sehr hohen räumlich-visuellen Fähigkeiten (Park et al. 2016). Zudem wird bei hohen räumlich-visuellen Fähigkeiten unter Prompting-Bedingung eine erhöhte kognitive Belastung berichtet (Park et al. 2016), was als Interferenzerscheinung in die eigenen, höheren kognitiven visuellen Verarbeitungsprozesse innerhalb der Kohärenzformation gedeutet werden kann. Die durch die Intervention mutmaßlich verursachten Interferenzerscheinungen können dabei Performanzeinbußen bei Lernenden mit an sich günstigeren Lernvoraussetzungen führen (Hinze et al. 2013). Zudem gibt es Hinweise darauf, dass es bei hohen räumlich-visuellen Fähigkeiten unter Treatmentbedingung zu nicht-trivialen Drei-Wege-Interaktionen mit Inhaltsvorwissen kommt (Galmbacher 2007, Vorstudie).

Nicht in jedem Fall führt ein hohes Maß an räumlich-visuellen Fähigkeiten auf der Ebene der Kohärenzformation zu einer besseren und schnelleren Performanz, besonders dann nicht, wenn die Antwort in sprachlicher Form erwartet wird (Hegarty und Sims 1994). Die Nachteile gleichen sich jedoch bei Antworten in bildlicher Form aus. Offensichtlich hat das Testformat Einfluss auf die Auswirkung räumlich-visueller Fähigkeiten. So ist der Einfluss räumlich-visueller Fähigkeiten bei bildhaften oder praktischen Testformaten wesentlich höher als bei schriftbasierten (Roach et al. 2021).

Diese Befundlage spiegelt sich innerhalb der Strategien wider, welche den „Generative Drawing Effect“ ausnutzen. Demnach werden bessere Verständnisleistungen erzielt, wenn Sachverhalte grafisch dargestellt werden (Leopold und Leutner 2012; Stieff und DeSutter 2021). Allerdings erhöht die generative Tätigkeit des Zeichnens die kognitive Belastung der Lernenden (Schwamborn et al. 2011), weshalb Probanden unabhängig von deren räumlich-visuellen Fähigkeiten eine signifikant bessere Erinnerungs- und Verstehensleistung erbringen, wenn während der Rezeption eines Textes dessen Inhalte bildlich vorgestellt, nicht aber wenn diese zeitgleich als Bild zu Papier gebracht werden (Leutner et al. 2009).

3.2.2 Einfluss von Inhaltsvorwissen

Es scheint zunächst kein Zweifel daran zu bestehen, dass Inhaltsvorwissen für die Rezeption von Repräsentationen benötigt wird und von Vorteil ist: Ein höheres Inhaltsvorwissen führt zu höherem Lernerfolgen (Mautone und Mayer 2007, Studie 2; Butcher 2006; Boucheix und Guignard 2005; Mayer et al. 2002; Mayer und Gallini 1990). Allerdings verhält sich dies nicht unter jedem Umstand so (Seufert 2003; Joseph und Dwyer 1984). Auch bezüglich der Frage, welche Personengruppe in der Differenz zwischen Prä- und Post-Test den größeren Lernfortschritt leistet, ist die Studienlage nicht eindeutig: zum Teil sind Probanden mit hohem Vorwissen im Vorteil (Butcher 2006; Boucheix und Guignard 2005), zum Teil sind die größeren Zugewinne auf Seiten der Lernenden mit niedrigem Vorwissen zu verzeichnen (Kalyuga 2008; Mayer und Gallini 1990) und zuweilen finden sich innerhalb derselben Untersuchungsreihe gemischte Ergebnisse (Rau et al. 2021). Daher lohnt es sich ebenso für das Inhaltsvorwissen, in äquivalenter Vorgehensweise wie beim Repräsentationswissen differenziert die einzelnen Verarbeitungsstufen zu betrachten.

… auf die Wahrnehmung und perzeptuelle Oberflächenverarbeitung

Bereits auf der Ebene der Perzeption lässt sich ein allgemeiner Einfluss von Inhaltsvorwissen auf den Rezeptionsprozess nachweisen: Mit vorhandenem Vorwissen inspizieren Lernende begleitende grafische Repräsentationen bedarfsgerecht, während sich bei niedrigem Vorwissen unabhängig von der Aufgabenstellung sowohl bezüglich Zeit als auch Anzahl eine gleichbleibende Bildinspektion zeigt (Canham und Hegarty 2010). Zugleich verweilen Lernende mit niedrigem Vorwissen länger im Textteil des Informationsmaterials (Schnotz et al. 2014), Lernende mit höherem Vorwissen inspizieren die gegebenen Abbildungen deutlich länger und intensiver (Zhao et al. 2020). Lernende mit hohem Vorwissen bevorzugen konzeptuell-relevante, abstrakte Darstellungen, Lernende mit niedrigem Vorwissen betrachten dagegen aus der Alltagswelt bekannte Darstellungen (Cook et al. 2008). Dekorative Abbildungen, die keine wesentlichen Anforderungen an die Lernenden stellen, werden unabhängig vom Inhaltsvorwissen nur kurzzeitig in Augenschein genommen (Scheiter et al. 2017) und während des weiteren Rezeptionsprozess weitgehend ignoriert (Rey 2012; Lenzner et al. 2013). Jedoch scheinen dekorative Abbildungen für Lernende mit niedrigem Vorwissen die wahrgenommene Schwierigkeit des Lernmaterials zu senken und über motivationale Effekte den Lernerfolg zu moderieren (Lenzner et al. 2013).

Eine weitere Möglichkeit, Rückschlüsse über die Auswirkung von Inhaltsvorwissen auf der Ebene der Oberflächenverarbeitung zu ziehen, bieten Studiendesigns, welche Oberflächenmerkmale durch z.B. Signaling-Interventionen direkt manipulieren. Mittels Signaling lassen sich nicht nur der Perzeptionsprozess external steuern, sondern die kognitiven Aktivitäten auf relevante Elemente lenken. Meta-analytisch ist für Signaling eine Lernförderlichkeit mit einer kleinen bis mittleren Effektstärke ermittelt (Richter et al. 2016). Undifferenziert betrachtet scheint dabei Signaling nur einen Effekt auf den Erwerb relationalen, nicht aber tiefenstrukturellen kausalen Wissens zu haben (Mautone und Mayer 2007, Studie 1 & 2). Allerdings profitieren Lernende mit niedrigem Vorwissen beim Erwerb von Wissen über die Oberflächenstruktur als auch von tiefenstrukturellen Wissen von Signaling-Maßnahmen (Richter et al. 2016; Johnson et al. 2013). Für Lernende mit hohem Vorwissen ergibt sich kein Vorteil gegenüber der Kontrollgruppe, zuweilen werden sogar lernhinderliche Ergebnisse berichtet (Richter et al. 2021; Johnson et al. 2013). Dies jedoch steht im Kontrast zu Befunden, welche marginal lernförderliche Effekte für Lernende mit mittlerem und hohem Vorwissen ermitteln (Boucheix und Guignard 2005), während sich Signaling-Maßnahmen bei niedrigem Vorwissen als lernhinderlich erweisen (Bodemer und Faust 2006; Boucheix und Guignard 2005). Ein derartiger Expertise-Reversal-Effekt wird auch beim Einsatz von bedeutungstragenden ikonischen Zusatzelementen festgestellt (Homer und Plass 2010): Probanden mit niedrigerem Vorwissen schneiden im Verständnistest besser mit der grafischen Unterstützung ab, während die ikonische Unterstützung auf Probanden mit wesentlich höherem Vorwissen keinen Einfluss zeigte (siehe Tab. 2).

Tab. 2 Differenzielle Befunde zum Einfluss von Inhaltsvorwissens bzgl. Verarbeitungsstufe (Nummer der Teilstudie mitangegeben, M steht für Metaanalyse)

… auf die tiefenstrukturelle Analyse der repräsentationalen Oberfläche

Jedoch lässt sich aus den Befunden zum Einfluss des Inhaltsvorwissens auf die perzeptiven Handlungsmuster nicht auf den Lernerfolg per se schließen. Hierfür sind nach Inhaltsvorwissen differenziertende Studien wie die von Mayer und Gallini (1990) notwendig, die durch grafische Darstellungen als Ergänzungen zu Textmaterial als direkte inhaltliche Unterstützungsmaßnahmen auf das Verständnis von Oberflächen- und Tiefenstrukturen wirken. Bei diesen Studien werden einzelne Bestandteile eines Systems (Oberflächenwissen), deren Funktion (tiefenstrukturelles Wissen) oder beides grafisch dargestellt. Der Lesetext ohne bildliche Darstellung stellt die Kontrollbedingung dar. Sowohl bezüglich der Wiedergabe des Inhaltes als auch bei der Bewältigung von Problemlöseaufgaben weisen Lernende mit niedrigem Vorwissen signifikant bessere Lernergebnisse zur Kontrollgruppe in der Bedingung auf, in der Oberflächen- und tiefenstrukturelles Wissen zugleich als ergänzende Darstellung vorliegt. Wenn nur eine der beiden Maßnahmen getroffen wurden, liegen gemischte bzw. marginale Befunde für diese Probandengruppe vor. Keine oder nur bedingte Performanceunterschiede konnten hingegen für Probanden mit hohem Vorwissen in jeder der Experimentalbedingungen festgestellt werden (Mayer und Gallini 1990). In der Replikation ergaben sich zudem lernhinderlichen Befunde für beide Probandengruppen, wenn nur eine der beiden Unterstützungsmaßnahmen dargeboten wurde (Ollerenshaw et al. 1997).

Über die z. B. in den Mayer-Studien vorgenommene, direkte Darstellung tiefenstrukturellen Wissens hinaus unterstützen Prompting-Maßnahmen den tiefenstrukturellen Analyse-Prozess (vgl. Renkl und Scheiter 2017). Untersuchungen zu direkten und indirekten PromptsFootnote 4 ergeben (Seufert 2003), dass sich für Probanden mit niedrigem Vorwissen für das Verständnis keine, für die Wiedergabe der Inhalte lernschädliche Effekte festzustellen sind. Probanden mit mittlerem Vorwissen profitieren hingegen bei der Inhaltswiedergabe von der direkten Maßnahme, beim Verständnis sogar von beiden. Probanden hohen Vorwissens zeigen bezüglich der Inhaltswiedergabe wie Probanden mittleren Vorwissens nur bei direkter Unterstützung einen marginalen Performancezuwachs, bezüglich des Verständnisses keinen signifikanten Zuwachs, sondern sogar marginale Einbußen (Seufert 2003).

… auf die Ausbildung einer semantisch-kohärenten Tiefenstruktur

Für den Einfluss von Inhaltsvorwissen innerhalb des Prozesses der Kohärenzformation liegen Befunde aus direkten Trainingsintervention zu kohärenzstiftenden Strategien vor. Diese zeigen nur bei Lernenden mit hohem Vorwissen positive Auswirkungen (Seufert 2019).

Allerdings gibt es auch Versuche, über die grafische Gestaltung (Realitätsgrad/Abstraktion) von Abbildungen Einfluss auf die Ausbildung kohärenter Mentaler Modelle hinzuwirken. Hierbei scheinen Probanden mit niedrigem und mittlerem Vorwissen von reduzierten oder schematischen und Probanden mit hohem Vorwissen von realistischen bzw. hybriden Darstellungen zu profitieren (Butcher 2006; Joseph und Dwyer 1984). Dementgegen stehen Befunde, die keinen spezifischen Einfluss des Inhaltsvorwissens ermitteln können und schematische Darstellungen grundsätzlich als lernförderlicher einstufen (Scheiter et al. 2009). Eine Gestaltung der externalen Repräsentationen unter Berücksichtigung der Ausbildung des Mentalen Modells scheint dabei ein wichtigerer Faktor als Inhaltsvorwissen zu sein (Klein et al. 2019; Schnotz et al. 1994), allerdings zeigten zusätzliche seduktive Details keinen Einfluss (Bender et al. 2021).

Untersuchungen zum generativen Drawing-Effekt zufolge scheint darüber hinaus der Zusammenhang zwischen den Propositionalen Repräsentationen und dem Mentalen Modell nicht abhängig von Inhaltsvorwissen zu sein (O. Chen und Manalo 2016; Leutner et al. 2009). Allerdings wird für Lernende beim Zeichnen von Sachverhalten mit niedrigem Inhaltsvorwissen eine erhöhte kognitive Belastung bei zeitgleich besserem Abschneiden im Verständnistest berichtet (O. Chen und Manalo 2016). Jedoch ist es lernförderlicher, statt zu zeichnen sich die Sachverhalte mental zu vorstellen (Leutner et al. 2009). Einflüsse des Vorwissens werden dagegen von Van Meter et al. (2006) berichtet: Zeichnen und (eingefordertes oder unaufgefordertes) Kontrollieren mit einer Musterdarstellung führte nur bei Sechstklässlern, nicht aber bei Viertklässlern zu einer besseren Performanz bei Problemlöseaufgaben. Auf Oberflächenwissen hatte das Treatment keinen Einfluss. Ebenso kein Einfluss ließ sich durch Zeichnen bei Inferenz-Aufgaben ermitteln, deren Lösungen sich aus dem Text ergeben (Butcher 2006).

Übersicht über die kontroverse Befundlage zum Inhaltsvorwissen

Die berichtete, in sich nicht widerspruchsfreie Befundlage wird in Tab. 2 zusammengefasst. Dazu werden die vorliegenden Studien, die sowohl nach Inhaltsvorwissen als auch in den auf Oberflächen- oder Tiefenstruktur wirkende Interventionen vor dem Hintergrund einer Kontrollgruppe differenzieren, hinsichtlich des Lernerfolges dargestellt.

3.3 Zusammenfassung und Diskussion der empirischen Befundlage

Die Befunde zeigen durchgehend, dass intensivere Inspektionen graphischer Repräsentation zu besseren Lernergebnissen führen – und das auf allen drei Ebenen: Perzeption, tiefenstruktureller Analyse und Kohärenzformation. Dabei fällt auf, dass sich die Befundlage bezüglich des Repräsentationswissen durchaus kohärent darstellt, wobei die Studienlage zum deklarativen Repräsentationswissen als noch nicht ausreichend eingeschätzt wird, um eine abschließende Beurteilung vorzunehmen (Renkl und Scheiter 2017).

Mit Blick auf Unterrichtsgestaltung lassen sich die Befunde wie folgt zusammenfassen:

  • Generell deutet die frühe Erkennung der Relevanz von externaler Repräsentation darauf hin, dass die Top-Down-Prozesse im ITPC auch eine wesentliche Rolle auf perzeptiver Ebene spielen (vgl. Scheiter et al. 2017). Das gleiche gilt für die berichteten Expertise-Reversal-Effekte sowohl bei der Perzeption als auch bei der Kohärenzformation. Die kausalen Zusammenhänge dahinter sind allerdings bislang unzureichend geklärt und stellen zu diskutierende Herausforderungen an die Theorie (vgl. Kalyuga 2008; Richter und Scheiter 2019; Evans und Stanovich 2013) und zugleich auch an die Praxis dar.

  • Bezüglich des prozeduralen Repräsentationswissens lässt sich mit Blick auf die berichteten Befunde zu den räumlich-visuellen Fähigkeiten feststellen, dass diese grundsätzlich lernförderlich wirken, bei hohen räumlich-visuellen Fähigkeiten jedoch auf Unterstützungsmaßnahmen besonders in der Kohärenzformation verzichtet werden sollte. Hier kann es zu Expertise-Reversal-Effekten kommen und sich die Unterstützung als lernhinderlich erweisen. Mit Blick auf Tab. 1 ist festzustellen, dass sich im Rahmen des Reviews vorwiegend Studien zu räumlich-visuellen Fähigkeiten als prozedurales Vorwissen in Bezug auf externale Repräsentationen identifizieren ließen. Allerdings wären noch weitere Befunde zu repräsentationalen Fertigkeiten zu erwarten, z. B. automatisierte Prozesse zur Bildung von Inferenzen innerhalb des Bereichs der Kohärenzformation (vgl. Hamami et al. 2021; López-Astorga et al. 2021) oder das Konzept der Visual Fluency (vgl. Rau et al. 2021). Diese Fähigkeiten wären an den Schnittstellen zwischen Propositionalen Repräsentationen bzw. Mentalem Modell und der Kohärenzformation anzusiedeln. Daher sind für beide Interaktionseffekte mit Inhaltsvorwissen und strategischem Wissen notwendig.

  • Mithilfe strategischen Repräsentationswissens lassen sich lernhinderliche Lernpräferenzen, z. B. die lernerseitige Annahme einer informellen Überlegenheit von Texten gegenüber Bildern, abmildern. Beispielsweise zeigt sich, dass von Lernenden zwar textuelle Repräsentationen für den Aufbau des Mentalen Modells bevorzugt genutzt werden, es jedoch lernförderlicher ist, auf einer eingehenden, initialen Inspektion der Grafik zu bestehen. Für den Bereich Kohärenzformation und Inferenz liegen darüber hinaus weitergehende Einzelstrategien vor, deren empirische Überprüfung jedoch noch aussteht.

  • Deklaratives Repräsentationswissen wird auf den unteren Ebenen Perzeption und Oberflächen-Verarbeitung als Wissen zu Konventionen notwendig und für höhere kognitive Prozesse als Wissen zur Funktion der jeweiligen Repräsentation. Das Wissen um die Funktion wird besonders dann bedeutsam, wenn Aussagen in einer Repräsentation identifiziert und auf eine andere Repräsentation zu übertragen sind.

  • Für Lernergebnisse vor dem Hintergrund unterschiedlichen Inhaltsvorwissens liegen hingegen widersprüchliche Befunde vor. Auch der unter Berücksichtigung der Verarbeitungsstufen differenzierte Blick konnte keine substanzielle Aufklärung leisten. Die Unterschiede manifestieren sich sowohl auf der Wissensebene der Oberfläche als auch des Tiefenstrukturellen. Daher soll dieser Punkt im Folgenden eingehender diskutiert werden.

Es ist naheliegend, die Widersprüche in den Befunden bezüglich des Inhaltsvorwissens auf uneinheitliche Operationalisierungen des Vorwissens zurückzuführen. Im Gegensatz beispielsweise zu prozeduralem Repräsentationswissen, in der Regel durch normierte, standardisierte und psychologisch validierte Testverfahren ermittelt, wird Inhaltsvorwissen in einer Vielzahl der Studien lediglich als „domänenspezifische Kenntnisse“ abgefragt, mehrheitlich durch Multiple-Choice-Tests. Aber auch Kohortenspezifika (Alter bzw. Zugehörigkeit zu Schulklasse oder -form) oder reine Selbstauskünfte dienen als Grundlage der Datenerhebung. Diese unterschiedlichen Erhebungsverfahren allein können bereits Ursache der uneinheitlichen Ergebnisse sein.

Allerdings bemisst sich die Frage, ob Probanden über hohes oder niedriges Vorwissen verfügen, in den vorliegenden Studien ausschließlich in Relation zur gewählten Probandengruppe, nicht aber zu den Anforderungen der zu rezipierenden Repräsentationen. Dies ist insofern bedeutsam, da sich in der Literatur vereinzelt der Hinweis darauf findet, dass sich je nach Vorwissen bzw. Kompetenz der jeweiligen Lernenden eine Zone der nächsten Entwicklungsmöglichkeiten im Sinne Wygotskis ergeben könnte (Schnotz und Kürschner 2007; Seufert et al. 2007). Liegt die Aufgabenschwierigkeit einschließlich deren Reduktion durch Unterstützungsmaßnahmen innerhalb dieser Zone, kann erfolgreiches Lernen gelingen. In diesem Fall wird die Unterstützungsmaßnahme effektiv genutzt (Seufert et al. 2007), und es kommt zu Enabling- bzw. positiven Unterstützungseffekten (Schnotz und Kürschner 2007). Ist das Vorwissen zu niedrig, können die kognitiven Anforderungen durch die Lernenden nicht erfüllt werden, ist das Vorwissen hingegen zu hoch, kommt es durch negative Unterstützungseffekte zu Expertise-Reversal-Effekten (vgl. Castro-Alonso et al. 2021; Baadte und Schnotz 2012). Dieser Zusammenhang ist in Abb. 5 dargestellt.

Abb. 5
figure 5

a Zusammenhang zwischen Inhaltsvorwissen und der Wirksamkeit von Unterstützungsmaßnahmen nach Seufert et al. (2007), b Einfluss einer Zone der nächsten Entwicklung auf die Wirksamkeit von Unterstützungsmaßnahmen nach Schnotz und Kürschner (2007), beide Abb. durch die Autoren übersetzt

Allerdings werden mithilfe dieses Ansatzes, wenn lediglich zwei Gruppen mit unterschiedlich ausgeprägtem Vorwissen miteinander verglichen werden, alle denkbaren Befunde post-hoc erklärbar und die Hypothese lässt sich auf der bisher vom Forschungsfeld eingeschlagenen Weise weder bestätigen noch nicht falsifizieren. Dafür wären mindestens drei Messpunkte der Variable Vorwissen notwendig. Bislang liegen nur zwei Studien mit derartigem Design vor (Seufert et al. 2007; Vogt et al. 2020), deren Datenlage zudem für diese Frage inkonkludent ist. Somit bleibt nicht nur offen, ob sich die Hypothese als zutreffend erweist, sondern auch, wie sich die unterschiedlichen Verarbeitungsstufen darin wiederfinden, ob beispielsweise für die Verarbeitungsstufen verschiedene Entwicklungs-Zonen existieren, in denen jeweilige Unterstützungsmaßnahmen erfolgreich zum Einsatz gebracht werden können.

Wie aus der Diskussion im Abschn. 2 hervorgeht, werden auf der Verarbeitungsstufe der Oberflächenstrukturen sowie der der Kohärenzformation unterschiedliche Arten von Vorwissen bedeutsam. Dies spricht für unterschiedliche Wirksamkeitsbereiche und somit dafür, die Fähigkeitseinschätzung der Probanden in Relation zu den kognitiven Anforderungen der jeweiligen Repräsentation zu ermitteln. Im Besonderen stellt allerdings keine der gesichteten Studien dar, wie das erhobene Inhaltsvorwissen mit den konkreten Inhalten der Repräsentation in Beziehung steht. Die vorliegenden Befunde legen damit nahe, dass ein solcher Bezug von Anforderungen durch das Lernmaterial und die Einschätzung des Vorwissens eine notwendige Voraussetzung darstellt, um zu einer kohärenten Forschungslage in der Frage auf den Einfluss des Inhaltsvorwissens zu gelangen.

4 Konsequenzen für Forschung und Unterricht

Während sich die Befundlage zum Repräsentationswissen weitgehend kohärent und eindeutig verhält, ist bezüglich des Inhaltsvorwissens festzuhalten, dass bislang der generelle Zusammenhang zwischen Vorwissen unterschiedlicher Ausprägung und der Lernwirksamkeit von Unterstützungsmaßnahmen auf den Verarbeitungsstufen als widersprüchlich zu betrachten ist. Dies wird unmittelbar zum Problem bei der Entwicklung und Gestaltung von Selbstlernmaterialien in Form klassische Printmedien und besonders bei digitalen und adaptiven Formaten. Aber auch einer validen Diagnostik im Klassenraum als auch kohärenten Ergebnissen in der Repräsentationsforschung steht diese offene Erkenntnislücke entgegen.

Daher wird in Folgenden ein Framework vorgeschlagen, welches die bisherige Forschungslogik umkehrt und den Fokus auf Top-Down-Prozesse lenkt, um die Problematik des Inhaltsvorwissens aufzulösen und die Entscheidung in Abhängigkeit von der Repräsentation bzw. des Lernmaterials zu treffen, ob zu hohes, adäquates oder zu niedriges Vorwissen vorliegt. Das Framework legt eine strukturierte Analyse der kognitiven Anforderungen nahe, die eine Repräsentation an Rezipierende stellt (siehe Abb. 6).

Abb. 6
figure 6

Vorgeschlagenes Vorgehen im Gegensatz zur bisherigen Forschungslogik der Multimedia-Design-Forschung (Abb. 4)

Entsprechend Tab. 1 kann zu dieser Analyse die in dieser Arbeit genutzte Unterteilung in Inhaltsvorwissen, deklarativen, strategischen und prozeduralen Repräsentationswissen als Wissensbestände berücksichtigt werden, um zu einer Einschätzung zu gelangen, ob sich Lernende bei Vorliegen bzw. Abwesenheit dieser Wissensbestände kognitiv in oder nahe der Zone der nächsten Entwicklung einordnen. Dies trägt zugleich dem Umstand Rechnung, dass neben dem Inhalts- auch die drei anderen Wissensarten für den Rezeptionsprozess bedeutsam sind und in die Überlegungen bei Unterrichtsplanung, Lehrmittelgestaltung und Untersuchungsdurchführung einzubeziehen sind. Zugleich sollte bei der Durchführung des vorgeschlagenen Vorgehens eingeschätzt und unterschieden werden, ob ermittelte Vorwissensbestände grundsätzlich für die Rezeption der Repräsentation notwendig oder ob diese für eine tiefergehende Elaboration des dargestellten Sachverhaltes hilfreich sind (vgl. Erlebach und Frank 2018). Als hilfreich ist ein Wissensbestand beispielsweise zu erachten, wenn dieser (wie strategisches Wissen) kompensatorische Funktionen erfüllt oder (wie bei inhaltlichem Hintergrundwissen) die Aussagen der Repräsentation im Rahmen der Kohärenzformation an einen reichhaltigen Wissensvorrat anknüpfen lässt. Abb. 7 fasst diese Überlegungen zusammen und stellt das konzeptuelle Framework für die Erfassung kognitiver Anforderungen einer externalen Repräsentation an den Rezipienten dar.

Abb. 7
figure 7

Konzeptuelles Framework zur Erfassung kognitiver Anforderungen bei der Bearbeitung externaler Repräsentationen

An diese Stelle soll noch einmal das Potenzial eines solchen Vorgehens hervorgehoben werden, die Vorbereitung und Durchführung von Unterricht dahingehend zu unterstützen, indem Lehrende in die Lage versetzt werden, sich systematisch Klarheit über für das Verständnis einer speziellen Repräsentation notwendige Wissen und die zu beherrschenden Fertigkeiten zu verschaffen. Auf Grundlage des dadurch erlangten Verständnisses kann den Lernenden vertiefendes Wissen bereitgestellt werden, welches z. B. in Form von Lernkarten oder Leittextfragen vorbereitet wird bzw. sich für die Vermittlung innerhalb eines Unterrichtsgespräches vorstrukturieren lässt. In diesem Zusammenhang unterstützt dieses Vorgehen bezogen auf den Repräsentationseinsatz die Planung eines an den kognitiven Ressourcen der Lernenden orientierten Unterrichts (vgl. Erlebach et al. 2020). Indem durch ein solches Vorgehen Lernenden Wissen über Inhaltsaspekte, Funktion und Funktionsweise sowie Erschließungsstrategien für die zu bearbeitenden Repräsentationen bereitgestellt wird, lässt sich das repräsentationale Dilemma der Lernenden proaktiv entschärfen.

Zudem werden durch dieses Vorgehen Lehrende dabei unterstützt, das eigene Expertenwissen aus Fachwissenschaft oder Berufserfahrung in den Unterricht einzubringen und zu kommunizieren. Hierzu ist an Erkenntnisse und Diskurse der jeweiligen Fachdisziplinen und -didaktiken anzuknüpfen. Beispielhaft wurde für die Technikdidaktik das fachspezifische Inhaltsvorwissen in Repräsentationen mithilfe des in Erlebach und Frank (2021) erarbeiteten Analyserasters in inhaltlicher und lernpsychologischer Dimension ausdifferenziert und für den unterrichtlichen Einsatz aufbereitet. So sind auch Lehrende mit wenig Unterrichtspraxis im jeweiligen Inhaltsbereich nicht ausschließlich auf unterrichtspraktische Erfahrungen, Rückmeldungen von Lernenden bezüglich des Umgangs mit konkreten Repräsentationen oder gar der schwer zu greifenden und zu vermittelnden „Lehrerintuition und Bauchgefühl“ angewiesen. Somit unterstützt das ein solches Vorgehen besonders Lehrende zu Beginn ihrer Laufbahn bzw. im Quereinstieg dabei, guten Unterricht zu gestalten und durchzuführen. Gleichzeitig stellt das Framework das notwendige Vokabular und mit den unterschiedlichen Wissensarten entscheidendes pädagogisches Wissen für den kollegialen Austausch im Themenfeld Repräsentationsarbeit bereit. Diese beiden Aspekte stärken die Annahme, durch dieses Vorgehen den in der Literatur berichteten Defiziten seitens der Lehrkräfte (McElvany et al. 2009) beim Einsatz von Repräsentationen entgegen wirken zu können.

5 Fazit

Im Rahmen dieses Artikels wurde sich mit dem repräsentationalen Dilemma auseinandergesetzt, welches Lernende aufgrund mangelnden Vorwissens bei der Rezeption externaler Repräsentationen erfahren. Dazu wurde zunächst der Rezeptionsprozess statischer externaler Repräsentationen mit Fokus auf das in den verschiedenen kognitiven Prozessebenen benötigten Vorwissen untersucht und anschließend konkrete empirische Befunde hinsichtlich der unterschiedlichen Wissensarten und Prozessebenen aufgearbeitet. Dabei zeigte sich im Speziellen für Inhaltsvorwissen eine unübersichtliche Befundlage. Zur Lösung dieses Problems wird ein konzeptuelles Framework vorgeschlagen, mithilfe dessen die kognitiven Anforderungen an Lernende durch externale Repräsentationen erfasst werden können.

In Hinblick auf die Theorie des Text-Bild-Verstehens wird dabei für eine stärkere Beachtung der Top-Down-Prozesse im Sinne des ITPC (Schnotz 2014) plädiert. Hierzu liegen bislang noch keine einschlägigen Überblicksarbeiten vor. Die konkrete Interaktion und die damit verbundene Bedeutsamkeit aktivierten Vorwissens aus dem Langzeitgedächtnis auf den einzelnen Prozessebenen sind bislang Desiderate.

Methodologisch wird aus diesem Grund eine Umkehrung des bisherigen forschungslogischen Vorgehens empfohlen: Anstatt den Einfluss von unspezifisch erhobenem Vorwissen auf den (in Form von Lernförderlichkeit gemessenen) Rezeptionserfolg zu ermitteln, wird eine zunächst durchgeführte, systematische Untersuchung der kognitiven Anforderungen durch die Repräsentation als Grundlage für die Einschätzung des vorliegenden Vorwissens vorgeschlagen.

Auch für die Vorbereitung und Durchführung eines unterrichtlichen Repräsentationseinsatzes wird dieses Vorgehen als bedeutsam erachtet: Lehrende, die sich der kognitiven Anforderungen bewusst sind, können diese in ihrem unterrichtspraktischen Handeln entsprechend einplanen und erfolgreich adressieren. Zudem ermöglicht die Vermittlung von Strategiewissen kompensatorische Effekte bzgl. Inhaltsvorwissen und fördert speziell lernschwächere Lernende (Kaiser und Kaiser 2018).

Limitiert wird die vorliegende Betrachtung dadurch, dass kognitive Voraussetzungen als Einzelfaktor auf der Ebene des Individuums betrachtet werden. Lernförderlichkeit wird jedoch durch weitere Einflussgrößen wie Motivation, Selbstwirksamkeitserwartungen, sozialer Konformitätsdruck oder körperliche und geistige Einschränkungen mitbestimmt (vgl. z. B. Herzig 2014; May 2001). Ebenso wurden repräsentationale Eigenschaften und der einbettende Kontext weitgehend ausgeblendet. Dies betrifft sowohl Effekte durch die Bearbeitung multipler Repräsentationen (vgl. Ainsworth 2008) als auch über den inhaltlichen Aspekt hinausgehende Funktionen der einzelnen Repräsentation innerhalb des Lernmaterials, wie beispielsweise lernförderliche Interaktionen zwischen Vorwissen und Motivation bei dekorativen Repräsentationen (Lenzner et al. 2013).

Ebenso erweist sich die begriffliche Vielfalt im Feld der Repräsentationsverarbeitung bzw. der einzelnen Forschungsstränge innerhalb der Forschungsrichtung als inhaltlich herausfordernd. Die nur teilweise zueinander kompatiblen theoretischen Zugänge stehen dabei einem übergreifenden und allgemein akzeptierten Framework entgegen (vgl. Scaife und Rogers 1996). Um dies aufzulösen, wurde das in der Literatur berichtete, für die Bearbeitung von Repräsentationen relevante Wissen kategorisiert und auf Basis der kognitiven Verarbeitung im Sinne des ITPC (Schnotz 2014) einzelnen Verarbeitungsstufen zugeordnet (vgl. Tab. 1). Anschließend wurde unter Zuhilfenahme dieser Systematik ein Review der empirischen Befundlage durchgeführt.

Das Ergebnis des Reviews unterstreicht die Notwendigkeit systematischer und eingehender Untersuchungen zum Einfluss des Vorwissens, speziell des Inhaltsvorwissens, auf den Erfolg der Repräsentationsrezeption. Hierzu werden weitere domänenspezifische Untersuchungen, auch qualitativ wie z. B. in inhaltsanalytischer Form, an konkreten, fachtypischen externalen Repräsentationen unter Einbezug fachdidaktischen Überlegungen angeregt.