Ein valides, realitätsgetreues (veridikales) und nicht-reaktives Protokoll von Denkprozessen samt tauglicher Codierung und deren Analyse ist der Gral einer auf Problemlösung und phänomenale Erlebnisse abzielenden Kognitionsforschung. Valide, veridikal und nicht-reaktiv meint, dass die Denkprozesse verbalisiert und zu Protokoll gegeben werden können, ohne dass die Tätigkeit des Verbalisierens und Zu-Protokoll-Gebens diese Prozesse – etwa durch eine Verschiebung der Aufmerksamkeit – verändert.Footnote 1 Mit Karl A. Ericssons und Herbert A. Simons Protocol Analysis. Verbal Reports as Data (Ericsson und Simon 1993) liegt ein diskussionswürdiger Ansatz vor, der darauf abzielt, theoretische gleichwie methodische Leitlinien zum Gewinnen solcher Protokolle zu formulieren. Versuchsleiter fertigen diese Protokolle aus den audiovisuell aufgezeichneten Verbalisierungen an, die die Versuchspersonen als so genanntes »Think aloud« zeitgleich zu Denkleistungen im Rahmen bestimmter Aufgaben äußern:

Protocol analysis is a rigorous methodology for eliciting verbal reports of thought sequences as a valid source of data on thinking. […] In the new research approach to the study of thought processes, subjects were asked to ›think aloud‹, leading to a new type verbal reports of thinking that differed from the earlier introspective methods and became the core method of protocol analysis (Ericsson 2001, 12256–12257).

Die Entwicklung audiovisueller Aufzeichnungsmethoden (ab ca. 1945) des »Think aloud« hat sich auf die wissenschaftliche Verwertbarkeit der Protokolle, die in der Frühzeit der Protocol Analysis summativ und interpretativ vom Versuchsleiter aufgezeichnet worden waren, positiv ausgewirkt (vgl. Ericsson und Simon 1993, 261). Die verbalen Protokolle der Versuchspersonen werden anschließend – vorwiegend von Menschen, also nicht-maschinell – codiert und zumeist mit anderen beobachtbaren Leistungen (z. B. dem Erfolg beim Durchführen der Aufgaben, der »Performance«) sowie mit anderen messbaren und ihrerseits codierbaren Verhaltensparametern der Versuchspersonen (z. B. Eyetracking, Hautwiderstandsmessungen, Pupillengrößenvariations-Messungen, EEG, fMRI) verglichen (Methode der so genannten Triangulierung). Das Ziel ist es, in unterschiedlichen Graden indirekte Externalisierungen von Denkprozessen mehrerer (im Idealfall: sehr vieler) Versuchspersonen mit statistischen Methoden auszuwerten und damit zu sich wechselseitig validierenden Resultaten über Art und Verlauf bestimmter Denkverläufe zu gelangen. Das Protokoll, seine Codierung und deren Analyse stehen dabei im Zentrum.

Introspektion

Gleichwohl es von den Verfechtern der Protokollanalyse strikt in Abrede gestellt wird, hat das Gewinnen von Protokollen des Denkverlaufs in einem noch näher zu spezifizierenden Sinn mit dem zu tun, was man als »Introspektion«Footnote 2 bezeichnet hat (dazu mehr unten). Dem liegt eine wechselvolle Anziehungs- und Abstoßbewegung der Valorisierung bzw. Perhorreszierung jener psychologischen Ansätze zugrunde, die auf das Konzept und die Methode der »Introspektion« zum Gewinn von Einsichten über das menschliche Denken und Problemlösen setzten. Die Frage nach der Verlässlichkeit von Introspektion und dem Status des Experiments innerhalb der Psychologie ist seit dem ausgehenden 19. Jahrhundert äußerst kontrovers diskutiert worden. Selbstbeobachtung wurde entweder experimentell mit technischem Aufwand als Reaktionsuntersuchung (wie bei Wilhelm Wundt, Edward Bradford Titchener) oder phänomenologisch (wie von Franz Brentano, Edmund Husserl) zu ergründen versucht, wenn sie nicht – wie später mit dem Behaviorismus als die Wissenschaften dominierendem Paradigma – vollständig perhorresziert wurde:

Der Behaviorismus hat wissenschaftliche Untersuchungen der Introspektion verhindert, indem er sie für überflüssig erklärte – obgleich sich die behavioristische Begriffsbildung wie jede andere auf halb- und unbewußte Selbstwahrnehmung, ja auch, meine ich, auf bewußte wenn auch unterschlagene Selbstbeobachtung stützt (Wiener 1996, 78).

Auf der einen Seite stehen die experimentellen Psychologen, die einzig quantitative Methoden zur Auswertung von experimentell erhobenen Daten für wissenschaftsfähig halten und Introspektion nur als Registrierung von Sinnesreizen anerkennen (Wundt-Schule). Auf der anderen Seite wollen qualitativ vorgehende Psychologen am Ende des 19. und am Beginn des 20. Jahrhunderts Introspektion als wissenschaftliche Methode zur Erkundung von Denkvorgängen (in dem von ihnen ›Denkpsychologie‹ genannten Paradigma) zur via regia der psychologischen Forschung erklären (Karl Marbe, Narciss Ach, Otto Selz, Oswald Külpe, Karl Bühler und im englischsprachigen Raum natürlich William James).

Unter Introspektion versteht man üblicherweise den direkten Zugang zu den eigenen bewussten Erfahrungen und unter einem introspektiven Bericht oder Protokoll die Beschreibung dieser Erfahrungen: In vielen kognitionswissenschaftlichen Meta-Studien und in philosophischen Aufsätzen steht zur Diskussion, ob ein solcher direkter Zugang tatsächlich möglich ist und sich von dem Zugang unterscheidet, den wir zu den Erfahrungen anderer haben. »Das scheint auf den ersten Blick absurd, meine Erfahrungen sind mir doch bewusst und zugänglich«, ist die häufige erste intuitive Erwiderung darauf. Und weiter: »Zumindest meine bewussten und erfahrungsmäßigen Zustände, meine ›phänomenalen Zustände‹, scheinen doch der direkten Introspektion zugänglich.« »Ich weiß, wie die Suppe in meinem Mund gerade schmeckt«, »ich weiß, welche visuelle Erfahrung ich gerade mache«, »ich weiß, wann ich Schmerzen habe«, sind diesbezüglich häufig volkspsychologisch geäußerte Sätze.

Kritik an der Verlässlichkeit von Introspektion I

Kritik an der Verlässlichkeit solcher Sätze und der dahinterstehenden Konzeption der Introspektion berührt das Problem, ob wir uns selbst trauen können, wenn wir Aussagen über unsere mentalen Zustände und Erfahrungen machen. Außerdem ist fraglich, ob nicht unsere Erfahrungen durch den Akt, dass wir uns auf sie introspektiv konzentrieren, verändert werden. Diese zweite Frage berührt die Unsicherheit, ob wir zu einem sicheren und unverfälschten Blick auf unsere phänomenalen Zustände und den Inhalt unseres Bewusstseins fähig sind (vgl. Marcel 2003, 171).

Marcel geht davon aus, dass es einen logischen Unterschied gibt zwischen zwei Aspekten dessen, was man als Bewusstsein bezeichnen kann: a) auf der ersten Stufe: ›phänomenale Erfahrung‹ (wie es sich anfühlt, in einem gewissen Zustand zu sein) als unterschieden von nicht-phänomenalen Zuständen und b) auf der zweiten Stufe: ›Gewahrsein‹ (awareness) von etwas (als eine Art Wissen durch Vertrautheit).

Darauf bauen psychologische Studien auf, die einige Evidenz dafür bereithalten, dass bewusste Erfahrungen von Emotionen entweder aus dem phänomenalen Aspekt dieses emotionalen Zustands allein bestehen oder aber auch aus dem zusätzlichen Gewahrwerden dieser Emotion (second-order-awareness, »Ich weiß, dass ich mich in diesem Zustand befinde«). Ersteres kann ohne das Letztere bestehen, Letzteres kann Ersteres zu seinem Inhalt haben. Nur das, dessen man gewahr ist (also b), ist berichtbar (in dem Sinne, dass man darüber redet), was phänomenal ist ohne Gewahrsein (also a) ist ausdrückbar (und nicht berichtbar) (vgl. Marcel 2003, 175).

Ein ernstes Problem für die Introspektion liegt für Marcel im direkten Vorgang, die Aufmerksamkeit auf die eigenen Erfahrungen zu richten, mit dem Ziel, eine second-order-awareness davon zu erlangen, sei es, um die Erfahrungen zu erforschen, sich an sie zu erinnern oder um von ihnen zu berichten. Hier unterscheidet Marcel verschiedene Punkte:

  1. i)

    Aufmerksamkeit kann das Objekt der Aufmerksamkeit beeinflussen: Introspektion verändert die Beschaffenheit der Erfahrung. Je stärker analytisch die aufgewendete Aufmerksamkeit bei der Introspektion ist, desto stärker wird die in Frage stehende Erfahrung dekontextualisiert und abstrahiert. Man kann z. B. auf Rede als eine Folge von Phonemen achten oder im Hinblick auf Wörter oder Bedeutungen. Man kann sich auf die eigenen Emotionen hinsichtlich unterscheidbarer körperlicher Empfindungen und ihrer situationalen Besonderheiten beziehen oder, auf dem anderen Extrem der Skala, im Hinblick auf komplexe Emotions-Kategorien wie z. B. ›Wut‹, ›Ärger‹, ›Eifersucht‹.

  2. ii)

    Aufmerksamkeit kann ihr Objekt hervorbringen: Aufmerksamkeit auf die eigene Erfahrung kann diese hervorbringen oder ihr etwas hinzufügen. Das wird deutlich am Beispiel der Vorstellungsbilder: Wenn jemand gebeten wird, sich ein Frauengesicht vorzustellen, und anschließend angeben soll, ob die Frau Ohrringe getragen hat und, wenn ja, welche, so wird diese Person in der einen oder anderen Weise antworten, jedoch vor der zweiten Frage unwahrscheinlicherweise Ohren an dem Frauenkopf imaginiert haben.

  3. iii)

    Aufmerksamkeit kann ihr Objekt verzerren: Auf der ersten Stufe ist phänomenale Erfahrung nicht-analytisch und nicht zerlegbar, eine Beschreibung davon erfolgt zumeist durch Metaphern und Analogien. ›Gewahrsein‹ über phänomenale Zustände auf der zweiten Stufe ist von der konzeptuellen Struktur der Person abhängig, logisch und kohärent. Wenn nun diese second-order-awareness auf phänomenale Zustände angewandt wird, können durch die Abgehobenheit und Analytizität manche Aspekte der ersten Stufe verzerrt werden – deshalb reagieren wir auch auf die imaginative und anspielungsreiche Sprache von Dichtung anders als auf die eher abstrakte akademische Sprache.

  4. iv)

    Aufmerksamkeit kann Erfahrung zudecken: Unsere verborgenen Theorien hinsichtlich unserer Erfahrungen könnten interferieren, wenn wir auf sie fokussieren. Dadurch ist es schwierig, das Wissen, wie es diesen Theorien zufolge sein sollte, zu unterscheiden von den Erfahrungen selbst. So geben etwa Personen an, dass sie sich ›heiß‹ fühlen, wenn sie wütend sind, weil das auch mit ihrem Wissen um Sprache zusammenstimmt: »Anger is hot fluid in a container«, heißt die zugehörige konzeptuelle Metapher, die mittlerweile zum allgemeinen Wissensbestand als folk-theory gehört. Es gilt also, unsere Theorie hinsichtlich der Erfahrung von der Erfahrung selbst zu unterscheiden (vgl. zu allen vier Punkten: Marcel 2003, 179–181). Dahinter lauert allerdings das nächste Problem: Gibt es diese Unterscheidung tatsächlich immer?

Kritik an der Verlässlichkeit von Introspektion II

Peter Carruthers (Carruthers 2009 u. 2010) unterteilt mentale Zustände, die wir uns selbst zuschreiben, in zwei Kategorien: solche, die introspizierbar sind, und solche, die nicht introspizierbar sind. Er bestreitet die Möglichkeit eines introspektiven Zugangs zu unseren Urteilen und Entscheidungen als Vorgänge propositionaler Einstellungen, während er Wahrnehmungszustände, Körperempfindungen und Gefühle sehr wohl für introspizierbar hält.

Im Hinblick auf Introspektion entfaltet Carruthers seine These wie folgt: »We should have access to our own perceptual and quasi-perceptual states«, erklärt er und fährt fort,

I propose to defend the view that there aren’t any causal pathways from the outputs of the judgment-generating systems and the decisionmaking system to mindreading, which would be necessary to allow introspective access to our own judgments and decisions. My thesis is that the mindreading system only has access to perceptual input (in addition to some forms of stored knowledge), and thus that it can only self-attribute judgments and decisions through interpretation of that input, in much the sort of way that it attributes judgments and decisions to other people (Carruthers 2010, 81 f.).

Es gebe nur einen Unterschied hinsichtlich des Grades der Evidenz, mit der wir uns selbst mentale Zustände zuschreiben, im Vergleich zu dem, wie wir sie anderen zuschreiben; dies sei begründet in der weitaus größeren Basis der Hinweise, die wir im Fall der Selbstzuschreibung vor allem durch innere Rede und Vorstellungsbilder zur Verfügung haben.

Ein Punkt an Carruthers’ Ausführungen (Carruthers 2009, 125 f.) scheint besonders entscheidend zu sein: Innere Rede und Vorstellungsbilder fallen für ihn unter jene Formen von Evidenz, die für unsere Selbstzuschreibung als Interpretation, und das heißt gerade nicht: als Introspektion, verfügbar sind. Carruthers nimmt an, dass innere Rede und Vorstellungsbilder Denkprozesse ausdrücken, ohne aber konstitutiv für sie zu sein (im Gegensatz zu Auffassungen aus dem Bereich des so genannten ›Whorfianismus‹, der die sprachliche Determiniertheit von Verstandesleistungen annimmt). Das bedeutet, dass verbale Berichte eines Sprechers von seinen inneren Vorgängen, die propositionale Einstellungen betreffen, die Ergebnisse einer unbewussten Form von Selbstinterpretation (also nicht: Introspektion) sind (Carruthers 2010, 83 und 103). Das trifft auch dann zu, wenn Personen beim Problemlösen gebeten werden, in Form von »Think aloud« (siehe unten) ihre jeweiligen Problemlösungsschritte zu verbalisieren: diese Personen müssen immer wieder korrigiert und dazu angehalten werden, nicht ihre Denkprozesse zu kommentieren, sondern diese direkt in Sprache auszudrücken zu versuchen. Denn wenn sie diese Prozesse kommentieren, verfälscht das die üblichen Vorgänge beim Problemlösen.

Es könnte eingewendet werden, dass wir, auch wenn wir unserer Überzeugungen zuerst durch deren sprachliche Formulierung gewahr werden, dennoch einen vertrauenswürdigen, nicht-interpretativen Zugang zu diesen erlangen. Damit könnte dieser Vorgang als Introspektion gelten. Aber, so Carruthers, diese scheinbare Unmittelbarkeit ist illusorisch. Alle Rede, sei sie eigene innere oder fremde laut geäußerte, muss zuerst interpretiert werden, bevor sie verstanden werden kann. Wenn wir nicht zu Unrecht und krampfhaft an dem in Frage stehenden Punkt festhalten (nämlich, ob wir direkten introspektiven Zugang zu unseren zu artikulierenden Absichten haben), müssen wir annehmen, dass auch in solchen Fällen das kognitive System zum Sprachverstehen dieser inneren Sprach-Äußerungen zur Anwendung kommt und deren Bedeutung im Licht der sprachlichen Eigenschaften dieser Äußerung (lexikalische Bedeutungen, Syntax etc.) zusammen mit dem Wissen um den Kontext erschließt (Vgl. Carruthers 2009, 125).

Argumente für die Verlässlichkeit von Introspektion

Im Gegensatz zu Marcel und Carruthers ist Alvin Goldman (Goldman 2004) kein Skeptiker der Vertrauenswürdigkeit von Introspektion; er beharrt aber dennoch auf der Notwendigkeit, die Reichweite von Introspektion als ›Quelle von Evidenz‹ festzulegen. ›Quelle von Evidenz‹ definiert Goldman wie folgt: »A method or process M is a source of evidence just in case any deliverance of M to the effect that p counts as prima facie warrant for the truth of p« (Goldman 2004, 2). So könnte z. B., wenn ich meine, ein Buch vor mir auf dem Tisch zu sehen, dies ein prima facie-Garant dafür sein, dass sich da ein Buch befindet. Prima facie-Garant meint, dass gegebene Umstände nur provisorische (oder Standard-)Garanten dafür sein können, dass die Proposition p tatsächlich zutrifft. Diese können durch andere, konkurrierende Evidenzen über den Haufen geworfen werden, die entweder von der Quelle M direkt oder aber von anderen Quellen ausgehen können. Der Gesichtssinn wird häufig als eine solche Quelle von Evidenz für die Gegenwart, die Erinnerung als eine für die Vergangenheit und das Schlussverfahren der Induktion als eine für die Zukunft genannt.

Ist nun Introspektion ein plausibler Kandidat für eine grundlegende Quelle von Evidenz? Und wenn ja: Ist Introspektion die einzige verlässliche Quelle von Evidenz für den Bereich des Mentalen? Denn zusätzlich könnte man ja annehmen, dass auch das ›Verhalten‹ von Personen eine Quelle für den mentalen Bereich sein könnte. Dann könnte die aus dem Verhalten gewonnene Evidenz dafür genützt werden, die Evidenzkraft und Vertrauenswürdigkeit von Introspektion zu stärken oder zu schwächen.

Introspektion gilt für Goldman als eine grundlegende Quelle von Evidenz, allerdings als eine, die durch andere, von ihr unabhängige Quellen unterstützt oder überstimmt werden kann. So erklärt Goldman, dass der Status der Introspektion als eine grundlegende Quelle von Evidenz eine prima facie-Versicherung nur hinsichtlich der Überzeugungen der Introspizierenden garantiere, wie etwa für die ProbandInnen in diesbezüglichen Versuchen. Damit ist laut Goldman noch nichts darüber ausgesagt, ob und wie introspektive Berichte für WissenschaftlerInnen zu Garanten werden können. Zudem können beim Übersetzungsprozess von Introspektion in Worte Verluste, Rauschen oder Verzerrung auftreten – all das, was in der Forschungsliteratur »verbal overshadowing« (Schooler und Engstler-Schooler 1990) genannt wird. Allerdings wird dadurch nicht die Vertrauenswürdigkeit der Introspektion an sich (d. h. der nicht-sprachlichen Überzeugungen), sondern die der introspektiven Berichte in Frage gestellt. Goldman schlägt deshalb vor, zwischen Introspektion tout court und vorsichtiger konzipierten »Introspektionen-unter-Bedingung-O*« (Goldman 2004, 9) zu unterscheiden. Letztere haben eine beschränktere Reichweite. Anstatt jedoch hier defensiv die Limitation der Reichweite zu beklagen, können auch offensiv die Möglichkeiten von introspektiven Berichten methodisch geschärft werden: z. B. in der im nächsten Abschnitt noch weiter zu behandelnden »Protokoll-Analyse« von Ericsson und Simon (vgl. Ericsson und Simon 1980, Ericsson und Simon 1993, Ericsson 2001, Ericsson 2003). Die engste Verbindung zwischen Denken und wörtlichem Bericht sei dann gegeben, wenn Personen ihre Gedanken während des Ausführens von Aufgaben versprachlichen (»Think aloud«-Protokolle – siehe dazu unten). Darüber hinaus müsse Introspektion intersubjektiv sein (nicht nur privat), zudem wiederholbar.

Wenn gewöhnliche Subjekte introspektive Berichte über kognitive Prozesse anbieten, die gewöhnlich für Kognitionswissenschaftler interessant sind (kausale oder computationelle Prozesse, die gewissen Gedanken zugrunde liegen), ist dies zumeist für Wissenschaftler weniger interessant. Diese Berichte hätten kaum einen Wert als Evidenzquellen für kognitionswissenschaftliche Hypothesen und würden auch nicht in den Bereich dessen fallen, wofür Introspektion als verlässlich betrachtet werden kann. Denn gewöhnliche Personen würden kaum Introspektionen über die genannten kognitionswissenschaftlichen Bereiche anstellen – introspektive Berichte seien gewöhnlich viel grobkörniger als kognitionswissenschaftliche Fragestellungen dies erfordern. Auf dieser grobkörnigeren Ebene seien sie wahr und angemessen (wenn auch nicht für die Wissenschaft).

Um die Reichweite von Introspektionen zu bestimmen, müsse man die operationalen Bedingungen, unter denen Introspektion hinreichend verlässlich sei, unterscheiden von der Bestimmung des propositionalen Gehalts, für dessen Angabe introspektive Operationen vertrauenswürdig seien. Hinsichtlich der operationalen Bedingungen scheinen Introspektionen nur für bewusste Zustände vertrauenswürdig – verbale Berichte über nicht-bewusste Zustände und Vorgänge seien nicht vertrauenswürdig. (Jedoch adressieren Introspektionen zumeist bewusste Vorgänge.) In jüngster Zeit hat der Anwendungsbereich von Introspektion noch eine Zuspitzung erfahren: nicht bewusste Zustände, sondern nur Zustände, auf die sich die Aufmerksamkeit richtet, könnten verlässlich introspiziert werden (vgl. Goldman 2004, 14). Wenn verbale Berichte nicht auf Vorgänge im Aufmerksamkeitsfokus beschränkt bleiben, so Goldman, seien die Aussichten auf ihre Verlässlichkeit nicht sehr gut. Besser würden die Aussichten, wenn die Berichte (cum grano salis) zeitgleich und nicht retrospektiv abgegeben werden. Zusätzlich spielen nicht nur die Nähe oder Ferne des Berichtszeitpunkts, sondern auch Zeitrelationen im zu introspizierenden Inhalt eine Rolle: Kurze Episoden, auch wenn sie bewusst sind und beachtet werden, könnten schwieriger zu introspizieren sein als einzelne Zustände, die länger andauern und stabil sind.

Schließlich scheine die Vertrauenswürdigkeit auch abzunehmen, je stärker Personen in Introspektionen über ihre »kognitive Architektur« Aufschluss geben wollen: »If a (naïve) subject were to ›report‹ that her concurrent conscious thoughts are mediated by a language of thought, no cognitive scientist should regard that as reliable evidence for the existence of a language of thought.« (Goldman 2004, 15). Aber, so schließt Goldman: Auch wenn ein systematisches und vollständiges Verständnis der Verlässlichkeit von Introspektion zur Zeit noch außer Reichweite sei, folge daraus keineswegs, dass ein solches systematisches Verständnis prinzipiell (aus theoretischen Überlegungen) außer Reichweite bleiben müsse (vgl. Goldman 2004, 15).

Wie aber ist es um den Bericht dieser Introspektionen bestellt, vor allem im Licht der zitierten Auffassung, Introspektionen sollten möglichst zeitnah zum Lösen der gestellten Aufgaben mittels »Think aloud« erfolgen? »Think aloud«-Protokolle des Introspizierenden, die später im Anschluss in einer konsistenten Interpretation schriftlich ausgewertet werden, sind womöglich als nachträglicher Bericht über Introspektionen durch das Festhalten und die sprachliche Kommentierung danach ›verunreinigt‹.

Die Befürworter der experimentellen Methode vom Beginn des 20. Jahrhunderts setzten vor allem auf gelenkte Selbstbeobachtungen, wobei die Versuchsperson von einem Versuchsleiter befragt wurde: So entwickelte etwa Narziß Ach die von ihm so genannte »systematische experimentelle Selbstbeobachtung« (Ach 1905, 8–25), die eine Befragung durch den Versuchsleiter und eine gleichzeitige Intensivierung der Labortechnik vorsieht. Nachfragen werden bei Ach durch die »Perseveration« legitimiert, worunter er den Umstand versteht, dass »aufmerksam erlebter Bewusstseinsinhalt die Tendenz hat, als solcher im Bewusstsein weiter zu verharren« (Ach 1905, 10). Die Methode Achs beabsichtigt,

das durch äußere experimentelle Hilfsmittel veranlasste Erlebnis der Versuchsperson jedesmal in der dem Versuche unmittelbar folgenden Zeit einer vollständigen Beschreibung und Analyse zu unterwerfen. Hierbei findet ein fortwährender enger Gedankenaustausch zwischen der beobachtenden Versuchsperson und dem protokollierenden Versuchsleiter statt (Ach 1905, 8).

Und Ach weiter:

Es ist unser Bestreben, auch diese ›subjektive‹ Methode der Selbstbeobachtung wenigstens insofern objektiv zu gestalten, als die willkürliche und unkontrollierbare Behandlung des zu untersuchenden Gebietes sowohl von Seiten der Versuchsperson als auch von Seiten des Versuchsleiters möglichst ausgeschaltet wird. Dies gelingt nur dadurch, dass das ganze Erlebnis vom Eintritt des Signals bis zum Abschluss des Experiments vollständig geschildert und protokolliert wird (Ach 1905, 14; Hervorhebung im Orig.).

Auch Karl Bühler sieht in der Einführung eines Versuchsleiters die große Leistung der ›Würzburger Psychologie‹:

Jene […] Methode […] unterscheidet sich wesentlich von den älteren Bemühungen der Selbstbeobachtung an zufällig gebotenen oder durch ein inneres Experiment hervorgerufenen Erlebnissen. Zufälligkeit und Willenseinfluß des Erlebenden, die beiden Mißstände aller älteren Beobachtungen, hat sie durch eine einfache Arbeitsteilung beseitigt. Es wird nämlich dem [Selbst-] Beobachter ein Versuchsleiter beigegeben, der die Erlebnisse hervorruft und die Beobachtungen zu Protokoll nimmt, so daß die Versuchsperson nur mit ihrem Erlebnis und seiner Beschreibung beschäftigt ist (Bühler 1907, 3).

Gerade an diesem Punkt treten wohl die größten methodologischen und epistemologischen Probleme auf: Jeder wissenschaftliche Zugang zu mentalen Phänomenen und dem, was man ›Bewusstsein‹ nennt, muss sich vollständig auf objektive Kriterien hinsichtlich der Zuschreibung von mentalen Phänomenen an ein gegebenes System stützen. Denn der Umstand, dass mentale Phänomene in der Selbstbeobachtung einen zutiefst subjektiven Charakter haben, macht es unwahrscheinlich, dass das Phänomen der Subjektivität jemals zu einem Explanandum der harten Wissenschaften werden kann. Die Trennung in Versuchsperson und Versuchsleiter stellt somit eine nur scheinbare Lösung dar, die dieses Dilemma nur widerspiegelt, anstatt es zu lösen.

Protocol Analysis

Dem entgegen ist die so genannte »Protocol Analysis« (PA) ein von Ericsson und Simon (im Folgenden: E/S) seit den späten 1970er Jahren entwickeltes Verfahren,Footnote 3 das verbale Berichte von Gedankenabläufen als valide Daten zum Erkennen von Denkprozessen bereithalten möchte: »Chronologically ordered collections of verbalisations and comparable kinds of behavioural data are usually called protocols. Accordingly, the set of methods for analysing them is known as protocol analysis.« (Angerer 2020, 100). Die Qualität und Aussagekraft hängt von zahlreichen Faktoren ab:

Reliable and valid reports may be obtained if participants are provided with practice exercises; if they are instructed to think aloud but not to explain their behavior; if the task does not induce reactivityFootnote 4; if tasks are designed to have a single best solution; and if a priori task analyses are constructed for the purpose of evaluating protocols (Austin und Delaney 1998, 54).

Die dem Einholen von verbalen Protokollen notwendigerweise vorangehende Analyse der Aufgabe (task analysis) stellen sich E/S so vor:

It is particularly important to explicate the knowledge necessary to generate successful solutions when we study tasks that cannot be easily performed with simple strategies, like guessing. In such task domains as mathematics, logic, statistics, etc. clearly defined procedures exist for generating correct solutions. These procedures can be described as a sequence of steps, which in turn can be described with flow charts or even computer programs (Ericsson und Simon 1987, 28).

Mit dieser zuvor festgestellten Annahme, welche Schritte zum Lösen der Aufgabe ausgeführt werden, sollen die verbalen Äußerungen, die die Versuchspersonen per »Think aloud« von sich geben und die von den Versuchsleitern aufgezeichnet werden, abgeglichen werden. Zum Einholen der Protokolle haben E/S die Anweisungen zum »Think aloud« standardisiert – sie sollten idealer- und typischerweise so formuliert werden: »In this experiment we are interested in what you think about when you solve performance problems. We would like you to think aloud as you solve the problem, simply speaking aloud as if you were alone and thinking to yourself« (zit. nach Austin und Delaney 1998, 49). Dass dabei die im vorangegangenen Abschnitt beschriebenen Probleme zur Verlässlichkeit von Introspektion und zum erklärungswürdigen Verhältnis von wortsprachlicher Äußerung und Denkprozessen besonders schlagend werden, scheint mir evident. Dennoch beharrt Ericsson in einem zusammen mit Robert Crutcher verfassten Aufsatz darauf, dass die Introspektion kognitiver Prozesse und verbale Berichte solcher kognitiven Prozesse zwei deutlich zu unterscheidende Zugänge zur Untersuchung menschlicher Denkprozesse sind:

Whereas introspection implicitly trusted subjects’ reports, the verbal report approach treats reports as another type of data to be accounted for by theory. Furthermore, while the introspectionists often disagreed over what information subjects could report and extensively trained their subjects to report specific types of information, investigators collecting verbal reports have tried to discover what types of information naive subjects can reliably report when given simple instructions to report their thoughts. While the earlier introspective techniques were plagued by methodological problems, the current verbal report techniques have been put on a secure scientific foundation by careful analysis of the different types of reports and the conditions under which valid reports may be elicited (Ericsson und Crutcher 1991, 57).

Es gelte zu unterscheiden zwischen verbalen Berichten beim Problemlösen, die nach klaren methodischen Vorgaben aufgezeichnet und ausgewertet werden, und introspektiven Beobachtungen und Analysen des Denkens, die von Versuchspersonen, zumeist retrospektiv, angestellt werden.

Neben der bereits vorgestellten Kritik an der Verlässlichkeit von Introspektion zum Ergründen von Denkprozessen ist vor allem die in die Wissenschaftsgeschichte (der Introspektion) eingegangene, so genannte »Wundt-Bühler-Debatte« zu nennen, in der Wilhelm Wundt Karl Bühler unter anderem vorwarf, dass eine Spaltung der Aufmerksamkeit beim Problemlösen und -berichten der Denkprozesse dabei nicht oder nur um den Preis einer Affektion der tatsächlichen Verhältnisse (des Denkverlaufs oder seines Berichts) möglich sei. Bühler konterte, indem er die Möglichkeit zu knapp nach dem Denkprozess erfolgenden Berichten auf der Basis des so genannten Kurzzeitgedächtnisses stark machte.Footnote 5 Schließlich mündete die Debatte im wenig aussagekräftigen Wissenschafts-Streit, in dem Bühler Wundt vorwarf, die Berichte von geübten Selbstbeobachtern (Experten) nicht anerkennen zu wollen und Wundt damit konterte, dass die Versuche Bühlers ob der geringen Probandenzahl (lediglich zwei Probanden, nämlich die Professorenkollegen Ernst Dürr und Oswald Külpe) nur Pseudo-Experimente seien (vgl. Massen und Bredekamp 2005). Eben jener geübte Selbstbeobachter Dürr habe jedoch eine Ericsson überzeugende Auflösung dieses Konflikts in einem Aufsatz von 1908 (Dürr 1908) vorgeschlagen:

Dürr (1908) agreed with Wundt that systematic introspection of thinking was not possible in Bühler’s studies. However, he argued that reports of actual thought sequences were not only possible but quite valuable to the study of thought.Footnote 6 In fact, Wundt had never disagreed with the ability of subjects to report their actual thought sequences (or mediate experience as he called it); hence, the controversy over »imageless thought« was really over the problems with introspective analysis of thinking and involved no disagreements regarding verbal reports on thinking (Ericsson und Crutcher 1991, 61).

Im Lichte der angestrebten Wissenschaftlichkeit einer auch auf Introspektion setzenden Psychologie wurden im weiteren Verlauf statt geübten Selbstbeobachtern gerade naive, nicht-geübte Versuchspersonen herangezogen und auf deren spontane Denkäußerungen (auf der Basis klar fixierter Instruktionen) abgezielt. Nicht die Einschätzung und Bewertung von stattgehabten Denkvorgängen und diese zu externen Reizen und Erlebnissen in Beziehung zu setzen, kann die Aufgabe eines validen »Think aloud« sein, sondern die möglichst zeitnahe, spontane Äußerung von ›Gedankeninhalten‹:

In sum, asking subjects to give more information than they can recall as part of their retrospective report is likely to lead to additional inferential processing that has no clear relation to the cognitive process under observation (Ericsson und Crutcher 1991, 69).

Dieser im Zeichen des Behaviorismus zur Ablehnung von Introspektion führende Wissenschaftlichkeitsanspruch, der auf beobachtbares Verhalten und messbare Leistungsergebnisse setzt, führte schließlich zu einer Zuspitzung der Beschreibung von selbstbeobachteten Denkverläufen in Richtung der viel engeren Methode des Protokollierens von so genannten »Think aloud«-Vorgängen. Bezeichnenderweise war der Behaviorist John Broadus Watson der erste, der diese Methode formuliert und favorisiert hat:

To get valid information on thought processes, Watson (1920) suggested that subjects should be instructed to think aloud while performing tasks. In fact, Watson (1920) was the first investigator to publish an analysis of a think-aloud protocol. Watson viewed thinking as primarily subvocal speech and thus viewed thinking aloud as simply externalized verbal behavior. Think-aloud verbalizations were seen as one of many observable indicators of cognitive processes, along with eyefixations, electrophysiological measures, and other observable behavior (Ericsson und Crutcher 1991, 63).

Verbale Protokolle von »Think aloud«-Vorgängen seien ein probates, nicht reaktives Mittel, um Denkprozesse zu untersuchen, wie Ericsson beständig betont:

Given the well-established validity of retrospective reports, the case for introspective reports depends upon demonstrating that the additional information generated by introspective reports is valid and can be obtained without altering the studied cognitive processes (Ericsson und Crutcher 1991, 66).

Der Methode von E/S liegen sechs Annahmen (Ericsson und Simon 1993, 221–225) zugrunde:

1. The verbalizable cognitions can be described as states that correspond to the contents of STM [= short-term memory; Anm. TE] (i.e., to the information that is in the focus of attention).

2. The information vocalized is a verbal encoding of the information in short-term memory (Ericsson und Simon 1993, 221).

Es komme darauf an, auszuführen, wie nichtsprachliche Gedanken in sprachliche Form übertragen werden. E/S nützen an zentralen Stellen ihrer Argumentation auf den ersten Blick eine einfache, Common-sense-getriebene, vielleicht einer so genannten folk psychology entstammende, Terminologie: »heeded thoughts«, »a thought is heeded«, also ungefähr: »beachtete bzw. ›bewusst‹ gewordene Gedanken«, bzw. »ein Gedanke wird beachtet bzw. ›bewusst‹«. Solche Wendungen legen nahe, dass die damit bezeichnete phänomenale Erfahrung unbestreitbar und von allen vergleichbar zu erleben sei. Auch dagegen habe ich oben einige Einwände vorgebracht.

3. The verbalization processes are initiated as a thought is heeded. […]

4. The verbalization is a direct encoding of the heeded thought and reflects its structure (Ericsson und Simon 1993, 222).

Bis zu diesem Punkt haben E/S die Begriffe »lautes Sprechen« und »lautes Denken« synonym verwendet. Bei der Anwendung eines detaillierteren Modells ist es manchmal notwendig, den Fall, in dem eine Versuchsperson Gedanken äußert, die bereits in verbaler Form kodiert sind, zu unterscheiden von dem Fall, bei dem die Versuchsperson verbal rekodiert und Gedanken äußert, die möglicherweise in anderer Form (z. B. visuell) im Gedächtnis gespeichert sind. Unbeachtet bleibt meiner Einschätzung nach hier die Möglichkeit, dass Denkprozesse und Gedächtnisleistungen auf ganz andere Weise, also jenseits der Unterscheidung sprachlich/visuell, erfolgen, wie das z. B. jüngst in den Theorien des so genannten »radikalen Enaktivismus« propagiert wird.

Ebenso am Grund der Protokollanalyse und ihrer Theorie liegt die folgende Annahme: »Think aloud« und »Talk aloud«Footnote 7 lassen sich durch entsprechende Anweisung bei praktisch allen erwachsenen Menschen spontan hervorrufen. Das bedeutet, dass die notwendigen kognitiven Prozesse nicht erlernt werden müssen, sondern bereits vorhanden und einsetzbar sind, was darauf hindeutet, dass die Verbalisierungsprozesse sehr eng mit den Prozessen verwandt sein müssen, die Menschen im alltäglichen Sprachverhalten verwenden (Ericsson und Simon 1993, 224). Entscheidend aber – und im Lichte des im vorigen Abschnitt Vorgebrachten bezweifelbar – ist die in den Punkten 5 und 6 vorgebrachte Annahme, dass Sprachprozesse insgesamt kognitive Vorgänge spiegeln bzw. dass in normaler Rede Äußerung und kognitives Prozessieren koinzidieren.

5. Units of articulation will correspond to integrated cognitive structures.

6. Pauses and hesitations will be good predictors of shifts in processing of cognitive structures. The tight coordination between verbalization and thought, even in normal speech, is summarized by McNeill in this way: ›For many speakers, normal speech seems to be uttered as it is organized. The conceptual arrangements behind speech can be worked out at nearly the same time the sentence is produced, certainly not always a phrase or sentence in advance‹ (McNeill 1975, 356, zit. nach Ericsson und Simon 1993, 225).

Dies korrespondiert auch mit der von William James vorgebrachten Kritik an Humes Auffassung, dass Denkverläufe Kopien von zuvor durchlaufenen Erlebnissen und Eindrücken seien und deshalb auch vollständig ausgeführt und detailreich abliefen – wir könnten uns z. B., so Hume, nicht eine bedruckte Buchseite vorstellen, ohne zugleich jeden einzelnen Buchstaben zu imaginieren. Stattdessen geht James von einer Unterscheidung zwischen den so genannten »substantive parts« (Zuständen) und den Übergängen zwischen ihnen (»transitive parts«) aus. Erstere seien (selbst-)beobachtbar, letztere (die Übergänge) seien es aus prinzipiellen Gründen nicht (James 1890, 243).

Darüber hinaus gehen auch E/S davon aus, dass Versuchspersonen häufig spontan interne Sprache erzeugen und diese manchmal auch vokalisieren. Diese interne Sprache kann Selbstinstruktionen wie »Lass mich mal sehen«, »Warte mal« usw. oder umfangreichere Selbstdialoge enthalten. Solche »Metakommentare« gilt es von Verbalisierungen laufender Prozesse zu unterscheiden. Für E/S liegt der aussagekräftigste Einzeltest, um Metakommentare von Verbalisierungen laufender Prozesse zu unterscheiden, in der Betrachtung ihrer jeweiligen Rolle in den nachfolgenden Prozessen. Ein verbalisiertes Verfahren wird wie ein Rezept jedes Mal aufgerufen, wenn der entsprechende kognitive Prozess ausgeführt wird, und entspricht damit der Repräsentation des relevanten Wissens. Auf einen Metakommentar wird höchstwahrscheinlich nicht zugegriffen und er wird nicht zur Steuerung des nachfolgenden Prozessierens verwendet.

Insgesamt konstatieren E/S, dass mithilfe der von ihnen vorgeschlagenen Methode der PA gezeigt werde,

how the information heeded during a cognitive process can be identified by an analysis of the corresponding verbalizations. In protocol analysis, we are trying to infer what information was heeded as input for the observed verbalization. Through a careful task analysis it is possible to define a priori a space of possible encodings representing the information relevant to the task. Then, encoding protocols involves finding the category that expresses the same information as the verbalization. […] By locating language production units and linguistic structures, the sequence of heeded information can be uncovered. Although the majority of encoding schemes define their categories so that individual protocol segments can be encoded, many schemes do not attempt to uncover the heeded information, but seek to infer directly the processes that generated the heeded information. We argue that, whenever possible, the original encoding should reflect as closely as possible the verbalized information, and should preferably be derived by automatic or semiautomatic means. Once verbalizations are converted to formal encodings, theoretical proposals for representations, processes and strategies can be introduced to provide parsimonious accounts for the protocol data (Ericsson und Simon 1993, 312).

Als erstes Beispiel seien hier zwei Protokolle von Versuchspersonen zitiert – sie geben deren »Think aloud« beim Lösen eines Anagrammrätsels wieder: Solving an Anagram: SCLIAO (Sargent 1940, 30 f., zit. nach Ericsson und Simon 1993, 226).

figure afigure a

Bei dieser Problemlösung fallen Gegenstand (Buchstabenmanipulation mit dem Ziel des Findens einer sinnvollen Kombination), Vorgestelltes (Manipulation und Kombination von vorgestellten Laut-Buchstaben-Kombinationen) und protokolliertes »Talk aloud« in vergleichbare Sphären. Damit lässt sich, so deute ich E/S, behaupten, dass das tatsächliche Vorgehen der Personen in seinen wesentlichen (= funktionalen, eventuell sogar strukturalen) Aspekten gut wiedergegeben ist. Für solche Fälle könnte tatsächlich die PA zu validen Schlüssen über den sequentiellen Ablauf der Leistungen beim Problemlösen führen. Kaum berührt wird davon allerdings die Frage, welche phänomenalen Erlebnisse die Versuchspersonen beim Problemlösen haben: Flüstern sie oder subvokalisieren sie oder stellen sie sich nur gedanklich die Laut/Buchstabenkombinationen vor und drehen quasi den Lautstärkeregler auf »laut«, wenn sie zum »Think aloud« /»Talk aloud« angehalten werden?

In diese Richtung argumentieren auch E/S:

When heeded information is already encoded orally, we claim that the internal activation associated with attending to this information provides input for a process (VOCALIZE) without additional central processing. In talkaloud we assume that verbalization begins as soon as the internal activation takes place (Ericsson und Simon 1993, 226).

Die Herausforderung für das Codieren (und damit einen Codierer) von Protokollen wird deutlich komplexer und fehleranfälliger, wenn die Protokolle mehrdeutige Wörter enthalten, die beim Codieren disambiguiert werden müssen. Eine zentrale Aufgabe bei der Verwendung von verbal mitgeteilten Informationen ist es, den Codierungsprozess so objektiv wie möglich zu gestalten. Ohne entsprechende Sicherheitsvorkehrungen könnte der Codierer, wenn er einer Reihe von mehrdeutigen verbalen Aussagen ausgesetzt ist, diese aufgrund persönlicher Voreingenommenheit in Richtung seiner eigenen bevorzugten Interpretation codieren.

Der Kontext ist eine wichtige Quelle für die Disambiguierung von verbalen Informationen. Nehmen wir als zweites Beispiel ein Konzeptbildungsexperiment an, bei dem eine Versuchsperson eine Annahme innerhalb ihres Denkverlaufs wie folgt verbalisiert: »eine dunkle Kugel«.

Ohne Kontext könnte ein Codierer große Schwierigkeiten haben, zu entscheiden, welche Objekte als Instanzen des durch diesen Satz definierten Konzepts betrachtet werden sollten. Im Kontext eines bestimmten Experiments jedoch, bei dem alle möglichen Stimuli farbige Formen sind (dunkelblau, gelb oder weiß; Quadrat, Dreieck, Rechteck oder Kreis), ist dieselbe Hypothese relativ eindeutig, denn sie ist synonym mit ›blauer Kreis‹ (Ericsson und Simon 1993, 287 f.; Übers. Verf.).

Als drittes Beispiel sei ein Problemlösungsexperiment genannt, das so genannte »Eight Puzzle«, bei dem es darum geht, eine spezifische Ordnung von acht verschiebbaren Kacheln in einem 3 × 3 Raster, bei dem ein Feld als Verschiebefeld leer ist, zu erzeugen (Abb. 1). Die Versuchsperson sagt (Ericsson und Simon 1993, 288): »I want to get 1 to its place.«

Abb. 1
figure 1

Eight Puzzle (Ericsson und Simon 1993, 288)

E/S kommentieren dies so:

If the experimenter knows the task the subject is performing, a coder can convert this verbal statement into an explicit goal. In this context, the verbal statement is readily encoded as the goal of getting the tile with the number 1 to the upper left-hand corner of the frame (Ericsson und Simon 1993, 288).

In diesen Beispielen ist es zur Disambiguierung nicht notwendig, sich auf andere Passagen des Protokolls zu beziehen. Es ist jedoch notwendig, vor dem Codieren der Protokolle eine genaue Aufgabenanalyse und Beschreibung der potentiellen Lösungsschritte durchgeführt zu haben, die dann vom Codierer mit den jeweiligen tatsächlichen Äußerungen im »Think aloud«-Protokoll abgeglichen werden können (vgl. Ericsson und Simon 1987, 28).

Kurze Rekapitulation und Coda

Ericsson und Crutcher (1991) unterscheiden in ihrer Einschätzung des Werts und der Brauchbarkeit deutlich zwischen sprachlichen Protokollen des Denkverlaufs, wie sie in den »Think aloud«-Äußerungen protokolliert werden, und introspektiven Analysen des Denkens, die sie als Möglichkeit abwerten:

Verbal reports on thinking (think-aloud and retrospective reports) have had an essentially uncontested history and have recently survived rigorous theoretical and empirical evaluation. On the other hand, efforts to go beyond the information provided by these types of verbal reports through introspective analysis of thinking have been remarkably unsuccessful and led to a series of unresolved controversies (Ericsson und Crutcher 1991, 69).

Trotz dieser klar gewichteten Einschätzung scheinen sie eine künftige Methode der Introspektion für vielversprechend zu halten, wenngleich noch nicht klar ist, wie eine solche verbesserte Selbstbeobachtung, auch im Vergleich zu der in ihren Augen gescheiterten Methode Bühlers, aussehen könnte:

[A] revised method for introspection needs to show how it differs from early unsuccessful methods with their unresolved controversies and invalid results. Until the time revised introspective methods meet such criteria, cognitive science is better off rejecting them and relying instead on the use of verbal reports collected using proven procedures (Ericsson und Crutcher 1991, 70).

Aber ist die Unterscheidung zwischen »Think aloud« und Introspektion tatsächlich so rein aufrechtzuerhalten? Sind nicht auch in »Think aloud«-Protokollen, sowohl uneingestanden bei den »Think aloud« Betreibenden als auch bei den dies Protokollierenden, Codierenden und Auswertenden, immer auch Anteile von introspektiver Tätigkeit enthalten?

Ich bin ein gespaltener Literaturwissenschaftler: Ich hänge Fragen der Denkpsychologie nach (wie funktioniert Sprachverstehen? Was heißt Auswendiglernen und Hersagen von Sprachereignissen, was ist der phänomenale Aspekt dabei, wie funktioniert Erinnerung und Gedächtnis?) und ich nütze dazu üblicherweise als schwierig zu verstehen bezeichnete Gedichte (Celan, Hölderlin, Priessnitz, …). Ich beschreibe zusammenfassend und selektiv die einzelnen Ereignisse, wie sie mir in einer Vielzahl von Durchgängen vorgekommen sind; zumeist habe ich das Gedicht vollständig innerlich hergesagt, manchmal nur teilweise, manchmal beinahe unfreiwillig. Mein Vorgehen mag man als eine Zuspitzung eines rezeptionsästhetischen Zugangs betrachten, noch dazu mit der Schwierigkeit, dass ich mir Gegenstand und zugleich Aufzeichnender der phänomenalen Erlebnisse beim Hersagen bin, mit allen den genannten (und einigen mehr) Schwierigkeiten und Zweifeln, denen die Selbstbeobachtung dabei unterliegt.

Ich habe keine exakten Protokolle je einzelner Durchgänge angefertigt, wie das die bisherige Leseforschung (Afflerbach und Pressley 1995; Afflerbach 2000; Israel 2015) mit einer Aufzeichnung und späteren Transkription von so genannten »Think aloud«-Vorgängen verschiedener Versuchspersonen und anschließender Protokollanalyse durch die Versuchsleiter (siehe eben E/S) macht.

Ich sehe davon ab, weil ich an mehreren für dieses Vorgehen grundlegenden Annahmen zweifle, u. a. daran, dass solche sprachlichen Protokolle geeignet wären, das wiederzugeben, was im Denkverlauf beim Gedichtverstehen vor sich geht und relevant ist, oder dass die Analyse solcher Protokolle durch Versuchsleiter, die zumeist auf ein Codieren von Wörtern hinausläuft und vor vergleichbaren Schwierigkeiten steht wie die Versuchsperson beim Lesen eines Texts, fruchtbar sein könnte. »Code & Count«, wie es Benjamin Angerer in seiner Dissertation (2020) beschreibt, funktioniert bei der weichen Aufgabe »Gedichtverstehen« meiner Einschätzung nach nicht:

Code & count [/] In hypothesis-testing studies, protocols acquired in controlled experiments – e. g. by letting participants think aloud while solving a well-defined problem […] can be used to elucidate other measured variables such as task performance or reaction times. In such studies protocols are coded, i. e. a pre-defined interpretation schema is applied to the protocols, bringing them into a form that allows quantification and subsequent testing of specific hypotheses. […] Thus, this approach is sometimes referred to as code & count […]. Crucially, applying this approach depends on the possibility of a formal task analysis from which both, a reliable coding scheme as well as testable hypotheses can be derived. This pretty much constrains the method to well-defined problems for which such a task analysis is conceivable, and for which inter-subject variability can be accounted for by this prior task analysis (Angerer 2020, 100 f.).

Während das eine approbate Methode dafür sein kann, etwas herauszufinden »about strategy choices in solving well-defined problems [as, for instance, the Tower of Hanoi task]«, macht die implizierte Abhängigkeit der Methode von klar definierten Aufgaben, formalen Aufgabenanalysen und einer vorhersehbaren Variabilität zwischen den Versuchspersonen (vgl. Angerer 2020, 101) es eher unwahrscheinlich, dass sie auch für die Aufgabe »Sprach- und Gedichtverstehen« sinnvoll und erkenntnisbringend anzuwenden sein könnte. Eine task analysis, wie oben beschrieben und als klare Voraussetzung für die Produktivität von Protokollanalysen erkannt, existiert meiner Einschätzung nach für die Aufgabe Gedichtverstehen nur sehr eingeschränkt.

Denn vor allem adressiert das geforderte möglichst zeitgleiche »Think aloud« unmittelbare (zumeist ein- und erstmalige) Lesevorgänge, was mir für den Umgang mit literarischen Texten ungeeignet erscheint, selbst wenn man das Vermittlungsproblem zwischen Versuchspersonen und Versuchsleiter außer Acht lässt.

Anders als das erstmalige und rasche Verarbeiten von Text, das bei den meisten Experimentaldesigns der so genannten »empirischen Literaturwissenschaft« abgefragt wird, interessiert mich die Lesepraxis des Philologen – mein Gedankenverlauf beim Versuch, einen komplexen Text zu verstehen, die mehrfach wiederholten und mitunter auch retrospektiven Beobachtungen meiner Denkverläufe, Momente und Erlebnisse, an denen sich grundlegend und plötzlich etwas an meinem Verstehen des Texts geändert hat.

Ich verfolge damit gleichsam einen Zwischenkurs: zwischen einer auf Textdeutung fokussierten Vorgehensweise des Philologen, der außertextliche Hilfsmittel und die Methoden seiner Disziplin anwendet, und einer auf Einsichten in den Denkverlauf zielenden Schilderung und Reflexion meiner Selbstbeobachtungen bei dem Versuch, schwierige Gedichte zu verstehen.

Die aktuelle Forschungsliteratur zu den phänomenalen Prozessen des Sprachverstehens beim Lesen (das bei allen Unterschieden mit dem stillen Rezitieren von Gedichten verglichen werden kann) scheint bislang eher dürftige Ergebnisse erbracht zu haben: »the experimental literature on reading has told us a lot about the cognitive architecture recruited for reading but very little about the conscious experiences that people have while reading« (Moore und Schwitzgebel 2018, 58). Dies weist deutlich in die Richtung einer Neubewertung und -anstrengung der Forschungsdesiderata einer kognitionswissenschaftlich informierten Forschungsliteratur, die Protokollanalyse und Introspektion neu konzeptualisiert und anwendet.

Dazu schließe ich mit einem Ausblick auf mögliche weiter zu befragende und auszuwertende Behauptungen: Je vertrauter ein Satz oder Text ist, je einfacher er zu verstehen ist, desto weniger haben wir introspektiven Zugang zu den beteiligten kognitiven Vorgängen respektive zu den bewusstseinsmäßigen Anteilen am Sprachverstehen. Erst durch Fehlersignale, in deren Folge quasisensorische Intrusionen entstehen können, ist womöglich Sprachverstehen der Selbstbeobachtung indirekt zugänglich. Die Vorgänge, die zur Übersetzung von sprachlichem Input in andere Schichten des Denkens führen, sind der Selbstbeobachtung üblicherweise nicht zugänglich. Es scheint jedoch unbestreitbar, dass bei erschwertem Verstehen – in Momenten, in denen etwa der sprachliche Input Irritationen durch Ambiguitäten erzeugt – wir darauf zurückgeworfen sind, das unterbrochene glatte, automatisierte Verstehen durch aufgabengesteuerte Assemblagen, die durch Sprachereignisse ausgelöst werden, zu unterbrechen (vgl. Eder 2015, 362).