1 Feedback als Thema der Lehr-Lernforschung

Feedback als eine zentrale Komponente der Tiefenstruktur des Unterrichts gilt für die Interaktion im Lehr-Lernprozess und damit für die Qualität des Unterrichts als entscheidend. Auf den unterrichtlichen Kontext bezogen zielt Feedback auf eine Verringerung der Diskrepanz zwischen der momentanen Leistung und dem gewünschten Lernziel (vgl. Hattie und Timperley 2007). Feedback lässt sich als „jede Art von Rückmeldung [fassen], die den Lernenden über die Richtigkeit seiner Antwort bzw. seiner Aufgabenlösung informiert […] oder die dem Lernenden inhaltliche und/oder strategische Hilfen und Informationen zu dessen Bearbeitungsprozess zur Verfügung stellt“ (Lipowsky 2015, S. 82; Mory 2004). Um den momentanen Leistungsstand und das gewünschte Lernziel näher zu bringen, ist es notwendig, „dass für die Lehrperson und den Lernenden der Zielzustand (feed-up) klar ist und dass das Feedback Antworten darauf gibt, wo man im Hinblick auf das angestrebte Lernziel steht (feed-back) und welche weiteren Schritte erforderlich sind, um dem angestrebten Ziel näher zu kommen (feed-forward)“ (Lipowsky 2015, S. 82). Demnach wird effektives Feedback grundsätzlich als zielgerichtet, aufgabenbezogen, spezifisch und neutral beschrieben (vgl. Hattie und Timperley 2007; Thurlings et al. 2013). Hattie und Timperley (2007) unterscheiden vier Ebenen der Rückmeldung: Feedback kann auf die Aufgabe, den Lösungsprozess, die Selbstregulation oder die Person des Lerners fokussieren.

2 Formen und Wirksamkeit von Feedback

In der aktuellen Unterrichtsforschung steht häufig das Rückmeldeverhalten der Lehrpersonen im Fokus sowie Aufgaben, bei denen es eine richtige Antwort bzw. Lösung gibt. Um die Lernwirksamkeit des Feedbacks möglichst präzise zu erfassen, werden verschiedene Feedbackformen hinsichtlich ihrer Komplexität und Elaboriertheit voneinander abgegrenzt. Während einfache Rückmeldungen lediglich Auskunft darüber geben, ob eine Lösung bzw. Antwort richtig oder falsch ist („Knowledge of Results“, KR) und ggf. die Information beinhalten, wie die richtige Antwort lautet („Knowledge of Correct Results“, KCR), sind komplexe Feedbackformen differenzierter, informativer und elaborierter (vgl. Kulhavy und Stock 1989; Jacobs 2002; Lipowsky 2015).

Die Häufigkeit unterschiedlicher Feedbackarten untersuchte Richert (2005) in 22 Unterrichtsstunden verschiedener Fächer der Sekundarstufe. Während Formen des Knowledge of Result kaum auftreten, kommen die Feedbackarten des Knowledge of Correct Result mit 35 % relativ häufig vor. Für den Grundschulunterricht analysierte Lotz (2016) im Rahmen der PERLE-Studie anhand von 48 Lerngruppen die Rückmeldungen der Lehrpersonen im Leseunterricht der ersten Klasse. Hinsichtlich elaborierter Feedbackarten zeigt sich, dass knapp 82 % der Rückmeldungen keine elaborativen Aspekte enthalten. Tritt elaboratives Feedback auf, handelt es sich meist (14 %) um tutorielles Feedback (Lotz 2016, S. 316). Grundsätzlich gelten elaborierte Feedbackformen gegenüber einfacheren Formen als überlegen (vgl. Kluger und DeNisi 1996; Lipowsky 2015). Dass einfache Rückmeldungen, die ausschließlich eine Auskunft darüber geben, ob die Lösung korrekt ist oder nicht, wenig wirksam sind bzw. keinen Einfluss auf die Leistung haben, konnten Bangert-Drowns et al. (1991) in einer Metaanalye zeigen. Rückmeldungen, die das richtige Ergebnis enthalten, erwiesen sich dagegen als lernförderlich.

Der Vorteil elaborierten Feedbacks gegenüber nicht-elaborierten Feedbackformen zeigt sich nicht einheitlich über alle vorliegenden Studien hinweg (vgl. zusammenfassend Bangert-Drowns et al. 1991; Kulhavy und Stock 1989; Jacobs 2002; Mory 2004). Die wenig konsistente Befundlage deutet darauf hin, dass für die positiven Effekte elaborierter Feedbackformen weitere Variablen, wie die Art und Komplexität der Aufgabenstellung, sowie die Voraussetzungen der Lernenden eine Rolle spielen (vgl. Lipowsky 2015). Mit Blick auf die Lernenden hat sich u. a. der Stand des Vorwissens als bedeutsam für die Lernwirksamkeit des Feedbacks erwiesen (vgl. Jacobs 2002; Lipowsky 2015). Der Zusammenhang von erteiltem Feedback und individuellen Lernvoraussetzungen zeigt, dass Lernende mit ein und demselben Feedback unterschiedlich gut lernen können. Studien, welche die Zuwendung der Lehrperson zu einzelnen Lernenden untersuchen, weisen für die Schülerarbeitsphase eine häufigere Interaktion der Lehrperson mit leistungsschwächeren Schülerinnen und Schülern nach (vgl. Lipowsky et al. 2008; Lotz und Lipowsky 2014; Pohlmann-Rother et al. 2018).

3 Feedback in der Domäne Schreiben

3.1 Forschungsstand

Während vorliegende Studien der Unterrichtsforschung zur Wirksamkeit von Feedback überwiegend im mathematisch-naturwissenschaftlichen Bereich durchgeführt wurden, erscheint der Forschungsstand in der Domäne Schreiben weniger vielfältig und differenziert (Koster et al. 2015, S. 268). Rückmeldungen werden mehrheitlich als summatives Feedback betrachtet, wobei dem Experten-Feedback (durch Lehrpersonen) häufig das Feedback durch Novizen (meist als Peer-Feedback) und die Selbstbeurteilung durch die Lernenden gegenübergestellt wird (vgl. Sturm 2014). In der Metaanalyse von Graham et al. (2012) zur Schreibförderung in der Grundschule wurde auf der Grundlage von 14 recht unterschiedlichen Studien zur Effektivität von Feedback eine mittlere Effektstärke von d = 0,42 nachgewiesen. Auch in der Meta-Analyse von Graham et al. (2011) zur Frage nach der Wirksamkeit verschiedener Verfahren von Rückmeldungen und Selbstevaluation zeigte sich über alle 16 Studien hinweg ein positiver Effekt des Feedbacks auf die Textqualität (d = 0,77). Koster et al. (2015) analysierten in ihrer Metaanalyse in den Klassenstufen vier bis sechs anhand von 32 Studien verschiedene Instruktionen beim Schreiben, wobei sich Feedback ebenfalls als effektive Maßnahme (d = 0,88) erweist.

In einer quasi-experimentellen Studie mit 43 Lernenden der siebten Jahrgangsstufe wurde der Einfluss von Peer-Feedback auf die Schreibleistung analysiert (Gielen et al. 2010). Das Feedback wurde anhand von fünf Kriterien erfasst. Rückmeldungen, welche das Kriterium ‚Presence of justification‘ erfüllen (also eine Begründung beinhalten), führen zu verbesserten Ergebnissen bei leistungsschwächeren Schülerinnen und Schülern. Cho und MacArthur (2010) unterscheiden in einer Studie mit 28 Studierenden u. a. Rückmeldungen, die spezifische Verbesserungsvorschläge enthalten (‚Directive Feedback‘), von Feedback, das nicht explizit auf den Text bezogen ist (‚Non-directive Feedback‘). Während Feedback des Typs ‚Directive Feedback‘ die Empfänger häufiger dazu leitet, sog. ‚Simple Repairs‘ an ihren Texten vorzunehmen (einfache, oberflächliche Verbesserungen des Textes), führt Feedback des Typs ‚Non-Directive Feedback‘ dagegen eher zu sog. ‚Complex Repairs‘ beim Feedback-Empfänger. Diese wiederum führen zu einer Verbesserung der Textqualität. Breetvelt et al. (1994) konnten zeigen, dass sich bei Rückmeldungen während des Schreibens negative Effekte zeigen, wenn bereits zu Beginn der Textproduktion und über den gesamten Verlauf des Schreibprozesses der Text revidiert wird.

Während die groß angelegten Metastudien Feedback im Unterricht global und häufig als „Beiprodukt einer umfassenderen Instruktion“ (Sturm 2014, S. 3) untersuchen, fehlen insbesondere im Primarbereich Studien, die eine differenzierte Erfassung von Feedback vornehmen und die Bedeutung verschiedener Feedbackformen für die Textqualität analysieren. Der vorliegende Beitrag greift dieses Forschungsdesiderat auf und analysiert das Feedbackverhalten von Lehrpersonen während einer Schreibphase in der ersten Jahrgangsstufe der Grundschule. Im Folgenden werden zunächst das schreibdidaktische Setting und die mit der Aufgabenstellung verbundenen Anforderungen an die Kinder vorgestellt.

3.2 Fachdidaktische Konkretisierung: Schreiben im Anfangsunterricht der Grundschule

Im vorliegenden Projekt werden Daten aus der PERLE-Videostudie herangezogen, in der die Lehrkräfte auf der Basis von Vorgaben unterrichteten (Lipowsky et al. 2013). Im Videomodul Deutsch sollten sie den Anfangsteil des fantastischen Bilderbuchs „Lucy rettet Mama Kroko“ (Doucet und Wilsdorf 2005) vorstellen und eine Schreibphase durchführen. Der Arbeitsauftrag für die Kinder bestand darin, aus der Sicht der literarischen Hauptfigur (Lucy) einen Brief an eine andere literarische Figur (Krokodilsmutter) zu verfassen. Aus der Perspektive der Schreibforschung lässt sich der Beginn der Schreibentwicklung als assoziatives Schreiben auffassen (Bereiter und Scardamalia 1987), bei dem Fähigkeiten auf Seiten der Schreibenden vorausgesetzt werden, zu denen das Schreibenkönnen als basale Ausführungshandlung gehört. Der Rückgriff auf graphematische und motorische Schreibroutinen kann von Kindern einer ersten Klasse der Grundschule, in der zunächst eine grundlegende Literalisierung stattfindet, jedoch nicht erwartet werden. Vielmehr kann angenommen werden, dass die ihnen zur Verfügung stehenden freien mentalen Kapazitäten für die Erfordernisse des Textschreibens begrenzt sind. Im vorliegenden Schreibsetting liegen die Anforderungen an die Kinder sowohl in der konkreten Aufgabenstellung (perspektivisches Schreiben, Textsorte persönlicher Brief), als auch in der Textproduktion selbst. Sie müssen sich mit den sprachlichen, motorischen und konzeptionellen Anforderungen des Schreibens auseinandersetzen, Sprache aus dem Zusammenhang ihres Gebrauchs herauslösen, graphematisch reflektieren und eine graphomotorische Umsetzung der Wörter leisten (Weinhold 2002). Die vorliegende Schreibaufgabe erfordert damit sowohl basale Schreibfähigkeiten (z. B. Handschreiben) als auch hierarchiehöhere Fähigkeiten (z. B. Inhaltsgenerierung und Formulierung von Sätzen).

Zur Explikation der Beziehung verschiedener Feedbackformen und Textqualität scheint der Rückgriff auf Studien hilfreich, welche die Effektivität verschiedener Schreibfördermaßnahmen untersuchen und die Textqualität als abhängige Variable modellieren (z. B. Graham et al. 2015a, 2015b; vgl. Überblick bei Philipp 2017, S. 287). Danach sollten beispielsweise elaborierte Feedbackarten zur Anwendung von Schreibstrategien mit der Textqualität in Zusammenhang stehen ebenso wie Rückmeldungen, die spezifizieren, worin das Schreibziel besteht („Feed-up“), welche nächsten Schritte zur Erreichung des Ziels zu unternehmen sind („Feed-forward“) bzw. an welchem Punkt der Lernende steht („Feed-back“). Aus Erwerbsperspektive bilden derartige Rückmeldungen, die das Schreibziel explizieren und mit dem aktuellen Arbeitsstand des Lernenden in Beziehung setzen, einen Zwischenschritt zum eigenständigen Setzen von Zielen bzw. zur internen Zielformulierung. Rückmeldungen zur Anwendung von Schreibstrategien im Sinne mentaler Handlungspläne ermöglichen die Sequenzierung des Schreibprozesses. Dadurch können die Komplexität der Schreibaufgabe sowie die kognitive Beanspruchung reduziert und der Entstehungsprozess der Texte kann besser bewältigt werden. Auch imaginationsunterstützende Rückmeldungen (z. B. Hinweise mit inhaltlichem Fokus) sollten in Beziehung zur Textqualität stehen, da sie zur Ideengenerierung und -organisation anregen. Es kann angenommen werden, dass derartige Rückmeldungen insbesondere dann für die Qualität der Texte bedeutsam sind, wenn sie durch die Lehrperson erfolgen und explizit formuliert werden. Allgemeines und unspezifisches Feedback scheint dagegen zu implizit und wenig hilfreich im Vergleich zu Rückmeldungen, die als „direkte Vermittlung“ durch die Lehrperson erfolgen (Philipp 2017).

4 Fragestellungen und Hypothesen der Studie

Die Analyse des Feedbackverhaltens der Lehrpersonen zielt darauf ab, verschiedene Formen und Themen der Rückmeldung während des Schreibprozesses zu beschreiben und ihre Relevanz für die Textqualität zu analysieren.

Fragestellung 1

Wie häufig erteilen Lehrpersonen während der Schreibphase in der ersten Klasse Feedback? Welche Rückmeldeformen lassen sich identifizieren und auf welche inhaltlich-thematischen Aspekte beziehen sich diese?

Wir erwarten deutliche Unterschiede im Feedbackverhalten der Lehrpersonen, die sich sowohl in der Häufigkeit als auch in der Art der Rückmeldung zeigen sollten. Wir vermuten, dass einfache Feedbackformen (KR und KCR) dominieren und elaborierte Formen seltener auftreten.

Fragestellung 2

Wie verteilen Lehrpersonen das Feedback während der Schreibphase auf die Lernenden? Werden leistungsstärkere oder -schwächere Schülerinnen und Schüler bevorzugt? Wer ergreift die Initiative: Geben die Lehrpersonen von sich aus eine Rückmeldung oder fordern die Kinder das Feedback ein?

Mit Blick auf vorliegende Untersuchungen zu Beteiligungsmustern im Unterricht, die während einer Schülerarbeitsphase eine häufigere Interaktion der Lehrpersonen mit leistungsschwächeren Schülerinnen und Schülern nachweisen (vgl. z. B. Lipowsky et al. 2008; Lotz und Lipowsky 2014), erwarten wir ebenfalls eine häufigere Zuwendung der Lehrpersonen zu dieser Schülergruppe. Wir vermuten, dass die Lehrpersonen durch ihre Rückmeldungen den Kindern das Ziel der Aufgabenstellung verdeutlichen und weitere Schritte zur Erreichung des Lernziels aufzeigen. Daher sollte die Initiative vorrangig von den Lehrpersonen ausgehen.

Fragestellung 3

Wie wirkt sich das Feedback der Lehrpersonen während des Schreibprozesses auf die Textqualität aus?

Wir erwarten insbesondere von elaborierten Feedbackformen im Vergleich zu einfachen Rückmeldungen positive Effekte auf die Qualität der Schülertexte. Elaboriertes Feedback, das Erläuterungen enthält, auf die Aufgabe bezogen ist und auf diese Weise die Lernenden mit weiteren Informationen zur Aufgabenbearbeitung versorgt, sollte in besonderer Weise lernförderlich wirken.

5 Methodisches Vorgehen

Die hier vorgestellte Studie wurde in dem DFG-Projekt NaSch1 („Narrative Schreibkompetenz in Klasse 1“, vgl. Pohlmann-Rother et al. 2014) durchgeführt, das Daten aus der PERLE-Videostudie heranzieht (vgl. Lipowsky et al. 2013). In dieser Studie wurden ca. 90-minütige Unterrichtseinheiten im Fach Deutsch in 37 Klassen aufgezeichnet, in denen die Lehrpersonen ihren Unterricht nach Vorgaben gestalteten, die didaktische Umsetzung aber selbst bestimmten (Abschn. 3.2). Die Unterrichtseinheiten wurde zu Beginn des zweiten Halbjahres im ersten Schuljahr (im März 2006) durchgeführt.

5.1 Informationen zur Stichprobe

Die Stichprobe aus dem PERLE-Projekt beinhaltet sowohl staatliche als auch sogenannte private BIP-Kreativitätsgrundschulen (Begabung – Intelligenz – Persönlichkeit). Aufgrund des Team-Teachings, das in den meisten videografierten BIP-Klassen praktiziert wurde und ein Aufteilen des Unterrichts in verschiedenen Räumen vorsieht, ergeben sich insgesamt 49 Videos (staatliche Schulen N = 20; BIP-Schulen N = 29) und 657 Lernende. Im vorliegenden Beitrag werden ausschließlich diejenigen Kinder betrachtet, die einen beurteilbaren Text verfasst haben.Footnote 1 Damit reduziert sich die Stichprobe auf 47 Aufzeichnungen und 540 Lernende (55,7 % weiblich), die zu 57,8 % eine staatliche Schule besuchen und zum Zeitpunkt der Einschulung (N = 536) im Mittel 6 Jahre und 7 Monate (SD = 4,9 Monate) alt sind.

5.2 Instrument zur Erfassung von Feedback

Zur Auswertung des Feedbackverhaltens wurde in einem induktiv-deduktiven Vorgehen ein Beobachtungsinstrument entwickelt, das auf einem zweistufigen Analyseprozess basiert (vgl. Hattie und Timperley 2007; Lotz 2016). In einem ersten Schritt wurde zunächst jede Lehrer-Schüler-Interaktion in der Schülerarbeitsphase mit thematischem Bezug zum Schreiben erfasst und mit Anfangs- und Endzeitpunkt sekundengenau festgehalten. Im zweiten Schritt wurde jede der Lehrer-Schüler-Interaktionen dahingehend untersucht, ob ein Feedback enthalten ist. Dieses wurde anhand des Beobachtungsinstruments näher charakterisiert, wobei u. a. informierende Aspekte und Funktionen des Feedbacks bestimmt wurden. In Tab. 1 finden sich die Kriterien des Beobachtungsinstruments, die im zweiten Analyseschritt verwendet wurden (vgl. Lotz 2016).

Tab. 1 Überblick über das Beobachtungssystem

Detailliertere Informationen zur inhaltlichen Ausgestaltung des Beobachtungssystems und zum methodischen Vorgehen finden sich im Technischen Bericht (vgl. Kürzinger und Pohlmann-Rother 2019). Zur Beantwortung der Forschungsfragen fokussiert der vorliegende Beitrag auf die informierenden Aspekte sowie die Funktionen des Feedbacks. In Tab. 2 wird zudem der thematische Fokus der Rückmeldungen beschrieben.

Tab. 2 Thematischer Fokus des Feedbacks

Neben dem thematischen Fokus wurden informierende Aspekte der Rückmeldung erhoben. Die Unterscheidung zwischen einfachen und elaborierten Formen wurde anschließend weiter ausdifferenziert (Tab. 3).

Tab. 3 Informierende Aspekte des Feedbacks

In Anlehnung an Hattie und Timperley (2007) wurde eine weitere Unterscheidung hinsichtlich des Informationsgehalts von Feedback vorgenommen (Tab. 4). Während ein Feed-up Informationen über das Lernziel bereitstellt, informiert eine Lehrkraft mittels eines Feed-forwards über das weitere Vorgehen. Das Feed-back beinhaltet Informationen zum Lernfortschritt (vgl. Abschn. 1; vgl. auch Lotz 2016).

Tab. 4 Funktionen des Feedbacks

Für die Auswertung wurden zwei Kodiererinnen (Studentinnen der Erziehungswissenschaft) in einem zweitägigen Training geschult. Die Güte der Analyse wurde fortlaufend auf die Erfüllung vorab festgelegter Mindestkennwerte überprüft. Insgesamt lässt sich die Beobachterübereinstimmung mit Werten von 93,26–99,16 % für die prozentuale Übereinstimmung und Werten von κ = 0,82–0,98 für Cohens Kappa als zufriedenstellend beschreiben (vgl. Kürzinger und Pohlmann-Rother 2019).

5.3 Gruppen- und individuumsbezogene Datenstruktur

Für die Untersuchung des Rückmeldeverhaltens wurde ein lerngruppen- und individuumsbezogener Datensatz angelegt. Im Datensatz für die Lerngruppen sind Informationen zum Feedbackverhalten jeder einzelnen Lehrkraft enthalten (z. B. Angaben über die Anzahl von tutoriellem Feedback pro Lehrkraft), während im individuumsbezogenen Datensatz die Feedback-Kriterien für alle Kinder erfasst wurden. So lässt sich u. a. nachvollziehen, wie viele und welche Art von Rückmeldungen jedes Kind erhalten hat. Für die Analyse wird entweder die Datenmatrix für die Schülerinnen und Schüler oder für die Lehrpersonen herangezogen.

5.4 Bedeutung des Feedbacks für die Textqualität

5.4.1 Indikator für die Textqualität: Kriteriale Textbewertung

Insgesamt gingen 15 Items in die Textqualitätsanalyse ein. Diese lassen sich in formal-strukturelle (Anrede- und Schlussformel, Textende), inhaltliche (Perspektivenübernahme, Orientierung am Bilderbuch), sprachliche (Wortschatz, Angemessenheit der Sprachmittel, Kohäsionsmittel, Implizitheit, Textidee und -entfaltung, syntaktische Komplexität) und sprachsystematische Kriterien (Satzkonstruktion, Orthografie, Grammatik, Leserlichkeit) einteilen. Die Items wurden entweder niedrig, mittel oder hoch inferent erhoben.

Die Grundlage bildete ein vereinfachtes Modell der Textqualität, das sich an der spezifischen Aufgabenstellung sowie an den individuellen Voraussetzungen der Schülerinnen und Schüler orientiert. Ein Schreibprodukt wurde dann als Text bewertet, wenn eine für den Adressaten verständliche Kommunikationsabsicht bestehend aus mindestens einer Subjekt-Prädikat-Beziehung erkennbar war. Auch die Auswertungskriterien wurden in Anlehnung an die spezifischen Lernvoraussetzungen der Stichprobe sowie das Schreibsetting entwickelt. Das Kriterium Textidee und -entfaltung wurde beispielsweise als eine Vorstufe zu den Kategorien „Gesamtidee, Thema, Absicht des Textes; Aufbau, Gliederung; thematische Entfaltung“ in Anlehnung an das Zürcher Textanalyseraster (Nussbaumer und Sieber 1995, S. 45 f.) entwickelt. Mit diesem Item wurde die Nachvollziehbarkeit des Textsinns erfasst. Dieser zeigt sich in der logischen Verknüpfung von Sätzen und kann als ein Aspekt der Textverständlichkeit entscheidend für die Bewertung der Kohärenz angesehen werden. Bei dem Item Kohäsionsmittel ging es dagegen weniger um die Nachvollziehbarkeit des Textsinns, sondern um die in einem Text eingesetzten „Sprachmittel des Textbaus“ (Nussbaumer und Sieber 1995, S. 47), wie Verweis- oder Verknüpfungsmittel bzw. Konnektive (Kürzinger und Pohlmann-Rother 2014, S. 88).

In Anlehnung an Steinig et al. (2009) wurde anhand der Anzahl der Nebensätze die syntaktische Komplexität bestimmt. Dieses Vorgehen beschränkte sich im vorliegenden Fall jedoch darauf, ob überhaupt Nebensätze verwendet wurden. Die sprachsystematischen Aspekte wie Orthografie und Grammatik wurden nicht über die Anzahl identifizierbarer Fehler operationalisiert, sondern über die Einschränkung der Lesbarkeit durch grammatikalische oder orthografische Fehler, wobei die lautgetreue Verschriftlichung als Bezugspunkt für die Orthografie fungierte. Empirisch ließ sich eine sprachsystematische Kompetenzfacette von einer inhaltlich-stilistischen Dimension unterscheiden (Pohlmann-Rother et al. 2016; Kürzinger et al. 2019; Tab. 5).

Tab. 5 Dimensionen der kriterial erfassten Textqualität in Klasse 1

Hinsichtlich der beiden Subdimensionen lassen sich geschlechtsspezifische Unterschiede feststellen. So sind die Mädchen (M = 0,06; SD = 1,68; N = 301) den Jungen (M = −0,21; SD = 1,19; N = 239) in Bezug auf den sprachsystematischen Faktor mit einer Effektstärke von dCohen = −0,18 signifikant überlegen (t (538) = −2,95; p = 0,00). Die Mittelwertsunterschiede bezüglich der inhaltlich-stilistischen Dimension sind dagegen nicht statistisch signifikant (Mädchen: M = 0,11; SD = 1,31; Jungen: M = −0,11; SD = 1,73; t (538) = −1,19; p = 0,23).

5.4.2 Prädiktor: Schriftsprachbezogene Vorläuferfähigkeiten

Zu Beginn des ersten Schuljahres wurde die Buchstabenkenntnis mit dem Untertest „Buchstaben lesen“ des LEst 4–7 (Moser et al. 2004) erhoben. Die Datenbasis bilden WLE-Personenschätzer (M = 0,28; SD = 2,57; N = 524Footnote 2), die über eine Rasch-Skalierung berechnet wurden. Weiterführende Angaben zur Skalenbildung und Item-Beispiele sind Gresser et al. (2011) zu entnehmen. Von der Buchstabenkenntnis als Facette schriftsprachspezifischer Vorläuferfähigkeiten (z. B. Plume und Schneider 2004) kann angenommen werden, dass sie für das Verfassen von Texten bedeutsam ist.

5.4.3 Prädiktor: Geschlecht

Aufgrund der geschlechtsspezifischen Leistungsunterschiede im Schreiben zugunsten der Mädchen, die sich auch in der vorliegenden Stichprobe zeigen (Kürzinger et al. 2019), wird das Geschlecht als Prädiktor in der Mehrebenenanalyse kontrolliert. Zusätzlich wird auf Ebene 2 der Geschlechteranteil in den Klassen kontrolliert, weil dieser Einfluss auf das Rückmeldeverhalten der Lehrkräfte nehmen kann.

5.4.4 Prädiktor: Dauer der Schreibphase

Die Dauer der Schreibphase wird ebenfalls auf der Ebene 2 berücksichtigt. Aufgrund der freien zeitlichen Gestaltung der Textproduktion variiert der zeitliche Umfang in der Stichprobe relativ stark (M = 20,49 min; SD = 10,40 min; N = 47), was sich auf die Häufigkeit der Rückmeldungen während der Schreibphase auswirken kann.

5.4.5 Mehrebenenanalysen

Um den Einfluss der Rückmeldungen auf die Textqualität der Schülerinnen und Schüler aufzeigen zu können, werden Mehrebenenanalysen mit HLM 7.0 (vgl. Raudenbush et al. 2008) berechnet. Dabei werden ausschließlich diejenigen Schülerinnen und Schüler einbezogen, die eine Rückmeldung erhalten haben (G1, siehe Tab. 10). Somit umfasst die Stichprobe 320 Kinder. Als abhängige Variable auf Ebene 1 wurde jeweils eine der beiden Dimensionen der Textqualität modelliert (inhaltlich-stilistische Dimension: Tab. 12 und 13; sprachsystematische Dimension: Tab. 14 und 15). Für jede Subdimension der Textqualität wurden auf Ebene 1 jeweils die Buchstabenkenntnis sowie das Geschlecht der Kinder kontrolliert. Als unabhängige Variablen fließen auf der Ebene 2 jeweils verschiedene Merkmale von Feedback in die Analyse ein (tutorielles Feedback, KR, KCR, Feed-forward, Schreibinhalt und Orthografie), die nach ihrer Häufigkeit des Auftretens (vgl. Abschn. 6.1) ausgewählt wurden. Auf Ebene 2 werden zudem der Geschlechteranteil in den Klassen sowie die Dauer der Schreibphase kontrolliert. Die Zentrierung der Items erfolgt um den Gesamtmittelwert, wobei alle Items (bis auf das Geschlecht als dichotome Variable) z‑transformiert wurden.

6 Ergebnisdarstellung

6.1 Deskriptive Ergebnisse

6.1.1 Fragestellung 1: Feedbackverhalten der Lehrpersonen

Während der Schreibphase (M = 20,49 min; SD = 10,40 min) werden durchschnittlich 1,04 Rückmeldungen pro Minute (SD = 0,66) von den Lehrpersonen (N = 47) erteilt. Die Rückmeldehäufigkeit mancher Lehrpersonen beträgt nahezu bis zu drei Feedbacks in der Minute, während andere nur alle ein bis zwei Minuten ein Feedback geben. Eine Lehrperson erteilt nur ein einzelnes Feedback in 18 min (Abb. 1).

Abb. 1
figure 1

Überblick über die Häufigkeit der Rückmeldungen in der Stichprobe

Insgesamt werden in der Schreibphase 1064 Rückmeldungen erteilt. Ein genauerer Blick auf die Merkmale des Feedbacks in absoluten Zahlen zeigt, dass die meisten Rückmeldungen keine Funktion enthalten (Tab. 6). Etwa 69 % der Rückmeldungen informieren die Kinder somit weder über das Lernziel, noch über das weitere Vorgehen und den erreichten Fortschritt. Mit einer Häufigkeit von 16 % erteilen Lehrpersonen ein Feed-forward, womit den Lernenden Informationen über das weitere Vorgehen zum Schreibinhalt bereitgestellt werden.

Tab. 6 Verteilung der Funktion des Feedbacks

In Bezug auf das einfache Feedback (Tab. 7) fällt auf, dass 31 % aller Rückmeldungen Informationen über die richtige Lösung enthalten (KCR), während in 22,18 % der Fälle die Kinder lediglich darüber informiert werden, ob ihre Antwort korrekt oder falsch ist (KR). In 42,67 % aller Fälle geben die Lehrkräfte keine einfache Rückmeldung. In der Kategorie „Nicht enthalten“ wurden ablehnende Reaktionen einer Lehrkraft (S: „Wo soll ich meinen Namen hinschreiben?“ L: „Das habe ich vorhin gesagt.“) und Äußerungen, die keine Informationen zur Lösung der Schreibaufgabe bereitstellen, erfasst. Auch elaboriertes Feedback wurde dieser Kategorie zugeordnet.

Tab. 7 Verteilung des einfachen Feedbacks

Wie in Tab. 8 deutlich wird, enthält die Mehrheit aller in der Stichprobe erhobenen Rückmeldungen (62,88 %) keine elaborierten Aspekte. Darunter fallen alle Rückmeldungen, die weder tutorielle Aspekte noch Erläuterungen zur korrekten bzw. zur falschen Antwort aufweisen. Bei immerhin einem Drittel handelt es sich jedoch um tutorielle Rückmeldungen (35,34 %).

Tab. 8 Verteilung des elaborierten Feedbacks

Thematisch-inhaltlich beziehen sich die Rückmeldungen zu je fast einem Drittel auf die Orthografie (36,37 %) sowie auf den Schreibinhalt (29,23 %) (Tab. 9).

Tab. 9 Verteilung der thematischen Foki von Feedback

Zwischen dem thematischen Fokus der Rückmeldung sowie der Funktion und den informierenden Aspekten lassen sich Zusammenhänge (Spearman-Rho-Korrelationen) nachweisen. Mit dem Schreibinhalt korrelieren beispielsweise vor allem tutorielles Feedback (rs = 0,86; p ≤ 0,01), einfaches Feedback (KR) (rs = 0,72; p ≤ 0,01) und Feed-forward (rs = 0,84; p ≤ 0,01). Rückmeldungen zur Orthografie treten vor allem mit einfachen Rückmeldungen der Kategorie KCR (rs = 0,94; p ≤ 0,01) sowie mit tutoriellem Feedback (rs = 0,77; p ≤ 0,00) auf.

6.1.2 Fragestellung 2: Verteilung der Rückmeldungen auf die Schülerinnen und Schüler

Von den insgesamt 540 Lernenden erhalten 320 Kinder (59,25 %) mindestens eine Rückmeldung während des Schreibprozesses. Die Teilstichprobe derjenigen Kinder, die ein Feedback erhält (G1), unterscheidet sich von denjenigen Kindern, die keine Rückmeldung erhalten (G2), hinsichtlich des Geschlechts und der Leistungen (Tab. 10). So setzt sich G2 zu 64,54 % aus Mädchen zusammen, während G1 ein relativ ausgewogenes Geschlechterverhältnis aufweist.

Tab. 10 Gegenüberstellung der beiden Teilstichproben

In der Gesamtstichprobe (N = 540) lässt sich kein Beleg für einen Zusammenhang zwischen der Häufigkeit der Rückmeldungen pro Minute und der Buchstabenkenntnis der Kinder (N = 524; r = −0,02; p = 0,71) nachweisen. In diesem Kontext ist jedoch auch relevant, wer die Initiative für eine Rückmeldung ergreift. Wie Tab. 11 verdeutlicht, geht mehr als die Hälfte des erteilten Feedbacks (N = 61,65 %) von den Lernenden selbst aus.

Tab. 11 Verteilung der Initiierung des Feedbacks

Die Kinder ergreifen tendenziell mit höheren Leistungen (Buchstabenkenntnis) eher die Initiative für ein Feedback (r = 0,13; p = 0,04; N = 243), wobei dieser Zusammenhang nur schwach ausgeprägt ist. Zwischen der Anzahl der Rückmeldungen und dem Geschlecht besteht ein negativer, schwacher Zusammenhang (rs = −0,15; p = 0,00; N = 540; Spearman-Rho-Korrelation), wonach Jungen tendenziell etwas häufiger eine Rückmeldung erhalten. Ein etwas geringerer Zusammenhang besteht auch zwischen der Anzahl von Feedback in der Minute und dem Geschlecht (rs = −0,13; p = 0,00; N = 540; Spearman-Rho-Korrelation).

6.2 Ergebnisse der Mehrebenenanalysen

6.2.1 Fragestellung 3: Einfluss der Rückmeldungen auf die Textqualität

Um den Zusammenhang zwischen dem Feedbackverhalten und der Textqualität der Lehrpersonen zu untersuchen, wurden verschiedene Modelle für jede Subdimension berechnet, in denen die Formen und Themen von Feedback einzeln modelliert wurden. In einem ersten Schritt erfolgte die Bestimmung der Intraklassenkorrelation (ICC) anhand des Nullmodells. Sie verweist bei dem sprachsystematischen Faktor mit einem Wert von 22,77 % sowie bei dem inhaltlich-stilistischen Faktor mit einem Wert von 25,50 % auf Unterschiede zwischen den Lerngruppen in Bezug auf die Textqualität. In einem zweiten Schritt wurden die einzelnen Prädiktoren in jeweils sieben Modellen auf Ebene 1 und 2 getestet (Tab. 121314 und 15). Für die inhaltlich-stilistische Dimension zeigt sich, dass die Buchstabenkenntnis (Tab. 12 und 13: β = 0,34*** bzw. 0,35***) als schriftsprachbezogene Vorläuferfähigkeit über alle Modelle hinweg konstant signifikante positive Effekte auf die Textqualität besitzt. Das Geschlecht beeinflusst die inhaltlich-stilistische Textqualität jedoch nicht (Tab. 12 und 13). Einfache Rückmeldungen (KR und KCR), tutorielles Feedback, die Häufigkeit von Feedback sowie Rückmeldungen zum weiteren Vorgehen in Form eines Feed-forwards wirken sich in der vorliegenden Stichprobe nicht auf die inhaltlich-stilistische Textqualität aus (Tab. 12).

Tab. 12 Zusammenhang zwischen Feedbackformen und der inhaltlich-stilistischen Textqualität
Tab. 13 Zusammenhang zwischen den thematischen Bezügen von Feedback und der inhaltlich-stilistischen Textqualität
Tab. 14 Zusammenhang zwischen Feedbackformen und der sprachsystematischen Textqualität
Tab. 15 Zusammenhang zwischen den thematischen Bezügen von Feedback und der sprachsystematischen Textqualität

Auch im Hinblick auf die thematischen Aspekte lassen sich weder bei Rückmeldungen zur Orthografie noch zum Schreibinhalt signifikante Zusammenhänge feststellen (Tab. 13: Modell 6 und 7). Modell 2 mit tutoriellem Feedback als unabhängige Variable leistet mit ca. 11,5 % die höchste Varianzaufklärung.

Bei der sprachsystematischen Dimension lassen sich wie bei der inhaltlich-stilistischen Dimension für die Buchstabenkenntnis über alle Modelle (Tab. 14 und 15: β = 0,34***) signifikante positive Zusammenhänge auf die Textqualität belegen. Darüber hinaus bestehen hier Zusammenhänge zwischen der Textqualität und dem Geschlecht (Tab. 14 und 15: β = 0,24*). Zwischen den untersuchten Formen von Feedback (Tab. 14: Modelle 1–5) und der sprachsystematischen Teildimension zeigt sich kein Zusammenhang.

Hinsichtlich der thematischen Bezüge von Feedback lässt sich ein signifikanter negativer Zusammenhang der Rückmeldungen zum Schreibinhalt auf die sprachsystematische Dimension der Textqualität erkennen (Tab. 15, Modell 6: β = −0,23*).

7 Zusammenfassung und Diskussion

Insgesamt zeigen sich deutliche Unterschiede im Feedbackverhalten der Lehrkräfte: Während manche bis zu drei Rückmeldungen pro Minute erteilen, geben andere alle ein bis zwei Minuten ein Feedback (Fragestellung 1). Die Verteilungen zu elaborierten Feedbackformen zeigen, dass diese seltener auftreten als einfache Feedbackformen. Wenn elaborierte Rückmeldungen auftreten, handelt es sich vorrangig um tutorielles Feedback (35 %). Dass Lotz (2016) mit 14 % einen deutlich geringeren Wert für tutorielles Feedback im Leseunterricht der ersten Klasse bei weitestgehend gleicher Operationalisierung (Lotz 2016, S. 316) konstatiert, könnte mit dem Anspruch und der Komplexität der Aufgabenstellung zusammenhängen (Abschn. 3.2), welche hohe Anforderungen an die Schülerinnen und Schüler stellte und somit möglicherweise von den Lehrpersonen in höherem Maße tutorielles Feedback verlangte als es bei den untersuchten Leseübungen der Fall war. Dieser Befund verweist auf die Relevanz der Kontextabhängigkeit des Feedbacks (Abschn. 2).

Die Verteilung des Feedbacks auf einzelne Schülerinnen und Schüler (Fragestellung 2) zeigt, dass mehrheitlich Jungen eine Rückmeldung erhalten. Dieses Ergebnis deckt sich mit vorliegenden Studien, die eine häufigere Zuwendung der Lehrperson zu Jungen oder leistungsschwächeren Kindern nachweisen (vgl. z. B. Lotz und Lipowsky 2014; Pohlmann-Rother et al. 2018). Insgesamt geht die Initiative weniger von den Lehrpersonen, sondern etwas häufiger von den Lernenden selbst aus. Dies könnte mit der Aufgabestellung zusammenhängen, deren Bearbeitung zu Beginn des Schriftspracherwerbs die Kinder möglicherweise zum Einfordern von Rückmeldungen veranlasste. Die zu Schuljahresbeginn erfasste Buchstabenkenntnis der Kinder als Facette schriftsprachbezogenen Vorwissens scheint ein halbes Jahr später zum Zeitpunkt der durchgeführten Schreibaufgabe (zu Beginn des zweiten Halbjahres der erste Klasse) weder für die Zuwendung der Lehrperson noch für die Initiative der Kinder relevant zu sein.

Dass sich keine positiven Zusammenhänge der elaborierten Rückmeldeformen (tutorielles Feedback, Feed-foward) mit den Dimensionen der Textqualität nachweisen lassen, steht im Widerspruch zu den Vorannahmen, nach denen ein positiver Effekt dieser Rückmeldeformen auf die Qualität der Texte einerseits durchaus plausibel gewesen wäre (Fragestellung 3). Anderseits muss mit Blick auf den Forschungsstand eingeräumt werden, dass die Befundlage zu positiven Effekten elaborierter Feedbackformen aufgrund weiterer Variablen überwiegend inkonsistent erscheint. Vor diesem Hintergrund wäre die Schlussfolgerung, dass Rückmeldungen durch die Lehrkraft beim Schreiben nicht relevant bzw. lernförderlich sind, jedoch verkürzt. Vielmehr muss bei der Interpretation der Ergebnisse bedacht werden, dass das Feedback in der vorliegenden Studie zwar differenziert erfasst, allerdings weder in seiner fachdidaktischen Qualität noch in seiner Adaptivität näher betrachtet wurde. Zum anderen ist zu vermuten, dass insbesondere von elaborierten Feedbackformen, welche die Förderung hierarchiehöherer Schreibprozesse anregen (z. B. hinsichtlich Inhaltsgenerierung und planerischer Aktivitäten), eher langfristig positive Effekte auf die Textqualität zu erwarten sind.

Der negative Zusammenhang der Rückmeldungen zum Schreibinhalt auf die sprachsystematische Dimension könnte aus fachdidaktischer Perspektive damit erklärt werden, dass die Rückmeldungen zum Schreibinhalt die mentalen Kapazitäten der Kinder in Bezug auf die graphomotorische Umsetzung (Leserlichkeit des Schriftbildes), die Satzkonstruktionen und die Beachtung der Phonem-Graphem-Korrespondenzen (Lesbarkeit in Bezug auf Grammatik und Orthografie) belasteten. Dass die Kinder das Feedback zum Inhalt überwiegend in Form von elaborierten Feedbackformen (Feed-forward, tutorielles Feedback) erhielten (Abschn. 6.1), könnte möglicherweise die mentale Kapazität der Kinder weiter beansprucht haben und damit zu Lasten der sprachsystematischen Dimension gegangen sein.

Mit Blick auf die Limitation der Studie ist zu bedenken, dass nicht ermittelt werden konnte, was sich durch die Rückmeldungen an den Texten verbessert hat, sondern nur, ob sich ein Zusammenhang zwischen dem erteilten Feedback und der finalen Textqualität zeigt.

Abschließend lässt sich zusammenfassend festhalten, dass der vorliegende Beitrag einen vertieften Einblick in das Rückmeldeverhalten von Grundschullehrkräften offeriert. Forschungsmethodisch bieten die Ausführungen konkrete Anregungen für künftige Studien. Sinnvoll wäre, neben einer umfangreicheren Berücksichtigung des Vorwissens der Lernenden, die Passgenauigkeit der Rückmeldungen hinsichtlich kognitivem Anspruchsniveau und Lernstand zu berücksichtigen, die Textrevisionen einzubeziehen (Lipowsky et al. 2015) und auch die fachdidaktische Qualität der Rückmeldungen in den Blick zu nehmen.