Ergebnisse

Wey, Santina

doi:10.1007/978-3-658-36038-2_7

Santina Wey²

4154 Accesses

Zusammenfassung

Bei DBR-Projekten stellt sich die Frage, wie der zyklische Forschungsprozess und dessen Ergebnisse sinnvoll im linearen Buchformat dargestellt werden können. Die Ergebnisse pro Zyklus darzulegen, würde diverse Redundanzen bedeuten. Außerdem würde es dem Anspruch von DBR-Projekten, bei der Problemlösung ein Gesamtkonzept zu adressieren, nicht gerecht werden.

You have full access to this open access chapter, Download chapter PDF

Books are linear, educational design research is not. (McKenney/Reeves 2019, S. 3)

Bei DBR-Projekten stellt sich die Frage, wie der zyklische Forschungsprozess und dessen Ergebnisse sinnvoll im linearen Buchformat dargestellt werden können. Die Ergebnisse pro Zyklus darzulegen, würde diverse Redundanzen bedeuten. Außerdem würde es dem Anspruch von DBR-Projekten, bei der Problemlösung ein Gesamtkonzept zu adressieren, nicht gerecht werden. Die Ergebnisse der Studie werden daher nach inhaltlichem Fokus strukturiert dargestellt. Zunächst werden Unterrichtsbeobachtungen und zentrale Rückmeldungen der Lehrkräfte zu den Treatments und der Durchführung geschildert (vgl. Abschn. 7.1). Daran anschließend erfolgt die Gütebeurteilung der Studie (vgl. Abschn. 7.2). In den weiteren drei Unterkapiteln werden die aufgestellten Hypothesen (vgl. Abschn. 5.2) überprüft. Beginnend mit der Darstellung der Eingangsvoraussetzungen der Proband*innen zum Zeitpunkt der Präerhebungen (vgl. Abschn. 7.3) werden darauffolgend die Treatmenteffekte dargelegt (vgl. Abschn. 7.4). Anschließend wird auf die bezugsgruppenspezifischen Treatmenteffekte fokussiert (vgl. Abschn. 7.5) und abschließend die Beständigkeit der Treatmenteffekte überprüft (vgl. Abschn. 7.6). Es fließen Erkenntnisse aus beiden Design-Zyklen in die Ergebnisdarstellung ein, wobei sich die Berechnungen in den Abschnitt 7.3 bis 7.6 ausschließlich auf die Daten aus dem zweiten Design-Zyklus beziehen.

1 Unterrichtsbeobachtungen und Rückmeldungen der Lehrkräfte aus Design-Zyklus I und II

Mindestens 50 % jeder Unterrichtsreihe des zweiten Design-Zyklus habe ich als Beobachterin in den Klassen begleitet und Notizen zum Unterrichtsgeschehen angefertigt. Darüber hinaus haben die Lehrkräfte im zweiten Design-Zyklus einen Fragebogen mit offenen und geschlossenen Fragen u. a. zur Zusammensetzung der Klasse sowie der Unterrichtsreihe ausgefüllt. Die Beobachtungen und Rückmeldungen von mir sowie von den Lehrkräften werden nachfolgend untergliedert in Beobachtungen bezüglich der Zielvariablen (vgl. Abschn. 7.1.1) sowie Rückmeldungen zum Treatment selbst (vgl. Abschn. 7.1.2).

1.1 Beobachtungen aus Zyklus I und II

Während der Durchführung der Unterrichtsreihen konnten bezüglich der Zielvariablen Fachwissen, Fachsprache und Selbsteinschätzungen verschiedene Beobachtungen gemacht werden. Die Aspekte betreffen vor allem das Vorwissen der Schüler*innen, auffällige Schwierigkeiten sowie einzelne, wiederholte Schüler*innenaussagen.

Fachwissen

An Berliner und Brandenburger Schulen wird das Fach Geographie mit Eintritt in die Sekundarstufe I in der 7. Klasse unterrichtet. Je nach Schulart und Schule entfallen dabei auf das Fach Geographie eine oder zwei Schulstunden pro Woche. An der Integrierten Sekundarschule (ISS) wird das Fach außerdem häufig im Verbund mit Geschichte, politischer Bildung und Ethik unterrichtet. An den meisten teilnehmenden Schulen wird Geographie in der 7. Klasse einstündig und in nur einem Halbjahr unterrichtet, um jeweils Doppelstunden zu ermöglichen. Diese Einschränkung bedingte einen langen organisatorischen Vorlauf sowie viel Koordination mit den entsprechenden Schulen. Je nachdem, wie die Vorbedingungen erfüllt waren, bestand zum Erhebungszeitpunkt unterschiedliches Vorwissen im Fach Geographie. Während im ersten Design-Zyklus (2. Halbjahr der 7. Klasse) die Schüler*innen zum Beispiel schon weitgehend vertraut mit Koordinaten, Längen- und Breitengraden waren, bereitete dies im zweiten Design-Zyklus (1. Halbjahr der 7. Klasse) einigen noch größere Schwierigkeiten. Die Unterrichtsreihe ist in sich abgeschlossen und erforderte kein umfangreiches Vorwissen. Dennoch war auffällig, dass das Vorwissen von Klasse zu Klasse und noch stärker von Schule zu Schule schwankte, was in der Umsetzung der Unterrichtsreihe teilweise zu Schwierigkeiten führte. So hatten einige Klassen noch nie zuvor im Unterricht experimentiert und mussten viel grundsätzlicher mit den Regeln und Vorgaben des Experimentierens vertraut gemacht werden. Für manche war es herausfordernd, eine passende Atlaskarte zu suchen, andere hingegen konnten mit Leichtigkeit Transfers von der Atlaskarte auf verschiedenes Unterrichtsmaterial leisten. Darüber hinaus unterrichten einige der teilnehmenden Lehrkräfte aufgrund des Lehrer*innenmangels im Land Berlin das Fach Geographie fachfremd. Es ist denkbar, dass auch dieser Aspekt Auswirkungen auf das Fachwissen der Schüler*innen hat.

Fachsprache

Bezüglich der fachsprachlichen Kompetenzen zeigten sich in den Beobachtungen auf Schüler*innenseite insbesondere Vorbehalte gegenüber dem Schreiben von Texten, die über den Umfang von ein bis zwei Sätzen hinaus gehen. Auch die Lehrkräfte gaben an, dass die Schüler*innen im Geographieunterricht in der Regel nur sehr wenig schreiben müssen. Das Schreiben ganzer Texte beispielsweise war zuvor in keiner Klasse Gegenstand des Geographieunterrichts. Insofern haben sowohl Schüler*innen als auch Lehrer*innen den Umfang an Schreibaufgaben in beiden Treatments als höher bewertet als normalerweise üblich.

Selbsteinschätzung

Verstärkt im ersten Design-Zyklus sind mir verschiedene Schüler*innenaussagen zur Selbsteinschätzung aufgefallen, die auf ein eher negatives Fähigkeitsselbstkonzept schließen lassen. Insbesondere Schülerinnen zeigten sich in ihrem eigenen Selbstbild verunsichert. Sätze wie „Ich bin eh zu dumm“, „Geo kann ich nicht“, „Geo hab ich noch nie verstanden“, „In Deutsch bin ich schlecht“, „Ich kann das nicht, weil ich Legasthenie habe“ sind in allen Klassen im ersten Design-Zyklus aufgefallen. Kindern, die die Aufgaben nicht lösen wollten, haben auch trotz meiner Bitte nicht mitgemacht, weil sie fürchteten, „einfach zu dumm“ für die Aufgaben zu sein. In der Auswertung der Selbsteinschätzungsitems von t1 zeigte sich, dass es signifikante Geschlechterunterschiede in der Selbsteinschätzung zu Ungunsten der Mädchen gab. Diese Unterschiede wurden daher im sprachsensiblen Treatment zu adressieren versucht. In Design-Zyklus II, also einer anderen Kohorte, konnten diese Unterschiede zu t1 nicht mehr beobachtet werden.

1.2 Rückmeldungen zu den Treatments aus Zyklus I und II

Die Lehrkräfte aus Design-Zyklus I waren stark in die Entwicklung des Treatments involviert, haben die Unterrichtsreihen aber nicht selbst durchgeführt. Die Lehrkräfte in Design-Zyklus II haben die Unterrichtsreihe durchgeführt, dafür aber erst im Nachgang der Unterrichtsdurchführung in Form eines Fragebogens Rückmeldung zur Unterrichtsreihe gegeben. Die Schüler*innen wurden zu t3 des dritten Erhebungszeitpunkts per Fragebogen nach positiven und negativen Aspekten der Unterrichtsreihen befragt. Insgesamt ergeben sich in den Rückmeldungen sowohl auf Schüler*innen- als auch auf Lehrer*innenseite keine konkreten Hinweise auf weitere, notwendige Überarbeitungen. Es gibt darüber hinaus keine signifikanten Unterschiede zwischen Experimental- und Kontrollgruppe hinsichtlich der Freude am Unterricht, der Neugierde auf die nächste Schulstunde sowie der Vorfreude auf den Unterricht. Die folgenden Rückmeldungen sind daher lediglich mögliche Hinweise auf weiteren Forschungsbedarf.

Sprachsensible Unterrichtsreihe

Von Schüler*innenseiten der Experimentalgruppe (N = 55) kam am häufigsten die Rückmeldung, dass zu viele Arbeitsblätter ausgegeben wurden (20 %). Außerdem haben 5,5 % angemerkt, dass zu viele Schreibaufgaben in der Unterrichtsreihe vorkamen. Dass viel geschrieben wurde, haben die Lehrer*innen allerdings als besonders positiv bewertet. Eine ISS-Lehrkraft sowie manche Schüler*innen merkten an, dass das Aufgabenverständnis nicht immer uneingeschränkt gegeben und die sprachlichen Anforderungen teils noch zu hoch waren (7,3 %). Ebenfalls 7,3 % der Schüler*innen geben an, dass der Stoff zu umfangreich war. Die Lehrkräfte bewerteten vor allem das selbstständige Arbeiten der Schüler*innen und die methodische Umsetzung der fachlichen Inhalte positiv.

Nicht-sprachsensible Unterrichtsreihe

In der Kontrollgruppe (N = 32) merkten 9,4 % der Schüler*innen an, zu viel schreiben zu müssen. Dies ist auffällig, da der Schreibanteil der Kontrollgruppe deutlich geringer war als in der Experimentalgruppe. 9,4 % der Schüler*innen gaben an, dass die Unterrichtsreihe zu viel Stoff enthalten hat. Keine*r der Schüler*innen merkte an, Schwierigkeiten mit der Aufgabenstellung zu haben. Dies ist ebenfalls auffällig, da die Aufgabenstellung in der sprachsensiblen Gruppe mehrfach überarbeitet und sprachlich niedrigschwellig angelegt sein sollte. Außerdem hatten laut Aussage der Lehrkräfte einige Schüler*innen Konzentrationsschwierigkeiten, weil manche Stunden in den Nachmittag fielen. In manchen Phasen des selbstständigen Erarbeitens gaben die Lehrkräfte außerdem an, dass die Schüler*innen überfordert waren. Auch in der nicht-sprachsensiblen Unterrichtsreihe wurde von den Lehrkräften positiv bewertet, dass die Schüler*innen selbstständig fachliche Inhalte erarbeiten konnten; die methodische Umsetzung der fachlichen Inhalte wurde gelobt.

Für die vorliegende Arbeit waren insbesondere die Unterrichtsbeobachtungen und Rückmeldung aus Design-Zyklus I relevant, da basierend auf ihnen die Unterrichtsreihe sowie die Erhebungsinstrumente für den zweiten Zyklus angepasst wurden. Die Lehrkräfte bewerteten beide Unterrichtsreihen positiv und hatten für beide Einheiten konstruktive Rückmeldungen, die integriert werden konnten.

2 Validität und Kontrolle von Bedrohungen der Validität im Forschungsprozess

Zur Bewertung einer Studie können über den gesamten Forschungsprozess hinweg verschiedene Kriterien wissenschaftlicher Qualität angelegt werden. Besonders im Fokus steht nachfolgend das Kriterium der methodischen Strenge mit dem zentralen Merkmal der Validität (vgl. Döring/Bortz 2016, S. 93). Inhaltliche Relevanz, methodische Strenge (Validität), ethische Aspekte sowie die Präsentation und Verwertbarkeit werden als vier verschiedene Kriterien nachfolgend bewertet. Dabei werden Bedrohungen des entsprechenden Kriteriums ebenso beleuchtet wie getroffene Maßnahmen, um den möglichen Einschränkungen der Güte entgegenzuwirken. Ziel dieses Abschnitts ist es, die Güte des eigenen Vorgehens zu bewerten und Grenzen deutlich aufzuzeigen.

2.1 Inhaltliche Relevanz

Die Themenwahl sowie die Auswahl der zu präsentierenden Ergebnisse müssen inhaltlich relevant sein. Das heißt für DBR-Projekte, dass sie einerseits einen Beitrag zur Grundlagenforschung im Sinne der Theoriebildung bzw. der (Weiter-)Entwicklung von Theorien leisten sowie andererseits für die praktische Umsetzung relevant sind (vgl. Bakker 2018, S. 13). Im Projekt ist dies insoweit erfüllt, als theoretische Design-Kriterien für sprachsensiblen Geographieunterricht abgeleitet (vgl. Kap. 4) und die Erkenntnisse in Form von Unterrichtsmaterialien und Qualifizierungsmaßnahmen für Lehrkräfte Eingang in die Praxis finden können. Zur inhaltlichen Relevanz gehört auch, dass das Forschungsprojekt in einen realistischen Rahmen eingebettet ist, das heißt, die zur Verfügung stehenden Ressourcen so eingeschätzt werden, dass die methodische Strenge nicht vernachlässigt wird.

2.2 Bewertung verschiedener Validitätsdimensionen

Die methodische Strenge ist das zentrale Kriterium der Gütebewertung. Es beschreibt den Grad der Gültigkeit wissenschaftlicher Aussagen mit dem Konzept der Validität. Man unterscheidet nach Campbell (1957) vier Typen der Validität: Interne Validität, Externe Validität, Konstruktvalidität und Statistische Validität. Diese Typologie ist auf experimentelle und quasi-experimentelle Studien zugeschnitten, die einen Anspruch darauf erheben, aus den Korrelationen Ursache-Wirkungs-Beziehungen abzuleiten, wie es auch in der vorliegenden Studie der Fall ist.

Damit die Kriterien der Validität überhaupt erfüllt sein können, muss die methodische Strenge bereits in der Grundlegung der Studie gewährt sein. Das bedeutet eine konsequent hohe Qualität bei der Literaturrecherche, der Erarbeitung des Forschungsstandes und der Theoriebildung, um daraus schlüssig die Forschungsfrage sowie die Forschungshypothesen ableiten zu können (vgl. Döring/Bortz 2016, S. 94).

Interne Validität

Interne Validität fragt danach, inwiefern der interessierende Effekt tatsächlich auf die unabhängige Variable zurückzuführen ist. Inwiefern sind zum Beispiel Veränderungen im Fachwissen auf den sprachsensiblen Geographieunterricht zurückzuführen? Die Studie gilt dann als intern valide, wenn die untersuchten Variablenzusammenhänge als kausale Ursache-Wirkungs-Relationen interpretiert werden können (vgl. Döring/Bortz 2016, S. 97). Bei quasi-experimentellen Studien wie der vorliegenden müssen die kausalen Interpretationen allerdings vorsichtig erfolgen. Insbesondere im Rahmen der DBR-Philosophie, innerhalb derer die Attribution von Effekten auf isolierte Variablen nicht möglich ist, stellt das Gütekriterium der internen Validität einen Bruch dar bzw. macht das Spannungsfeld der verschiedenen Forschungsansätze deutlich. Da die Untersuchungsbedingungen in Form von Experimental- und Kontrollgruppe aktiv variiert werden und die Zuweisung der Klassen zu Experimental- und Kontrollgruppe zufällig erfolgt ist, besteht trotzdem ein Anspruch auf hohe interne Validität, auch wenn es sich nicht um eine randomisierte Stichprobe handelt (vgl. Abschn. 6.5). Es werden neun Bedrohungen der internen Validität unterschieden (vgl. Döring/Bortz 2016, S. 103; Shadish et al. 2002), die nachfolgend dargestellt sowie hinsichtlich der vorliegenden Studie beurteilt werden.

(1)
Unklare zeitliche Abfolge | Um kausale Ursache-Wirkungs-Effekte abbilden zu können, müssen die Messungen vor und nach dem Treatment stattfinden und nicht etwa währenddessen. In der vorliegenden Studie fanden die Prä-Erhebungen unmittelbar vor dem Treatment, die Post-Erhebungen unmittelbar nach dem Treatment statt.
(2)
Selektionseffekte | Die Proband*innen in den verschiedenen Untersuchungsgruppen müssen vergleichbar sein. Unterscheiden sie sich bereits vor dem Treatment, könnten bestehende Unterschiede später fälschlich als kausale Treatmentwicklung interpretiert werden (vgl. Döring/Bortz 2016, S. 103). Um Selektionseffekte abzumildern, wird bei den interferenzstatistischen Verfahren mit Differenzscores zur Beurteilung des Treatmenterfolgs gerechnet; bestehende Unterschiede zu t1 würden somit mathematisch berücksichtigt. Bezüglich der Zielvariablen lassen sich allerdings zu t1 keine Gruppenunterschiede ausmachen (vgl. Abschn. 7.3.1).
(3)
Externe zeitliche Einflüsse | Es ist zu vermeiden, dass allein durch die unterschiedlichen Erhebungszeiträume und damit einhergehende, unterschiedliche externe Bedingungen Effekte entstehen, die nicht durch das Treatment bedingt sind. Im zyklischen Design von DBR-Projekten ist diese Bedrohung durchaus ernst zu nehmen. Um mögliche Effekte auf das Treatment zurückführen zu können, wurden in beiden Zyklen Kontrollgruppen integriert.
(4)
Reifungsprozesse | Bei Studien, bei denen ein längerer Zeitraum zwischen Prä- und Posterhebung liegt, können Reifungsprozesse der Proband*innen die Effekte des Treatments zusätzlich verzerren. Der Zeitraum zwischen Prä- und Posttest in der vorliegenden Studie belief sich auf maximal fünf Wochen. Signifikante Effekte geistiger Reifung sind daher eher auszuschließen.
(5)
Statistische Regressionseffekte | Schüler*innen, die zu Extremgruppen gehören, also besonders starke oder besonders schwache Leistungen zeigen, sind anfällig für den Regressionseffekt. Dieser beschreibt das Phänomen, dass Extremgruppen bei Messwiederholungen automatisch eine Tendenz zur Mitte zeigen, sich also extreme Einschätzungen (z. B. ein schlechtes Selbstkonzept) beim zweiten Mal abgeschwächt haben. Um diesem Effekt entgegenzuwirken, sollten die Proband*innen möglichst übliche Merkmalsausprägungen haben. Dies ist im Rahmen von Schulklassen nicht immer möglich. Denn innerhalb einer Klasse kann es vorkommen, dass es, zum Beispiel in Bezug auf die Selbsteinschätzung, Schüler*innen gibt, die sich sehr schlecht oder sehr gut einschätzen und sie daher bei Messwiederholung zur Regression der Selbsteinschätzung kommen.
(6)
Experimentelle Mortalität | Im Verlauf der Studie fallen immer wieder Proband*innen weg. Insbesondere bei DBR-Projekten ist dieser Aspekt eine relevante Bedrohung. Denn Kooperationspartner*innen zu finden und über einen längeren Zeitraum, in diesem Fall zwei Schuljahre, zu halten, ist herausfordernd. Es wurden daher von Anfang an mehr Schulen akquiriert als für die optimale Stichprobengröße errechnet (vgl. Abschn. 6.5). Dies war notwendig, da durch verschiedene Faktoren (Schulleitungswechsel, Lehrer*innenmangel im Fach Geographie etc.) schließlich einige Lehrkräfte und Klassen weggefallen sind. Darüber hinaus kam es zu den üblichen Ausfällen von einzelnen Schüler*innen zu einem, zwei oder allen Erhebungszeitpunkten aufgrund von Krankheit, Schuldistanz oder anderen schulintern bedingten Ausfällen. Insbesondere im ersten Design-Zyklus war die Anzahl an fehlenden Schüler*innen relativ groß. Außerdem kam es bei einigen Erhebungsinstrumenten zu Schwierigkeiten im ersten Design-Zyklus. Während der Fachwissenstest jeweils zu t1 und t2 in jeder Klasse durchgeführt wurde, Fehlwerte also allein auf das Fehlen einzelner Schüler*innen zu einem der Erhebungszeitpunkte zurückzuführen sind, wurden andere Erhebungen nur zu einem Erhebungszeitpunkt durchgeführt. Die Profilanalyse zur Messung der Fachsprache konnte aufgrund der mangelnden Schreibmotivation nicht in allen Klassen zu t2 erneut durchgeführt werden. Da DBR-Projekte eine gewisse Flexibilität für Umstellungen im Laufe des Forschungsprozesses einräumen, wurde die Fachsprache in einer Klasse zusätzlich mittels eines C-Tests erhoben. Es liegen daher nur Daten aus einer Klasse vor (vgl. Tab. 7.1). Im zweiten Design-Zyklus konnte der dritte Erhebungszeitpunkt in zwei Klassen aufgrund der COVID-19-Pandemie nicht stattfinden. Dies hat zur Folge, dass mehr als 10 % der Daten zu t3 fehlen und nur noch begrenzt statistische Aussagen getroffen werden können.

Tab. 7.1 Anzahl der Proband*innen nach Design-Zyklus, Erhebungszeitpunkt und -instrument sowie fehlende Daten

1)	GesamtH₁FW_t1: m(EG_t1) ≠ m(KG_t1)	verwerfen
1)	GesamtH₀FW_t1: m(EG_t1) = m(KG_t1)	beibehalten

2)	GesamtH₁FS_t1: m(EG_t1) ≠ m(KG_t1)	verwerfen
2)	GesamtH₀FS_t1: m(EG_t1) = m(KG_t1)	beibehalten

3)	GesamtH₁SE_t1: m(EG_t1) ≠ m(KG_t1)	annehmen
3)	GesamtH₀SE_t1: m(EG_t1) = m(KG_t1)	verwerfen

4)	LesenH₁FW_t1: m(Lesen_{SL t1}) < m(Lesen_{MGL t1})	annehmen
4)	LesenH₀FW_t1: m(Lesen_{SL t1}) ≥ m(Lesen_{MGL t1})	verwerfen

Ergebnisse

Zusammenfassung

1 Unterrichtsbeobachtungen und Rückmeldungen der Lehrkräfte aus Design-Zyklus I und II

1.1 Beobachtungen aus Zyklus I und II

1.2 Rückmeldungen zu den Treatments aus Zyklus I und II

2 Validität und Kontrolle von Bedrohungen der Validität im Forschungsprozess

2.1 Inhaltliche Relevanz

2.2 Bewertung verschiedener Validitätsdimensionen

2.3 Ethische Aspekte

3 Geschlecht, Erstsprache und Lesekompetenz als bezugsgruppenspezifische Eingangsvoraussetzungen

3.1 Gruppenunterschiede zum ersten Erhebungszeitpunkt

3.2 Eingangsvoraussetzungen der Bezugsgruppe Lesekompetenz

3.3 Eingangsvoraussetzungen der Bezugsgruppe Geschlecht

3.4 Eingangsvoraussetzungen der Bezugsgruppe Deutsch als Erst-/Zweitsprache

4 Effekte des sprachsensiblen Geographieunterrichts

4.1 Treatmenteffekte auf das Fachwissen

4.2 Treatmenteffekte auf die Fachsprache

4.3 Treatmenteffekte auf die Selbsteinschätzung

5 Bezugsgruppenspezifische Treatmenteffekte

5.1 Bezugsgruppenspezifische Treatmenteffekte auf das Fachwissen

5.2 Bezugsgruppenspezifische Treatmenteffekte auf die Fachsprache

5.3 Bezugsgruppenspezifische Treatmenteffekte auf die Selbsteinschätzung

6 Beständigkeit der Treatmenteffekte

6.1 Beständigkeit der Treatmenteffekte auf das Fachwissen

6.2 Beständigkeit der Treatmenteffekte auf die Fachsprache

6.3 Beständigkeit der Treatmenteffekte auf die Selbsteinschätzung

Author information

Authors and Affiliations

Corresponding author

Rights and permissions

Copyright information

About this chapter

Cite this chapter

Download citation

Share this chapter

Publish with us

Search

Navigation