1 Einleitung

Da der Rolle von Lehrkräften eine große Bedeutung für die Leistung eines Bildungssystems zukommt (vgl. Kunter et al. 2011), wird deren Aus- und Weiterbildung oft als der zentrale Baustein zur Verbesserung von Bildungs- und insbesondere Unterrichtsprozessen benannt (Böttcher und Liesegang 2009). In den letzten Jahren wurden in diesem Zusammenhang die Erforschung und Entwicklung erfolgversprechender Fortbildungsformate in Verbindung mit geeigneten Evaluationsinstrumenten verstärkt in den Fokus genommen (z. B. Yoon et al. 2007). Nach Lipowsky (2010) lassen sich vier zentrale Ebenen unterscheiden, die die Wirksamkeit von Lehrerfortbildungen betreffen. Grundlage und Zielperspektive der Wirksamkeitsforschungen, die auf der zweiten, hier relevanten Ebene (Erweiterung der Lehrerkognitionen) beschrieben werden, sind dabei theoretisch-empirische Annahmen über die Dimensionen professioneller Kompetenz (Kompetenzmodelle, z. B. bei Blömeke 2010). Bis dato vorhandene Zugänge zur Erfassung der darin enthaltenen Lehrerüberzeugungen (im englischsprachigen Raum beliefs) erscheinen für einen praktikablen Einsatz im Rahmen zeitlich kompakter Lehrerfortbildungen jedoch allesamt nur bedingt geeignet, da diese oftmals kaum zur Teilnahme motivieren und insbesondere der zeitliche Aufwand, der mit dem Einsatz dieser Methoden verbunden ist, vor den beteiligten Lehrpersonen kaum zu rechtfertigen ist. Günstig wären deshalb ökonomische und möglichst computergestützte Erfassungsinstrumente, die eine Erhebung von Lehrerüberzeugungen idealerweise vor und nach der eigentlichen Lehrerfortbildung am heimischen PC ermöglichten. Der hier vorgestellte Beitrag versteht sich als erster Versuch, ein derartiges Erfassungsinstrument für das Fach Mathematik auf Basis des sogenannten Q‑Sort-Verfahrens in die Weiterbildungs- und Fortbildungsdiskussion einzubringen. Ausgangspunkt hierfür war die Entwicklung und Evaluation einer zweistufigen Lehrerfortbildung mit dazwischenliegender Praxisphase zur Unterrichtsplanung für Erarbeitungsphasen. Diese zielte neben einer Weiterentwicklung des professionellen Wissens und Könnens auch auf eine Veränderung der mathematikunterrichtsbezogenen Überzeugungen der teilnehmenden Lehrkräfte.

2 Theoretischer Rahmen und Ableitung der Forschungsfrage

2.1 Überzeugungen von Mathematiklehrkräften

Kunter et al. definieren auf Basis aktueller Übersichtsartikel Lehrerüberzeugungen allgemein „als überdauernde existenzielle Annahmen über Phänomene oder Objekte der Welt, die subjektiv für wahr gehalten werden, sowohl implizite als auch explizite Anteile besitzen und die Art der Begegnung mit der Welt beeinflussen“ (Kunter et al. 2011, S. 236). Überzeugungen von Mathematiklehrkräften können auf unterschiedliche Art und Weise ausdifferenziert werden (Kunter et al. 2011; Leder et al. 2002; Ambrose et al. 2003), wobei für die dargestellte Untersuchung in erster Linie die mathematikunterrichtsbezogenen Überzeugungen der Lehrkräfte, also ihre epistemologische Überzeugung über das mathematische Wissen und den mathematischen Wissenserwerb (Hofer und Pintrich 1997; Schommer 1990; Schoenfeld 1992) sowie ihre Einstellungen zum Lernen und Lehren von Mathematik (Kuhs und Ball 1986) interessant und relevant sind. Es lassen sich grob zwei unterschiedliche Leitvorstellungen der epistemologischen Überzeugungen identifizieren (Grigutsch et al. 1998; Staub und Stern 2002), nach denen Mathematik einerseits als statisches System und andererseits als dynamischer Prozess aufgefasst werden kann. Im Bereich des Lernens und Lehrens wiederum lassen sich eine eher lernerorientierte und eine eher fachorientierte Überzeugung unterscheiden. Lehrpersonen mit einer lernerorientierten Überzeugung betrachten Lernen als einen aktiven Konstruktionsprozess, während Lehrkräfte mit einer fachorientierten Überzeugung den Kern von Unterricht in einer Wissensvermittlung zum Zwecke der Reproduktion sehen. Unter Einbeziehung lerntheoretischer Überlegungen sowie empirischer Erkenntnisse integrieren Kunter et al. (2011, S. 238) beide Überzeugungsdimensionen auf einer höheren Ebene zu „transmissiven Orientierungen“ (transmission view) bzw. „konstruktivistischen Orientierungen“ (constructivist view).Footnote 1 Transmissiven Orientierungen liegen dabei behavioristische Lerntheorien zugrunde, in denen Mathematiklernen in erster Linie als eine Übermittlung von Wissenselementen an eher passive Rezipienten verstanden wird. Im Gegensatz dazu wird bei konstruktivistischen Lerntheorien davon ausgegangen, dass der Kern mathematischen Wissens in subjektiven Konstruktionsprozessen besteht und Lernen ein aktiver und an die Vorerfahrungen der Lernenden anschließender Vorgang ist.

2.2 Veränderbarkeit von Überzeugungen

Überzeugungen von Lehrkräften gelten gemeinhin als recht stabil und nur schwer veränderbar (vgl. Schommer-Aikins 2004; Blömeke 2008; Baumert und Kunter 2006). Auf der anderen Seite lassen sich aber offenbar sogar bei kurz- und mittelfristig angelegten Maßnahmen (Arbeit mit Lerntagebüchern, spezielle hochschuldidaktische Ansätze) Veränderungen bei den Überzeugungen nachweisen (Rösken et al. 2006; Bernack et al. 2011), so dass auch zeitlich befristete Interventionen mit entsprechenden Lerngelegenheiten durchaus das Potential zu haben scheinen, Veränderungen in den Beliefs von Lehrkräften zumindest anzubahnen. Es erscheint daher denkbar und erfolgversprechend, mathematikunterrichtsbezogene Überzeugungen auch durch Lehrerfortbildungen verändern zu wollen. Da die empirische mathematikdidaktische Forschung gezeigt hat, dass sich eine konstruktivistische Orientierung von Lehrkräften eher positiv auf die Unterrichtsqualität auswirkt (Kunter et al. 2011), besteht das perspektivische Ziel der Aus- und Weiterbildung von Mathematiklehrkräften aktuell in einer relativen Stärkung ihrer konstruktivistischen Orientierungen.

2.3 Erfassung von Überzeugungen

Bisherige Untersuchungen zur Bestimmung und Messung von Lehrerüberzeugungen bedienten sich in erster Linie der Methodiken extensiver Interviews (z. B. Baxter Magolda 2004), Likert-Skalen (z. B. Perry et al. 1999; Grigutsch et al. 1998; Baumert 2009), Vignetten (z. B. Ambrose et al. 2003), Interviews (z. B. King und Kitchener 2004), Papier-Bleistift-Tests (z. B. Schommer 1990) oder auch Bilder oder Lerntagebücher (z. B. Bulmer und Rolka 2005; Rolka et al. 2006). Für die Anwendung in zeitlich begrenzten Interventionen, wie etwa zweistufigen Lehrerfortbildungen mit dazwischenliegender Praxisphase, erscheinen diese Erfassungsinstrumente jedoch als allesamt unbefriedigend. Insbesondere der zeitliche Aufwand, der mit einer Erfassung verbunden ist, ist vor den an Fortbildungen beteiligten Lehrkräften nur schwer zu rechtfertigen, da diese Lehrerfortbildungen besuchen, um Impulse und Anregungen für die unterrichtliche Praxis zu erhalten und nicht, um mehrfach wenig motivierende Likert-Skalen abzuarbeiten oder Bilder zu ihren Mathematikvorstellungen zu zeichnen. Unter folgender Forschungsfrage stellt der Beitrag nun ein für die Zwecke der Lehrerfortbildung alternativen und computergestützten Zugang zur Erfassung der Relation zentraler mathematikunterrichtlicher Überzeugungen mithilfe einer sog. Q‑Sortierung (vgl. Abschn. 3) vor: Lässt sich das Q‑Sort-Verfahren einsetzen, um über eine Indexbildung eine mögliche Veränderung der Relation zwischen transmissiver und konstruktivistischer Orientierung von Mathematiklehrkräften erfolgversprechend zu erfassen?

Neben den eingangs genannten Problemen bei der Messung von Beliefs besteht ein weiteres darin, dass die von Personen geäußerten Überzeugungen auch widersprüchlich sein, sich gegenseitig beeinflussen und miteinander konkurrieren können (Reusser und Pauli 2014, S. 643). So zeigte beispielsweise Thompson (1984, S. 110) in ihrer Untersuchung, dass bei ein und derselben Person inkonsistente Beliefs über Mathematik auftreten können. Auch bei der Erfassung von Beliefs durch Likert-Skalen ist zu beobachten, dass einige Lehrkräfte sowohl konstruktivistischen wie auch transmissiven Items zustimmen (Grigutsch et al. 1998). Nachteilig wirkt sich bei dieser Form der Erhebung aus, dass die in den Statements artikulierten Aussagen von den Befragten unabhängig voneinander bewertet werden müssen. Die Statements „Im Mathematikunterricht werden Aufgaben durch das sichere Beherrschen von mathematischen Rechenroutinen gelöst“, und „Im Mathematikunterricht können Aufgaben und Probleme auf verschiedenen Wegen richtig gelöst werden“, sollen beispielsweise einmal eine transmissive und das andere Mal eine konstruktivistische Überzeugung zum Ausdruck bringen (vgl. Baumert 2009). Nun ist es aber denkbar und vor einem unterrichtspraktischen Hintergrund überaus plausibel, dass Mathematiklehrkräfte beide Aussagen als wichtig ansehen. In traditionellen Likert-Skalen (Grigutsch et al. 1998) würden diese Lehrpersonen somit auch beiden Aussagen zustimmen. In Bezug auf die Forschungsfrage und auf der Folie der Mathematikdidaktik ist es aber gerade wichtig zu erfahren, welches der beiden Statements Lehrkräfte in Relation zueinander favorisieren.

3 Q-Methode und Q‑Sortierung

In diesem Kapitel werden die Q‑Methode sowie das für diesen Beitrag zentrale Erhebungsverfahren, das sogenannte Q‑Sort-Verfahren, dargestellt.

Die Q‑Methode als Forschungsmethode führt in der deutschsprachigen Sozial- und Bildungsforschung bislang eher ein Schattendasein und ist vielen Forscherinnen und Forschern gänzlich unbekannt. Das Q‑Sort-Verfahren (Minsel und Heinz 1983, S. 135 ff.) ist die zentrale Anwendung der Q‑Methode (vgl. Coogan und Herrington 2011 für einen kompakten Überblick) und erlaubt es jeder Versuchsperson, individuelle Sichtweisen ausdrücken. Dies geschieht, indem unterschiedliche Aussagen (Statements) bzgl. eines interessierenden Konstrukts in eine vorab festgelegte Rangordnungsstruktur gebracht werden. Dabei müssen die Probanden die einzelnen Aussagen miteinander in Beziehung setzen und damit variabel gewichten, es entsteht eine sogenannte Q‑Sortierung (vgl. Abb. 1). Diese Q‑Sortierungen stellen im Rahmen der hier vorgestellten Indexbildung die Datenbasis dar.

Abb. 1
figure 1

Beispiel für eine Q‑Sortierung

In der hier dargestellten Untersuchung bekam jeder Proband sechzehn Aussagen über das Lehren und Lernen im Mathematikunterricht vorgelegt, die er entlang einer Skala von „geringste Zustimmung“ (−3) bis „höchste Zustimmung“ (+3) in Form eines erzwungenen Verteilungsverfahrens anordnen musste (vgl. Abb. 1). Die Befragung wurde mit der kostenfreien und zweistufigen Applikation „Q-sortware“ von Alessio Pruneddu (www.qsortouch.com) durchgeführt und dauerte bei den beteiligten Lehrkräften am heimischen PC zwischen fünf und zehn Minuten. Neben diesem erzwungenen Verteilungsverfahren können bei Q‑Sortierungen prinzipiell auch offene Verteilungsverfahren zum Einsatz kommen, die die Verteilung der Statements auf die Positionen (−3 bis +3) nicht vorgeben und damit keine relational-hierarchischen Entscheidungen erzwingen. Für die hier untersuchte Forschungsfrage eignet sich jedoch ein erzwungenes Verteilungsverfahren deutlich besser, da erst durch den Entscheidungsprozess, den das Sortieren der Items erzwingt und welches bei Likert-Skalen eben nicht gegeben ist, die eigenen Überzeugungen respektive Aussagen- und Überzeugungshierarchisierungen manifest werden (Brown 1993; Müller und Kals 2004). Die mündlichen Rückmeldungen der Lehrkräfte, die an der Befragung teilgenommen hatten, bestätigten in dem Zusammenhang, dass genau dieser Entscheidungsprozess als spannend erlebt und ein abwägend-hierarchisierendes Hinterfragen eigener Vorstellungen und Überzeugungen zum Mathematikunterricht provoziert wurde.

3.1 Auswahl und Konstruktion der Statements

Beim Q‑Sort-Verfahren ist die Auswahl bzw. Konstruktion der verwendeten Statements von erheblicher Bedeutung (Brown 1993; Minsel und Heinz 1983). Je nach Erkenntnisinteresse und insbesondere je nach Erkenntnisstand werden unterschiedliche Methoden und Quellen zur Erstellung eines Q‑samples (Ein Q‑sample ist die Bezeichnung für ein Set von Statements) verwendet. Müller und Kals (2004) unterscheiden dabei drei Arten von Q‑samples: 1. „naturalistic samples“, 2. „ready-made Q‑samples“ sowie 3. standardisierte Q‑samples. Während „naturalistic samples“ aus eher explorativen Datenquellen aus dem Alltagskontext der Befragten stammen, beziehen sich die hier verwendeten, „ready-made Q‑samples“ „bei der Itemauswahl auf Quellen, die nicht unmittelbar aus dem ‚Kommunikationskontext‘ der Befragten stammen, sondern z. B. aus anderen empirischen Studien oder bekannten Konzepten zum interessierenden Gegenstandsbereich übernommen werden. In diesem Fall spricht man auch von ‚quasi-naturalistic Q‑samples‘, da davon ausgegangen wird, dass die Statements mit großer Wahrscheinlichkeit den Lebenskontext der Probanden widerspiegeln“ (Müller und Kals 2004).

Standardisierte Q‑samples werden beispielsweise in der Differentialpsychologie eingesetzt, entstehen aus standardisierten Persönlichkeitstest und sind für die hier dargestellte Studie irrelevant.

Neben der Auswahl bzw. Konstruktion spielt für die Bewertung der Ergebnisse auch das Design von Q‑samples eine wichtige Rolle. So können diese entweder theoretisch strukturiert oder in stark explorativen Settings unstrukturiert sein. Theoretisch strukturiert bedeutet, dass bei der Auswahl der verschiedenen Aussagen bereits bekannte theoretisch-empirische Kategorien oder Dimensionen zugrunde gelegt werden. Um eine einseitige Itemauswahl zu vermeiden, wird dabei jede relevante Kategorie mit der gleichen Anzahl an Items besetzt.

Da der Gegenstandsbereich der mathematikunterrichtsbezogenen Überzeugungen bei Mathematiklehrkräften empirisch bereits gut erforscht und entsprechend konzeptualisiert ist, kann in dieser Untersuchung bei der Auswahl respektive Konstruktion der zum Einsatz kommenden Statements auf vorhandene Quellen zurückgegriffen werden (ready-made Q‑samples). Ausgehend von der im Theorieteil beschriebenen Konzeptualisierung mathematikunterrichtsbezogener Überzeugungen (Kunter et al. 2011) sowie dazu bereits existierender Operationalisierungen wurde das Q‑sample auf Basis theoretischer Annahmen strukturiert. So wurden acht Statements verwendet, die eher „transmissive Orientierungen“ (transmission view) beschreiben sowie acht Statements, die eher „konstruktivistische Orientierungen“ (constructivist view) zum Ausdruck bringen (vgl. Tab. 1). Damit wurde sichergestellt, dass die beiden theoretisch relevanten Dimensionen mit jeweils der gleichen Anzahl an Items besetzt sind. Die sechzehn Statements beinhalten sowohl epistemologische wie auch Überzeugungen zum Lehren und Lernen, stammen aus verschiedenen Likert-Skalen (vgl. Grigutsch et al. 1998; Kunter et al. 2011; Baumert 2009) und wurden für die hier dargestellte Untersuchung adaptiert (vgl. Müller und Kals 2004). Es kann damit Konstruktvalidität für die beiden relevanten Orientierungen angenommen werden. Die vorgenommene Adaption bezog sich im Wesentlichen auf eine sprachliche Vereinheitlichung der Statementformulierungen; jedes Statement beginnt nun mit den Worten: „Im Mathematikunterricht soll(t)en …“. Der Grund dieser Adaption war die Annahme, dass einheitliche Formulierungen auch das Gewicht der einzelnen Statements vereinheitlichen und daher von den Probanden alle Statements als potentiell „gleich wichtig“ angesehen werden.

Tab. 1 Beispielhafte Statements für die Q‑Sortierung

4 Versuch einer quantitativen Erfassung der Relation zwischen transmissiver und konstruktivistischer Orientierung

4.1 Mathematikbild-Index

In diesem Abschnitt wird versucht, auf Basis von Q‑Sortierungen einen sog. Mathematikbild-Index zu definieren, der eine Aussage darüber macht, ob sich die konstruktivistische Überzeugung bei Teilnehmerinnen und Teilnehmern einer Intervention (z. B. einer Lehrerfortbildung) in Relation zur transmissiven Überzeugung verändert hat. Perspektivisches Ziel ist es dabei, diesen Mathematikbild-Index sowohl für eine generelle und eher plakative Evaluation von mathematikunterrichtsbezogenen Überzeugungen im Rahmen von Lehrerfortbildungen einsetzen als auch bei Bedarf oder Interesse zügig „interessante“ Personen für mögliche Post-Interviews identifizieren zu können (vgl. Abschn. 4.2).

Die beiden Überzeugungsarten können nach aktueller Forschungslage (Kunter et al. 2011) als zwei inhaltlich tendenziell in sich abgeschlossene, stark negativ korrelierende Dimensionen aufgefasst werden. Das heißt aber nicht, dass beide Überzeugungsarten im Falle des konkreten Lehrerhandelns auch gleichstark wirksam sein müssen – im Gegenteil. Welche Überzeugungsdimension aktuell stärker ausgeprägt ist, hängt von vielfältigen Faktoren ab, z. B. dem Besuch einer Lehrerfortbildung. Bei der Konstruktion des Mathematikbild-Indexes wird im Folgenden davon ausgegangen, dass Lehrkräfte, deren konstruktivistische Überzeugung stärker ausgeprägt ist als die transmissive, konstruktivistische Statements insgesamt als bedeutsamer einschätzen als die Personen, bei denen die transmissive Überzeugung überwiegt. Weiter wird bei der Berechnung des Mathematikbild-Indexes angenommen, dass alle Statements einer Dimension prinzipiell gleichwertig sind, es also für die Relation beider Dimensionen unerheblich ist, in welcher Reihenfolge beispielsweise die acht Statements der transmissiven Überzeugung in die entsprechenden Slots einsortiert werden. Aus dieser letzten Annahme ergibt sich unmittelbar, dass verschiedene Q‑Sortierungen zum gleichen Mathematikbild-Index führen können. Außerdem wird antizipierbar, welch große Rolle vermutlich die Auswahl der Statements für den Wert des Indexes spielt.

Ob eine Lehrperson eine relativ stark konstruktivistische, eine relativ stark transmissive oder eine eher gemischte mathematikunterrichtsbezogene Überzeugung aufweist, wird insgesamt durch die Positionen der einzelnen Statements innerhalb der Q‑Sortierung determiniert. Aufgrund der Konstruktion der Q‑Sortierungen bedeutet eine Erhöhung der relativen Wichtigkeit konstruktivistischer Überzeugungen gleichzeitig eine Verringerung der relativen Wichtigkeit transmissiver Überzeugungen. Werden beispielsweise alle konstruktivistischen Statements als wichtiger erachtet als jedes transmissive Statement, so wird davon ausgegangen, dass bei der entsprechenden Person eine konstruktivistische Lehrerüberzeugung in Relation zu einer transmissiven dominiert. Die relative Gewichtung der beiden Überzeugungsdimensionen kann also erfasst werden, indem man die Positionen der einzelnen Statements innerhalb der Q‑Sortierung mit ihrer jeweiligen Statement-Kategorie (konstruktivistisch vs. transmissiv) verknüpft. Ordnet man jedem transmissiven Statement den Wert (−1) und jedem konstruktivistischen Statement den Wert (+1) zu, nummeriert außerdem die Spalten der Q‑Sortierung von 1 bis 7 durch (wobei die Spalte 7 die Spalte mit der höchsten Zustimmung ist) und verknüpft schließlich jedes Statement mit seiner Position in der Q‑Sortierung, so lässt sich durch die folgende Festlegung ein eindimensionaler Mathematikbild-Index I definieren:

$$I=\sum _{n=1}^{8}S_{kn}-\left \lceil \sum _{n=1}^{8}S_{tn}\right \rceil$$
S kn :

= Spaltennummer des n-ten konstruktivistischen Statements mit n ∈ {1, 2, 3, 4, 5, 6, 7, 8}

S tn :

= Spaltennummer des n-ten transmissiven Statements mit n ∈ {1, 2, 3, 4, 5, 6, 7, 8}

Der Mathematikbild-Index gibt an, wie stark die konstruktivistische Überzeugung in Relation zur transmissiven Überzeugung auf Grundlage der hier verwendeten Operationalisierung (Statementauswahl) ist. Eine Erhöhung des Mathematikbild-Indexes bedeutet damit, dass die konstruktivistische Überzeugung in Relation zur transmissiven jetzt subjektiv stärker ausgeprägt ist als vorher. Es sei in diesem Zusammenhang nochmals darauf hingewiesen, dass die absolute „Stärke“ beider Dimensionen bei dieser Vorgehensweise nicht bestimmt werden kann, sondern lediglich die Relation beider Dimensionen zueinander auf Grundlage der hier gewählten Statements (Operationalisierung). Möglich sind demnach Aussagen in dieser Form: Die subjektive Gewichtung transmissiver Aussagen zum Mathematikunterricht hat im Vergleich zu konstruktivistischen Aussagen bei Person A zu- oder abgenommen.

Die einzelnen Items (= Kärtchen) der Q‑Sort-Methode sind statistisch abhängig, d. h. wenn eine Person alle konstruktivistischen Items hoch zustimmend einordnet, dann kann sie die transmissiven Items aufgrund der erzwungenen Verteilung gar nicht mehr hoch zustimmend einordnen – jede Person muss sich also in einem Selbstreflexionsprozess entscheiden, welche der beiden Überzeugungen subjektiv als „wichtiger“ angesehen wird. Auf diese Weise kann die relative Stärke der beiden Überzeugungsarten zueinander festgestellt werden. Problematisch ist diese Vorgehensweise bei Personen, die keine großen Unterschiede zwischen transmissiven und konstruktivistischen Überzeugungen aufweisen. Hier könnte nämlich der theoretische Fall eintreten, dass durch das Erhebungsinstrument eine Relation erzwungen wird, die so in Wirklichkeit gar nicht vorhanden ist. Da die beiden Überzeugungsarten durch jeweils acht verschiedene Items operationalisiert werden, ist in diesem Fall aber vermutlich eher davon auszugehen, dass sich Positionen der transmissiven und konstruktivistischen Items in etwa ausgleichen.

Für die Interpretierbarkeit und statistische Auswertbarkeit ist die Frage wichtig, ob davon ausgegangen werden kann, dass der Mathematikbild-Index intervallskaliert ist. Dagegen spricht, dass es sich beim Q‑Sort-Verfahren um eine Sortieraufgabe handelt und sich die Lehrkräfte entsprechend der Idee des Verfahrens vermutlich vornehmlich daran orientieren, wie sie die Items im Verhältnis zueinander empfinden. Items könnten also nach der Anordnung im oberen Bereich sehr nahe beieinander und im unteren Bereich sehr weit auseinanderliegen. Die erzwungene Anordnung gibt der Person aber keine Möglichkeit, dies auszudrücken. Es wird aufgrund dieser Überlegungen davon ausgegangen, dass die entstehenden Daten ordinalskaliert sind.

Zur Berechnung des Index wird jedem Statement in Abhängigkeit seiner Position in der Q‑Sortierung ein Wert zugeordnet. Die Werte sämtlicher Statements werden im Anschluss addiert und bilden den Index I. Für ein transmissives Statement beispielsweise, das sich in der sechsten Spalte befindet (also relativ große Wichtigkeit erfährt) ergibt sich somit ein Wert von (–1) · 6 = –6. Die Wertespanne des Index reicht von −20 bis +20, wobei die Extremwerte jeweils dann erreicht werden, wenn beispielsweise alle transmissiven Statements in den „hohen“ Spalten eingetragen werden.

4.2 Anwendung des Mathematikbild-Indexes im Rahmen einer Lehrerfortbildung

Im Rahmen einer zweistufigen Lehrerfortbildung mit dazwischenliegender Praxisphase zur Unterrichtsplanung für Erarbeitungsphasen wurde der entwickelte Index im Jahr 2016 eingesetzt. Ziel der Fortbildung war dabei u. a. die Weiterentwicklung der mathematikunterrichtsbezogenen Überzeugungen (Grigutsch et al. 1998) der beteiligten Lehrkräfte in Richtung konstruktivistisch-orientierter Lehrerüberzeugungen. Die zehn (von sechzehn) sich beteiligenden Mathematiklehrkräfte der Sekundarstufe I haben dabei die identischen Q‑Sortierungen (vgl. Abb. 1) einmal vor der ersten und einmal nach der zweiten Präsenzveranstaltung generiert. Das nachfolgende Diagramm zeigt die Ergebnisse.

Es lässt sich erkennen, dass es bei sieben der zehn befragten Lehrkräften zu einer Erhöhung und bei einer Person zu einer Verringerung des Mathematikbild-Indexes gekommen ist. Der durchschnittliche Mathematikbild-Index ist von 8,0 auf 12,2 gestiegen. Zwei Personen zeigten keine Veränderung. Aufgrund des relativ geringen Stichprobenumfangs und der Annahme ordinalverteilter Daten wurde entschieden, zur statistischen Prüfung der Gleichheit der zentralen Tendenzen nicht den t‑Test sondern den nichtparametrischen Vorzeichenrangtest von Wilcoxon für gepaarte Stichproben zu verwenden (Bortz et al. 2008, S. 259–267). Dieser lieferte das Ergebnis, dass der Mathematikbild-Index nach der zweiten Präsenzveranstaltung signifikant (α = 5 %) höher ist als vor der ersten Präsenzveranstaltung. Die Berechnung von Cohens d ergibt einen Wert von d = 0,63, was nach den Konventionen von Cohen einem mittleren Effekt entspricht. Die Lehrerfortbildung scheint somit offenbar dazu beigetragen zu haben, dass die relative „Stärke“ der konstruktivistischen Lehr-Lern-Überzeugung bei der Mehrheit der beteiligten Lehrkräfte zugenommen hat. Einschränkend muss hier darauf hingewiesen werden, dass sich nicht alle angeschriebenen sechzehn Lehrkräfte an der Befragung beteiligten und Verfälschungen durch soziale Erwünschtheit und andere Effekte naturgemäß nicht gänzlich ausgeschlossen werden können.

Abb. 2 bietet zusätzlich die methodische Chance, potentiell „interessante“ Kandidaten für ein evaluierendes und möglicherweise validitätssteigerndes Post-Interview zu ermitteln (vgl. Müller und Kals 2004). Unter der Voraussetzung bzw. der Annahme, dass die Testergebnisse nicht verfälscht sind, würde man hier vermutlich zunächst die Personen „L3“ (starke Zunahme), „L4“ (starke Abnahme) und „L8“ (keine Veränderung) bitten, sich für ein Post-Interview zur Verfügung zu stellen.

Abb. 2
figure 2

Veränderung des Mathematikbild-Indexes durch eine Lehrerfortbildung

5 Zusammenfassung und Diskussion

In vorliegenden Beitrag wurde versucht, das Erhebungsinstrument der Q‑Sortierung zu nutzen, um Veränderungen in der Relation zentraler mathematikunterrichtsbezogenen Überzeugungen bei Teilnehmerinnen und Teilnehmern einer Lehrerfortbildung praktikabel zu erfassen. Dabei weisen die Ergebnisse eines ersten Einsatzes im Rahmen einer Mathematik-Lehrerfortbildung (vgl. Abschn. 4.2) darauf hin, dass das Verfahren der Q‑Sortierung und der daraus konstruierte Mathematikbild-Index geeignet sein könnten, schnell und plakativ die Richtung mathematikunterrichtsbezogener Überzeugungsverschiebungen durch eine Lehrerfortbildung anzugeben. Um die Evidenz dieser Vermutung zu erhöhen, wäre es für potentielle Folgestudien wichtig und notwendig, die Kriteriumsvalidität durch Korrelation mit geeigneten Außenkriterien (z. B. etablierten Likert-Skalen, vgl. dazu z. B. Baumert (2009)) sowie die Evidenz der Ergebnisse durch den Einsatz einer Kontrollgruppe zu erhöhen. Erst positive Ergebnisse eines derartigen Vergleichs würden es letztlich erlauben, die Q‑Sort-Methode als geeignet zu begründen. Auch mit qualitativen Ergänzungsuntersuchungen (vgl. dazu z. B. Muis et al. 2014) könnte überprüft werden, ob sich Veränderungen des Mathematikbild-Indexes in der angenommenen Art und Weise inhaltlich begründen ließen. Für weitere Untersuchungen wären darüber hinaus eine Veränderung der Statementauswahl oder -konstruktion sowie eine Modifikation der Statementanzahl sehr spannend und interessant.

Als quantitatives Maß hat der hier eingesetzte Mathematikbild-Index naturgemäß nicht das Potential, Ursachen einer Überzeugungsentwicklung aufzuklären. Warum es nämlich zu einer Veränderung gekommen ist, kann durch den Index nicht geklärt werden. Hierzu bedarf es entweder einer qualitativen Herangehensweise, z. B. durch Interviews von an Fortbildungen beteiligter Lehrkräfte oder auch quantitativer Verfahren mittels größerer Stichproben.

Auch aus durchführungsökonomischen Gründen scheint die Erfassung mithilfe von Q‑Sortierungen für die Fortbildungsevaluation und das vorhandene Forschungssetting ein durchaus interessantes Instrument zu sein. Denn während andere Erfassungsmethoden teilweise zeitintensiv und kostspielig sind, lassen sich Q‑Sortierungen online und in wenigen Minuten erheben. Es geht somit keine wertvolle Fortbildungszeit durch langatmige und ermüdende Befragungen verloren. Darüber hinaus ist zu betonen, dass erfahrungsgemäß die Bearbeitung einer Q‑Sortierung für die Befragten wesentlich motivierender und spannender ist als das Ausfüllen einer Likert-Skala (Müller und Kals 2004; Fluckinger und Brodke 2013). Dies könnte auch dazu beitragen, dass die Bearbeitung von beteiligten Lehrkräften mit erhöhter Ernsthaftigkeit und Konzentration durchgeführt wird.

Im vorliegenden Fall einer zweistufigen Lehrerfortbildung im Fach Mathematik deuten die Ergebnisse darauf hin, dass es offenbar möglich zu sein scheint, mathematikunterrichtsbezogene Überzeugungen von Lehrkräften auch durch zeitlich eher weniger umfangreiche Interventionen zu modifizieren. Da Lehrerüberzeugungen grundsätzlich aber als schwer veränderbar gelten, ist sowohl hier als auch bei der Verwendung von Likert-Skalen stets kritisch zu hinterfragen, in welchem Ausmaß eine darstellbare Überzeugungsveränderung möglicherweise (auch) durch die verwendeten Aussagen (Statements) in Zusammenhang mit den Fortbildungsintentionen provoziert wird. Auf Basis dieser ersten Studie kann keine Aussage über die Nachhaltigkeit der festgestellten Überzeugungsveränderung gemacht werden. Denkbar wäre z. B., dass die Effekte der Lehrerfortbildung durch „ernüchternde“ Praxiserfahrungen schnell wieder nivelliert werden. Hier wären Studien mit einem Follow-up-Design notwendig.