Ausgehend von einer steigenden Anzahl an Schulabgängerinnen und -abgängern in Deutschland, die eine Hochschulzugangsberechtigung vorweisen können (Statistisches Bundesamt 2018), sehen sich viele Hochschulen mit der Herausforderung konfrontiert, dass die Anzahl der Studienbewerberinnen und -bewerber die Anzahl der freien Studienplätze bei weitem übersteigt. Hochschulen müssen daher vor Studienbeginn im Rahmen von Auswahlverfahren über Eignung und Zulassung der Studienbewerberinnen und -bewerber entscheiden (Konegen-Grenier 2018). Ziel universitärer Auswahlverfahren ist es dabei, diejenigen Personen für einen Studienplatz auszuwählen, die „am besten“ für diesen geeignet sind. „Am besten“ darf dabei nach einem Urteil des Bundesverfassungsgerichts vom Dezember 2017 jedoch nicht allein über die Hochschulzugangsberechtigungsnote definiert werden. Da neben institutionellen Rahmenbedingungen (Kleickmann und Anders 2013) insbesondere das individuelle Vorwissen die Entwicklung mathematischen Fachwissens von (angehenden) Lehrkräften bedingt (Kolter et al. 2018; Rach und Ufer 2020) und da so genannte „Studienfachbezogene KenntnistestsFootnote 1“ – die derartiges Fachwissen erfassen – nachweislich eine prognostische Validität für Studienerfolg besitzen sowie eine hohe Akzeptanz bei Bewerberinnen und Bewerbern auf ein Studium vorweisen (Stifterverband für die Deutsche Wissenschaft 2005), stellt die Erfassung mathematischen VorwissensFootnote 2 von Bewerberinnen und Bewerbern auf ein Mathematik-Lehramtsstudium ein mögliches, zusätzliches Auswahlinstrument für Universitäten dar. Im vorliegenden Beitrag sollen die Entwicklung und Güte eines solchen Testinstruments (sowie hiermit einhergehend Erkenntnisse bzgl. des Einsatzes dieses Tests in einem universitären Auswahlverfahren) vorgestellt und diskutiert werden. Hierzu werden zunächst (Abschn. 1) theoretische Vorüberlegungen zu universitären Auswahlverfahren sowie zu mathematischem (Vor‑)Wissen von (angehenden) Mathematik-Lehrkräften aufgezeigt und die sich aus diesen theoretischen Überlegungen ergebenden (Abschn. 2) Forschungsfragen explizit benannt. Hierauf aufbauend erfolgt (Abschn. 3) eine detaillierte Beschreibung des methodischen Vorgehens bei der Testentwicklung. Es schließt sich die (Abschn. 4) Darlegung zentraler Ergebnisse zur Beantwortung der Forschungsfragen an. Der Beitrag endet (Abschn. 5) mit einer kritischen Diskussion inklusive der Benennung von Limitationen und Implikationen für weiterführende Arbeiten.

1 Theorie

1.1 (Mathematisches) Fachwissen als Eignungskriterium in universitären Auswahlverfahren

Bereits im Jahr 1972 hat das Bundesverfassungsgericht in einem Grundsatzurteil entschieden, dass aus dem im Grundgesetz der Bundesrepublik Deutschland verankerten Recht auf freie Berufswahl generell auch ein allgemeines Recht auf Zulassung zum Studium folgt. Zwar impliziert diese Rechtsprechung nicht, dass allen Bewerberinnen und Bewerbern auf einen Studienplatz auch das Recht auf Zuteilung eines solchen zukommt, allerdings verpflichtet das Urteil die Universitäten, vorhandene Studienplatzkapazitäten auszuschöpfen und die Bewerberinnen und Bewerber nach „sachgerechten Kriterien“ auszuwählen (Schuler und Hell 2008). Unter derartigen „sachgerechte Kriterien“ dürfen Universitäten dabei nach einem erneuten Urteil des Bundesverfassungsgerichts vom Dezember 2017 nicht allein die Hochschulzugangsberechtigungsnote (im Folgenden HZB-Note) verstehen. Vielmehr müssen weitere Kriterien bei der Auswahl zur Zulassung herangezogen werden, die die zu erwartenden Anforderungen an einen Studiengang abbilden und die dementsprechend als Indikatoren für die Beschreibung der Eignung von Bewerberinnen und Bewerbern anzusehen sind. Wie aber könnten derartige Kriterien aussehen? Was bedeutet „Eignung“ mit Blick auf ein angestrebtes Lehramtsstudium? Mayr definiert die Eignung von Studienplatzinteressierten als „das Vorliegen jener Dispositionen und Kompetenzen, die es erwarten lassen, dass die Personen die Lehrerausbildung erfolgreich durchlaufen und auf Grundlage dieser Ausbildung den Lehrerberuf über längere Zeit kompetent und berufszufrieden ausüben und sich kontinuierlich im Beruf weiterentwickeln werden“ (Mayr 2012, S. 39). Eignung bedeutet entsprechend dieser Definition – auch auf Grund des besonderen Charakters eines Lehramtsstudiums, das wie nur wenige andere direkt auf einen spezifischen Beruf vorbereitet – beinahe zwangsläufig „mehr als Studieneignung“ (Mayr 2012, S. 39). Entsprechend gilt es, Eignung für ein Lehramtsstudium in universitären Auswahlverfahren sowohl über Prädiktoren für Studienerfolg als auch zusätzlich über Indikatoren für Berufserfolg zu erheben.

Studienerfolg wird dabei empirisch häufig über Zwischen- und Abschlussnoten operationalisiert (Berthold et al. 2015). Für den so gemessenen Studienerfolg ist fächerübergreifend die HZB-Note in vielen Studien einer der besten Prädiktoren (Heine et al. 2006; Robbins et al. 2004; Trapmann et al. 2007). Eine noch höhere oder mindestens ähnlich hohe prädiktive Validität (und auch inkrementelle Validität zusätzlich zur HZB-Note) kann jedoch ebenso über so genannte studienfachbezogene Kenntnistests – welche explizit fachspezifisches Vorwissen und nicht allgemeine Intelligenz erheben – erzielt werden (Hell et al. 2007; Schult et al. 2019; Tarazona 2006). Dies gilt insbesondere für mathematikspezifische Kenntnistests, die sich oft als sehr gute Prädiktoren für Studienerfolg sowohl im Mathematik(‑Lehramts‑)Studium (Hailikari et al. 2008; Kolter et al. 2018; Pustelnik 2018; Rach und Heinze 2017; Rach und Ufer 2020) als auch in verwandten Studiengängen mit hohem Mathematikanteil erweisen (Buschhüter et al. 2017; Greefrath et al. 2017; Laging und Voßkamp 2017; Müller et al. 2018). Hierüber hinaus bringt der Einsatz solcher Kenntnistests weitere Vorteile mit sich: Empirische Erkenntnisse über das mathematische Vorwissen von Studierenden zu Studienbeginn sind – neben einem Rückgriff auf diese in universitären Auswahlverfahren – auch für die Ausgestaltung von Lehrveranstaltungen von theoretischem und praktischem Interesse. Aufgrund des an Universitäten hochgradig kumulativen Aufbaus mathematischen Fachwissens und seiner deduktiven Begründung auf festgelegten Voraussetzungen bzw. Axiomen (z. B. Fischer et al. 2009; Hefendehl-Hebeker 2016) ist eine Klärung der fachlichen Voraussetzungen von Studienanfängerinnen und -anfängern für eine evidenzbasierte Qualitätsentwicklung universitärer Lehre essenziell. In der Hochschuldidaktik Mathematik gibt es entsprechend intensive Bemühungen, theoretisch und empirisch abgeleitete Mindeststandards zu definieren (z. B. Deeken et al. 2019; Dürr et al. 2016; Neumann et al. 2017), deren Erreichen bereits vor Studienbeginn durch Vor- oder Brückenkurse ermöglicht werden soll (z. B. Bausch et al. 2014; Biehler et al. 2018).

Unter Berufserfolg kann in Anlehnung an etablierte und empirisch geprüfte Modelle der „guten Lehrkraft“ vor allem eine Herausbildung von denjenigen spezifischen, professionellen Kompetenzen verstanden werden, die die Lehrkraft zum Experten werden lassen (vgl. Besser und Krauss 2009; Bromme 2008; Bromme und Haag 2008). Hierzu zählen insbesondere ein ausgeprägtes fachliches und fachdidaktisches Wissen, lernförderliche Überzeugungen und Werthaltungen, Selbstregulationsfähigkeiten sowie pädagogisches Interesse (Baumert und Kunter 2013). Eine Überprüfung bzw. Vorhersage der so verstandenen beruflichen Eignung bereits vor Studienbeginn stellt jedoch – insbesondere auf Grund der zentralen Idee des Expertenparadigmas der Lehrerinnen- und Lehrerforschung, dass sich manche Eignungsmerkmale erst im Laufe der Ausbildung entwickeln (siehe u. a. Krauss und Bruckmaier 2014) – eine nicht zu unterschätzende Herausforderung dar. Die wenigen existierenden Längsschnittstudien lassen dabei zunächst vermuten, dass kognitive Merkmale zu Studienbeginn (wie HZB-Note oder Intelligenz) für den späteren Berufserfolg (z. B. operationalisiert als pädagogische Handlungskompetenz) weniger bedeutsam sind als für den Studienerfolg. Vielmehr lässt sich der so gemessene Berufserfolg eher durch Studienwahlmotive, Interessen und Persönlichkeitsmerkmale vorhersagen (Hanfstingl und Mayr 2007; Wolf et al. 2018). Andererseits kommt gerade auch dem Fachwissen (neben dem fachdidaktischen Wissen) von Mathematiklehrkräften im Schuldienst empirisch nachweisbar eine entscheidende Rolle für das Gelingen von Mathematikunterricht und die Qualität mathematischer Lehr-Lern-Prozesse (als Operationalisierung von Berufserfolg) zu (Baumert et al. 2010; Hill et al. 2005; Kunter et al. 2013). Der Aufbau dieses Fachwissens wird entsprechend als elementares Ziel universitärer Lehrkräftebildung explizit von der Kultusministerkonferenz benannt (Kultusministerkonferenz 2008). Eine Operationalisierung und Erfassung derartigen Fachwissens – auch schon vor Studieneintritt – ist daher durchaus als Möglichkeit der Beschreibung von erwartbarem Berufserfolg zu verstehen (für konkrete Umsetzung einer solchen Operationalisierung/Erfassung siehe unten).

Zusammenfassend kann konstatiert werden: Mathematisches Fachwissen ist als wichtiger Prädikator für Erfolg im mathematikhaltigen Lehramtsstudium und Lehrerinnen- und Lehrerberuf anzusehen. Empirische Kenntnisse über dieses Wissen stellen aufgrund des kumulativen Aufbaus universitärer Mathematik hierüber hinaus eine essentielle Grundlage für die Gestaltungen von Lehrveranstaltungen an Hochschulen dar. Im Folgenden soll aufgezeigt werden, welche Arten von mathematischem Fachwissen sowohl mit Bezug auf das Hochschulstudium selbst als auch mit Bezug auf die spätere Berufsausübung dabei zentral erscheinen (d. h.: in Studien theoretisch/empirisch operationalisiert und entsprechend als Voraussetzung für Studien- und Berufserfolg angesehen werden).

1.2 Erfassung mathematischen Vorwissens von Mathematik-(Lehramts‑)Studierenden

Angesprochene Kenntnistests zur Erfassung mathematischen Fachwissens zu Studienbeginn operationalisieren dieses auf Grundlage unterschiedlicher theoretischer Überlegungen dazu, welches mathematische Vorwissen als notwendig zur Bewältigung der jeweiligen Studiengänge angesehen wird. In der Regel haben diese Kenntnistests jedoch gemein, dass sie sich mit Schulwissen bearbeiten lassen. Die getesteten Inhaltsbereiche umfassen entsprechend oftmals Wissen über Termumformungen, Gleichungen und Ungleichungen, elementare Funktionen, Trigonometrie sowie Vektorrechnung, Differenzial- und Integralrechnung (z. B. Buschhüter et al. 2017; Greefrath et al. 2017; Laging und Voßkamp 2017; Müller et al. 2018; Pustelnik 2018). Inhaltsbereiche außerhalb der Analysis oder linearen Algebra, wie z. B. Elementargeometrie oder elementare Stochastik, sind dagegen kaum vertreten. Die Tests fokussieren dabei häufig (bewusst) auf symbolisches, formales und technisches Arbeiten. Prozessbezogene Tätigkeiten wie bspw. Problemlösen (Hailikari et al. 2008) oder, in Antizipation von Herausforderungen der Hochschulmathematik, etwa das Arbeiten mit Definitionen und Beweisen (Rach und Heinze 2017) werden hingegen selten erfasst. Zentral ist hierüber hinaus, dass vor allem inhaltlich breit angelegte Tests bzgl. späterem Studienerfolg als prädiktiv valide anzusehen sind: So korreliert bspw. Pustelniks Gesamttest mit den späteren universitären Klausurnoten höher als die einzelnen getesteten Inhaltsbereiche dies tun (Pustelnik 2018).

Die in der Operationalisierung der Kenntnistests erfolgende Fokussierung auf genannte mathematische Inhaltsbereiche werden durch aktuelle Diskussionen über Mindeststandards für ein universitäres Mathematikstudium – in Teilen – zunächst empirisch gestützt (Deeken et al. 2019; Dürr et al. 2016; Neumann et al. 2017). So liefert insbesondere die Befragung von 664 Hochschullehrenden, die in den Jahren 2012–2015 Mathematikvorlesungen im ersten Semester eines MINT-Studiums angeboten haben, als zentrales Ergebnis, dass MINT-Studierende zu Studienbeginn zuallererst über gesichertes mathematisches Fachwissen der Sekundarstufe I verfügen sollten: „Die Mehrzahl der identifizierten Lernvoraussetzungen ist dem Bereich ‚Mathematische Inhalte‘ zuzuordnen. Dabei fallen insbesondere Aspekte mathematischer Grundlagen, d. h. Inhalte der Sekundarstufe I, auf, zu denen […] die meisten Lernvoraussetzungen genannt wurden“ (Neumann et al. 2017, S. 17). Bemerkenswert ist hierüber hinaus jedoch ergänzend, dass neben dem symbolischen, formalen und technischen Arbeiten explizit auch solche mathematischen Arbeitstätigkeiten zum Umgang mit jenen Inhalten von den Studienanfängerinnen und -anfängern eingefordert werden, die sich auch in den Bildungsstandards für den Mittleren Schulabschluss als dort benannte „prozessbezogene Kompetenzen“ wiederfinden (wie z. B. Argumentieren, Kommunizieren, Problemlösen oder Modellieren), die aber in den genannten Mathematiktests kaum operationalisiert werden (Deeken et al. 2019; Dürr et al. 2016; Neumann et al. 2017):

Typische mathematische Arbeitstätigkeiten, die als notwendige Lernvoraussetzungen genannt wurden, bezogen sich neben grundlegenden Tätigkeiten auf das Argumentieren und Beweisen, Kommunizieren, Definieren, Problemlösen, Modellieren sowie auf Recherche. Wie bei den Lernvoraussetzungen aus dem Bereich mathematischer Inhalte umfassen die Lernvoraussetzungen zu mathematischen Arbeitstätigkeiten wesentliche Aspekte der nationalen Bildungsstandards für Mathematik (Neumann et al. 2017, S. 23).

Die hier für mathematikhaltige Studiengänge im Allgemeinen empirisch identifizierten und eingeforderten Inhaltsbereiche der Sekundarstufe I sowie zugehörige Arbeitstätigkeiten finden sich (teils) auch in länderspezifischen „Anforderungskatalogen“ für die Aufnahme eines mathematikhaltigen Hochschulstudiums (COSH 2014; Niedersächsisches Kultusministerium und Niedersächsisches Ministerium für Wissenschaft und Kultur 2019). Bei der Operationalisierung eines fachspezifischen Kenntnistests auf diese mathematischen Inhalte und Arbeitstätigkeiten der Sekundarstufe I zur Beschreibung der Studieneignung zurückzugreifen, erscheint entsprechend dieser Kataloge sowie obiger Überlegungen naheliegend. Insbesondere für Mathematik-Lehramtsstudiengänge im Speziellen kommt einer derartigen Fokussierung in fachspezifischen Kenntnistests hierüber hinaus jedoch explizit eine besondere Bedeutung zu, die sich unmittelbar aus der gegebenen (und im Vergleich zu nicht lehramtsspezifischen Mathematikstudiengängen teils größeren) Nähe von Veranstaltungsinhalten zu Inhalten der Sekundarstufe I ergibt und die sich entsprechend in einer gemeinsamen Empfehlung von DMV, GDM und MNU zu Standards für die Lehrerbildung im Fach Mathematik (DMV et al. 2008) explizit widerspiegelt: So sollen Mathematik-Lehramtsstudierenden bspw. Gesetze der Grundrechenarten anwenden (Arithmetik; mathematisch technisch arbeiten), Eigenschaften ebener Figuren beschreiben (Geometrie; mathematisch kommunizieren) und funktionale Zusammenhänge in außermathematischen Situationen erläutern (Analysis; mathematisch modellieren) können. Auch auf diesen Empfehlungen basierend beschreiben daher die von der Kultusministerkonferenz verabschiedeten Standards für die Lehrerbildung in Deutschland u. a. solche inhaltlichen Anforderungen an die Ausgestaltung von Lehrveranstaltungen im Fach Mathematik im Lehramtsstudium, die für Lehrämter beider Sekundarstufen eine direkte thematische Überschneidung mit Inhalten der Sekundarstufe I deutlich werden lassen (Kultusministerkonferenz 2008). Konkret und exemplarisch ausformuliert bzw. umgesetzt am Beispiel der Fachveranstaltungen des Mathematik-Lehramtsstudiengangs „Lehren und Lernen“ für Grund‑, Haupt- und Realschulen an der Leuphana Universität Lüneburg (für die der in diesem Beitrag beschriebenen fachspezifische Kenntnistest hauptsächlich entwickelt wird) bedeutet dies, dass in den zentralen Modulen u. a. folgende Inhaltsbereiche der Sekundarstufe I abgedeckt werden: „Arithmetik als Prozess“ (Stellenwertsysteme, Figurierte Zahlen und Folgen, Beweisverfahren in der Arithmetik, Teilbarkeitslehre, Relationen, Algebraische Strukturen, Historisches zu Zahlsystemen), „Elementargeometrie“ (Kongruenz‑, Ähnlichkeits- und Abbildungsgeometrie, Satzgruppe des Pythagoras, besondere Punkte und Linien in der Ebene, Längen‑, Flächen- und Volumina-Bestimmungen, Geometrie des Raumes) und „Elementarmathematik vertiefen“ (Teilbarkeitslehre, Primzahlen und andere besondere Zahlen, Euklidischer Algorithmus, Restklassenringe, lineare Kongruenzen, Grundzüge zahlentheoretisch basierter Verschlüsselungsverfahren, Vertiefung der Kenntnisse zu Folgen, ausgewählte Funktionsklassen und deren Eigenschaften, Verknüpfungen von Funktionen, Relationen, sowie Elemente der Differential- und Integralrechnung: Grenzwert, Stetigkeit, Differenzierbarkeit, Integralbegriff)Footnote 3.

1.3 Erfassung mathematischen Fachwissens von Mathematik-Lehrkräften

Bei der Operationalisierung von Fachwissen für Lehrkräfte wird unter diesem – auch in den beiden im deutschsprachigen Raum sehr einflussreichen Studien COACTIV (z. B. Krauss et al. 2008b) und TEDS‑M (z. B. Buchholtz et al. 2013; Döhrmann et al. 2012) bzw. der entsprechenden Vorläuferstudie MT21 (z. B. Blömeke et al. 2008) – oftmals primär ein eindimensionales Konstrukt verstanden (welches theoretisch und empirisch begründet wird). Dieses orientiert sich dabei (bewusst) nur bedingt an universitärem akademischem Fachwissen, welches entsprechend der Studiengangausgestaltung im Laufe eines Mathematik-Lehramtsstudiums aufgebaut werden soll. Dass für eine Beschreibung von Entwicklungsverläufen im Studium evtl. andere theoretische Modelle des Fachwissens von Mathematik-Lehramtsstudierenden notwendig sind, diskutieren entsprechend aktuelle Arbeiten zu einem „differenzierten Modell des fachspezifischen Professionswissens von angehenden Mathematiklehrkräften“ (Dreher et al. 2018; Heinze et al. 2016). Dennoch: Trotz dieser eindimensionalen Modellierung des Fachwissens von (angehenden) Mathematiklehrkräften in COACTIV und TEDS‑M (bzw. MT21) ist diesen Ansätzen – ebenso wie dem Ansatz von Heinze und Kolleginnen und Kollegen sowie den oben diskutierten Ansätzen für Tests der Hochschulen – gemein, dass auch das mathematische Fachwissen von (angehenden) Lehrkräften auf jeweils projektspezifische Art mathematisches Schulfachwissen umfasst. Dies zeigt sich sowohl in der theoretischen Ausformulierung der Konstrukte selbst als auch in der Operationalisierung von Testaufgaben und in Ergebnissen der Studien:

Theorie

In COACTIV wird unter mathematischem Fachwissen ein „tieferes Verständnis der Fachinhalte des Curriculums der Sekundarstufe“, jedoch explizit kein universitäres Fachwissen verstanden (Krauss et al. 2011, S. 142). In TEDS‑M versteht man unter Fachwissen „a knowledge that comprises school mathematics, but goes beyond it“ (Buchholtz et al. 2013, S. 108). Und Heinze und Kolleginnen und Kollegen beziehen in ihre Beschreibungen des Fachwissens im schulischen Kontext zusätzlich zu akademischem Fachwissen auch explizit „knowledge about school mathematics“ ein (Dreher et al. 2018, S. 330).

Operationalisierung

In Abb. 1 sind beispielhaft je ein veröffentlichtes Item zur Erfassung und Beschreibung mathematischen Fachwissens in den Studien COACTIV und TEDS‑M sowie ein Beispielitem von Heinze und Kolleginnen und Kollegen gegeben. Die auch in den theoretischen Beschreibungen des Konstrukts deutlich herausgestellten Bezüge zur Schulmathematik der Sekundarstufe I werden auch hier ersichtlich bzw. – noch expliziter ausgedrückt – sind offensichtlich gegeben (COACTIV: „Unendlicher Dezimalbruch“; TEDS-M: „Matchsticks“; Heinze und Kolleginnen und Kollegen: „Senkrechtstehen zweier Geraden“).

Abb. 1
figure 1

Beispielaufgaben zur Operationalisierung mathematischen Fachwissens. (Für Originale siehe COACTIV (Krauss et al. 2008b, S. 235), TEDS‑M (Döhrmann et al. 2012, S. 331) sowie Heinze und Kolleginnen und Kollegen (Hoth et al. 2020, S. 346))

Ergebnisse

Der Kenntnistest in COACTIV wurde auch bei Schülerinnen und Schülern der Jahrgangsstufe 13 eingesetzt. Zwar schnitten diese hier signifikant schlechter ab als etwa Mathematik-Lehramtsstudierende, dennoch konnten auch jene ohne universitäre Ausbildung und somit allein auf der Basis schulbezogenen mathematischen Fachwissens einzelne Aufgaben des Kenntnistests erfolgreich bearbeiten (Krauss et al. 2008a). Ebenso sind in MT21 sowie bei Heinze und Kolleginnen und Kollegen Studierende zu Beginn des Studiums (also vor Antritt der Lehramtsausbildung) in der Lage, den dort administrierten mathematischen Kenntnistest zu bearbeiten – in MT21 erreichen sie hierbei jedoch nicht das Niveau von Studierenden am Ende des Studiums (Blömeke et al. 2008), bei Heinze und Kolleginnen und Kollegen zeigen sich keine Unterschiede zwischen Studierenden zu Beginn des ersten und dritten Fachsemesters (Hoth et al. 2020).

1.4 Testentwicklung zur Erfassung mathematischen Vorwissens in einem universitären Auswahlverfahren

Wie aufgezeigt, kommt in der Diskussion um Studien- und Berufserfolg von (angehenden) Mathematik-Lehramtsstudierenden dem fachlichen (Vor‑)Wissen eine zentrale Rolle zu. Mit Blick auf die hochschuldidaktische Diskussion zu Eingangsvoraussetzungen liegt der Fokus dabei oftmals insbesondere auf einem derart fundierten Fachwissen über die Inhalte der Sekundarstufe I, welches ein routiniertes Arbeiten mit symbolischen, formalen und technischen Elementen ermöglicht. Hochschuldozierende selbst fordern jedoch zusätzlich solche Arbeitstätigkeiten von Studienanfängerinnen und -anfängern ein, die als prozessbezogene Kompetenzen in den Bildungsstandards verankert sind. Und auch für Berufserfolg gilt: Für (angehende) Mathematiklehrkräfte ist die Beherrschung des mathematischen Schulstoffs der Sekundarstufe I ein elementarer Bestandteil professionellen Wissens. Entsprechend sind mathematische Inhalte und Arbeitstätigkeiten der Sekundarstufe I eine wesentliche Grundlage vieler (wenn nicht gar (fast) aller) universitärer Mathematikveranstaltungen, länderspezifische Anforderungen zum Übergang von der Schule zur Hochschule sowie Standards für die universitäre Lehrkräftebildung im Fach Mathematik greifen diese Inhalte und Arbeitstätigkeiten explizit auf, insbesondere in Lehramtsstudiengängen für Grund‑, Haupt- und Realschulen (GHR) – aber auch hierüber hinaus – werden sie gezielt adressiert und vertieft.

Ausgehend von diesen Überlegungen sowie der durch das Urteil des Bundesverfassungsgerichts geschaffenen Notwendigkeit der Erfassung von „studiengangspezifischer Eignung für ein Hochschulstudium“ wurde im Rahmen der im Folgenden vorgestellten Studie ein fachspezifischer Kenntnistest zur Erfassung mathematischen Vorwissens von Bewerberinnen und Bewerbern auf ein Mathematik-Lehramtsstudium entwickelt und empirisch erprobt (sowie in gekürzter Form in einem universitären Auswahlverfahren eingesetzt). Die Entwicklung des Testinstruments basierte dabei im Wesentlichen auf drei zentralen, theoretischen Überlegungen (siehe oben): Erstens sollte der Kenntnistest auf mathematische Inhaltsbereiche und Arbeitstätigkeiten der Sekundarstufe I referieren. Diese Inhaltsbereiche und Arbeitstätigkeiten werden von Hochschuldozierenden in großer Übereinstimmung als wesentliche Voraussetzungen für ein Mathematik-Lehramtsstudium angesehen (Neumann et al. 2017) und sind auch mit Blick auf die inhaltliche Ausgestaltung von Lehramtsstudiengängen ein wesentlicher Teil der Schnittmenge der für die späteren Lehrveranstaltungen relevanten Themengebiete (Kultusministerkonferenz 2008). Zweitens sollten diese Inhaltsbereiche und Arbeitstätigkeiten in möglichst großer Breite abgebildet werden. Hierzu orientiert sich die Testentwicklung am Kompetenzmodell der Bildungsstandards für den mittleren Schulabschluss (Kultusministerkonferenz 2003) mit dem Ziel, zu jeder der fünf Leitideen (Zahl; Messen; Raum und Form; Funktionaler Zusammenhang; Daten und Zufall) jede der prozessbezogenen Kompetenzen (argumentieren; Probleme mathematisch lösen; modellieren; mathematische Darstellungen verwenden; mit symbolischen, formalen und technischen Elementen der Mathematik umgehen; kommunizieren) zu operationalisieren.Footnote 4 Im Einklang mit aufgezeigter hochschuldidaktischer Diskussion (Deeken et al. 2019; Dürr et al. 2016; Neumann et al. 2017) sollen hierbei vermehrt Items zur prozessbezogenen Kompetenz „mit symbolischen, formalen und technischen Elementen der Mathematik umgehen“ erstellt werden. Drittens sollten die Aufgaben – aus rein methodischen Gründen, die Anforderungen an ein hochgradig standardisiertes Messverfahren wie einem Auswahlverfahren mitbringen (siehe bspw. Rost 2004) – derart konzipiert sein, dass eine objektive und zeitlich unmittelbare Auswertung gewährleistet werden kann.

Abb. 2
figure 2

Beispielitems des neu entwickelten Mathematiktests

Im Rahmen der Testentwicklung wurden insgesamt 84 voneinander unabhängige Einzelitems als Paper-Pencil-Items im geschlossenen Antwortformat (Single-Choice oder Complex-Multiple-Choice) entwickelt, die aus theoretischer Sicht (Expertinnen- und Expertenvalidierung mit in den Normierungsprozess der Bildungsstandards involvierten Mathematikdidaktikerinnen und -didaktikern) über sämtliche inhaltsbezogene und prozessbezogene Kompetenzen streuen (siehe Tab. 1 für die Verteilung der Items sowie Abb. 2 für vier Beispielitems, die exemplarisch die inhaltliche und prozessbezogene Breite des Instruments erkennen lassen). Die durch die Aufgaben abgebildeten Themengebiete umfassen u. a. Termumformungen, Gleichungen und Ungleichungen, elementare Funktionen, Trigonometrie, Flächen- und Volumenberechnungen, Prozentrechnung, Kombinatorik sowie Elemente elementarer Geometrie und Stochastik. Die Aufgaben bilden damit ein breiteres Inhalts- und Tätigkeitsspektrum als die meisten existierenden Tests ab, die hauptsächlich auf technisches Arbeiten im Bereich der Analysis und lineare Algebra fokussieren.

Tab. 1 Verteilung der entwickelten und erprobtem Items

2 Forschungsfragen

Mit Blick auf den entwickelten mathematikspezifischen Kenntnistest (und dessen Einsatz im Auswahlverfahren) sollen in diesem Beitrag die folgenden Forschungsfragen diskutiert werden (die sich empirisch auf Population I (Studierende) und Population II (Bewerberinnen und Bewerber auf ein Mathematik-Lehramtsstudium) stützen – siehe im Detail unten):

Forschungsfrage 1 (Interne Testgüte)

Welche empirische Qualität weist der entwickelte mathematikspezifische Kenntnistest bei Probandinnen und Probanden mit vorliegender Hochschulzugangsberechtigung auf?

Insbesondere stellen sich folgende Teilfragen:

1.1

Lässt sich das durch den Test in der Breite der Bildungsstandards operationalisierte mathematische Fachwissen bei Probandinnen und Probanden mit vorliegender Hochschulzugangsberechtigung eindimensional reliabel erfassen (Population I)?

1.2

Ermöglicht der Test trotz Fokussierung auf Schulmathematik der Sekundarstufe I eine Leistungsdifferenzierung zwischen Probandinnen und Probanden mit vorliegender Hochschulzugangsberechtigung? D. h. vor allem: Wie sind die empirischen Itemschwierigkeiten der Testaufgaben (Population I) und die durch den Test erfassten Personenfähigkeiten (Population I und II) verteilt?

Forschungsfrage 2 (Konstruktvalidität)

Stellt der Einsatz des mathematikspezifischen Kenntnistests einen echten Mehrwert für ein Auswahlverfahren dar?

Insbesondere stellen sich folgende Teilfragen:

2.1

Inwieweit korreliert das so gemessene mathematische Fachwissen mit einfacher zu erhebenden Konstrukten wie HZB-Note, letzter Mathematiknote oder kognitiven Fähigkeiten? Inwieweit lässt sich das mathematische Fachwissen durch diese Konstrukte erklären (Population I)?

2.2

Ist der Test einerseits vergleichbar mit anderen mathematikspezifischen Kenntnistests, die auf der Basis theoretischer Kompetenzmodelle schulbezogenes Fachwissen der Sekundarstufe I erfassen? Und deckt der Test dabei zeitgleich andererseits ein breiteres Leistungsspektrum (d. h.: eine größere Spannweite bzgl. empirisch messbarer minimaler und maximaler Leistung) zur Beschreibung mathematischen Vorwissens bei Probandinnen und Probanden mit vorliegender Hochschulzugangsberechtigung ab, als dies jene Kenntnistests ermöglichen (Population I)?

3 Methode

Aufgaben des entwickelten mathematikspezifischen Kenntnistests wurden von insgesamt 947 Probandinnen und Probanden mit vorliegender Hochschulzugangsberechtigung sowohl im Rahmen der Testentwicklung (Population I) als auch im Rahmen eines universitären Auswahlverfahrens (Population II) bearbeitet. Konkret ergibt sich der im Folgenden beschriebene methodischer Rahmen für diese beiden Populationen.

3.1 Testentwicklung (Population I)

3.1.1 Stichprobe

In den Jahren 2015 bis 2018 haben insgesamt 654 Studierende (523 weiblich, 129 männlich, 2 ohne Angaben) verschiedener Universitätsstandorte (Berlin, Braunschweig und Lüneburg) an Erhebungen zur Erprobung des neu entwickelten mathematikspezifischen Kenntnistests teilgenommen (im Projektverbund Recruiting, Assessment, Support gefördert durch die deutsche Telekom-Stiftung; Projektleitung: T. Ehmke und D. Leiss; Fördernummer: Hs-08-03.8; im Projekt PROKOM gefördert durch den Forschungsservice der Leuphana Universität Lüneburg; Projektleitung: M. Besser). 545 Teilnehmerinnen bzw. Teilnehmer sind Studierende eines Lehramtsstudienganges, 348 hiervon belegen das Studienfach Mathematik. Die Studierenden haben freiwillig an den Erhebungen teilgenommen.

3.1.2 Erhebung

Die 84 entwickelten Items des mathematikspezifischen Kenntnistests wurden im Multi-Matrix-Design in insgesamt 15 verschiedenen Testheftversionen mit rotierenden Aufgabenblöcken, innerhalb welcher die Aufgabenreihenfolge konstant war, administriert. Die Erhebungen waren als „Speed Tests“ mit beschränkter Bearbeitungszeit konzipiert, diese dauerten (je nach Anzahl neu erprobter Aufgaben in den jeweiligen Teilerhebungen) zwischen 90 und 120 min. Die mittlere theoretisch veranschlagte Bearbeitungszeit der Einzelitems beträgt 3 min. Hilfsmittel (wie z. B. Taschenrechner) waren bei der Bearbeitung nicht zulässig. Das Überspringen und Zurückblättern innerhalb eines Testhefts war möglich.

Ergänzend zu den neu entwickelten Aufgaben wurden im Rahmen der Testentwicklung folgende Informationen erhoben: Alter, Fachsemester, Hochschulsemester, HZB-Note, letzte Zeugnisnote im Fach Mathematik und – allerdings nur im Jahr 2018 bei insgesamt 381 Probandinnen und Probanden – die allgemeinen kognitiven Fähigkeiten über den figuralen Testteil des „KFT 12 + R“ (Heller und Perleth 2000). Außerdem wurden in einzelnen Testheftversionen 8 veröffentlichte Items der Bildungsstandards für den Mittleren Schulabschluss sowie 11 veröffentlichte PISA-Items administriert, deren empirischen Kennwerte und zugehörige Kodieranweisungen öffentlich zugänglich sind.

3.1.3 Auswertung

Sämtliche Antworten zu den entwickelten Aufgaben wurden dichotom gescored (0 = nicht korrekt; 1 = korrekt) und im Anschluss in zwei aufeinander aufbauenden Skalierungsdurchläufen zur Berücksichtigung unterschiedlicher Güte so genannter „missings“ eindimensional Rasch-skaliert (siehe hierzu u. a. auch Jordan und Duchhardt 2013; OECD 2017).

Durchlauf 1

Zur Bestimmung der Itemkennwerte und Testgütekriterien werden sämtliche „Endmissings“ (Aufgaben am Ende eines Testhefts, die nicht mehr bearbeitet wurden; oft auch als „not reached“ bezeichnet) tatsächlich als fehlende Werte im Sinne von „nicht administriert“ (und entsprechend nicht als falsch bearbeitete Aufgaben) behandelt. Als Ergebnis dieser Skalierung erhält man für jedes Item die mittlere empirische Itemschwierigkeit, Trennschärfe und Weighted Meansquare (WMNSQ). Items mit Trennschärfe unter 0,20 oder WMNSQ kleiner 0,80 bzw. größer 1,20 gelten als psychometrisch unzureichende Items (Bond und Fox 2015; Bortz und Döring 2006).

Durchlauf 2

In einem zweiten Durchlauf werden zunächst sämtliche empirisch schlechte Items aus Durchlauf 1 entfernt. Die aus Durchgang 1 erhaltenen Itemschwierigkeiten werden nun gesetzt, „Endmissings“ im Sinne eines Speed-Tests bekommen den Score 0 (entspricht: nicht erfolgreich bearbeitet). Als Ergebnis erhält man für jeden einzelnen Probanden einen individuellen Fähigkeitswert.

Dieses Vorgehen wurde insgesamt für zwei verschiedene Skalierungen durchgeführt: (Skalierung 1) Eindimensionale Skalierung mit den 84 neu entwickelten Aufgaben. (Skalierung 2) Eindimensionale Skalierung aller guten Items aus Skalierung 1 zuzüglich 8 Bildungsstandard-Items (kurz: BISTA-Items) sowie 11 PISA-Items. Bereits hier muss in diesem Zusammenhang herausgestellt werden: Ein Rückgriff auf die bekannten empirischen Schwierigkeitswerte der BISTA- und PISA-Items ist innerhalb der hier vorliegenden Stichprobe nicht möglich (dies liefert empirisch inakzeptable Itemkennwerte für diese Aufgaben). Bedingt wird dies jedoch nicht durch die Tatsache, dass die BISTA-Items und PISA-Items per se zu leicht seien, vielmehr stimmen die Reihungen der empirischen Itemschwierigkeiten innerhalb der vorliegenden Population nicht mit Reihungen von BISTA und PISA überein (ein Beispiel hierfür ist in Abb. 3 gegeben – in PISA ist dies innerhalb der PISA-Items eines der empirisch eher schweren Items mit einem Logit-Wert von 1,12, in der vorliegenden Stichprobe ist dies innerhalb der PISA-Items ein eher leichtes Item mit Logit-Wert von −1,25).

Abb. 3
figure 3

PISA-Item „Internet Chat 2“. (Für Original siehe Bundesinstitut BIFIE des österreichischen Schulwesens o.J., S. 32-33)

3.2 Auswahlverfahren (Population II)

3.2.1 Stichprobe

Seit dem Jahr 2017 können diejenigen Bewerberinnen und Bewerber auf ein Mathematik-Lehramtsstudium, die nicht direkt über gesetzlich vorgeschriebene Mindestquoten zum Studium zugelassen werden (bspw. müssen nach Niedersächsischem Hochschulzulassungsgesetzt Bewerberinnen und Bewerber teilweise auf Grund von Wartezeiten zugelassen werden), am Auswahlverfahren der Leuphana Universität Lüneburg aktiv teilnehmen. In diesem Rahmen können die Bewerberinnen und Bewerber auch einen Sub-Test des mathematikspezifischen Kenntnistests (Dauer: 45 min) bearbeiten. Im Jahr 2017 haben N = 137 Bewerberinnen und Bewerber (102 weiblich, 34 männlich, 1 ohne Angabe), im Jahr 2018 haben N = 156 Bewerberinnen und Bewerber (121 weiblich, 33 männlich, 2 ohne Angabe) an diesen Sub-Test des mathematikspezifischen Kenntnistests teilgenommen.

3.2.2 Erhebung

Im Auswahlverfahren werden jeweils 16 Einzelaufgaben des mathematikspezifischen Kenntnistests administriert. Auf der Basis der empirischen Ergebnisse der Testentwicklung (Population I) soll dieser studienfachbezogene Kenntnistest sowohl über eine gleichbleibende mittlere Schwierigkeit als auch über eine vergleichbare Streuung der Anforderungen in der Breite verfügen. Ebenso sollen möglichst verschiedene inhaltsbezogene und prozessbezogene Kompetenzen sowie alle Anforderungsbereiche abgedeckt werden (wobei bei 16 Einzelitems hier natürlich bzgl. der Variabilität offensichtlich Grenzen gesetzt und offensichtlich nicht stets alle Kriterien in vollem Umfang berücksichtigt werden können). Hilfsmittel bei der Bearbeitung (z. B. Taschenrechner) sind auch in diesem Kontext nicht zulässig. Das Überspringen und Zurückblättern ist hingegen ebenfalls möglich.

3.2.3 Auswertung

Auch die 16 im Auswahlverfahren eingesetzten Aufgaben wurden jeweils dichotom kodiert und im Anschluss Rasch-skaliert. Hierbei wurden die aus der Testentwicklung (Population I) bekannten Itemschwierigkeiten (aus Skalierung 1) als bekannt gesetzt, „Endmissings“ entsprechend unmittelbar als 0 (= nicht korrekt) gescored.

4 Ergebnisse

4.1 Interne Testgüte (Population I)

Die eindimensionale Skalierung des mathematikspezifischen Kenntnistests (Skalierung 1) liefert im ersten Skalierungsdurchlauf zunächst das Ergebnis, dass 77 von 84 Items als empirisch gut anzusehen sind, die EAP-Reliabilität beträgt 0,68 und ist insbesondere auf Grund der inhaltlichen Breite als akzeptabel zu bezeichnen. Die Itemschwierigkeiten variieren dabei von sehr leicht bis sehr schwer (siehe für eine Gesamtübersicht zu zentralen Itemkennwerten auch Tab. 5 im Anhang). Als Ergebnis des zweiten Skalierungsdurchlaufs streuen die Personenparameter über das gesamte, durch die Items abgebildete Schwierigkeitsspektrum und sind normalverteilt (siehe Abb. 4 für die Verteilung von Itemschwierigkeiten und Personenfähigkeiten der Skalierungsergebnisse beider Durchläufe). Decken- oder Bodeneffekte zeigen sich nicht. Die mittlere Personenfähigkeit über die Gesamtpopulation der Testentwicklung (N = 654) beträgt M = −0,01 (SD = 1,04), die empirischen Extrema betragen MIN = −4,17 bzw. MAX = 3,36 (für alle deskriptiven Werte siehe Tab. 2).

Abb. 4
figure 4

Verteilung der Probandenfähigkeiten und Itemparameter für die beiden Skalierungen der Population I (a Skalierung 1; b Skalierung 2) (N Neues Item, B BISTA-Item, P PISA-Item)

Tab. 2 Deskriptive Werte, Population I

4.2 Interne Testgüte (Population II)

Aufbauend auf dieser eindimensionalen Skalierung bilden die 16 im Auswahlverfahren eingesetzten Einzelaufgaben einen Subtest mit einer mittleren Itemschwierigkeit von MST2017 = 0,52 (SDST2017 = 0,90) im Jahr 2017 und MST2018 = 0,45 (SDST2018 = 1,21) im Jahr 2018. Auf manifester Ebene erzielen die Bewerberinnen und Bewerber in diesen Subtests im Mittel MBew2017 = 8,20 Punkte (SDBew2017 = 2,85 Punkte) bzw. MBew2018 = 8,08 Punkte (SDBew2018 = 2,80 Punkte) von jeweils maximal möglichen 16 Punkten. Das empirische Minimum liegt bei MINBew2017 = 3 Punkten bzw. MINBew2018 = 2 Punkten, das empirische Maximum beträgt MAXBew2017 = 15 Punkte bzw. MAXBew2018 = 14 Punkte (siehe auch Abb. 5 für die Verteilung der erzielten Punkte). Bei Verankerung auf der eindimensionalen Skalierung des Gesamttests (Population I, Skalierung 1) unterscheiden sich die Bewerberinnen und Bewerber auf ein Mathematik-Lehramtsstudium im Mittel signifikant positiv von der Population I (2017: t (789) = 6,12; p < 0,001; 2018: t (808) = 5,72; p < 0,001; siehe auch Abb. 6 für die Verteilungen der Personenparameter bei festgesetzten Itemkennwerten). In der Population der Bewerberinnen und Bewerber auf ein Mathematik-Lehramtsstudium betragen die mittleren Personenfähigkeitswerte 0,58 (SD = 0,92) im Jahr 2017 bzw. 0,52 (SD = 0,94) im Jahr 2018. Decken- oder Bodeneffekte zeigen sich jedoch auch hier offensichtlich nicht.

Abb. 5
figure 5

Verteilung der Testleistungen von Population II im Auswahlverfahren 2017 (a) und 2018 (b) (x‑Achse Anzahl korrekt bearbeiteter Aufgaben, y‑Achse Anzahl der Bewerberinnen und Bewerber)

Abb. 6
figure 6

Verteilung der Personenparameter für die Skalierungen des Auswahlverfahrens (Population II; a Verfahren 2017; b Verfahren 2018) (Items in Testheftreihenfolge durchnummeriert)

4.3 Konstruktvalidität (Population I)

Die Leistung im mathematikspezifischen Kenntnistest korreliert leicht negativ mit dem Alter (r = −0,18) und der HZB-Note (im klassischen Notenformat: 1 = sehr gut, 6 = ungenügend; r = −0,16) sowie leicht bis mittel positiv mit der letzten Zeugnisnote (im Punkteformat) im Fach Mathematik (r = 0,26), den kognitiven Fähigkeiten (r = 0,34), dem Fachsemester (r = 0,09) sowie dem Hochschulsemester (r = 0,11). Sämtliche Korrelationen sind mindestens auf dem Niveau p < 0,05 signifikant (für sämtliche Korrelationen siehe Tab. 3). Eine Regressionsanalyse mit der Leistung im mathematikspezifischen Kenntnistest als abhängiger Variablen und Alter, Hochschulsemester, Fachsemester, HZB-Note, Mathematiknote sowie kognitiven Fähigkeiten als unabhängigen Variablen zeigt bei „Vorwärts-Selektion“ (die Residuen der abhängigen Variablen sind normalverteilt mit Erwartungswert 0, Multikollinearität der unabhängigen Variablen liegt nicht vor (Toleranz >0,1; VIF <10)): Die meiste Varianz (etwa 18 %) wird durch ein Modell mit den unabhängigen Variablen kognitive Fähigkeiten, Mathematiknote und HZB-Note aufgeklärt (F (3; 342) = 26,43; p < 0,001; n = 343; siehe auch Tab. 4). Dies entspricht einer nach Cohen mittleren Effektstärke von f2 = 0,22.

Tab. 3 Korrelationen
Tab. 4 Regressionsanalysen (abhängige Variable: Leistung im mathematikspezifischen Kenntnistest)

Die eindimensionale Skalierung mit den BISTA-Items und PISA-Items als Referenztests (Skalierung 2) liefert nach Durchlauf 2 (je 2 BISTA- und PISA-Items mussten nach Durchlauf 1 entfernt werden, da diese empirisch nicht „funktionieren“): Die EAP-Reliabilität beträgt 0,73 und ist ebenso wie die Kennwerte aller Items als gut zu bezeichnen, die Itemschwierigkeiten der BISTA- und PISA-Items erstrecken sich auf den Bereich von −2,92 bis 0,36 (siehe Tab. 5 im Anhang und Abb. 4). Der neu entwickelte mathematikspezifische Kenntnistest lässt sich somit auf einer gemeinsamen, eindimensionalen Skala zusammen mit anderen, auf vergleichbaren bzw. identischen theoretischen Kompetenzmodellen beruhenden Items empirisch abbilden. Die Korrelation beider Skalierungen spiegelt dies ebenfalls wider (r = 0,96). Die Itemschwierigkeiten des neu entwickelten Tests gehen dabei jedoch in der Zielpopulation über diejenigen der BISTA- und PISA-Items hinaus. Insgesamt ist durch den entwickelten mathematikspezifischen Kenntnistest somit einerseits ein zu BISTA und PISA-Tests vergleichbares Konstrukt gegeben, andererseits wird durch dieses ein größeres Leistungsspektrum (d. h.: eine größere Spannweite bzgl. empirisch messbarer minimaler und maximaler Leistung) als durch die BISTA- und PISA-Items erfasst, indem insbesondere auch im Vergleich zu BISTA bzw. PISA stärkere Leistungen abgebildet werden können (hierbei gilt es insbesondere zu bedenken, dass die BISTA- und PISA-Items im Original wiederum praktisch das gesamte, empirisch mögliche Leistungsspektrum von BISTA und PISA abdecken).

5 Diskussion

Im vorliegenden Beitrag konnte aufgezeigt werden, dass die Operationalisierung und Erfassung schulbezogenen mathematischen Vorwissens, das alle inhalts- und prozessbezogenen Facetten des Modells der Bildungsstandards für den mittleren Schulabschluss umfasst, durch einen fachspezifischen – jedoch zunächst zu entwickelnden – Kenntnistest für Probandinnen und Probanden mit vorhandener Hochschulzugangsberechtigung gelingt: Der aus insgesamt 77 Items bestehende, neu entwickelte mathematikspezifische Kenntnistest weist in der zugrunde liegenden Population I von Studierenden – größtenteils bestehend aus angehenden Lehrkräften: 545 im Lehramtsstudium; 348 davon mit Studienfach Mathematik – eine akzeptable interne Konsistenz sowie eine theoretisch nachvollziehbare diskriminante Validität (vor allem mit Bezug auf HZB-Note, letzte Zeugnisnote im Fach Mathematik und kognitive Fähigkeiten) auf. Allgemeine kognitive Fähigkeiten und insbesondere die HZB- und letzte Mathematiknote erklären dabei relativ wenig Varianz des gemessenen mathematischen Fachwissens. Ähnliche Ergebnisse finden sich in studiengangübergreifenden Metastudien, die vergleichbare (wenn auch teils etwas höhere) Zusammenhänge von Leistungen von Bewerberinnen und Bewerbern in Kenntnistests vor Studienbeginn (in der Regel: ACT/SAT score) mit Schulleistungen im Allgemeinen (in der Regel: high school GPA; 0,24 < r < 0,49) sowie spezifischen Facetten von Intelligenz (bspw: reasoning; 0,28 < r < 0,59) aufzeigen (Galla et al. 2019; Richardson et al. 2012; Robbins et al. 2004). Auch der bei Rach und Heinze (2017) berichtete Zusammenhang von Schulleistungen im Fach Mathematik im Speziellen und mathematischem Vorwissen fällt etwas höher aus als hier (r = 0,43), was aber durchaus durch eine andere theoretische Konzeptualisierung dieses Vorwissens als in der vorliegenden Studie begründet sein mag (Vorwissen wird bei Rach und Heinze mit deutlich stärkerem Fokus auf „universitäre/akademische Mathematik“ verstanden). Insgesamt lassen sich die empirischen Ergebnisse jedoch theoriekonform verorten und sprechen als solche dafür, dass der Einsatz des mathematikspezifischen Kenntnistest auf Grund der gegebenen empirischen Zusammenhangsmaße einen echten inhaltlichen Mehrwert für universitäre Auswahlverfahren darstellen kann. Insbesondere eine empirische Analyse der prädiktiven Validität erscheint jedoch abschließend notwendig und steht in den nächsten Jahren an.

Obwohl der Kenntnistest ausschließlich mathematisches Fachwissen der Sekundarstufe I abfragt und mit den eingesetzten BISTA-Items und PISA-Items hoch korreliert, differenziert dieser deutlich bei Studierenden mit Hochschulzugangsberechtigung (Population I), es zeigen sich keine Deckeneffekte. Um eine inhaltliche Verortung der Testschwierigkeit zu ermöglichen: Im unteren und mittleren Schwierigkeitsbereich sind die Itemschwierigkeiten mit denjenigen von BISTA uns PISA vergleichbar, im oberen Schwierigkeitsbereich gehen diese jedoch über BISTA und PISA hinaus (für einen Überblick zu den theoretischen Konzeptionen, inhaltlichen Anforderungen und empirischen Kennwerten der Leistungstests siehe bspw. Stanat et al. (2019) bzw. Prenzel et al. (2013)). Und auch ein Einsatz einzelner Aufgaben in einem Sub-Test in einem universitären Auswahlverfahren bei Bewerberinnen und Bewerbern auf ein Mathematik-Lehramtsstudium in den Jahren 2017 und 2018 (Population II) zeigt ebenfalls, dass trotz erwartbarer maximaler Anstrengungsbereitschaft – die Bewerberinnen und Bewerber kommen extra zum Auswahlverfahren an die Universität, um die Chance auf Zuteilung eines Studienplatzes zu erhöhen – keineswegs Deckeneffekte auftreten. Dabei streuen die so erfassten Personenfähigkeitswerte zu schulbezogenem mathematischem Fachwissen bzgl. der Inhalte der Sekundarstufe I auch innerhalb dieser Population von dezidiert an einem Mathematik-Lehramtsstudium interessierten jungen Menschen über fast die komplette theoretisch mögliche Spannweite, wenn diese auch im Mittel im Vergleich zu Population I signifikant höher liegen. Dies mag verschiedene Gründe haben, naheliegend sind natürlich: Es liegt mit Bezug auf das Fach Mathematik und die Anstrengungsbereitschaft eine Positivselektion vor, welche im Vorfeld des Mathematiktests auch die Möglichkeit zur Vorbereitung auf diesen hat (Ziele und Inhalte des Tests werden auf der Homepage der Universität vor Durchführung des Auswahlverfahrens transparent dargestellt). Dass durch letzteres Testleistungen gesteigert werden können, gilt als weitestgehend gesichert (für einen aktuellen Übersichtsartikel hierzu siehe Flippo et al. 2018). Bezüglich der Bewertung der Güte eines Testinstruments und der Validität von Testergebnissen muss dies jedoch keineswegs negativ verstanden werden – mit Blick auf Anforderungen eines Testeinsatzes im Auswahlverfahren kann sogar positiv konstatiert werden: Mittels Vorbereitung auf eine spezifische Testsituation können durch den Aufbau von Kenntnissen über die Grundstruktur eines Testinstrument bspw. Ängste vor diesem abgebaut sowie hiermit einhergehend unzutreffend schlechte – da verfälschte – Testleistungen reduziert und die Belastbarkeit der Messung gesteigert werden (Crocker 2005; Messick 1982; Powers 2017).

Einige zentrale Limitationen der vorliegenden Studie sind bei der Interpretation der Ergebnisse abschließend explizit (noch einmal) zu benennen:

  1. 1.

    Während Population I zwar bzgl. ausgewählter, zentraler Variablen (HZB-Note, Alter, Geschlecht, Kognitive Fähigkeiten) breit streut, deckt diese allein Studierende von wenigen Universitätsstandorten und wenigen Studiengängen ab. Mit Blick auf die finale Zielpopulation (angehende Mathematik-Lehramtsstudierende der Leuphana Universität Lüneburg) erscheint diese Einengung im Rahmen einer Testentwicklung jedoch durchaus zielführend, soll der Test doch bspw. nicht bei angehenden Juristen oder Medizinerinnen und Medizinern eingesetzt werden.

  2. 2.

    Die Darstellung der erfassten Breite der Testergebnisse zum mathematischen Vorwissen in Population II (Auswahlverfahren) umfasst leider nicht diejenigen Bewerberinnen und Bewerber, die auf Grund der aktuellen Gesetzgebung direkt einen Studienplatz zugeteilt bekommen müssen (bspw. auch direkt über eine sehr gute HZB-Note). Die Beschreibung des durch den entwickelten Test erfassten mathematischen Vorwissens der Bewerberinnen und Bewerber mag daher einerseits leicht negativ verzerrt sein. Andererseits werden zum Auswahlverfahren bei weitem nicht alle Bewerberinnen und Bewerber eingeladen, insbesondere die laut HZB-Note schwächsten Bewerberinnen und Bewerber finden hier keine Berücksichtigung (die Einladung erfolgt etwa im Verhältnis 3:1 bzgl. freier Studienplätze in Rangreihung der HZB-Note). Alles in allem kann somit (allein) konstatiert werden, dass sich die beschriebene Testgüte für Population II – nach Abzug maximaler Sonder- und Vorabquoten – auf den Einsatz des Testinstruments bei Bewerberinnen und Bewerber auf etwa 70 % der verfügbaren Studienplätze bezieht.

  3. 3.

    Trotz durchgeführter Expertenvalidierung sowie vorhandener diskriminanter Validität muss vor allem bei der Betrachtung der manifesten Ergebnisse von Population II (Auswahlverfahren) deutlich herausgestellt werden, dass der studiengangspezifische Kenntnistest natürlich nicht den gesamten mathematischen Schulstoff erfasst und entsprechend auch nicht „das Vorwissen per se“ beschreibt. Wie immer gilt auch hier: Die empirischen Ergebnisse zum Vorwissen können nur im Rahmen der vorgenommenen Operationalisierung des Testinstruments erfolgen. Auf Grund der durchaus vorhandenen – und den Autorinnen und Autoren bewussten – Brisanz heißt dies insbesondere, dass der fälschlicherweise naheliegende Schluss, „Bewerberinnen und Bewerber auf ein Mathematik-Lehramtsstudium beherrschen noch nicht einmal den mathematischen Schulstoff“, nicht möglich (und natürlich nicht intendiert) ist.

Trotz dieser Limitationen zeigen die Ergebnisse von Population II deutlich (wenn auch nur exemplarisch für einen Universitätsstandort mit Lehramtsstudium für Grund‑, Haupt- und Realschulen sowie Berufliche Schulen), dass die Heterogenität des mathematischen Vorwissens von Bewerberinnen und Bewerbern auf ein Mathematik-Lehramtsstudium zu Studienbeginn sehr groß ist – und dass diese Heterogenität mittels eines wie vorgestellten Testinstrumente in gegebener Breite erfolgreich abgebildet werden kann. Es zeigt sich auch hier, dass keineswegs davon ausgegangen werden kann, dass der mathematische Schulstoff der Sekundarstufe I von allen Bewerberinnen und Bewerbern auf ein Mathematik-Lehramtsstudium (sowie entsprechend von allen später eingeschriebenen Mathematik-Lehramtsstudierenden) trotz vorliegender Hochschulzugangsberechtigung sicher beherrscht wird. Die Ergebnisse bestätigen eine für das Bundesland Schleswig-Holstein unter Schülerinnen und Schülern der 13. Jahrgangsstufe allgemeinbildender oder beruflicher Gymnasien repräsentative empirische Studie, dass junge Menschen kurz vor Erreichen der Hochschulzugangsberechtigung bzgl. mathematischen Wissens der Mittelstufe keineswegs uneingeschränkt den Optimalstandard (entsprechend der Definition der Bildungsstandards) erreichen (Kampa et al. 2018). Der Einsatz eines wie entwickelten fachspezifischen Kenntnistests zur Unterstützung von Universitäten bei der Auswahl von Bewerberinnen und Bewerbern erscheint somit auch auf Grund der heterogenen Wissensbasis eben dieser im Sinne des Urteils des Bundesverfassungsgerichts zielführend und gerecht. Neben dieser Funktion als Instrument zur Auswahl von Bewerberinnen und Bewerbern ist seine mögliche Funktion als Instrument zur Diagnose des mathematischen Wissensstands von Studienbewerberinnen und -bewerbern hervorzuheben. Diesbezüglich verdeutlichen die Ergebnisse letztlich einmal mehr die zwingende Notwendigkeit einer hochschuldidaktischen Auseinandersetzung mit universitären Unterstützungsformaten in Form von mathematischen Vor- und Brückenkursen, um Lücken im mathematischen Schulwissen auszugleichen und junge Menschen erfolgreich im Studium und damit in der professionellen Entwicklung zu unterstützen (Bausch et al. 2014).