Die Entwicklung, Überprüfung und Anwendung von Kompetenzmodellen und entsprechenden Messinstrumenten erfordern umfangreiche Ressourcen sowohl auf wissenschaftlicher als auch auf schulischer Seite. Der diesem Ressourcenbedarf gegenüberstehende wahrgenommene oder tatsächliche Nutzen hängt jedoch wesentlich vom jeweiligen Akteur bzw. von der jeweiligen Akteurin innerhalb des Bildungssystems und dessen Interessen beziehungsweise Handlungsnotwendigkeiten ab.

Zurzeit werden standardisierte und zyklisch stattfindende Kompetenzmessungen im deutschen Bildungssystem durchgeführt im Rahmen

  • flächendeckender einzelschulbezogener Lernstandserhebungen (Vergleichsarbeiten in den Jahrgangsstufen 3, 6 und 8, im Folgenden VERA-3, VERA-6 bzw. VERA-8),

  • der Überprüfungen des Erreichens der länderübergreifenden Bildungsstandards der Kultusministerkonferenz (kurz: Ländervergleich) sowie im Rahmen

  • internationaler Schulleistungsstudien (PISA, IGLU/PIRLS, TIMSS) auf Staatenebene.

Die Implementation dieses Systems schulextern vorgegebener Kompetenzfeststellungen beruht auf einer Gesamtstrategie der Kultusministerkonferenz (KMK) zum Bildungsmonitoring (KMK 2006). Die Sicherung und Entwicklung von Bildungsqualität sollte demnach durch eine Konzentration auf die Bildungserträge der Schüler/-innen, der Schulen und des schulischen Bildungssystems insgesamt erzielt werden und nicht mehr nur über die Modifikation von Lehrplänen, die Verbesserung der Lehrkräfteausbildung oder die Entwicklung und Erprobung neuer didaktischer Modelle. Das Kernstück dieser Strategie sind die in den Jahren 2003 und 2004 von der KMK verabschiedeten länderübergreifenden Bildungsstandards, die für alle Schulen als verbindlich festgelegt wurden.

Bildungsstandards stellen eine Spezifizierung allgemeinerer Bildungsziele dar und können als normative Kompetenzerwartungen an Schüler/-innen verstanden werden. Sie definieren, welche – auf Wissen und Kenntnissen fußenden – Fähigkeiten und Fertigkeiten zu verschiedenen Zeitpunkten der Schullaufbahn von den Lernenden entwickelt worden sein sollen. Der Kompetenzbegriff, so wie er in den Bildungsstandards und den aktuellen Schulleistungsuntersuchungen Verwendung findet, bezieht sich dabei auf ein relativ pragmatisches Verständnis: Kompetenzen werden als Fähigkeiten konzeptualisiert, die sich in konkreten Anforderungssituationen relativ „oberflächennah“ als ein Können manifestieren. In den KMK-Bildungsstandards zeigt sich dies in der durchgängigen Formulierung der Kompetenzerwartungen als Könnensbeschreibungen (Can-do-Statements), zum Beispiel: „Schülerinnen und Schüler können die Aussagen einfacher literarischer Texte verstehen“, und „in klar geschriebenen argumentativen Texten zu vertrauten Themen die wesentlichen Schlussfolgerungen erkennen, z. B. in Zeitungsartikeln“ (KMK 2004, S. 12). Die Kompetenzmodelle der KMK-Bildungsstandards, die auch den flächendeckenden Lernstandserhebungen zugrunde liegen, weisen einerseits domänenspezifische Kompetenzstrukturmodelle und andererseits Domänen übergreifende Kompetenzniveaumodelle mit derzeit fünf Stufen je fachbezogenem Standard auf. Die Kategorisierung von gemessenen Leistungsergebnissen als Niveaustufen wird normativ mit einem Standard etikettiert („unter Mindeststandard“, „Mindeststandard“, „Regelstandard“, „Regelstandard plus“, „Optimalstandard“; vgl. Pant et al. 2012).

Die Frage nach dem Nutzen der Kompetenzmodelle ist demnach eng verbunden mit der Frage, in welchem Umfang Kompetenzmodelle Funktionen im Rahmen des Bildungsmonitorings beziehungsweise des schulaufsichtlichen Rechenschaftswesens, der Unterrichts- und Schulentwicklung oder der individuellen Leistungsfeststellung und -beurteilung erfüllen sollen (Tab. 1; vgl. Pant et al. 2011). Selbst bei bestehenden Large-Scale-Untersuchungen gibt es wichtige Unterschiede hinsichtlich der jeweiligen Zielfunktion (Wozu sollen die Ergebnisse dienen?), der Aussage- oder Evaluationsebene (Wer wird evaluiert?) und der Bezugsnormorientierung (Woran orientiert sich die Beurteilung der Testergebnisse?).

Tab. 1: Vergleich der aktuell laufenden Large-Scale-Studien im Rahmen der Gesamtstrategie der KMK zum Bildungsmonitoring

1 Nutzen auf Systemebene

Auf systemischer Ebene besteht der Nutzen von Kompetenzmodellen darin, dass überhaupt ein einheitliches Referenzmodell zur Verfügung steht, auf das sich politische, fachdidaktische und schulpraktische Vertreter/-innen in einem langwierigen und kontroversen Prozess verständigen konnten und auf das sie sich in Folge konsistent beziehen können. Die psychometrische Umsetzung dieser Kompetenzmodelle in Kompetenzskalen mit einer einheitlichen Metrik ermöglicht es, dass Leistungsrückmeldungen an Lehrkräfte, Schulen, Schulverwaltungen und Bildungspolitik auf unterschiedlichsten Aggregatstufen in einer einheitlichen „Währung“ (Kompetenzpunkte bzw. Kompetenzstufen) erfolgen kann. Durch Linking-Studien wird die Metrik der nationalen Studien mit denjenigen der internationalen Schulleistungsstudien abgestimmt. Die inhaltliche und psychometrische Anbindung von VERA-3 und VERA-8 an das nationale und internationale Systemmonitoring wird dadurch gewährleistet, dass die Aufgabenentwicklung und Pilotierung für alle Studien „aus einer Hand“ erfolgt (vgl. Pant et al. 2011).

Die primäre Zielfunktion von Kompetenzmodellierung und Kompetenztestung aus systemischer Perspektive ist es, politisches oder bildungsadministratives Steuerungswissen zu generieren. Zwei Beispiele: Wößmann (2005, 2006) demonstriert das Nutzenpotenzial international vergleichender Kompetenzstudien (hier: TIMSS), indem er Effekte institutioneller Merkmale von Bildungssystemen, die innerhalb eines Bildungssystems nicht variieren, auf die Mathematikkompetenzen von Schülerinnen und Schülern untersucht. Er kommt auf Staatenebene unter anderem zu folgenden steuerungsrelevanten Aussagen: Schüler/-innen schneiden in Kompetenztests besser ab

  • in Ländern mit mehr Wettbewerb durch privat geleitete Schulen,

  • wenn rechtliche Rahmenbedingungen Schulen mit Autonomie in Prozess- und Personalentscheidungen ausstatten,

  • wenn Lehrkräfte sowohl Anreize als auch Möglichkeiten haben, angemessene Lehrmethoden auszuwählen,

  • wenn Schulen durch externe Prüfungen zur Verantwortung gezogen werden, und insbesondere

  • wenn externe Prüfungen und Schulautonomie kombiniert werden (vgl. Wößmann 2005, 2006).

Auch im ersten Ländervergleich zu sprachlichen Kompetenzen, der 2009 auf der Basis der Kompetenzmodelle der KMK-Bildungsstandards und des Gemeinsamen Europäischen Referenzrahmens für Sprachen durchgeführt wurde, zeigten sich massive Unterschiede in den Englischkompetenzen (Lese- und Hörverstehen) zwischen den alten und neuen Bundesländern, die in der Größenordnung von 1–1,5 Jahrgangsstufenäquivalenten liegen (vgl. Leucht et al. 2010). Als Konsequenz haben die neuen Länder politische Maßnahmenkataloge und konkrete Interventionen im Bereich der Fort- und Weiterbildung für Englischlehrkräfte konzipiert und mit erheblichen Ressourcen versehen.

2 Nutzen auf Schul- und Unterrichtsebene

In dem Ende 2009 verabschiedeten Beschluss der KMK zur Nutzung der Bildungsstandards für die Unterrichtsentwicklung (KMK 2010) wird bekräftigt, dass Leistungsrückmeldungen aus Vergleichsarbeiten als zentraler Bestandteil eines „datengestützten Entwicklungskreislaufs an einer Schule“ fungieren sollen (KMK 2010, S. 13).

Die zentralen pädagogischen Potenziale der Vergleichsarbeiten für Lehrkräfte und Schulen liegen, neben der durchgängigen Kompetenzorientierung von Testaufgaben, Ergebnisrückmeldungen und begleitenden didaktischen Kommentierungen, bei

  • dem „Blick von außen“, d. h. den multiplen Vergleichsmöglichkeiten zum Lernstand der eigenen Klasse,

  • dem Ausbau diagnostischer Kompetenzen bei Lehrkräften,

  • der Begründung und Planung pädagogischer Interventionen und Fördermaßnahmen,

  • der Nutzung der Leistungsrückmeldungen für kooperative Unterrichtsentwicklung im Kollegium.

2.1 Multiple Vergleichshorizonte

Landesweite Kompetenztests erlauben neben den sozialnormorientierten Vergleichen auch kriteriale Vergleiche. Die Leistungsrückmeldung kann dank der flächendeckenden Durchführung auf nahezu beliebiger Aggregatebene erfolgen. Dies ermöglicht beispielsweise Lehrkräften, den Lernstand ihrer Klasse mit dem von Parallelklassen, dem Schuldurchschnitt oder anderen regionalen Referenzgruppen zu vergleichen.

Jede Lehrkraft kann eine Standortbestimmung ihrer Klasse im Hinblick auf die vorab definierten Kompetenzziele der Bildungsstandards vornehmen. Je nach Kompetenzmodell können theoretisch fundierte Kompetenzprofile erstellt werden, die zum Beispiel auf Klassenebene eine spezifische Stärken-Schwächen-Analyse zulassen.

2.2 Ausbau und Optimierung diagnostischer Kompetenzen bei Lehrkräften

Kompetenztestungen erlauben es Lehrkräften, ihre eigene Diagnosefähigkeit zu prüfen und zu trainieren. Unter diagnostischer Kompetenz im engeren Sinne wird die Urteilsgenauigkeit verstanden, mit der Lehrkräfte Schülerleistungen einschätzen können (vgl. ausführlich Helmke 2009). Wird das Augenmerk nicht auf die Lernenden, sondern auf die Testaufgaben gelegt, dann zeigt sich hohe diagnostische Kompetenz in der korrekten Beurteilung der Schwierigkeit von Aufgaben, gemessen über die vorhergesagte beziehungsweise tatsächliche durchschnittliche Lösungshäufigkeit in der Klasse (vgl. Leucht et al. 2012).

2.3 Begründung pädagogischer Interventionen

Für die einzelne Lehrkraft eröffnet sich durch die Kenntnis des Stärken-Schwächen-Profils ihrer Klasse die Möglichkeit, differenzierte, zugeschnittene Fördermaßnahmen zu begründen und zu initiieren. Darüber hinaus können Lehrkräfte die diagnostische Information aus Kompetenztests als ein zusätzliches, jenseits eigener Bewertungsmuster erstelltes Datum in Elterngesprächen nutzen. Um entsprechend geeignete Fördermöglichkeiten zur Verfügung zu stellen, können Kompetenzmodelle in der fachdidaktischen Forschung zur Überprüfung der Effektivität von Interventionen eingesetzt werden.

2.4 Nutzung für Schulentwicklungsprozesse

Zu den praxisbezogenen Vorschlägen auf Schulebene zählen die Stärkung von Kommunikation und Kooperation bei der Reflexion von Rückmeldeergebnissen und der Entwicklung angemessener Fördermaßnahmen im Rahmen professioneller Lerngemeinschaften (vgl. Fishman et al. 2003). Als besonders geeignete Ebene gelten jahrgangsbezogene Fachgruppen beziehungsweise jahrgangsübergreifende Fachkonferenzen. Die Diskussion im Kollegenkreis von einer ersten Einschätzung und Analyse über die Codierung und Bewertung der Kompetenztest-Aufgaben bis zu den später bereitgestellten Rückmeldungen bietet zahlreiche Austauschgelegenheiten.

Bewährt haben sich die Analyse der Aufgaben und Fehlermuster aus methodisch-didaktischer Sicht und die Diskussion möglicher Fehlerursachen. Als Folgerungen sind unter anderem denkbar, in Parallelklassen wechselseitig zu hospitieren, Unterrichtsprojekte gemeinsam vorzubereiten, Materialien arbeitsteilig zu erstellen und auszutauschen oder gezielte Fortbildungen zu organisieren.

Die empirischen Befunde zum Rezeptionsverhalten von Lehrkräften (vgl. z. B. Maier 2008) zeigen jedoch, dass insgesamt noch erhebliche Forschungslücken hinsichtlich der Determinanten des Nutzungsverhaltens auf Kollegiumsebene existieren.

3 Nutzen für individualdiagnostische Zwecke

Weder die internationalen und nationalen Schulleistungsstudien noch die an allen Schulen durchgeführten Vergleichsarbeiten streben von ihrer Konzeption her individualdiagnostische Aussagen an. Dennoch werden in der Praxis individuelle Lernstandsrückmeldungen aus den Kompetenztestungen sowohl von Lehrkräften als auch von Eltern und den Lernenden selbst erwartet und eingefordert.

Das zentrale Argument gegen eine individualdiagnostische Nutzung wird darin gesehen, dass Schulleistungsstudien auf individueller Ebene keine reliablen diagnostischen Informationen liefern (vgl. Leutner et al. 2007). Diese Ungenauigkeiten in den Messungen individueller Lernstände können bei der Zuordnung einzelner Schüler/-innen zu den jeweiligen Kompetenzstufen zu Fehlklassifikationen führen (vgl. Ercikan und Julian 2002).

Insgesamt müsste ein auf Individualebene regelmäßig in Schulen einsetzbares Instrument Folgendes ermöglichen:

  1. a.

    Individualdiagnostische Aussagen,

  2. b.

    formative Evaluation, d. h. reliable und änderungssensitive Erfassung der Kompetenzentwicklung von Schülerinnen und Schülern innerhalb eines Schuljahres,

  3. c.

    selbst initiierte, einfache Anwendung und

  4. d.

    weitgehende „Hoheit“ über die erzeugten Ergebnisse beziehungsweise Ergebnisrückmeldungen (vgl. u. a. das in den Niederlanden existierende Modell für ein Schülermonitoring-System; Staphorsius und Krom 2008).

Im Bereich der (Fremd-)Sprachen existiert bereits für eine Reihe von Sprachen ein umfangreiches, auf Individualebene nutzbares System. Dieses besteht unter anderem aus

  • der klaren Beschreibung der Kompetenzen im Europäischen Referenzrahmen für Sprachen (Council of Europe 2001),

  • deren Integration in bildungspolitisch relevante Dokumente (z. B. KMK-Bildungsstandards für die erste Fremdsprache) und für den Lerner bzw. die Lernerin potenziell relevante gesellschaftliche Anforderungsprofile (z. B. Studienzugangsvoraussetzungen),

  • Selbst- bzw. Fremdeinschätzungsbögen in unterschiedlichen Detailgraden (z. B. http://europass.cedefop.europa.eu/LanguageSelfAssessmentGrid/en),

  • Portfoliovorlagen zur Dokumentation der Kompetenzentwicklung (z. B. http://www.sprachenportfolio.ch),

  • Testinstrumenten (z. B. http://diplomas.cervantes.es),

  • umfangreichen und abgestimmten Angeboten in Bezug auf Lernmaterialien (auch zum Selbststudium) und Kurse.

Gerade aufgrund der hohen Verfügbarkeit (z. B. Online-Versionen vergangener Prüfungen inkl. Lösungsschlüssel) ist dieses Modell damit nicht nur in Schulen, sondern vor allem auch von den Lernerinnen und Lernern selbst einsetzbar. Durch die mittlerweile hohe gesellschaftliche Anerkennung des Modells und der Testinstrumente wird gleichzeitig auch eine Einschätzungs- und Vergleichsmöglichkeit individueller Lerner/-innen geboten (z. B. im Rahmen von Job- oder Studienbewerbungen).

4 Fazit

Kompetenzmodelle weisen vielfältige Nutzungsmöglichkeiten auf. Ihr tatsächlicher Nutzen hängt jedoch von unterschiedlichen Faktoren ab, insbesondere von der ihnen zugewiesenen gesellschaftlichen bzw. bildungspolitischen Rolle und Anerkennung und der Verfügbarkeit und Zugänglichkeit von entsprechenden Testinstrumenten und Lernmaterialien.

Insgesamt lässt sich dabei immer noch eine große Heterogenität in Bezug auf den Entwicklungsstand von Kompetenzmodellen und den sie begleitenden Angeboten zwischen den einzelnen schulischen Fächern beobachten. Gerade im nicht-sprachlichen Bereich kann dabei das weitgehende Fehlen von passgenauen Unterstützungsangeboten die Motivation von Lehrkräften (und Lernenden) untergraben, sich mit Kompetenzmodellen und kompetenzorientierten Rückmeldungen aus Leistungstests auseinanderzusetzen. Gerade in Domänen mit bereits vorhandenen empirisch validierten Kompetenzmodellen sollten zukünftige Strategien den Anwendungsnutzen von Kompetenztestungen dadurch erhöhen, dass sie begleitende Angebote ins Zentrum stellen.