1 Zum Stand der Dinge. Erhöht Qualität messen und zeigen die Qualität im Bildungs- und Wissenschaftssystem?

„Auch in den Geisteswissenschaften soll eine systematische Qualitäts- und Leistungsmessung stattfinden“ – so heißt es im Positionspapier „Für eine Erneuerung der Geisteswissenschaften“ der Schweizerischen Akademie der Geisteswissenschaften (2012, S. 34). In Zeiten internationalen Wettbewerbs, der sich unter anderem in Hochschulrankings niederschlage, sei es unumgänglich, Qualität und Leistung aller Wissenschaften systematisch und öffentlich auszuweisen (ebd., S. 32). Und weiter:

Der Forderung nach einer professionalisierten Qualitäts- und Leistungsmessung vonseiten der Hochschulsteuerung darf durchaus kritisch begegnet werden. Kommt man der Forderung nach einer systematischen Qualitäts- und Leistungsmessung allerdings nicht nach, so schwächt man die Position der Geisteswissenschaften und suggeriert, Letztere entsprächen nicht anerkannten Normen und Kriterien der Wissenschaftlichkeit. Daher ist es notwendig, die bereits vorhandenen Qualitätskriterien sichtbar zu machen und im Sinne einer umfassenden Strategie zur Qualitätssicherung weiterzuentwickeln. Nicht zu unterschätzen ist dabei die Wirkung einer angemessenen Qualitäts- und Leistungsmessung auf die gemeinsame Wissenschaftskultur der Geisteswissenschaften. Sie fördert die Zusammenarbeit und verlangt eine Verständigung über Standards, Kriterien und Ziele. (ebd., S. 34)

Damit sind die wesentlichen Argumente auf dem Tisch, die den offenbar breiten gesellschaftlichen und wissenschaftlichen Konsens darüber tragen, dass in Zeiten zunehmender Internationalisierung und globalen Austausches, in Zeiten des Wettbewerbs um öffentliche Ressourcen und der Neuverhandlung staatlicher Aufgaben, der Kontrolle der Qualität von Leistungen des Wissenschafts- und Bildungssystems besondere Aufmerksamkeit zuzumessen sei. Geradezu zwangsläufig folge hieraus die Notwendigkeit der Etablierung von Prozeduren des Messens und Bewertens, denen sich kein wissenschaftlicher Bereich entziehen könne – wolle er nicht Gefahr laufen, als minderwertig angesehen zu werden; so die vielstimmig vorgetragene Argumentationsfigur.

Solche Prozeduren der Prüfung, die Grundlagen für die Verbesserung oder Kontrolle oder das ‚Management von Qualität‘ erbringen (sollen), begleiten inzwischen die alltägliche Praxis in Institutionen der Forschung, der Lehre und der Bildung – vom Kindergarten bis zu den Hochschulen und Forschungsinstituten. Die Mittelvergabe erfolgt zunehmend wettbewerbsförmig und mit Rücksicht auf ‚Kundenzufriedenheit‘; der Wettbewerb an sich gilt weithin als probates Mittel der Sicherung von Qualität. Der Hochschulbereich in Deutschland ist ein markantes Beispiel hierfür. Das höchste Gremium seiner Selbstverwaltung, die Konferenz der Hochschulrektoren, verordnete sich vor ca. zwei Jahrzehnten eine solche Entwicklung. Daran erinnerte der seinerzeitige Präsident der Hochschulrektorenkonferenz Professor Klaus Landfried in einer Bilanz der ersten knappen zehn Jahre dieser Entwicklung, der er den Titel „Qualität durch Wettbewerb“ gab.Footnote 1 Darin heißt es:

In ihrem 1992 verabschiedeten ‚Konzept zur Entwicklung der Hochschulen‘ hat die Hochschulrektorenkonferenz gefordert, zur Steigerung der Effizienz des Mitteleinsatzes die Elemente des Wettbewerbs im Hochschulsystem zu stärken. Wenn auch langsam und mit unterschiedlichem Tempo in den sechzehn Ländern gelingt dies schrittweise, zumindest was den Zufluss staatlicher Mittel und die Gestaltung der Haushaltsseite der Hochschulen angeht. Eine leistungs- und belastungsorientierte Mittelverteilung vom Staat auf die Hochschulen ist in einer Reihe von Ländern implementiert. Sie fördert nicht nur den Wettbewerb zwischen den Hochschulen eines Landes, sondern trägt ihn auch in die Hochschule hinein, da diese, wenn sie erfolgreich im Verteilungskampf bestehen will, die Anreize und Sanktionen an die Fachbereiche und Fakultäten weitergeben muss. Dass bei zuviel Indikatoren-‚Mechanik‘ auch Risiken entstehen – z. B. für kleine Fächer und für Innovationen, die nicht dem ‚main stream‘ folgen, sei hier nur angemerkt. (Landfried 2002)

Demnach ist mit dem Wettbewerb ein überschaubares Risiko verbunden, das aber nicht in ihm selbst liegt, sondern in den quasi sachfremden Mechanismen, die mit seiner Implementierung verbunden sind. Ansonsten sei alles gut.

Mit der Qualitäts- und Leistungsmessung im angesprochenen Sinne wurden Rhetoriken, Konzepte, Legitimationen und praktische Verfahrensweisen aus der Ökonomie in die Gestaltung von Bildung und Wissenschaft eingeschrieben. Mindestens für weite Teile des Bildungs- und Wissenschaftsbereichs gilt, dass ihm dies nicht von außen aufgezwungen wurde, sondern von innen getragen und vorangetrieben wird.

Gewiss werden die Entwicklungen, wie alle durchgreifenden Neuerungen, auch von kritischen Stimmen begleitet. Diese stammen keineswegs nur aus dem Lager der Geistes- und Sozialwissenschaften, denen die kritische Sicht auf Veränderungen, die nicht auf den Kommunikationsweisen des Wissenschaftssystems selbst beruht, besonders naheliegt. Sie sind auch aus den ‚harten Wissenschaften‘ heraus vernehmlich und betreffen insbesondere die Versuche, Metriken für die Qualitätsfeststellung einzuführen (vgl. z. B. Mocikat 2010; Drubin 2014). Ohne Unterschied wird darauf aufmerksam gemacht, dass die Einführung der Kategorien Verwertbarkeit und Kundenzufriedenheit als Merkmale von Qualität, die den aus der Ökonomie importierten Verfahren inhärent sind, mit der Erkenntnisorientierung der Wissenschaft nicht in Einklang zu bringen sind. „Irrtum“, so Ralph Mocikat (a. a. O.), „ist konstitutiv für wissenschaftlichen Fortschritt. Wo Effizienz eingefordert wird, wird Irrtum zu einem Skandalon.“ Dieter Lenzen (in diesem Band) argumentiert, dass mit der Einführung des Gedankens der Kundenzufriedenheit „in den so geführten Universitäten der Wahrheitscode durch den ‚Geldcode‘ ersetzt wird.“

Die Einführung einer ‚professionalisierten Qualitäts- und Leistungsmessung‘ und eine auf ihre Resultate gestützte Praxis der Steuerung von Institutionen der Forschung, der Lehre, der Bildung beruht also, so scheint es, einerseits im Großen und Ganzen auf einem breiten gesellschaftlichen und wissenschaftlichen Konsens. Dieser betrifft die Notwendigkeit, die Effizienz und die Wirksamkeit der eingeführten Praktiken. Auf der anderen Seite aber gibt es Zweifel. Diese Zweifel betreffen das Grundanliegen der Implementation ökonomischer Steuerungsinstrumente in das Wissenschaftssystem. Und je näher man der Realität der Verfahren kommt, die zur Qualitätsüberprüfung eingesetzt werden, kommt, desto ferner scheint der Konsens wieder zu rücken. Die geläufigen Vorgehensweisen der Kontrolle und Beurteilung der Qualität von Bildungspraxis oder Wissenschaft und ihrer Resultate – von gut geförderten Kindern bis zu gut verbreiteten Publikationen – sind sämtlich hoch umstritten. Ihre unintendierten Nebeneffekte wurden vielfach aufgezeigt (z. B. Hornbostel 2011; vgl. auch Frost und Brockmann in diesem Band). Mehr als 10.000 Wissenschaftlerinnen und Wissenschaftler weltweit haben die ‚San Francisco Declaration on Research Assessment DORA‘ unterzeichnet, die von der American Society for Cell Biology (ASCB) initiiert wurde. In ihr sind die wissenschaftsfremden, der Erzeugung wissenschaftlichen Wissens abträglichen Folgen der Anwendung unzureichender, aber weit verbreiteter Verfahren – insbesondere die Anwendung von Zitationsindizes – dargelegt, und es wird für die Entwicklung von Alternativen plädiert, deren unerwünschte Nebenwirkungen geringer sein sollten.Footnote 2

Ungeachtet dessen aber sind die Verfahren, an deren Qualität begründet zu zweifeln ist, von hoher praktischer Bedeutung für die Entwicklung und Steuerung des Wissenschafts- und Bildungssystems. Verwendet werden sie auch dann, wenn ihre Validität von den sie einsetzenden Instanzen selbst in Frage gestellt wird. Ein Beispiel hierfür ist die Planung des ‚Research Excellence Framework (REF) 2014‘ der britischen Gemeinschaften für die Forschungsförderung. Hier wird in der 2013 beginnenden nationalen Evaluation der Forschungsleistungen von Universitäten bzw. ihrer Wissenschaftlerinnen und Wissenschaftler auf Zitationsindizes zurückgegriffen, obwohl deren Aussagekraft und Stichhaltigkeit nach Analysen, die von den Fördergemeinschaften selbst in Auftrag gegeben wurden, mindestens für weite Teile der Wissenschaftsproduktion fragwürdig ist. Die nicht intendierten Nebenfolgen sind so eklatant, dass sie den Verfahren selbst den Grund entziehen könnten. Sie dennoch zu verwenden, legitimiere sich durch das Fehlen besserer Methoden (vgl. Technopolis 2009; Higher Education Funding Council for England (HEFCE) 2011; siehe auch Seglen 1997). Vertrauen auf die Ergebnisse sei aber jedenfalls angebracht, so verspricht es die Selbstdarstellung des REF 2014: „The assessment provides accountability for public investment in research and produces evidence of the benefits of this investment“ (http://www.ref.ac.uk/; April 2014).

Wir befinden uns also in einem Diskursraum voller offener Fragen und Widersprüche. Dabei geht es nicht um das Anliegen selbst, dass Leistungen des Bildungs- und Wissenschaftssystems so gut wie möglich ausfallen. Vielmehr geht es um die Rahmung und Legitimierung dieses Anliegens und darum, auf welche Weise, mit welchen Mitteln es in Praxis gesetzt wird.

2 Vorschau auf die Beiträge

Das ZfE-Forum 2012Footnote 3 hat sich mit dem hier knapp umrissenen Problemkomplex beschäftigt. Aus nationaler und internationaler Perspektive wurden Standpunkte zum Thema, Erfahrungen aus verschiedenen Bereichen des Wissenschafts- und Bildungssystems und vorliegende Forschungsergebnisse diskutiert. Leitende Frage des Forums war es, ob überhaupt, und wenn ja: in welchen Aspekten und Verfahrensvarianten Qualitätsprüfung und Steuerung im angedeuteten und weithin praktizierten Sinne für die Entwicklung von Forschung, Lehre und Bildung so geeignet ist, wie es die befürwortenden Rhetoriken der oben angedeuteten Art suggerieren. Die Beiträge dieses Bandes repräsentieren eine Auswahl der Impulse zum Forum.

Wir haben die Beiträge zu drei Kapiteln geordnet. Im ersten Kapitel wird der grundlegende Diskurs zur Frage aufgefächert, ob Wissenschafts- und Bildungssystem unternehmerische Formen des Kommunizierens und der Steuerung vertragen. Dieter Lenzen stellt dies in seinem Beitrag für die Universität als Institution grundsätzlich in Zweifel. Er beschreibt Gefährdungen auf der Seite der Forschung ebenso wie der Bildung, die mit Qualitätsprüfung und Steuerung in der angedeuteten Manier verbunden sind, unter Rückgriff auf eine systemtheoretische Perspektive, und er entwirft Szenarien, die – mehr oder weniger erfolgversprechend – Auswege aus der anscheinend unaufhaltsamen Entwicklung weisen. Jetta Frost und Julia Brockmann kommen aus der Betriebswirtschaft, also aus der Mitte der Wissenschaften, deren Verfahrensweisen im Bildungs- und Wissenschaftssystem implementiert wurden. Ihre Perspektive ist folgerichtig nicht fundamental gegen die Praxis gerichtet, Qualität von Forschung, Lehre und Bildung als quantitative Produktivität zu messen. Aber sie zeigen, untermauert durch eine empirische Analyse, dass die verstärkte Anwendung ökonomischer Steuerungslogiken zwar gewisse Formen der Produktivität von Wissenschaftlerinnen und Wissenschaftlern erhöht, zugleich aber dysfunktionale Effekte auf Innovations- und Kommunikationsprozesse in der Gemeinschaft der Forschenden besitzt.

Johannes Bellmann rekurriert in seinem Beitrag darauf, dass ein ökonomisch inspiriertes Qualitätsdenken dem Bildungssystem durchaus nicht erst neuerdings naheliegt. Er zeichnet die Genese eines solchen Qualitätsdenkens an drei ausgewählten Stationen für die Schule nach: am Vorschlag zur Übertragung von ‚Scientific Management‘ auf die Schule am Anfang des 20. Jahrhunderts in den USA; am seit den 1960er Jahren in den USA und später auch in Deutschland verbreiteten Versuch der Übertragung von ergebnisorientierten Modellen der Organisationsentwicklung auf Schulen; und am seit den 1990er Jahren sich verbreitenden Konzept der ‚Neuen Steuerung‘. Allen drei Exempeln sei ein ‚gewisses Enttäuschungspotential‘ gemeinsam; sie hätten also die in sie gesetzten Erwartungen nicht erfüllt. Eine weitere Gemeinsamkeit sei die Verspätung: ihre Anwendung auf die Schule setze erst ein, wenn die Angemessenheit der Praktiken in anderen Sphären längst in Zweifel stünde. Renate Girmes schließlich stellt eine phänomenologisch fundierte Betrachtung des Qualitätsanspruchs vor, der mit ‚Bildung‘ verbunden werden könne. Sie legt dar, dass und warum dieser Perspektive die Möglichkeit der ‚Messung‘ fernliegen muss.

Im zweiten Kapitel des Bandes sind Beiträge versammelt, die erfahrungsbasierte Sichten auf die Praktiken anbieten, mit den Qualität im Wissenschafts- und Bildungssystem geprüft wird. Die Beiträge beruhen auf der Analyse von Erfahrungen, die in unterschiedlichen Regionen, verschiedenen Disziplinen und Bereichen des Bildungs- und Wissenschaftssystems gemacht wurden.

Alis Oancea, Universität Oxford, präsentiert Ergebnisse ihrer empirischen Untersuchungen zum 2008 durchgeführten landesweiten ‚Research Assessment Exercise (RAE)‘ in Großbritannien. Solche ‚Übungen‘ werden dort seit 1986 alle vier bis sechs Jahre praktiziert. Sie bilden die Grundlage für besondere Mittelzuweisungen an die besonders erfolgreichen Hochschulen und Fakultäten. Oancea zeichnet ein differenziertes Bild von positiven und negativen Erfahrungen, die ihr in einer Befragung von Wissenschaftlerinnen und Wissenschaftlern nach der 2008er RAE berichtet wurden. Zugleich zeigt sie auf, dass die Durchführung der ‚exercises‘ in einer Hinsicht einen Erfolg auf der ganzen Linie erzielten: die performanzorientierten Mechanismen der Rechtfertigung wissenschaftlichen Handelns und die mit ihnen verbundene Fokussierung auf Routinen und Normen, die der Wissenschaft selbst fern stehen, aber leicht handhabbar sind, „[…] were not just internalized at system, institutional, and individual levels, but became constitutive of higher education research“ (Oancea, in diesem Band).

Ochsner, Hug und Daniel führen uns in ihrem Beitrag in die Schweiz. Ihr besonderes Augenmerk gilt der Frage nach Akzeptanz und Möglichkeiten der Anwendung ‚metrisierender‘ Verfahren der Qualitätsmessung auf geisteswissenschaftliche Fächer. Die Autoren berichten aus den Ergebnissen von vier Studien im Rahmen eines von der Rektorenkonferenz der Schweizer Universitäten geförderten Projektes, dass zwar der Anwendung von quantitativen Indikatoren in den Geisteswissenschaften Grenzen gesetzt seien, jedoch eine Beurteilung von Forschungsleistungen mittels qualitativer Kriterien – sog. Informed Peer Review – auch in diesen Disziplinen auf Akzeptanz stoßen könnte.Footnote 4

Auch Axel Horstmann beschäftigt sich mit dem Qualitätsdiskurs in den Geisteswissenschaften. Sein Erfahrungsfeld ist die Forschungsförderung. Horstmann, selbst Professor für Philosophie, war Mitglied der Geschäftsleitung der VolkswagenStiftung Hannover und hatte die Zuständigkeit für die Geistes- und Gesellschaftswissenschaften inne. Sein Beitrag reflektiert aus dem ‚Tagesgeschäft der Forschungsförderung‘ heraus das Problem einer Qualitätsprüfung als Vorausschau auf die Zukunft, das sich den fördernden Institutionen stellt. Auch er plädiert für die Anwendung des Peer-Review-Verfahrens, „zu dem sich trotz seiner nicht zu leugnenden Mängel bislang noch keine wirklich überzeugende Alternative gefunden hat“ (Horstmann, in diesem Band), und illustriert die vielen Schwierigkeiten, die sich für Mitglieder geisteswissenschaftlicher Disziplinen bei der Urteilsbildung über die Qualität einer wissenschaftlichen Idee oder eines Forschungsvorhabens stellen.

Der Beitrag von Hans-Günther Roßbach und Katharina Kluczniok führt in ein Praxisfeld des Erziehungs- und Bildungssystems ein. Präsentiert wird die Diskussion um die pädagogische Qualität im Kindergarten, die in Deutschland seit den 1990er Jahren verstärkt geführt werde. Vor dem Hintergrund unterschiedlicher theoretischer Zugänge zum Qualitätsbegriff stellt der Beitrag ein Konzept der Anregungsqualität in Kindergärten vor, das sog. Struktur-Prozess-Modell, welches vier Komponenten differenziert: Strukturmerkmale, Einstellungen, Anregungsprozesse sowie Familienbezug/Vernetzung, so Roßbach und Kluszniok in diesem Band. Zudem wird über Studien berichtet, die sich – angelehnt an das Rahmenmodell – mit der ‚Anregungsqualität‘ von Kindergärten befassen. Den Maßstab der Forschung bildet der Einfluss, den die Qualität des Kindergartens auf die Entwicklung der Kinder nimmt. Kritisch betrachtet wird hier also nicht die Qualitätsprüfung, sondern ihr Ergebnis, nämlich die ermittelte Qualität der Einrichtungen, und es wird reflektiert über Maßnahmen, mit denen das Ziel einer Qualitätsverbesserung erreicht werden könne.

Nina Kolleck setzt in ihrem Beitrag ebenfalls bei Qualitätsentwicklungsprozessen an. Sie stellt Methoden der sozialen Netzwerkanalyse vor und geht den Fragen nach, wie bzw. warum solche Verfahren in Qualitätsentwicklungsprozessen eingesetzt werden können und welche Rolle Vertrauen dabei spielt. Am Beispiel einer Studie zum Themenfeld ‚Bildung für nachhaltige Entwicklung‘ illustriert sie Stärken und Schwächen der Netzwerkanalyse als Methode der wissenschaftlichen Begleitung von Innovationen, die sich um die Vernetzung von Bildungseinrichtungen als einer Säule der Qualitätsverbesserung drehen.

Mit dieser Stärken-Schwächen-Analyse eines Verfahrens, das im Qualitätsprüfprozess eingesetzt wird, enden die im engeren Sinne wissenschaftlichen Beiträge des vorliegenden Bandes. Das Schlusskapitel bildet ein Beitrag, der aus der Praxis der Forschungsförderung stammt – in diesem Falle aber nicht im Rückblick auf Verfahren und die damit verbundenen Probleme, sondern in einer Vorausschau auf erhebliche Summen an Fördermitteln, die ‚im Wettbewerb‘ ergattert werden können. Die Autorin Angela Schindler-Daniels ist Programmkoordinatorin in der Nationalen Kontaktstelle Sozial-, Wirtschafts- und Geisteswissenschaften und Koordinatorin des ‚NET4SOCIETY‘ – eines Netzwerks der Vertreterinnen und Vertreter der entsprechenden nationalen Kontaktstellen der EU-Mitgliedsstaaten. Zu den Zielen den Netzwerks gehört die Verbesserung des Status und der Sichtbarkeit der Geistes- und Sozialwissenschaften im europäischen Forschungsraum, was unter anderem verbunden ist mit dem Bemühen, Instrumente der Qualitätsprüfung für die Antragsverfahren zu etablieren, die den Ansprüchen dieser Disziplinen so gerecht wie möglich werden. Schindler-Daniels Beitrag enthält eine Einladung, sich in den Wettbewerb um die Mittel der EU-Forschungsförderung zu begeben. Sie erläutert die neue Förderstrategie ‚Horizon 2020‘ der Europäischen Union, in der die Geistes- und Sozialwissenschaften insgesamt eine eher kümmerliche Rolle spielen. Zwar sind ihre Perspektiven rhetorisch eingearbeitet in alle ‚Säulen‘ der Förderstrategie. Es hat aber eines von vielen Wissenschaftlerinnen und Wissenschaftlern getragenen aktiven Protests bedurft, damit eine nicht nur implizite, sondern auch explizite Berücksichtigung geistes- und sozialwissenschaftlicher Themen in die Strategie aufgenommen wurde – wenn auch mit vergleichsweise bescheidenem Budget. An dieser Lage der relativen Geringschätzung kann sich, so die Autorin, nur etwas ändern, wenn die Wissenschaftlerinnen und Wissenschaftler selbst sich aktiver in die Prozesse einmischen – angefangen vom Mitwirken an der Ausgestaltung der Programme, der Anmeldung relevanter Themen (z. B. über die Nationalen Kontaktstellen) bis zur Beteiligung an der Antragstellung, an der Begutachtung oder der Beurteilung ex post. Einige Wege dafür zeigt Schindler-Daniels auf, einschließlich der Einladung, mit der Nationalen Kontaktstelle zu kooperieren.

Also doch alles gut?

Dieter Lenzen kommt in seinem Beitrag zu dem Schluß, „[…] dass die systemfremden Semantiken nicht aus dem Wissenschaftssystem extinguiert werden [können], das ginge ohnedies nur durch Kommunikationsverbote, die den gegenteiligen Effekt hätten, sondern dass diese Semantiken unter die Systemlogik der Wissenschaft gebracht werden. Dafür gibt es erstens die sanfte Kunst des Umdeutens (deren Durchsetzung allerdings Definitionsmacht voraussetzt) und zweitens die Schaffung der dritten Semantiken, die den Wahrheitscode stützen könnten“ (Lenzen, in diesem Band). Aufforderung zur Einmischung also auch hier – in der Hoffnung, dass die Definitionsmacht eines schönen Tages reicht.

Beim Zustandekommen dieses Bandes haben viele mitgewirkt, denen wir Dank schulden – alle können wir hier nicht nennen. Stellvertretend erwähnt seien die Gutachterinnen und Gutachter, die uns bei der Optimierung der Beiträge unterstützt haben. Gedankt sei ferner Melanie Heitmann und Julia Behr, die uns freundlich und effizient bei der Organisation des Forums und im Anschluss daran bei der Gewinnung der Beiträge geholfen haben, ferner Anja Segschneider, die die Texte in ein angenehm lesbares Format gebracht hat, und nicht zuletzt unserer Lektorin Stefanie Laux für unermüdliche Ermutigung und Unterstützung.

Hamburg, im Frühjahr 2014

Ingrid Gogolin & Dieter Lenzen