Die Reflexion des methodischen Vorgehens erfolgt dreigeteilt. Zunächst wird die Erhebungsmethode, insbesondere in Bezug auf die Datengewinnung kritisch beleuchtet und anschließend die angewandte Auswertungsmethodik reflektiert. Sodann wird das Vorgehen zusammenfassend und in Bezug auf Qualitätskriterien qualitativer Sozialforschung betrachtet, wobei auch auf die Aussagekraft und Reichweite der Ergebnisse dieser Studie eingegangen wird.

Reflexion der Datenerhebung

Wie in Abschnitt 6.1 herausgestellt, reiht sich die Arbeit methodologisch in die governanceanalytische Forschung ein, die auf Interviewstudien im Querschnittsdesign basiert und Befunde auf Basis von Einschätzungen der Akteure präsentiert (Maag Merki & Altrichter, 2016). Während Vor- und Nachteile für die ausgewählte Erhebungsmethode in Abschnitt 6.1 und Abschnitt 6.2 dargestellt wurden, geht es nun vor allem darum, die Datenerhebung kritisch zu reflektieren. Diesbezüglich ist zunächst die Auswahl der Experten zu beleuchten, auch um mögliche „durch das Sampling entstandene Fehler und Verzerrungen im Fortgang des Erhebungs- und Auswertungsprozesses“ (Misoch, 2019, S. 200) zu berücksichtigen. Eine Errungenschaft der Studie ist, dass es grundsätzlich gelungen ist, Interviewpartner:innen nach den durchaus komplexen Auswahlentscheidungen zu gewinnen (vgl. Abschn. 6.3.1). Diese zuvor identifizierten und begründet ausgewählten Personen sind Teil der formal reglementierten Akteurskonstellation im Kontext der Qualitätsanalyse, die hier untersucht wurden (vgl. Abschn. 5.2.1). Dies trägt dazu bei, dass die Studie nicht nur die anvisierte Mehrperspektivität gewährleisten (vgl. Kap. 4), sondern auch die Mehrebenenthematik (vgl. Abschn. 2.2) in das Forschungsdesign integrieren konnte. Gleichzeitig ist die Untersuchung notwendigerweise selektiv und schließt von vornherein andere Akteure aus, denen potenziell eine Bedeutung für die Prozesse bei der Qualitätsanalyse zugesprochen werden könnte (Bosche & Lehmann, 2014; Schemmann, 2014).

In Bezug auf die Auswahl der Interviewpartner:innen ist ferner kritisch anzumerken, dass der Forschenden Informationen über die Ergebnisse der Qualitätsanalysen und über die Inanspruchnahme von Schulentwicklungsberatung seitens der Schulen nicht bereitgestellt und entsprechend bei den Auswahlentscheidungen nicht berücksichtigt werden konnten. Es ist daher mehr oder weniger dem Zufall geschuldet, dass zwei von vier ausgewählten Schulleiter:innen vom Einsatz der Schulentwicklungsberater:innen an ihrer eigenen Schule berichteten. Auch bei den Schulentwicklungsberater:innen gab es vorab keine Informationen über die konkrete Involviertheit bei der Begleitung von Schulen im Kontext der Qualitätsanalyse. Dies konnte nur bei der telefonischen Anfrage für ein Interview in Erfahrung gebracht werden. Insgesamt erschien rückblickend der Weg in das Feld unter Berücksichtigung der hierarchischen Strukturen zwar langwierig, aber lohnend, da nur so Gatekeeper und umfassende Einblicke in die Prozesse gewonnen werden konnten (vgl. Abschn. 6.3.1).

Eine Herausforderung bei der Datenerhebung betrifft die z. T. dichotomen Rollen der Interviewpartner:innen, die sich als unerwartetes Spezifikum des Untersuchungsfeldes herausstellten. So waren einige Schulentwicklungsberater:innen gleichzeitig Schulleiter:innen oder einige Schulaufsichtsbeamt:innen waren mit der Leitung der Kompetenzteams betraut und standen deshalb mit den Schulentwicklungsberater:innen in einem Dienstverhältnis. Obwohl die Interviewenden explizit als Experten in einer bestimmten Funktion adressiert wurden, kann nicht ausgeschlossen werden, dass sich in den Aussagen Perspektiven aufgrund der Rollenüberschneidungen vermischten. Insofern kann die analytische Trennung der Akteure weder in der Praxis noch im Interview durchgängig aufrechterhalten werden. Potenziell zutreffend ist dies insbesondere bei zwei Interviews mit den Schulentwicklungsberater:innen, die in den Schulen befragt wurden, in denen sie selbst Schulleiter:innen sind. Denn gerade durch die räumliche Nähe zur eigenen Schule ist es vorstellbar, dass eine Trennung der Rollen von den Interviewten im Erzählfluss schwer durchzuhalten war (vgl. Abschn. 6.3.2).

Darüber hinaus ist kritisch zu reflektieren, inwiefern der Fragestil bzw. die Formulierung der Fragen Einfluss auf die Antworten der Interviewenden gehabt haben könnte (Helfferich, 2018). In der Interviewsituation wurde versucht, diesen Einfluss gering zu halten, indem Fragen so konzipiert wurden, dass in neue Themenfelder mit allgemeinen, offenen Fragen eingeführt und bezugnehmend auf geäußerte Aspekte nachgefragt wurde. Schließlich und zuletzt besteht die Gefahr – übrigens nicht nur bei Experteninterviews –, dass sozial erwünschte Aussagen getätigt und die Befragten „bloße Allgemeinplätze [referieren]“ (Bogner et al., 2014, S. 53). Diesem wurde durch eine offen interessierte Haltung und durch den Vertrauensaufbau während der Durchführung der Interviews entgegengewirkt. Rückblickend konnten weder in den Interviewsituationen noch in der Auswertung des Datenmaterials Anhaltspunkte gefunden werden, die vermuten lassen, dass Aspekte bewusst oberflächlich thematisiert oder zurückgehalten wurden. Darüber hinaus obliegen den Interviews insofern Grenzen, als dass „der Experte – selbst beim besten Willen – immer nur das mitteilen kann und wird, was ihm ‚wissentlich‘ präsent ist“ (Pfadenhauer, 2009a, S. 105). Folglich ist die gewählte Erhebungsmethode dahingehend begrenzt, „dass die Dynamiken und Prozesse nur partiell abgebildet werden können“ (Maag Merki & Altrichter, 2016, S. 485). Insofern sind Wahrnehmungsverzerrungen oder Erinnerungslücken bei Schilderungen von Vergangenem bei Erhebungen mit retrospektiver Sicht wie dieser nicht auszuschließen.

Reflexion der Auswertungsmethode

Grundsätzlich hat sich die strukturierende qualitative Inhaltsanalyse als Auswertungsmethode für das durch Experteninterviews generierte Datenmaterial bewährt. Denn sie ermöglichte nicht nur aussagekräftige Erkenntnisse mit Blick auf das hier interessierte Prozesswissen der Akteure, sondern vermochte es auch, die zugrundeliegende Handlungslogik vergleichend herauszuarbeiten sowie beides miteinander und im Abgleich der Akteursperpektiven untereinander in Beziehung zu setzen (vgl. Abschn. 6.2). Gleichwohl waren mit diesem Verfahren Herausforderungen verbunden, die es neben kritikwürdigen Aspekten zu reflektieren gilt. So ist zunächst die Zuverlässigkeit der Klassifikation also die Eindeutigkeit von Kategorien zu nennen, die mit anfänglich konsensuellem Codieren und der permanenten Diskussion des zugeordneten Materials im dreiköpfigen Team zu erreichen versucht wurde. Eine solche Diskussion war beispielsweise in Bezug auf geäußerte Bewertungen der Interviewten hinsichtlich des Zusammenwirkens der Akteure geboten, die in der Schärfung von Kategoriedefinitionen mündete (vgl. Abschn. 6.4).

Diese Studie war von vornherein als Vergleichsstudie mit einer größeren, multiperspektivisch geprägten Datenmenge konzipiert (vgl. Abschn. 6.1). Das gewählte Auswertungsverfahren, die Inhaltsanalyse, ist dafür prädestiniert mit ebendiesen „großen Textmengen“ (Mayring & Fenzl, 2019, S. 635, Herv. i. O.) zu arbeiten. Allerdings besteht hieran auch die Kritik, es ginge durch die Kategorisierung der „Blick auf die Ganzheit und Komplexität der Textstelle verloren“ (Ramsenthaler, 2013, S. 39). Eine tiefere Betrachtung weniger Textstellen könnte sich in Bezug auf die Analyse von latenten Sinnorientierungen – verbunden mit dem Anspruch eines tieferen Verstehens – lohnend sein. Hierfür könnten im Sinne einer Methodentriangulation rekonstruktive Verfahren ergänzend zum Einsatz kommen.

Die Auswertungsleistung des Datenmaterials lag in der sich an die kategorienbasierte Auswertung anschließenden komplexeren Analyse, die beschriebene Handlungsabläufe mit subjektiven Bedeutungszuschreibungen der Akteure in Beziehung setzt und diese vergleichend in der Akteurskonstellation untersucht (vgl. Abschn. 6.4). Im Einklang mit postulierten Prämissen der Educational Governance wurde dadurch der Akteursperspektive in besonderem Maße Rechnung getragen (vgl. Abschn. 2.2). Hieran kritikwürdig ist jedoch auch, dass die (zwar empirisch begründete) Annahme, die Perspektivunterschiede seien nicht zufällig, sondern ebenen- und funktionsspezifisch geprägt, entsprechend in die Analyse eingeflossen ist (vgl. Abschn. 6.3.1). Auch wenn eine solche Perspektivprägung in der Auswertung des empirischen Materials bestätigt wurde, bleibt offen, inwiefern dies praktisch durch die Fallauswahl bereits indiziert war.

Insgesamt lag der Vorteil des inhaltsanalytischen Vorgehens für die vorliegende Studie im systematischen Vergleich von Interviewaussagen, wodurch mögliche sozial erwünschte Darstellungen einem Abgleich unterzogen und entsprechend minimiert, partielle Darstellungen ergänzt und so letztlich robustere Ergebnisse hervorgearbeitet werden konnten. Folglich kann die Methode in dieser Arbeit als geeignete systematische Vorgehensweise für die Analyse von Handlungskoordination angesehen werden.

Zur Einlösung der Qualitätskriterien qualitativer Forschung in dieser Studie

Neben der konkreten Reflexion des methodischen Vorgehens soll abschließend die „Wissenschaftlichkeit, Güte und Geltung“ (Steinke, 2017, S. 319) dieser qualitativen Studie in den Blick genommen werden. In Auseinandersetzung mit der Bewertung qualitativer Forschung ist jedoch bereits die Frage nach den Qualitätskriterien nicht eindeutig zu beantworten, da sie sich grundsätzlich in zwei bzw. drei Diskussionsstränge ausdifferenziert (u. a. Flick, 2019a; Steinke, 2017): Während die einen für eine Übertragung der quantitativen Gütekriterien – Objektivität, Reliabilität und Validität – auf qualitative Forschung plädieren, bezweifeln die anderen jene Übertragbarkeit und argumentieren stattdessen für die Formulierung eigener Kriterien qualitativer Forschung.Footnote 1 Letztere Grundposition ist auch für die weiterführende Argumentation leitend, die sich damit für die Spezifizierung von Qualitätsstandards qualitativer Forschung ausspricht. Ausschlaggebend hierfür ist, dass zentrale Probleme im Übereinkommen zwischen der im Kontext des naturwissenschaftlichen Erkenntnisideals entwickelten Gütekriterien und den Besonderheiten qualitativer, inhaltsanalytischer Forschung gesehen werden (Bogner et al., 2014; Flick, 2019a; Mayring, 2015; Przyborski & Wohlrab-Sahr, 2014). So sind es neben unterschiedlichen Auffassungen der Konzeption von Wirklichkeit die sich unterscheidenden Erkenntnislogiken und methodologischen Prämissen, die eine Adaption quantitativer Gütekriterien für qualitative Forschung wenig erfolgsversprechend machen. Dies sei am Beispiel des Kriteriums Objektivität illustriert: Der Anspruch, dass die mittels Experteninterviews generierten Daten unabhängig von der Interviewsituation sind (Durchführungsobjektivität), ist schwerlich zu realisieren. Denn die Interviewsituation charakterisiert sich u. a. durch unterschiedliche Rollenerwartungen, die sich eher in der Vielfältigkeit denn in der Übereinstimmung von Interviewmaterial niederschlagen, das durch die Befragung desselben Experten von verschiedenen Interviewenden generiert wird (Bogner et al., 2014; vgl. Abschn. 6.3.2).Footnote 2 Folglich können die klassischen Gütekriterien lediglich als Anregungen für die Formulierung eigener Kriterien qualitativer Forschung dienen.

Die vielstimmige Diskussion um reformulierte Standards qualitativer Forschung schlägt sich in einer Reihe von Kriterienkatalogen nieder, die zwar in vielen Kernaspekten übereinstimmen, aber (noch) keine Einigung auf einen allgemeinverbindlichen Katalog hervorbringen (u. a. Mayring, 2016; Steinke, 2017; Strübing, 2018; Tracy & Hinrichs, 2017; im Überblick: Döring & Bortz, 2016). Ferner gibt es im Unterschied zu klassischen Gütekriterien auch keine klaren Grenzen (oder Grenzwerte). Stattdessen verweisen die Kriterien eher auf darzulegende Aspekte, die sich auf den prozeduralen Charakter des Forschungsprozesses beziehen und untersuchungsspezifisch zu konkretisieren sind (Flick, 2019a, 2009). Die nachfolgende Reflexion orientiert sich an wesentlichen Kernkriterien, die sich vor allem auf die Überlegungen von Steinke (2017), Flick (2019a) und Mayring (2016) beziehen.

An die Stelle der Überprüfbarkeit – wie sie in quantitativer Forschung durch Replikation und Standardisierung zu bewerten ist – tritt für qualitative Sozialforschung „der Anspruch auf Herstellung von intersubjektiver Nachvollziehbarkeit des Forschungsprozesses“ (Steinke, 2017, S. 327, Herv. i. O.; vgl. Bogner et al., 2014; Mayring, 2016). Allen voran ist zu diesem Zweck zunächst eine ausführliche Verfahrensdokumentation und die Explikation von Vorgehensweisen sicherzustellen, die den Prozess für Dritte nachvollziehbar werden lässt. Dies wird in der vorliegenden Studie durch die begründeten und stets konkreten Erläuterungen zur Erhebungs- und Auswertungsmethode in den Abschnitten 6.2 und 6.4 gewährleistet. Dazu zählt beispielsweise auch die nach Bogner et al. (2014) sowie Kaiser (2014) geforderte Konkretisierung der Art des Expertenwissens. Zum Zweck der Nachvollziehbarkeit erfolgte darüber hinaus eine umfangreiche Dokumentation des Forschungsprozesses.

Durch die Verwendung kodifizierter Auswertungsverfahren und der konkreten Beschreibung der Analyseschritte (vgl. auch Abb. 6.2) wird zudem dem Kriterium der Regelgeleitetheit entsprochen. Außerdem stellt sich die Frage nach der Indikation des Forschungsprozesses, die nach Steinke (2017) nicht nur die Gegenstandsangemessenheit der Erhebungs- und Auswertungsmethode beinhaltet, sondern den gesamten Forschungsprozess seiner Angemessenheit beurteilt. So sind in Abschnitt 6.1 der qualitative Zugang hinreichend begründet, potenzielle Erhebungsmethoden abgewogen sowie in den nachfolgenden Abschnitten Anwendungsbereiche und Grenzen der Methode und ihrer Auswertungsstrategie beleuchtet worden. Auch die zweckgerichtete Auswahl der Interviewpartner:innen (vgl. Abschn. 6.3.1), die Durchführung der Erhebung im Feld (vgl. Abschn. 6.3.2) und die induktive Kategorienbildung im Auswertungsverfahren (vgl. Abschn. 6.4) kann als dem Untersuchungsgegenstand angemessenes Vorgehen eingeschätzt werden. Die Studie erreicht auch deshalb in besonderem Maße Nähe zum Gegenstand, weil sie an einem konkreten Transferproblem aus der Praxis ansetzt (vgl. Abschn. 3.1) und so eine „Interessensübereinstimmung mit den Beforschten“ (Mayring, 2016, S. 146) erzielt.

Anhand der empirischen Verankerung wird Steinke (2017) zufolge bewertet, inwiefern die entwickelten Folgerungen und Ergebnisse am empirischen Datenmaterial begründet sind. Für eine solche Validierung werden in der qualitativen Forschung alternative Ansätze herangezogen, von denen einer in der vorliegenden Studie zum Einsatz kam. So wurden sogenannte member checks bzw. kommunikative Validierungen durchgeführt, bei denen die Erkenntnisse an zwei Interviewpartner:innen zurückgemeldet wurden. Dieses erfolgte wie von Flick (2019a) empfohlen „nach Vorliegen der vergleichenden Ergebnisse der Analyse mehrerer Fälle“ (S. 476, Herv. i. O.). Gegenstand der Beurteilung waren demnach nicht einzelne Aussagen der Teilnehmenden, sondern „Trends, die sich aus der Analyse der Daten insgesamt ergeben hatten“ (Flick, 2019a, S. 477). Die Zustimmung der Interviewten zu den Ergebnissen, ihre Angemessenheit und Plausibilität wurde als Ansatz der Validierung der Resultate gesehen.

Darüber hinaus wird dem Anspruch der Intercoder-Reliabilität in dieser Arbeit durch die getrennte Bearbeitung relevanter Ausschnitte des Datenmaterials in Bezug auf die Anwendung des Kategoriensystems und Überprüfung von kodierten Textstellen durch drei unterschiedliche Personen und anschließender Diskussion nachgekommen. In Anerkennung des interpretativen Vorgehens kann hierbei eine völlige Übereinstimmung jedoch nicht das Ziel sein. Vielmehr gilt es im Falle von Abweichungen „über die angemessene Kodierung zu entscheiden“ (Mayring & Fenzl, 2019, S. 637), eine Modifikation des Datensatzes vorzunehmen und so die Zuverlässigkeit der Materialsystematisierung zu erhöhen. Mit diesem „gemeinsame[n] Überprüfen von Codierungen“ (Kuckartz, 2018, S. 211) wird der qualitative Weg zur Sicherstellung größtmöglicher Unabhängigkeit der Ergebnisse von der untersuchenden Person beschritten. Dieser ist im Vergleich zum quantitativen Weg, der über die Berechnung der Intercoder-ReliabilitätFootnote 3 führt, aus folgenden zwei Gründen für die vorliegende Arbeit geeigneter: Erstens wird in der Logik der qualitativen Inhaltsanalyse eher zum oben beschriebenen prozeduralen Vorgehen tendiert, weil solche Berechnungen hier „praktisch schlecht einsetzbar sind“ (Müller-Benedict, 2019, S. 1) und nach Kuckartz (2018) eher in der quantitativ orientierten Inhaltsanalyse Anwendung finden. Eine Berechnung bietet sich insbesondere dann nicht an, wenn Kategoriensysteme besonders differenziert und umfangreich sind und dadurch erschweren, „eine hohe Zuverlässigkeit der Resultate zu erzielen“ (Ritsert, 1972, S. 70). Zweitens wurde das Material – wie bei der qualitativen Inhaltsanalyse üblich – nicht vorab segmentiert, vielmehr bilden Codieren und Segmentieren einen Analyseschritt. In deren Folge sind die Codierenden „frei in der Bestimmung von Anfang und Ende einer solchen Sinneinheit“ (Kuckartz, 2018, S. 211). Wie der Autor weiter ausführt, hat dies entsprechend Auswirkungen auf die Berechnung von Koeffizienten wie beispielsweise Cohens Kappa. So wird ihre

Nicht-Berechnung [...] häufig als Defizit interpretiert, obwohl der Zufallseffekt bei einer Analyse mit einem typischen qualitativen Kategoriensystem meist nur einen geringen Effekt hat. Beim qualitativen Codieren mit freiem Segmentieren und Codieren ist die Berechnung von Kappa wenig sinnvoll, weil hier einfach das Modell, das Kappa zu Grunde liegt, nicht stimmt. (Kuckartz, 2018, S. 217)

Zuletzt soll auf die triangulierten Akteursperspektiven, die das Forschungsdesigns und die Auswertung in besonderer Weise prägen, Bezug genommen werden, um davon ausgehend Aussagen zum Geltungsbereich der Erkenntnisse und zu den Limitationen der Arbeit abzuleiten. Die vergleichende Analyse von Fällen (hier Akteursgruppen, vgl. Abschn. 6.1) hat dazu beigetragen, dass Handlungsmuster innerhalb der Akteurskonstellation nicht nur identifiziert und durch herausgearbeitete Handlungslogiken plausibilisiert, sondern auch Abweichungen im Kontrast zu anderen aufgedeckt und insgesamt in eine schlüssige Interpretationslinie gebracht werden konnten. Weil hier ein (soziales) Phänomen, die Handlungskoordination, durch die Einnahme unterschiedlicher Perspektiven – in diesem Fall von Personen unterschiedlicher Positionen – mit derselben Methode untersucht wird, kann nach Denzin (1970) von einer Datentriangulation gesprochen werden. Eine solche Kombination von Daten, die bei verschiedenen Personen erhobenen wurden, wird in dieser Studie nicht nur als (zusätzliche) Validierungsstrategie angesehen, sondern explizit „als breiter angelegte Erkenntnisstrategie“ (Flick, 2019a, S. 481). Da die Erkenntnisse multiperspektivisch gewonnen werden, können sie potenziell „weiter reichen, als es mit einem Zugang möglich wäre“ (Flick, 2011, S. 12). Dadurch werden die gefundenen Einsichten bei ähnlichen Sichtweisen nicht nur robuster, sondern befähigen auch Widersprüche oder Divergenzen aufzudecken. Auf die Schlüssigkeit der Argumentation und die Offenlegung von ungelösten Fragen zielen auch der von Mayring (2016) benannte Beurteilungsaspekt argumentative Interpretationsabsicherung als auch das von Steinke (2017) herausgestellte Kriterium Kohärenz ab. Dies wurde in der vorliegenden Arbeit vor allem im Ergebnisteil durch die Verwendung von zahlreichen Textbelegen und durch bündelnde Zusammenfassungen am Ende eines jeden Abschnitts zu erreichen versucht.

Abschließend lassen sich folgende Limitation der Studie herausstellen: Über die vergleichende Analyse der Interviewaussagen ist versucht worden, möglichst nah an ein empiriebasiertes, verstehendes Abbild der schulinspektionsbezogenen Handlungskoordination bei der Qualitätsanalyse in Nordrhein-Westfalen zu gelangen. Gleichzeitig kann aufgrund der Größe des Samples, die – wie in Abschnitt 6.3.1 erläutert – begrenzt bleiben musste, kein Anspruch auf Vollständigkeit der gefundenen Handlungspraktiken erhoben werden. Dennoch kann davon ausgegangen werden, dass die wesentlichen Modi der Handlungskoordination identifiziert werden konnten. Denn die befragten Akteure haben nicht ausschließlich mit den hier Interviewten interagiert, sondern auch mit anderen Funktionsträgern im Kontext der Qualitätsanalyse, deren Erfahrungen also gesammelt in das Berichtete eingingen. Beispielsweise sprechen die Qualitätsprüfer:innen logischerweise nicht nur über die Handlungskoordination mit den hier interviewten Schulleiter:innen, sondern äußern sich insgesamt zu den erlebten Interaktionsgefügen. Allerdings konnten im Rahmen dieser Studie nur bedingt Aussagen darüber gemacht werden, welche Art der Handlungskoordination die Wirksamkeit der Schulinspektion in Bezug auf Schul- und Unterrichtsentwicklung zu erhöhen vermag.

Überdies ist erwähnenswert, dass die Untersuchung von Anfang an als mehrperspektivische Governanceanalyse für die Qualitätsanalyse in Nordrhein-Westfalen unter besonderer Berücksichtigung der Schulform Grundschule konzipiert war und damit eine Grenze in der Aussagenreichweite dieser Studie markiert wird, die sich jedoch nicht ausschließlich auf die fokussierten Fälle bezieht (vgl. Abschn. 6.1). Denn zum einen konnten die verdichteten Beschreibungen der betrachteten Akteursgruppen mit der Analyse der Zusammenhänge zwischen Kategorien (vgl. Abschn. 6.4) vergleichend untersucht werden, wodurch eine gewisse Robustheit der Erkenntnisse über die untersuchten Fälle hinaus erreicht werden konnte. Zum anderen zeigen sich die Ergebnisse dieser Studie mit Erkenntnissen vorhergehender Forschung insbesondere mit Blick auf die Rollenverständnisse in einer bestimmten Reichweite kompatibel, so dass zusammengenommen „für eine Übertragung auf einen eingegrenzten Gegenstandsbereich argumentiert werden kann“ (Hering & Schmidt, 2014, S. 526). Dieser Bereich ist insofern klar umrissen, als dass die Regelungsstrukturen Ähnlichkeiten zu denen in dieser Untersuchung geltenden Strukturen aufweisen müssen (vgl. Abschn. 2.3.2). Beispielsweise dürften die in Abschnitt 8.2.2 herausgearbeiteten Rollenkonflikte aufgrund des offenbar dramatischen Ressourcenmangels der nordrhein-westfälischen Schulformaufsicht für die Grundschulen, nicht ohne weitere Prüfung auf andere Schulformen übertragen werden.

In denjenigen Bereichen, in den sich die Regelungsstrukturen auch nur geringfügig unterscheiden, lässt sich eine grundlegend verschiedene Handlungskoordination vermuten. Dies zeigte sich in den Ergebnissen dieser Arbeit zum Beispiel im veränderten Rückmeldeformat, bei dem die Zusammenarbeit der intermediären Akteure auf eine gänzlich andere Ebene gehoben wurde (vgl. Abschn. 7.2.4). Damit unterstreicht diese Studie nicht nur die Relevanz von Regelungsstrukturen, wie sie auch in der Governance Forschung postuliert wird (vgl. Abschn. 2.2), sondern auch, dass die viel proklamierte Zusammenarbeit in allen deutschen Schulinspektionsverfahren in hoher Abhängigkeit von den Regelungsstrukturen realisiert wird. Inwiefern es dabei zu ähnlichen oder differenten Modi der Handlungskoordination kommt, wäre durch eine ähnliche Analyse der gleichen Akteurskonstellation unter dezidierter Berücksichtigung bundesland- und schulformspezifischer Regelungsstrukturen zu untersuchen. Damit erweist sich die in Kapitel 4 begründete und dezidiert bundesland- und schulformspezifische Ausrichtung des Forschungsvorhabens als gewinnbringende Herangehensweise zur Untersuchung einer – wie sich herausstellte – sehr kontextsensitiven Handlungskoordination.