1 Hintergrund und Anliegen des Beitrags

Vor nunmehr zwei Jahren erschien mit „Supervision auf dem Prüfstand“ (SAP 2) der zweite Teil einer umfangreichen Literaturanalyse zum Stand der internationalen Supervisionsforschung (Schigl et al. 2020).Footnote 1 Dieser Review entstand aus zwei im Rahmen des Lehrgangs Supervision & Coaching an der Donau Universität Krems verfassten Masterarbeiten, sowie einer weiteren umfänglichen Bearbeitung der Studien zu Supervision im Feld der Gesundheitsberufe und im Krankenhaus – dem Schwerpunkt der englischsprachigen Publikationen. Dabei wurden in der deutsch- und englischsprachigen Fachliteratur ausschließlich empirische Publikationen zu Supervision für die Jahre 2003 bis 2016 erhoben. Weitere Daten aus neu erschienenen Handbüchern wurden 2017 und 2018 hinzugefügt.

Wir konnten für dieses Projekt die Kooperation von Cochrane AustriaFootnote 2 gewinnen. Diese führten eine systematische Recherche zu den Keywords „supervision“, „clinical supervision“, „efficacy“, „effectivity“, „efficiency“, „outcome“, „research“, „supervision research methods“ und „review“ sowie „abusive supervision“ in den Datenbanken Pubmed, PsycINFO (Ebsco) und Social Sciences Citation Index (Web of Science) durch. Dabei wurden 1458 Treffer erzielt, die dann bereinigt und nach Relevanz gescreent wurden. Dazu kamen Recherchen in Fachzeitschriften und Handbüchern, sodass insgesamt 1629 Quellen bearbeitet wurden (vgl. Schigl et al. 2020, S. 51 ff.).

Das zur Ordnung der Studien herangezogene Schema entsprach jenem, das das Autor:innenteam von SAP 1 (Petzold et al. 2003) entwickelt hatte. Es wurde um einige Bereiche erweitert, die damals noch nicht auf der Bildfläche der Supervisionsforschung erschienen waren (vgl. Abschn. 3.). Die so entstandene Übersicht versteht sich als Nachschlagewerk, in dem die Entwicklung von Supervisionsforschung abgebildet und Themen und Methoden der Bearbeitung analysiert werden.

Die hier referierte Zusammenfassung der Ergebnisse bildet die Trends ab und beschreibt Phänomene, die Supervisionsforschung kennzeichnen. Auch ein Vergleich mit Coachingforschung wird auf diese Weise möglichFootnote 3. Weiterhin werden einige herausragende Arbeiten skizziert und Wünsche und Rückschlüsse für künftige Forschung formuliert.

2 Überblick: Welche Phänomene werden sichtbar?

2.1 Was ist Supervision (nicht)?

Wenn wir in SAP 1 noch konstatiert hatten, dass es „die Supervision“ nicht gibt, und daher kaum gültige Aussagen für „die“ Supervisionsforschung getroffen werden können, so stimmt diese Aussage nur noch teilweise.

Richtig ist nach wie vor, dass es keine einheitliche, länderübergreifende und von allen Communities der Forscher:innen verwendete einheitliche Definition von Supervision gibt. Dies hat seinen Grund auch darin, dass das, was diese beforschen, je nach Land/Kontinent ganz unterschiedlich verstanden wird. Schon in den ersten Recherchen zu SAP 2 fiel auf, dass v. a. im asiatischen Raum Supervision in dem im deutschsprachigen Raum verwendeten Sinne unbekannt zu sein scheint. Wenn es Publikationen zu Supervision gab, so waren diese zumeist technischer Natur, und Supervision wird vorwiegend als Sicherheitskonzept für maschinelle oder digitale Regelkreise o. ä. beschrieben. Für den englischsprachigen Raum (USA, Großbritannien, Australien) gilt großteils eine Definition von Supervision, die zwar nicht im technischen Sinne, dennoch eine starke Betonung von Kontrolle beinhaltet, wie schon der Wortsinn sagt: „Supervision is the act of watching a person or activity and making certain that everything is done correctly, safely etc.“ (Cambridge Dictionary o.J., Internet). Somit versteht der angloamerikanische Raum Supervision oft als Teil einer Ausbildung, in dem unerfahren(er)e Studierende von erfahrenen Professionals (Sozialarbeiter:innen, Psychotherapeut:innen, Clinical Counsellors etc.) angeleitet werden. Supervision wird hier als „Clinical Supervision“ verstanden, die v. a. dazu dient, anzuleiten, zu lehren und Qualität sicherzustellen.

Das, was wir im deutschsprachigen, z. T. auch im italienischen, französischen oder niederländischen Raum als Supervision verstehen, ein Reflektieren eigenen beruflichen Handelns unter Moderation und Leitung einer neutralen, zumeist externen Expert:in für den Prozess, würde im angloamerikanischen Raum als eine Art angeleiteter „peer supervision“, eine Besprechung unter Kolleg:innen verstanden werden. Hierbei treffen sich Angehörige eines Berufsstandes bzw. von Fachteams (auch disziplin-übergreifend), reflektieren ihre Praxis und beraten sich gegenseitig. Ducat et al. (2016) schlagen dafür den Begriff „Professional Supervision“ vor, der unserem Verständnis von Supervision ziemlich nahekommt, allerdings nicht die Regel ist.

Im europäischen Raum dominieren Definitionen von Berufsverbänden und beruflichen Vereinigungen, die kaum Bezug zu theoretischen Modellen aufweisen. Eine Ausnahme stellt hier „ECVision“ (Judy und Knopf 2015) dar, das als ein Projekt der ANSE versucht, „ein Europäisches System der Vergleichbarkeit und Validierung supervisorischer Kompetenzen“ (Judy und Knopf 2018, S. 526) zu etablieren, um so eine gemeinsame europäische Verständigung über Grundlagen von Supervision zu finden. Was im deutschsprachigen Raum ambivalent betrachtet wird, ist der Kontroll- und Qualitätssicherungsaspekt von Supervision. Einerseits ist sie als freiwillig, reflektierend, auf Augenhöhe und dialogisch konzipiert, andererseits wird aber in Job- und Institutionsbeschreibungen Supervision sehr wohl als Mittel der Sicherstellung eines gewissen Dienstleistungsniveaus dargestellt. In einigen Berufsfeldern wie etwa der Kinder- und Jugendhilfe sowie Ausbildungen zum/r Psychotherapeut:in, Sozialarbeiter:in, für Pflegeberufe oder anderen psychosozialen Professionen ist sie fixer Bestandteil der Curricula oder verpflichtende kontinuierliche FortbildungsmaßnahmeFootnote 4.

Was jedoch weiter fehlt, ist eine gemeinsame Auffassung davon, was Supervision ist, welche Elemente dafür unabdingbar sind und aufgrund welcher Hintergrundmodelle sie wirkt, wie schon Bergknapp (2009) postulierte. Noch größer ist die Differenz zwischen Festlandeuropa und dem angloamerikanischen Raum, was von den wenigen Autor:innen, die europäische Literatur rezipieren, ebenfalls festgestellt wird (z. B. Cutcliffe et al. 2010).

Wie schwierig die Etablierung eines Forschungsgebietes ist, wenn die darin bewegenden Wissenschafter:innen ganz unterschiedliche Definitionen, Vorstellungen und Modelle verwenden, liegt auf der Hand. Hier ergibt sich wohl eine Ähnlichkeit mit dem Bereich der Coachingforschung, die auf ebenso uneinheitliche und diverse Definitionen angewiesen ist und in der disparate Communities jeweils ihre eigene Forschungslinie anhand eigener Modelle und Definitionen verfolgen (Kotte et al. 2016). Oft diffundieren die Coaching- und Supervisionsauffassungen ja auch – was v. a. von den Berufsverbänden vorangetrieben wird. Möglicherweise profitieren diese ja auch von breiten Beschreibungen von Supervision, die vieles umfassen und mit Coaching diffundieren – nach dem Motto: „Supervisor:innen können alles“.

2.2 Welche Forschungsfragen werden gestellt?

Die meisten empirischen Arbeiten zu Supervision, sowohl im englischsprachigen wie im europäischen Feld, versuchen, die Wirkung und v. a. den Nutzen von Supervision zu dokumentieren. Oft sind die Forscher:innen dabei auch die Anbieter:innen oder Entwickler:innen der jeweiligen Supervisionskonzepte und betreiben so Legitimationsforschung für die eigenen Projekte. In der Hauptsache werden dabei die Supervisand:innen (manchmal auch Supervisor:innen) zu Rahmenbedingungen, ihrer Zufriedenheit mit dem individuell konstatierten Nutzen der Supervision befragt. Im Bereich der Clinical Supervision sind dies besonders Fragen nach guten Supervisor:innen = Ausbildner:innen (die oft nur kurze Trainings durchlaufen, um diese Tätigkeit auszuüben). Andere, von wissenschaftlichen Modellen oder Theorien abgeleitete Qualitätskriterien werden nicht erhoben. Es gibt nur ganz wenige Studien, die die Klient:innen der Supervisand:innen in die Forschung miteinbeziehen – die Antwort auf die Frage, ob Supervision auf dieser Ebene nachweisbar sein sollte, bleibt weitgehend unbeantwortet bzw. kann nicht nachgewiesen werden (z. B. Tanner 2012).

Prozessforschung ist weniger verbreitet, und wenn, dann mit sehr kleiner Fallzahl oder als Case Study zu finden. Im Feld der Clinical Supervision existiert eine breitere Forschungslinie zur supervisorischen Beziehung und Passung. Hier sind besonders Fragen zu Ethnizität und Gender im Fokus der Forscher:innen – etwas, was im europäischen Raum (noch?) kaum thematisiert wird. Dies wird durch den Schwerpunkt als Ausbildungssupervision erklärbar: Die Supervisor:innen sind meistens interne Angehörige der Institutionen und können nicht frei gewählt werden. Somit ist die Ausbildner:in und Beurteiler:in auch zugleich Supervisor:in, was die Beziehung herausfordernd macht. Jenseits dessen fehlen detaillierte Prozessstudien zur Entwicklung der supervisorischen Beziehung, auch wenn diese – übereinstimmend – als für gelingende Supervision unabdingbar betrachtet wird.

International stark vertreten sind Forschungsfragen zur Ausbildung zum/zur Supervisor:in: Dabei werden zumeist Trainings für die Erlangung des Status der Supervisor:in evaluiert, die allerdings im Vergleich zu Ausbildungen im europäischen Raum nur einen Bruchteil der Zeit in Anspruch nehmen – viele Trainings dauern wenige Tage. Auch hier zeigt sich eine Ähnlichkeit mit Coaching, bei dem vergleichbar unterschiedliche Ausbildungsniveaus existieren.

Neu ist die Forschung zu remote Supervision, also solchen Formaten, in denen Supervision online stattfindet. War diese im Jahr 2020 zur Herausgabe von SAP 2 noch weitestgehend dem amerikanischen und v. a. australischen Raum vorbehalten, sind derartige Themen seit der Corona-Pandemie auch in Europa en vogue – der Forschungsoutput ist jedoch noch sehr gering; es überwiegen Artikel, die konzeptuelle Überlegungen bringen oder eigene Erfahrungen referieren (Kühne und Hintenberger 2020; Engelhardt 2020). Da die Autor:innen häufig Entwickler:innen oder Durchführende solcher neuer Settings sind, fallen die Evaluationen meistens sehr optimistisch bzw. wenig kritisch aus. Die Mehrzahl der Beiträge kommen aus dem Feld der Psychotherapie oder der sozialen Arbeit und sind Handlungsanleitungen und Abwägungen der Expert:innen (z. B. Romanczuk-Seiferth 2020). Ähnlich stellt sich die Situation im Coaching dar. Auch hier werden digitale Kommunikationswege als zukunftsweisend beschrieben und Forderungen gestellt, welche Qualitätskriterien sie erfüllen müssten. Arbeiten zur empirischen Betrachtung dieser Formate durch dritte, den Prozess beobachtende und diesen analysierende Forscher:innen werden zwar gefordert, sind aber noch rar (vgl. Hasenbein und Kraiss 2021).

Interessant ist, dass sich auch international nur wenige Studien mit ethischen Fragen der Supervision beschäftigen – das Dunkelfeld von Supervision ist nach wie vor nicht sehr erhellt (Schigl 2016); hier hat Coachingforschung im Vergleich zu Supervisionsforschung schon früher diese Themen entdeckt (z. B. Schermuly 2014; Oellerich 2016). Forschungsarbeiten im Zusammenhang mit der Erstellung eines Supervisionskontrakts und der damit verbundenen supervisorischen Diagnose der Situation tauchen in den Veröffentlichungen nicht auf, obwohl dies in allen Praxisanleitungen als so wichtig beschrieben wird.

2.3 Mit welchen Designs wird geforscht?

In unsere SAP 2 Recherche wurden ausschließlich empirische Arbeiten aufgenommen, die wissenschaftlichen Mindestanforderungen entsprechen (vgl. Schigl et al. 2020, S. 54).

Die überwiegende Zahl der auf diese Weise selektierten empirischen Studien sind Ex-Post Befragungen der Teilnehmer:innen an Supervisionsprozessen oder Supervisionsausbildungen. Einige Studien führen einen Vergleich mit Personen, die keine Supervision in Anspruch nahmen, durch (z. B. Geißler-Piltz und Gerull 2007) oder vergleichen verschiedene Arten von Supervisionssettings/-methoden (Lin 2012). Legt man diesen Designs die Oxford Levels of Evidence (Howick 2009) als Beurteilungsschema zugrunde, bewegt sich die Supervisionsforschung großenteils auf Level 1 (Expert Opinions) und 2 (Case Studies/Case Series). Es stellt sich allerdings die berechtigte Frage, ob für Supervision ein in der medizinisch-pharmakologischen Forschung entwickeltes Qualitätsraster Anwendung finden sollte. In SAP 2 ordneten wir die Studien entlang einem erweiterten Schema, das für die Supervisionsforschung angepasst wurde (Schigl et al. 2020, S. 56). Auch in der Psychotherapieforschung werden solche Forderungen kontrovers diskutiert (Wampold et al. 2018). Allerdings gelten in den internationalen Publikationen Forschungen, die Forderungen nach Evidenzbasierung nachkommen, als höherwertig. Denn im Grund bedeutet Evidenzbasierung nichts anderes, als dass Nutzer:innen (eben oft Patient:innen) eine Leistung bzw. Behandlung nur dann erhalten sollen, wenn diese nachweislich wirksam ist. Zurecht kann man allerdings argumentieren, dass Supervision als eine Dienstleistung nicht „wirken“ muss, sondern in Anspruch genommen wird und in erster Linie ihre Kund:innen, die Supervisand:innen zufriedenstellen muss. Dafür reichen sozialwissenschaftlich konzipierte Surveys bzw. Kohortenstudien.

Als hauptsächliche Forschungsinstrumente werden Fragebögen oder Interviews eingesetzt. Standardisierte Messinstrumente finden sich v. a. in englischsprachigen Studien. Befragt werden, wie schon ausgeführt, in der Hauptsache Supervisand:innen und manchmal auch deren Supervisor:innen. Dabei stellt die Manchester Clinical Supervision Scale (MCSS©; Winstanley und White 2011) einen relativ weit verbreiteten und international verwendeten Fragebogen dar, der zur Evaluation von Supervision entwickelt wurde, – seine deutschsprachige Übersetzung steht noch aus.

Festzustellen ist, dass Supervisionsforschung im Vergleich etwa zur Psychotherapieforschung hauptsächlich von weiblichen Forscherinnen publiziert wird. Dies resultiert aus Feldern, in denen Supervision angewandt und erforscht wird, wie v. a. Pflege, Bildung, Sozialpädagogik und Sozialarbeit – alles hochfeminisierte Felder. Zur Coachingforschung kann das nicht konstatiert werden.

3 Welche Forschungsfelder konnten identifiziert werden?

Aus Gründen der Vergleichbarkeit verwendeten wir für die Ordnung der Studien die schon in SAP 1 extrahierten Themencluster und erweiterten diese um neu hinzugekommene Bereiche. Dies führte zu folgenden Themenclustern (dahinter die ursprüngliche Anzahl von zugeordneten Studien):

  • (Evaluation von) Supervision in diversen Gesundheitsberufen (außer Krankenpflege): 149

  • (Evaluation von) Supervision in der Krankenpflege (Nursing): 134

  • Generelle Effekte von Supervision: 86

  • Untersuchungen in speziellen Feldern von Supervision: 56

  • Untersuchung bestimmter Elemente des Supervisionsprozesses: 47

  • Wirkung auf Arbeit der der Supervisand:innen (auch Klient:innenebene): 38

  • Ethnizität, Diversity und Gender in der Supervision: 35

  • Aus/Weiterbildung von Supervisor:innen, Evaluation von Weiterbildungen: 29

  • Entwicklung und Überprüfung von Messinstrumenten in der Supervision: 23

  • Lernen und Kompetenzvermittlung in der Supervision: 18

  • Peer-Supervision: 12

  • Methoden und Techniken in der Supervision: 12

  • Risiken von Supervision: 11

  • Form und Weite des Begriffs Supervision: 4

  • Bedarf an Supervision: 3

  • Geschichte von Supervision: 2

  • Zu den Bereichen „Identität von Supervisor:innen“ und „spezielle Inhalte“ als einer Restkategorie, die wir in SAP 1 verwendet hatten, ergaben keine Zuordnungen

Daraus resultierten nach mehrfachen Bereinigungsprozessen (ungenügende Information, graue Literatur, doppelte Publikationen in unterschiedlichen Journals, ungenügende wissenschaftliche Qualität etc.; vgl. Schigl et al. 2020, S. 55 f.) insgesamt 659 Volltext-Beiträge.

Die ersten vier und größten Cluster untersuchen Supervision in verschiedenen Feldern und/oder Berufen. Der mehrheitlich englischsprachige Themenbereich Supervision in diversen Gesundheitsberufen ist der ursprünglich größte Cluster. Gesundheitsberufe meint hier medizinische Assistenzberufe, Berater:innen, Clinical Counsellors unterschiedlicher Herkunftsberufe wie Psycholog:innen, Sozialarbeiter:innen, Ergotherapeut:innen, Logopäd:innen etc.. Es handelt sich in der Mehrzahl um einfache ex post-Evaluationen (Fragebögen, Interviews) der Supervisionsangebote für interdisziplinäre oder interprofessionelle Teams. Auffallend ist bei vielen der englischsprachigen Studien, dass von den Teilnehmer:innen eine Unklarheit bezüglich der Begriffs Supervision konstatiert wird, etwa weil Supervisionen im Rahmen von Teamsitzungen oder sonstigen Besprechungen mit Vorgesetzten abgehalten wurden und so unterschiedliche Bedürfnisse und Anforderungen nicht unter einen Hut gebracht werden konnten. Eine größere Gruppe bilden mehr als 20 Multicenterstudien aus dem Umfeld Integrativer Supervision, die in Deutschland, Österreich und der Schweiz mit ähnlichen Instrumenten durchgeführt wurden, um die Wahrnehmung der Qualität des jeweiligen (institutionellen) Supervisionsangebots zu erfassen. Die Ergebnisse zeigen ein teilweise kritisches Bild: Die Qualität und der Nutzen von Supervision werden als eher mittelmäßig beurteilt, und teilweise mangelnde Feldkompetenz der Supervisor:innen festgestellt. In den meisten Einzel-Studien wird jedoch ein positiver Nutzen von Supervision konstatiert. Teamsettings, v. a. multiprofessionelle Supervisions-Teams, sind herausfordernd, da die Mitarbeiter:innen dabei oft auf unterschiedlichen Hierarchieebenen arbeiten. Hohe Bedeutung kommt der Implementierung und Information über die geplanten Supervisionsmaßnahmen für deren Akzeptanz zu (vgl. Diermann 2016).

Supervision im Feld der Krankenpflege (nursing) ist der größte Feld-Cluster, ebenfalls hauptsächlich in englischsprachiger Literatur. Wir identifizierten einige Studien zu Rahmenbedingungen und Setting und hauptsächlich Evaluationsstudien, von einfachen Umfragen bis zu hoch elaborierten RCT-Designs, sowohl mit qualitativen als auch mit quantitativen Messinstrumenten. Generell wird auch hier die Komplexität und unklare Funktion von Supervision konstatiert: Je größer das Wissen um Supervision bei den Supervisand:innen, desto eher wird Supervision positiv wahrgenommen und in Anspruch genommen. Wirksame Settings sind durch monatliche Intervalle über längeren Zeitraum in möglichst kleinen Gruppen, außerhalb des Arbeitsplatzes bei selbst gewählten Supervisor:innen gekennzeichnet. Supervision wird v. a. bei den qualitativen Studien positiv beurteilt, sie steigert etwa die Kommunikation im Team, den Teamzusammenhalt, die interdisziplinäre Kooperation, den Umgang mit Gefühlen und bringt eine Reduzierung wahrgenommener Belastungen.

Die Wirkung von Supervision auf die Arbeit der Supervisand:innen hatten ebenfalls viele Studien zum Thema, wobei auch hier zumeist die Supervisand:innen, selten Daten bei deren Patient:innen oder Klient:innen und nie Einschätzungen externer Rater:innen berücksichtigt wurden. Die Studien kommen fast ausschließlich aus den klinischen, wenige aus dem pädagogischen Feld. Die meisten Studien, die Clinical Supervision beforschen, bestätigen eine positive Wirksamkeit, die weitgehend als entlastend beschrieben wird; in einigen Studien konstatieren die Autor:innen auch eine burnout-prophylaktische Wirkung.

Risiken und unerwünschte Wirkungen von Supervision als Schattenseite des Wirksamkeitsspektrums sind neu aufgetauchte Themen, die seit etwa 2009 zu finden sind und versuchen, dieses Dunkelfeld durch Befragungen bei Supervisand:innen zu erhellen.

Auch in Zusammenhang mit Gender & Diversity werden Themen von Macht in der Clinical Supervision angeschnitten. Überwiegend sind die Studien mit kleiner Teilnehmer:innenanzahl konzipiert, allerdings durchaus anspruchsvoll (z. T. mit Audioaufzeichnungen als Datenbasis). Andere Arbeiten fokussieren auf den Spiegelungsprozess der Beziehung zwischen Supervisor:in – Supervisand:in – deren Klient:in. Studien zur Rolle der sexuellen Orientierung oder Ethnizität in der Supervision finden sich ausschließlich in angloamerikanischen Arbeiten und konstatieren die Wichtigkeit dieser Variablen.

Forschungsarbeiten zu Elementen des Supervisionsprozesses haben im Vergleich zu SAP 1 stark zugenommen, allerdings mit neuen Foki. So konnten zu Übertragung und Gegenübertragung keine empirischen Arbeiten identifiziert werden, allerdings eine Vielzahl von Studien zur supervisorischen Beziehung mit Aspekten wie Erwartungen, Macht, Scham und Vorsicht. Generell sind die Designs und Arbeiten eher simpel, es wurden mit einfachen Instrumenten Daten erhoben. Konkrete einzelne Methoden und Techniken werden nur selten in den Blick der Forscher:innen genommen, am ehesten noch in Zusammenhang mit digitalen Techniken zur Supervision mittels E‑Mails, Chat und Videokonferenzen oder live mittels bug-in-the-eyeFootnote 5. Die Beschreibungen sind durchaus positiv; eine auch kritische Betrachtung findet sich nur einem Handbuch (Rousmaniere und Renfro-Michel 2017). Unterschiedliche Hintergrundtheorien wie psychoanalytische, humanistische oder systemische Ansätze fehlen im Vergleich zu SAP 1 im Forschungsinteresse völlig. Hier hat sich Supervision im vergangenen Jahrzehnt schon weiter von ihren psychotherapeutischen Wurzeln entfernt.

Eine Vielzahl von Studien beschäftigt sich qualitativ und quantitativ mit der Evaluation von Supervisionsaus- und Weiterbildungen, auch elaboriert zu verschiedenen Zeitpunkten der Ausbildungsgänge. Diese sind im europäischen Raum durchgehend umfangreicher konzipiert als etwa in den USA oder Australien, wo manchmal Trainings von wenigen Tagen genügen, um sich zum Clinical Supervisor zu qualifizieren. Änderungen werden etwa bezüglich Selbstbild, Beziehungs- und emotionalen Kompetenzen und Aspekten der Persönlichkeit von (angehenden) Supervisor:innen durch die Ausbildungen festgestellt.

Lernen und Kompetenzentwicklung in und durch Supervision stellt ein großes und heterogenes Feld der Forschung dar. Es werden sehr unterschiedliche Aspekte des Lernens betrachtet, von kognitiven Inhalten bis hin zu Verhaltensänderungen. Die erhobenen Daten sind meistens qualitativer Natur bei kleinen Stichproben. Oft wird ein Lerngewinn konstatiert, den die Supervisand:innen jedoch nicht ursächlich mit der stattgefundenen Supervision in Zusammenhang bringen – es dürfte ihnen nicht klar sein, dass auch darauf fokussiert werden kann. Generell wird fallorientierte Supervision als hilfreich und somit implizit als lernfördernd identifiziert.

Dem Themencluster Peer Supervision entspricht inhaltlich am ehesten der deutschsprachigen Auffassung von Supervision und meint eine angeleitete (kollegiale) Beratung und Reflexion zumeist im Feld von Psychotherapie und Clinical Counselling, Hierzu konnten immerhin 12 Beiträge zugeordnet werden, die sich mit den Möglichkeiten dieser mehr reflexiven Form von Supervision beschäftigen. Die Autor:innen, oft selbst Entwickler:innen dieser Formate, konstatieren dabei durchgehend positive Erfahrungen.

Erfreulich ist, dass zumindest im angloamerikanischen Raum vermehrt Instrumente zur Erforschung von Supervision entwickelt und eingesetzt werden. Sie nehmen etwa auf die supervisorische Beziehung, auf Bereiche des Lernens, aber auch auf Mikroaggressionen im Rahmen von Supervision oder generell auf Zufriedenheit und Effekte Bezug (eine Liste aller Instrumente findet sich im Anhang von Schigl et al. 2020).

4 Einige spannende Beispiele

Einige Supervisionsforscher:innen versuchten sich an die Vorgaben von RCT StudienFootnote 6 zu halten. In diesen Studien werden Versuchsgruppen (z. B. diejenigen, die Supervision erhalten) mit Kontrollgruppen (z. B. die, die keine Supervision oder eine andere Art der Unterstützung erhalten) verglichen. Wesentlich ist dabei die willkürliche („randomized“) Zuordnung der Teilnehmer:innen zu den jeweiligen Gruppen, die so sicherstellen will, dass es zu keiner systematischen Verzerrung durch die Auswahl der Proband:innen kommt. So untersuchten Bambling et al. (2006) mit standardisierten Fragebögen den Einfluss von Supervision auf die therapeutische Beziehung und deren Zusammenhang mit einer Besserung der Symptome bei Kurzzeittherapien von schwerer Depression. Es handelt sich somit um eine Studie, die nicht nur auf der Ebene der Supervisand:innen, sondern auch auf der von deren Patient:innen den Effekt von Supervision festzumachen versucht. Dabei erhielten 127 Patient:innen mit schwerer Depression eine 8 Sitzungen umfassende Kurzzeittherapie bei 127 Therapeut:innen, die nach Zufallsprinzip drei Gruppen zugeordnet wurden: Eine Gruppe erhielt eine auf den Therapieprozess fokussierte, mehr reflexiv angelegte, eine zweite Gruppe eine mehr Skills-fokussierte, anleitende Supervision, die dritte Gruppe arbeitete ohne Supervision. Die supervisorische Begleitung war mit 8 Sitzungen – also 1:1 – sehr intensiv. Die Ergebnisse zeigten einen signifikanten Effekt auf die therapeutische Beziehung für beide Supervisionsbedingungen, ebenso konnte in beiden Gruppen eine signifikant bessere Symptomreduktion als in der Kontrollgruppe ohne Supervision gemessen werden. Die Patient:innen der supervidierten Therapeut:innen verblieben auch eher in der Therapie und bewerteten diese besser. Es zeigte sich allerdings kein signifikanter Unterschied zwischen den beiden Supervisionsbedingungen – die reflexiv arbeitende und die anleitend arbeitende Gruppe schnitten im Mittel gleich gut ab.

Zwei andere RCT-Studien zum Vergleich von supervidierten mit nicht-supervidierten Professionals – Therapeut:innen in Ausbildung (Tanner 2012) und psychiatrisches Pflegepersonal (White und Winstanley 2010) – hingegen konnten keine Auswirkungen auf die Symptomverbesserung der Patient:innen bei supervidierten Behandler:innen feststellen.

In einer Prä-Post-Vergleichsstudie mit Kontrollgruppe, allerdings ohne Zufallszuordnung zu den Gruppen (Bradshaw et al. 2007), konnte ein Effekt von Supervision, der sich bis auf der Ebene von 89 an Schizophrenie erkrankten Patient:innen zeigte, nachgewiesen werden: Die Untersuchung sollte erheben, welchen Effekt eine strukturierte Clinical Supervision im Rahmen einer 36-tägigen Schulung (Psychological Intervention Training) für psychiatrisches Krankenpflegepersonal zeigt. Die Versuchsgruppe erhielt zusätzlich eine „workplace clinical supervision“, die Kontrollgruppe nicht. Die Versuchsgruppe mit Supervision zeigte ein signifikant besseres Wissen über Schizophrenie und psychologische Interventionen. Die Patient:innen beider Gruppenbedingungen konnten profitieren, die Patient:innen, die von supervidierten Nurses (Versuchsgruppe) begleitet wurden, hatten darüber hinaus eine signifikante Verbesserung der positiven und affektiven Symptomatik.

Hyrkäs et al. (2006) stellten in ihrer Studie Efficacy of Clinical Supervision: Influence on Job Satisfaction, Burnout and Quality of Care eine burnoutprophylaktische Wirkung von Supervision fest: Sie untersuchten die Wirkung von Supervision mit vier standardisierten Messinstrumenten, darunter dem Maslach Burnout Inventory (Maslach et al. 1996); Weibliche Supervisandinnen beurteilten Supervision besser als ihre männlichen Kollegen und Personen ohne Nachtdienstverpflichtung, in unkündbarer Position oder mit zusätzlicher Ausbildung beurteilten Supervision am besten. Bevorzugt wurden bei freier Auswahl akademische weibliche Supervisorinnen, die nicht auch aus Krankenpflegeberufen kamen. Hohe Supervisionswirksamkeit korrelierte mit höheren Werten in Job-Zufriedenheit, besserer Aufgabenzentrierung sowie vermindertem Jobstress.

Eine qualitative Studie, die die Implementierung von Clinical Supervision in der Kinder- und Jugendhilfe in vier US-amerikanischen Staaten untersuchte (Collins-Camargo und Millar 2010), befragte Mitarbeiter:innen in Gruppendiskussionen am Beginn und Ende der Supervisionsprozesse: Dabei zeigte sich, dass durch die Supervision ein stärkerer Fokus auf Lernen und die Vermittlung von Techniken der Klinischen Arbeit gelegt und in den Teambesprechungen der Gruppendynamik mehr Beachtung geschenkt wurde. Außerdem förderte die Supervision die Zusammenarbeit der Dienststellen. Die Superviand:innen berichteten eine Steigerung des aktiven Zuhörens gegenüber den Klient:innen und eine realistischere Erwartung gegenüber den Veränderungen in den Familien. Die Supervisor:innen beobachteten, dass die Familien verstärkt in die Planung der Schritte miteinbezogen wurden, was sich positiv auf ihre Selbstwirksamkeit auswirkte. Prozesse konnten so schneller abgeschlossen werden, die Rückmeldungen der Klient:innen waren positiver, und es gab weniger Beschwerden.

Die Auswirkungen der Qualität der supervisorischen Beziehung bei Clinical Counsellors erhob Sterner (2009) mittels dreier standardisierter Messinstrumente mit 71 Supervisand:innen: Dabei zeigte sich ein deutlicher Zusammenhang zwischen einer positiv wahrgenommenen supervisorischen Allianz, der Arbeitszufriedenheit und einer Reduktion von arbeitsbezogenem Stress.

Willutzki et al. (2005) widmeten sich in ihrer Untersuchung der Frage nach der Auswirkung von Supervision auf die psychotherapeutische Beziehung. Sie verwendeten ebenfalls standardisierte Messinstrumente sowie einen für die Studie selbst konstruierten Fragebogen zur Beurteilung der therapeutischen Beziehung aus Sicht der Patient:innen (104) und Psychotherapeut:innen (16). Beide schätzten die therapeutische Beziehung nach der Supervision als besser ein als davor, wobei dieser Effekt bei den Patient:innen prägnanter war als bei den Therapeut:innen.

5 Schlussfolgerungen

5.1 Get together!

Ein generelles Manko der Supervisionsforschung, v. a. im europäischen Raum besteht darin, dass es keinen common ground gibt, auf dem die Forscher:innen stehen, sich treffen und austauschen. Es existieren verschiedene kleine Forschungsgruppen, zumeist um eine oder zwei engagierte Personen, die sich allerdings gegenseitig kaum wahrzunehmen scheinen. Jede/r verfolgt eine eigene Forschungslinie, erstellt eigene Instrumente, postuliert eigene Thesen zu eigenen Themen. Es gibt wenig Bezug aufeinander und kein von allen geteiltes, anerkanntes Wissen zum State of the Art, auf das alle sich beziehen.

Deshalb wäre als erste Empfehlung eine bessere Vernetzung der Forscher:innen untereinander zu postulieren. Dabei wäre ein Austausch der unterschiedlichen Auffassungen und Ziele von Supervision und damit einhergehend eine Abgrenzung zu anderen im Feld angesiedelten Beratungsformaten (vor allem Coaching, aber auch Mentoring, Krisenintervention, Training, Organisationsentwicklung etc.) wichtig. Dies würde die Etablierung von Forschungslinien begünstigen, mit denen Wissen, aufeinander aufbauend und zueinander in Bezug gesetzt, entwickelt werden könnte. Dazu beitragen könnte etwa ein internationales (englischsprachiges) Forschungs-Journal. Die verdienstvolle Zeitschrift OSC wird sprachlich bedingt im deutschsprachigen Raum rezipiert, beschäftigt sich auch immer mehr mit Coaching, und die Beiträge zu Supervision nehmen ab. Der englischsprachige „The Clinical Supervisor“ ist ein ähnliches Organ, in dem sich eine Mischung aus Praxisanleitungen und empirischen Untersuchungen finden. Jedoch gibt es kaum gegenseitige Zitationen oder Bezugnahmen. Zum Unterschied zur Psychotherapieforschung gibt es keine internationale Gesellschaft der Supervisionsforscher:innen als gemeinsame Plattform.

So fehlt ein regelmäßig stattfindender internationaler Kongress für Forscher:innen, die sich dem Feld der Supervision widmen, wie es im Coaching mit Coaching meets research schon gegeben ist. Einen Anfang schien die Association of National Organisations for Supervision in Europe (ANSE) im Jahr 2015 mit einer Forschungskonferenz in Budapest zu machen, dem 2017 auch eine Publikation der Beiträge folgte (De Roos et al. 2017). Leider wird dieses Projekt nicht weiterverfolgt. Die geplante (online‑) ANSE-Tagung im Juni 2022, die als Forschungstagung angekündigt war, widmet sich dem Thema lernende Organisation. So wichtig dieses sein mag, es wird nicht in erster Linie Supervisionsforscher:innen anziehen und vernachlässigt wieder einmal mehr die Forschung zu Supervision. Bei Drucklegung des Artikels wurde diese Konferenz mangels Teilnehmer:innen abgesagt, offenbar kam sie den Interessen der Forscher:innen nicht entgegen.

Ein weiterer Brückenschlag sollte mit den Kolleg:innen aus dem angloamerikanischen Raum erfolgen. In der dortigen Diskussion zeigen sich Tendenzen, Supervision eher in Richtung der europäischen Auffassung des Formats anzunähern. So argumentieren z. B. Martin und Milne (2018), man solle Supervision mehr als Beziehung begreifen und weniger als anleitendes Ausbildungselement. V. a. im Bereich der Supervision zu Psychotherapie scheint es eine Veränderung in diese Richtung zu geben – was auch die Publikationen zu Peer Supervision oder Professional Supervision belegen.

5.2 Connect your research

Diese Forderung kann nur dann erfüllt werden, wenn die Communities der Forscher:innen näher zusammenrücken und sich gegenseitig wahrzunehmen beginnen. Einfache Möglichkeiten einer solchen aufbauenden Forschung wären etwa Multicenterstudien, die etwa in verschiedenen Ländern mit demselben Design dieselbe Frage untersuchen, wie es etwa in den Felderkundungen im Umkreis der Integrativen Supervision schon versucht wurde (z. B. Gottfried 2012).

Das Verwenden der gleichen Instrumente oder standardisierter Fragebögen würde ebenfalls Anschluss und Vergleichbarkeit zwischen einzelnen Studien bringen. Auch Replikationen von schon durchgeführten Studien wären ein wertvoller Beitrag, Ergebnisse abzusichern. V. a. jene, die den größten empirischen Output produzieren, nämlich Teilnehmer:innen von Supervisions-(Master‑)Studien, müssten angehalten werden, nicht nur ihre theoretischen Bezugsquellen einzubinden, sondern qualifizierte Recherchen zur internationalen Forschung zu ihrer jeweiligen Fragestellung durchführen und – wie oben gesagt – mehr auf standardisierte Messinstrumente oder schon häufig verwendeten Fragebögen zurückgreifen.

5.3 Create good designs

Die Frage nach den adäquaten Forschungsdesigns für Supervision kann man wohl nicht einheitlich beantworten. In SAP 2 fanden sich folgende passende Forschungskonzepte:

  • (Single) Case Studies: Ausführliche Untersuchung einer einzelnen Person oder Gruppe

  • Expert:innen-Interviews: Leitfadengestützte Interviews mit Personen mit speziellem Wissen

  • Case Series: Reihe von systematisierten Fallberichten mit ähnlichem Fokus

  • Reviews/Übersichtsarbeiten: Darstellung, Analyse und Bewertung der (publizierten) Literatur eines Forschungsbereichs

  • Kohorten-Studien an einer Gruppe zu Outcome oder Prozess (ein bestimmter Fokus)

  • Quasi-experimentelle Studien: Vergleich zweier Gruppen ohne Zufallsauswahl, naturalistische Outcome Studien

  • Randomized Controlled Trial-Studies (RCT): Vergleich von mehreren Gruppen (Versuchs- und Kontrollgruppen) mit einem Vorher-Nachher-Vergleich und Zufallszuordnung

Das Autor:innenteam von SAP 2 kam zum Schluss, dass eine Forderung zum (weiteren) Nachweis der Wirksamkeit von Supervision durchaus berechtigt ist, wie auch Cutcliffe et al. (2010) im Handbook of Clinical Supervision fordern. Dies benötigt aber nicht notwendigerweise RCT-Untersuchungen. Ebenso wichtig ist Prozessforschung, um darstellen zu können, wie und wodurch Supervision wirksam wird. Wichtig wäre eine unabhängige Forschung, bei der nicht die Anbieter:innen von Supervision auch diejenigen sind, die diese bei ihren Supervisand:innen evaluieren.

5.4 Fazit

Bei Supervision handelt es sich um ein Forschungs- und Wissenschaftsfeld, das kaum einmal 50 Jahre alt ist, ein Gebiet, das eine eigenständige Tradition erst entwickeln muss. Insgesamt kann man konstatieren, dass sich das Gesamtniveau der empirischen Supervisionsforschung deutlich gesteigert hat. Die Qualität der Untersuchungen ist jedoch breit gestreut, es hat sich noch kein State of the Art herausgebildet. Weiter gilt: „Unser forschungsgegründetes Wissen über Supervision ist noch Stückwerk, die meisten Untersuchungen stellen kleine Inseln der Erkenntnis im Meer des Unbekannten dar“ (Schigl 2008, S. 51). Viele spannende Fragen, etwa zu ethischen Themen, Settings und Contracting, sind neben Evaluationen noch offen, und es besteht generell ein hoher Forschungsbedarf, um ebenso wie im Coaching dieses Beratungsformat zu schärfen.