Einleitung

In einer Meta-Studie von 2017 über Ethik-Trainings in den Wissenschaften kommen die Autor:innen zu der ernüchternden Feststellung, dass sich zwar die Ethik-Lehre ab dem Jahr 2000 verbessert hätte, insgesamt jedoch noch einiges an Potenzial zur Verbesserung vorhanden sei. Die meisten der untersuchten Lehrangebote würden nur eine „mässige Wirksamkeit des Unterrichts“ zeigen („moderate instructional effectiveness“), wobei insgesamt die Wirksamkeit unter den Programmen beträchtlich variiere (Watts et al. 2017, S. 381). Zwei weitere Meta-Analysen zum Wirtschaftsethik-Training (Medeiros et al. 2017) und zum Forschungsethik-Training (Katsarov et al. 2021a) stellen ebenfalls fest, dass viele Kurse weit hinter ihren Möglichkeiten zurückbleiben – während andere erprobte Kurse die gesteckten Lernziele mit Bravour erreichen. Während Meta-Studien wie diese vielfältige Indizien dafür liefern, welche Faktoren eine effektive Ethik-Lehre begünstigen, sucht man entsprechende Studien für das Ethik-Training in der Medizin bislang vergeblich. So lässt sich dieser Befund nur bedingt auf die Ethik-Lehre in der medizinischen Ausbildung übertragen. Und sicherlich ergeben sich auch aufgrund der großen Variabilität der einbezogenen Studien Probleme hinsichtlich der Vergleichbarkeit der Ergebnisse – immerhin flossen 66 empirische Studien, 106 Ethik-Kurse, 150 Effektgrößen bei über 10.000 Teilnehmenden in ganz unterschiedlichen Formaten in die Auswertung ein. Der Befund ist insofern mit Vorsicht zu genießen. Und dennoch: Das Ergebnis ist für Ethik-Dozierende irritierend. Es bescheinigt, dass sich aufgrund fehlender wissenschaftlich aussagekräftiger Evaluationsstudien mitunter nur vermuten lässt, wie wirksam bestimmte Lehrformate und -methoden in der Ethik-Lehre tatsächlich sind. Die Auswahl von Lehrformaten und -methoden, die die Ethik-Dozierende für das Erreichen eines festgelegten Lernziels einsetzen, wird häufig nicht nach evidenzbasierten Kriterien, sondern auf der Grundlage von guten oder schlechten Lehrerfahrungen sowie von unmittelbarem Feedback der Studierenden getroffen. Was sich nach eigener Einschätzung bewährt hat (meistens diejenigen Formate, in denen die Studierenden besonders viel diskutiert haben), wird beibehalten, womit man schlechte Erfahrungen gemacht hat, wird aussortiert. Ein solcher erfahrungs-basierter Ansatz mag im Bereich der Ethik-Lehre, in dem viele Dozierende seit vielen Jahren unterrichten, naheliegen und eine gewisse Berechtigung haben. Dennoch sollte ein vermeintliches Sicherheitsgefühl, das sich über die eigenen Lehrjahre angereichert hat, nicht dazu führen, sich mit dem Status Quo zufriedenzugeben, auf wissenschaftlich aussagekräftige Studien über die Wirksamkeit von ethischer Lehre zu verzichten und die mitunter äußerst überraschenden Erkenntnisse aus Einzelevaluationen und Meta-Studien nicht zur Kenntnis zu nehmen.

Eine gewisse Orientierung für die persönliche Überprüfung und Verbesserung von Lehrveranstaltungen geben studentische Evaluierungen, die zur Qualitätssicherung mittlerweile ein kaum mehr wegzudenkender Baustein universitärer Lehre geworden sind. Meist wird dabei jedoch nur eine nachgängige Zufriedenheitsbefragung durchgeführt und eine Selbsteinschätzung des eigenen Lernzuwachses der Studierenden abgefragt. Dieses Stimmungsbild kann für Dozierende wichtige Hinweise beinhalten, um in einer Feedback-Schleife die Kursinhalte und Lehrmethoden beizubehalten, zu justieren oder abzuändern. Dieses Evaluierungsinstrument sagt aber nur bedingt etwas darüber aus, ob Lehrformate, -methoden und -inhalte tatsächlich geeignet sind, um die vorab festgelegten Lernziele und einen ethischen Kompetenzzugewinn zu erreichen. Um Wirksamkeit systematisch und wissenschaftlich fundiert zu erfassen, müsste zumindest eine Vergleichskohorte oder eine Prä‑/Post-Evaluierung eingesetzt werden. Da dies zeit- und ressourcenaufwändig ist, kommen solche anspruchsvolleren Befragungen in der Regel nur im Rahmen innovativer Pilotprojekte und in der Lehrforschung zur Anwendung und können demnach nur bedingt etwas über den Routine-Ethik-Unterricht aussagen. Dementsprechend findet man kaum methodisch fundierte Evaluationen im Bereich der Ethik-Lehre an deutschsprachigen medizinischen Fakultäten, Hochschulen und anderen Ausbildungsstätten für Gesundheitsberufe. Anlässlich der curricularen Verankerung von „Geschichte, Theorie und Ethik“ wurde bereits 2008 auf die Notwendigkeit von Wirksamkeits-Analysen der entsprechenden Ethik-Lehre hingewiesen (Buyx et al. 2008). Dass bisher nur wenige Ethik-Dozierende diesem Aufruf gefolgt sind, mag sicherlich zu einem gewichtigen Teil an der bereits erwähnten Zeit- und Ressourcenintensität liegen. Daneben mag bei der Zurückhaltung aber auch eine grundsätzliche Skepsis und ein gewisses Unbehagen vieler Dozierender eine Rolle spielen, ethische Kompetenzen und Kompetenzzugewinn überhaupt in irgendeiner Form zu messen (vgl. Katsarov et al. 2021b).

Vor diesem Hintergrund möchte dieser Beitrag zweierlei leisten: Im ersten Teil sollen in einem kurzen Überblick Evaluationsverfahren ethischer Kompetenzen vorgestellt und diese in deren Grenzen diskutiert werden. Der zweite Teil fokussiert auf Erkenntnisse aus ausgewählten internationalen Wirksamkeitsstudien – Meta- wie Einzelstudien, Studien aus der medizinischen Ausbildung wie anderen angrenzenden Bereichen (etwa: forschungsethischen Trainings). Wenngleich die Ergebnisse in anderen Kontexten entstanden sind (etwa was die Ausbildungslandschaft, die Fachbereiche und auch die Lehrtraditionen betrifft), so können sie dennoch als Diskussionsanstoß dienen und einen Korridor definieren, wie gute Ethik-Lehre in der Medizin gelingen mag. Darüber hinaus mögen die Ergebnisse wichtige Impulse für die Pflegedidaktik bieten, was jedoch nicht Gegenstand des vorliegenden Beitrags ist.

Teil 1: Die Wirkung von Ethik-Lehre messen: Herausforderungen und Grenzen evaluativer Verfahren und Instrumente

Stand der Forschung

Im Bereich der Ethik-Lehre für die Medizin im deutschsprachigen Raum gibt es – um diesen Befund gleich vorwegzunehmen – kaum wissenschaftlich auswertbare Einzelevaluationen von spezifischen Unterrichtsformaten, die über eine rein reaktive Bewertung und Zufriedenheitsbefragung hinausgehen. Eine Reihe von Befragungsstudien beziehen sich allgemein auf den Querschnittsbereich „Geschichte, Theorie und Ethik“ und dessen curriculare Verankerung an den medizinischen Fakultäten aus Sicht der verantwortlichen Fachvertreter:innen (Möller et al. 2006; Schochow und Steger 2015; Schildmann et al. 2017), aus Sicht der Studierenden (Schulz et al. 2008, 2012) und auf Grundlage von Fachliteratur der Medizinethik-Didaktik (Bobbert 2013). Eine Ausnahme bildet eine Studie aus dem Jahr 2002, die Effekte eines Ethik-Seminars an der Medizinischen Hochschule Hannover untersuchte. Mithilfe einer Prä-Post-Einschätzung wurde eine Interventionsgruppe (Studierende, die das Ethik-Seminar besucht hatten) mit einer Kontrollgruppe (Studierende, die das Ethik-Seminar nicht besucht hatten) verglichen. Dabei wurden anhand eigens entworfener Fallvignetten nicht nur kognitive Lernziele (Wissen und Fakten) überprüft, sondern auch praktische Lernziele (Fähigkeiten und Fertigkeiten) sowie affektive Lernziele (Einstellungen, Haltungen und Gefühle) evaluiert (Neitzke und Möller 2002). Ähnlich systematisch evaluiert wurde medizinethische Lehre 2016 in einer Vergleichsstudie an der Ludwig-Maximilian-Universität München, wo zwei Lehrmethoden zur Auseinandersetzung mit klinisch-ethischen Fällen gegenübergestellt wurden (prinzipienbasierte Falldiskussionen und theorie-basierte Falldiskussionen) (Friedrich et al. 2017). Diese beiden Beispiele belegen, dass sich mittels eines derartigen kontrollierten und fall-gestützten Prä-Post-Designs Effekte von Kompetenzzuwachs besonders gut untersuchen lassen.

Ein Vergleichsdesign (Prä-Post oder mit Vergleichskohorte) definiert demnach einen wichtigen Standard unter den Wirksamkeits-Studien. Meta-Analysen greifen in der Regel nur Studien auf, die diesem Standard genügen. Der Goldstandard sind Studien, bei welchen Teilnehmende randomisiert einer von mindestens zwei Kursvarianten zugeordnet werden, idealerweise kombiniert mit Prä- und Post-Tests (sog. Randomized Control Trials). Aber auch Studien ohne Vergleichsdesign, die nur eine nachgängige Befragung vornehmen, können natürlich interessante Ergebnisse über die Wirkung von Ethik-Lehre erzielen. So untersuchte eine Studie aus dem Jahr 2014 an der Fachhochschule Bern den Zusammenhang zwischen der Teilnahme von Pflegestudierenden an einem Ethik-Kurs und der Stärkung ihrer moralischen Resilienz (Monteverde 2014). Die Untersuchung kommt zu dem Schluss, dass Ethik-Lehre vermittle, wie ethische Aspekte in schwierigen Alltagssituationen theoretisch identifiziert und gerahmt werden können. Darüber hinaus gibt es Studien, die keine Wirksamkeitsstudien einer Lehreinheit im eigentlichen Sinne darstellen, die aber Aufschluss darüber geben, wie sich das ethische Urteilsvermögen und andere ethische Kompetenzen einer Kohorte von Studierenden im Verlauf ihres Studiums entwickelt. Ende der achtziger Jahre wurden entsprechende Studien erstmals in den USA unternommen (Self et al. 1989), aber auch für den deutschsprachigen Raum gibt es mittlerweile ähnliche Untersuchungen (Lind 2000; Langer et al. 2016).

Zu Ethik-Lehre in der medizinischen Ausbildung gibt es auf englischsprachiger Literatur basierende Meta-Studien. Nicht alle dieser Studien legen das Augenmerk jedoch auf Wirksamkeit von Ethik-Lehre, wie etwa ein systematisches Review von 2020 (Shamim et al. 2020). Außerdem muss bei diesen Meta-Studien, welche internationale Einzelstudien zusammenfassen, auch immer berücksichtigt werden, dass diese Einzelstudien aus äußerst heterogenen Lehrkontexten stammen. So umfasst die Meta-Studie von Shamim Einzelstudien aus Nord- und Südamerika, Europa, Afrika und verschiedenen asiatischen Ländern. Entsprechend kommen diejenigen Meta-Studien zur Medizinethik-Lehre, die explizit die Wirksamkeit von Lehrformaten in den Blick nehmen, zu dem Schluss, dass nur wenige und äußerst heterogene wissenschaftliche Evaluationsstudien existieren und deswegen die Ergebnisse der Meta-Studien auch immer nur als vorläufige Identifizierungen von mehr oder weniger effektiven Lehrformaten gesehen werden können (Moreira et al. 2021; de la Garza et al. 2017). Möglichkeiten der quantitativen Meta-Analyse, die bei der bestehenden Anzahl von Studien durchaus gewinnbringend eingesetzt werden könnten, wurden bislang leider nicht fruchtbar gemacht. Am weitesten gehen die Autor:innen einer Studie von 2016 mit der Empfehlung, regelmäßig fallbasierte Lehre einzusetzen – beruhend auf einem Grundeindruck davon, welche Charakteristika relativ erfolgreiche Kurse gemeinsam hatten (Martakis et al. 2016).

Das Ergebnis der bisherigen Forschung zur Wirksamkeit von Medizinethik-Lehre bleibt also ernüchternd. Jedoch kann man den Blick weiten und Studien aus anderen Bereichen mitberücksichtigen. Hier fällt insbesondere das Feld der Forschungsethik ins Auge, in dem sich zunächst ebenfalls ein heterogenes Bild ergibt, was den Einsatz von Evaluationsinstrumenten in der Ethik-Lehre betrifft. In einer Meta-Studie aus dem Jahr 2016, die 380 Ethik-Trainings in der Forschungs- und Wirtschaftsethik ausgewertet hat, kommen die Autor:innen zum Schluss, dass die weitaus am meisten angewandte Methode zur Überprüfung des Lernerfolges mit 28,4 % sog. „reactions measures“, also eine subjektive Bewertung der Trainings, darstellen (Steele et al. 2016). Daneben werden aber auch objektivere, an der tatsächlichen Erreichung von Lernzielen orientierte Evaluationsmethoden bzw. deren definierte Zielkriterien genannt, wie „moral reasoning“ (15,1 %), „ethical-decision-making“ (11,2 %), „meta-coginitive strategies“ (9,7 %), „knowledge“ (9,6 %) und weit abgeschlagen „actual behavior“ (3,1 %). Die letztgenannte Kategorie scheint besonders interessant, ist doch relativ wenig darüber bekannt, ob Ethik-Lehre tatsächlich zu einer Verhaltensveränderung im späteren Berufsleben führt. Für den Bereich Ethik-Lehre in der Medizin im deutschsprachigen Raum gibt es – womöglich auch aufgrund methodischer Schwierigkeiten – kaum Follow-Up-Studien, welche ethische Kompetenzen der Studierenden auch nach Studienabschluss in den Blick nehmen würden. Dabei bescheinigen Ergebnisse aus den Meta-Studien zur Wissenschaftsethik dem Ethik-Training durchaus einen Langzeiteffekt (Watts et al. 2017). Die Follow-Up-Periode in den Einzelstudien rangierte hier von sechs Monaten bis zwei Jahren. Aufgrund der geringen Anzahl an Follow-Up-Studien formulieren die Autor:innen diesen Befund jedoch mit einiger Vorsicht.

Beschäftigt sich die Meta-Studie von 2016 zu Trainings in der Forschungs- und Wirtschaftsethik noch allgemein mit eingesetzten Evaluationsmethoden (Steele et al. 2016), so haben die Autor:innen der Studie von 2017 eine aufwändige Meta-Analyse über Evaluationen im Bereich Wissenschafts- und Forschungsethik vorgelegt (Watts et al. 2017). Die Autor:innen verbinden ihre Studie mit der spezifischen Forschungsfrage, welche Lehrmethoden sich gemessen an ethischen Zielkriterien als besonders wirksam oder unwirksam erwiesen haben. Sie übernehmen Kategorien einer Vorgängerstudie aus dem Jahr 2009 (Antes et al. 2009), um diese Effekte über einen längeren Zeitraum betrachten zu können, und kommen zu dem Schluss, dass insgesamt die Wirksamkeit von Ethik-Trainings in der Wissenschafts- und Forschungsethik zugenommen hat. Diese Meta-Studie (Watts et al. 2017) bildet wiederum die Grundlage für qualitative Studien über spezifische Lehrinhalte und Methoden der in der Meta-Studie erwähnten Einzelevaluationen (Torrence et al. 2017; Todd et al. 2017a). Wenn der Fokus dieser Meta-Studien auf der Identifizierung von besonders wirksamen Lehrformaten und strukturellen Rahmenbedingungen liegt, so macht eine weitere Studie (Mulhearn et al. 2017) darauf aufmerksam, dass alle Trainingstypen (etwa: group-based, problem-based, active participation, case-based, discussion) prinzipiell wirksam sind und es auf die Kombination von Lehrformaten innerhalb eines Kursplans ankommt. Die Evaluation von Ethik-Lehre ist somit unweigerlich komplex und muss sich immer auf eine Gesamtstruktur von kombinierten Lehreinheiten beziehen, welche aufeinander abgestimmt werden müssen. Besonders interessant ist bei der letztgenannten Studie, dass die Bereichsethik eines Kurses (z. B. Wirtschaftsethik oder Forschungsethik) keinen nennenswerten Einfluss auf seine Wirksamkeit hatte (Mulhearn et al. 2017). Dies deutet darauf hin, dass meta-analytische Befunde aus der Ethik-Lehre anderer Disziplinen auf die Ethik-Lehre in der Medizin übertragbar sein dürften.

Nicht unerwähnt bleiben sollen an dieser Stelle Studien, welche sich zwar nicht genuin mit Ethik-Lehre, aber mit verwandten Konzepten beschäftigen, so etwa Studien zum professionalism (Sarraf-Yazdi et al. 2021) oder zu reflective practices (Mann et al. 2009; Uygur et al. 2019).

Was und wie messen? Kriterien für ethische Kompetenzen

Dass Ethik-Lehre über eine Zufriedenheits- und Selbsteinschätzungsbefragung hinaus bislang kaum evaluiert wird, hat sicher unterschiedliche Gründe. Zu den gewichtigsten zählen wohl der damit verbundene Aufwand (1) sowie die Heterogenität der jeweiligen Ausrichtung und Verankerung im medizinischen Curriculum (2):

  1. 1.

    Eine wissenschaftlich fundiert und valide auswertbare Evaluation ist zeit- und personalaufwändig, lässt sich kaum im laufenden Lehrbetrieb durchführen und ist daher eigentlich nur im Rahmen von eigens finanzierten Lehrprojekten zu bewältigen;

  2. 2.

    Zwar können grundsätzlich Ziel- und Prüf-Standards definiert werden, wie sie weiter unten detaillierter beschrieben werden, jedoch müssen Evaluationsinstrumente immer auf festgelegte Lernziele und Lehrformate angepasst werden. Nun definiert der Nationale Kompetenz-Orientierte Lernzielkatalog der Medizin (NKLM) auch ethische Lernziele, doch werden diese auf fakultärer Ebene in ganz verschiedenen Strukturen in den unterschiedlichsten Lehrveranstaltungstypen wie Vorlesungen, Seminaren, Kursen, Praktika oder Modulen umgesetzt und eingebunden: von klassischen, ein Semester hindurch wöchentlich stattfindenden GTE-Kursen bis hin zu einzelnen, kurzen Lehreinheiten in an sich nicht-ethischen Veranstaltungsblöcken in stark modularisierten Studiengängen. Darüber hinaus werden die Lernziele von den jeweiligen Fachvertreter:innen individuell ausgestaltet. Angesichts der Heterogenität der Ethik-Lehre an deutschsprachigen medizinischen Fakultäten ist es schwer, einen einheitlichen Standard festzulegen (Schildmann et al. 2017).

So muss zur Überprüfung der Lehr-Effekte je nach Lehrformat und festgelegten Lernzielen ein passendes Evaluations-Design gefunden werden. Die wesentlichen Möglichkeiten hierfür sind:

  • Ethische Selbsteinschätzung (self-assessment) der Studierenden in einer Prä‑/Post-Evaluation

  • Ethische Einschätzung (assessment) anhand von Fallvignetten o. ä. in einer Prä‑/Post-Evaluation

  • Vergleich von verschiedenen Unterrichtsformaten (Prüf- und Kontrollgruppen, Non-Interventionsgruppen) anhand der Ergebnisse von Abschlussprüfungen (z. B. Klausuren mit offenen Fragen, Multiple-Choice-Tests)

  • Selbsteinschätzung (self-assessment) von Studierenden oder Fremd-Einschätzung mittels eines validierten, standardisierten Testverfahren

  • Selbsteinschätzung (self-assessment) von Studierenden oder Fremd-Einschätzung mittels eines qualitativen Designs (z. B. Einzel- und Fokusgruppeninterviews, Beobachtung, Analyse von Essays)

  • Kombinationen dieser Methoden, z. B. Vergleiche der Testergebnisse verschiedener Lerngruppen (verschiedene Methoden) unter Berücksichtigung der anfänglichen Kompetenz (Prä-Test) und begleitender qualitativer Forschung

Nicht ausführlich eingegangen kann an dieser Stelle auf Evaluierungsmethoden anhand standardisierter und zum Teil validierter Testverfahren, wie dem „Defining Issues Test“ (DIT) von James Rest oder dem „Moral Competence Test“ (MCT) von Georg Lind. Letzterer wurde in der Studie an der LMU eingesetzt (siehe Friedrich et al. 2017; allgemein: Eckles et al. 2005). Grundsätzlich versprechen diese Tests eine Messung von ethischen Kompetenzen bzw. Kompetenzzuwächsen mit dem Vorteil, eine Vergleichbarkeit und Standardisierung zu gewährleisten. Dem gegenüber stehen qualitative Methoden der Selbst- und Fremdeinschätzung von Studierenden, etwa in Einzel- oder Fokusgruppeninterviews (siehe etwa aus dem Bereich der „reflective pratices“: Scheide et al. 2020). Ein qualitatives Design ist sicherlich zur Einschätzung von Kompetenzen besonders gut geeignet. Dies geht jedoch mit dem Nachteil einher, dass es schwieriger wird, eine vergleichbare, grundsätzlich standardisierbare Basis zwischen den Einzelstudien zu schaffen.

Grundlegend ist hierbei wiederum die Frage, was eigentlich gemessen werden soll und aus welchen sinnvoll abgrenzbaren Teil-Komponenten (Wissen, Fertigkeiten und Haltungen) sich ethische Kompetenzen zusammensetzen. Grundsätzlich können Evaluationskriterien unterschieden werden, die sich auf folgende Teilkompetenzen beziehen (vgl. Katsarov et al. 2021a):

  • Ethische Sensitivität (Identifizieren und Erkennen ethischer Fragestellungen)

  • Ethisches Urteilsvermögen (Abwägen und Argumentieren)

  • Wahrnehmung eigener Wertvorstellungen und der Wertvorstellung anderer (inklusive Emotionen)

  • Ethische Entscheidungs- und Handlungskompetenz (Kommunikation, Teamfähigkeit, Umgang mit Ambiguitäten und Unsicherheit)

  • Ethische Wirksamkeit (konkrete Änderungen im Berufs- und Arbeitskontext)

Diese Teilkompetenzen enthalten jeweils – graduell unterschiedlich – theoretische, praktische und affektive Komponenten und lassen sich durch Fremd- und Selbsteinschätzungen anhand unterschiedlicher Schwierigkeitsgrade messen. Zu bedenken ist, dass Methoden, die zur Erlangung eines Teilziels beitragen –, wie eine neue Meta-Analyse zur Lehre in der Forschungsethik aufzeigt (Katsarov et al. 2021a) – nicht notwendigerweise geeignet sind, um auch andere Teilziele zu erreichen. Daher kann es sinnvoll sein, bei der Evaluierung eines Kurses mehrere verschiedene Methoden einzusetzen.

Zwischenfazit

Die Evaluierung von ethischen Kompetenzen sowie einem entsprechenden Kompetenzzuwachs ist demnach vielschichtig und entzieht sich einer Standardisierung, wie sie mancherorts gefordert wird (Savulescu et al. 1999). Die zunehmende Modularisierung von medizinischen Curricula trägt zudem dazu bei, dass Ethik-Lehre vielfach in nicht-ethische Module eingepasst wird und kaum mehr gesondert untersucht werden kann. Der ethische Lerneffekt ergibt sich demnach aus der Gesamtkonzeption des Moduls im Rahmen anderer theoretischer und klinischer Fächer bzw. aus einem Wiedererkennungswert von Ethik oder eines ethischen Portfolios innerhalb des Gesamtcurriculums über ein ganzes Studium hinweg. Auch wenn einzelne Meta-Analysen darauf hindeuten, dass die Einbettung ethischer Lernziele in weiter gefasste Lerneinheiten weder besonders vorteilhaft noch besonders nachteilig ist (z. B. Antes et al. 2009; Watts et al. 2017), wurde dem Charakter eines horizontal angesiedelten Faches oder Querschnittsbereichs in Evaluationsstudien noch zu wenig Rechnung getragen. Die Schwierigkeiten einer Standardisierung können jedoch nicht im Umkehrschluss bedeuten, dass die Frage nach der Wirksamkeit für einzelne ethische Lehrformate und -methoden nicht gestellt werden muss. Weiterhin gültig und wichtig bleibt die bereits 2008 formulierte Feststellung, dass medizinethischer Unterricht „sinnvoll evaluiert werden [kann]“ (Buyx et al. 2008, S. 661). Genauso aktuell und dringlich ist weiterhin die damit verbundene Aufforderung, Ethik-Lehre in Medizin, Pflege und anderen Gesundheitsberufen systematisch und wissenschaftlich fundiert zu evaluieren.

Teil 2: Ausgewählte Eckpunkte gelingender Ethik-Lehre in der Medizin

Im Folgenden sollen einige Ergebnisse ausgewählter Wirksamkeitsstudien vorgestellt und auf ihre Relevanz für die Ethik-Lehre in der Medizin im deutschsprachigen Raum diskutiert werden. Wie bereits erwähnt, sind die relevanten Meta-Studien zumeist in anderen Lehrkontexten entstanden, entweder was den Lehrgegenstand (etwa: Forschungsethik) oder was den Lehrkontext (etwa: andere Lehrtraditionen und strukturelle Rahmenbedingungen) betrifft. Grundsätzlich soll nochmals ausdrücklich darauf hingewiesen werden, dass aufgrund der Variabilität sowohl der untersuchten Ethik-Lehre selbst als auch der jeweiligen Evaluierungsmethoden einige der Studien zu vermeintlich widersprechenden Ergebnissen kommen. Was in einem spezifischen Kontext gut funktioniert hat, valide evaluiert worden ist und signifikante Effekte zeigte, muss nicht auf einen anderen Kontext übertragbar sein. Dennoch kann auf dieses überschaubare Spektrum an Wirksamkeitsstudien zurückgegriffen werden, um dies als Ausgangspunkt einer darüberhinausgehenden Forschung zu nehmen. Die gesammelten Erkenntnisse sollen nicht verstanden werden als Ausweise unumstößlicher Evidenz für Wirksamkeit, sondern sie sollen genutzt werden, um Hypothesen darüber zu generieren, auf welche Aspekte in der Konzipierung von ethischen Lehrveranstaltungen in der Medizin besonders geachtet werden muss – und nicht zuletzt darüber, wo weitere Forschungsdesiderate bestehen. Es sollen also keine Dos und Don’ts vorgegeben, sondern wesentliche Eckpunkte guter Ethik-Lehre skizziert werden.

Kriterien für gelingende Ethik-Lehre können sich auf Lehrmethoden, Lehrkonzepte und -formate, aber auch auf strukturelle Rahmenbedingungen wie die Rolle der Lehrperson beziehen. Da hier bei weitem nicht auf sämtliche entsprechende Variablen der Ausgestaltung ethischer Lehre eingegangen werden kann, fokussieren wir im Folgenden auf drei Teilaspekte: 1) auf Blended-Learning, d. h. auf Lehrformate mit Kombinationen von Selbststudium und interaktiven Gruppenphasen, was sich als besonders wirksam erwiesen hat; 2) auf fallbasiertes Lernen, was eines der am weitesten verbreiteten Lehrformate in der Medizinethik-Lehre darstellt; und schließlich 3) auf einen wesentlichen Faktor der strukturellen Rahmenbedingungen jeglicher Lehre: die Lehrkräfte und ihre Rolle in Bezug auf die Wirksamkeit ihres Unterrichts.

Selbststudium und Interaktivität (Blended Learning)

Klassische Formate der akademischen Lehre wie frontal ablaufende Vorlesungen, bei denen die Lernenden in der Rolle passiver Rezipienten präsentierten Stoff aufnehmen, sind gerade für die Vermittlung und Einübung ethischer Kompetenzen wenig geeignet (ATEAM 2001; Giubilini et al. 2016). Zwar gibt es auch im Bereich der Medizinethik grundlegende, für den weiteren Kompetenzaufbau und eine praxisnahe Anwendung unverzichtbare Wissensbestände, die Lernende sich gut in Form einer schlichten Aufnahme von Informationen und Fakten aneignen können. Allerdings ist fraglich, wie sinnvoll es ist, für diese Lernaktivität weiterhin das Format des Gruppenunterrichts in Präsenz zu nutzen. Generell ist die aktive Einbindung der Lernenden ein gemeinsames Merkmal erfolgreicher Kurse (Todd et al. 2017a). Dies geschieht vornehmlich in Kleingruppen und Gruppendiskussionen. Darauf deuten bereits die Ergebnisse von älteren Studien hin, die nachweisen konnten, dass Medizinethik-Unterricht in Kleingruppen im Vergleich zu Vorlesungen sowohl die Wahrnehmung und Einschätzung ethischer Probleme (Smith et al. 2004), und das moralische Urteilsvermögen (Self et al. 1998) als auch die Fähigkeit, mit ethischen Dilemmas umzugehen (Goldie et al. 2002, 2004) verbessert. Vor allem Studienanfänger:innen können von diesem positiven Effekt von Kleingruppenformaten in ihrer ethischen Entwicklung in Form von Wissen über Medizinethik und von Vertrauen in die eigene Fähigkeit, mit schwierigen Situationen adäquat umzugehen, signifikant profitieren (Chin et al. 2011). Außerdem konnte wiederholt gezeigt werden, dass Ethik-Lehre in der Medizin, die in kleineren und interaktiven Gruppen verläuft, zu einer erhöhten Zufriedenheit der Studierenden führt. Kurse sind tendenziell effektiver, wenn sie die Teilnehmer:innen in individuelles Lernen einbinden (Watts et al. 2017; Todd et al. 2017a). Als effektiv erwiesen sich Kurse, die sich nicht nur auf die Interaktion in der Gruppe verließen, die das individuelle Engagement verschlechtern kann (Watts et al. 2017; Todd et al. 2017a). Passives Lernen und eine starke Abhängigkeit von Gruppenaktivitäten waren häufige Merkmale von schwachen Kursen (Todd et al. 2017a).

Was vor dem Hintergrund dieser Erkenntnisse bereits nahelag, wurde ab dem Frühjahr 2020 durch die pandemiebedingte Verlegung nahezu aller Lehrformate in digitale Räume und Semester für die meisten Ethik-Lehrenden unumgänglich: die sinnvolle Konzipierung von effektiver Medizinethik-Lehre in einem Blended-Learning-Setting, häufig kombiniert mit Methoden des sog. Flipped Classroom-Formats: didaktische Kombinationsmodelle, bei denen die Lernenden in Selbststudiums-Einheiten sich entsprechend aufbereitete Inhalte individuell und selbstgesteuert aneignen, die dann in sich anschließenden Gruppeneinheiten, die entweder in Präsenz oder online synchron verlaufen können, gemeinsam besprochen, problematisiert und vertieft werden. Diese Kombinationsmodelle eignen sich besonders für Ethik-Lehre allgemein und in der medizinischen Ausbildung im Speziellen. So können zum einen der konkrete Zeitpunkt, die Geschwindigkeit sowie die Dauer (und ggf. Wiederholung) der Auseinandersetzung und Aneignung mit Wissensbeständen frei gewählt und den persönlichen Fähigkeiten, Vorlieben und Umständen optimal angepasst werden. Zum anderen kann im Präsenz- oder synchron verlaufenden Online-Unterricht die Expertise der Lehrpersonen genutzt werden, um gezielt auf Schwierigkeiten und zentrale Punkte des Stoffes einzugehen sowie diese in der Lerngruppe zu diskutieren und mit Übungen zur Perspektivenübernahme zu verschränken. Kurse, in denen entsprechend synchrone Einheiten (ob in Präsenz oder online) und asynchrone Selbststudiums-Lernaktivitäten kombiniert werden, haben sich nicht nur generell in der medizinischen Ausbildung als traditionellen Ansätzen überlegen erwiesen (Vallée et al. 2020), sondern erzielen gerade auch in der Angewandten-Ethik-Lehre tendenziell größere Effekte als Kurse, die nur entweder auf Präsenzunterricht in der Gruppe oder auf Online-Lernaktivitäten im Selbststudium setzen (Watts et al. 2017; Todd et al. 55,56,a, b; Hew und Lo 2018; Mosalanejad et al. 2020; Karamzadeh et al. 2021). Der Aufbau von theoretischem Wissen gelingt am besten im Selbststudium, z. B. über Online-Angebote, wohingegen interaktive Methoden für den Aufbau von Kompetenzen wichtig sind (Katsarov et al. 2021a).

Neben der messbaren Effektivitätssteigerung des Einsatzes von Blended-Learning-Formaten in der Ethik-Lehre konnten Untersuchungen in verschiedenen Fachbereichen wie der Pflege und der Physiotherapie, aber auch in interprofessionellen Lehrkonzepten, zudem deutliche Akzeptanz- und Motivationssteigerungen auf Seiten der Teilnehmenden feststellen (Hsu 2011; Lin et al. 2013; Cho und Shin 2014; Aguilar-Rodriguez et al. 2019). Bei allen didaktischen Vorzügen und zeitgemäßen Eigenheiten, die digital unterstützte Blended-Learning-Formate für die Ethik-Lehre in der Medizin aufweisen, muss mit Blick auf die entsprechende Realisierung bzw. die dadurch nötige Umstellung bisheriger Formate allerdings auch der Umstand berücksichtigt werden, dass dies tendenziell einen erhöhten konzeptuellen, zeitlichen und personellen Aufwand mit sich bringt, jedenfalls in der Anfangsphase. Damit hängt das reale Potenzial dieser Erkenntnisse wesentlich von auf der institutionell-politischen Ebene angesiedelten übergeordneten Ressourcenfragen ab.

Fallbasiertes Lernen

Ein zentrales Element gelingender Ethik-Lehre zur Einübung und Steigerung moralischer Kompetenzen scheint die Konfrontation und Auseinandersetzung mit konkreten Fällen zu sein, die für die zukünftige Praxis der Lernenden relevant sind. Eine Meta-Studie zu fallbasiertem Lernen in Medizin, Pflege und anderen Gesundheitsberufen kommt zu dem Schluss, dass der Einsatz von Fällen auf eine hohe Akzeptanz der Studierenden und Dozierenden stößt und insgesamt mit Gewinn einzusetzen ist (Thistlewaite et al. 2012). Ähnlich positive Bewertungen finden sich auch in Einzelstudien und Pilotprojekten zu fallbasiertem Lernen in der Ethik-Lehre, deren Evaluationen allerdings auf Zufriedenheitsbewertungen und Selbsteinschätzungen der Studierenden basieren (Kuhn et al. 2021; Stolper et al. 2016), sowie in Meta-Studien zur Effektivität unterschiedlicher ethischer Lehrformate und -methoden (Steele et al. 2016; Watts et al. 2017). Diese Einhelligkeit in der Bewertung verwundert zunächst nicht, nehmen doch kasuistische Vorgehensweisen als Grundlage von klinisch-ethischem Handeln eine besondere Stellung ein (Jonsen und Toulmin 1989). Die Vorteile liegen auf der Hand: Beim fallbasierten Lernen wird bereits in der Ausbildungsphase ein Anwendungsbezug zum späteren professionellen Handeln hergestellt. Mögliche Szenarien samt der Konsequenzen von Entscheidungen können wie in einer Simulation durchgespielt und die ethischen Aspekte eines Falles in realitätsnahen Settings identifiziert werden. Dabei kann auch geschult werden, wie sich allgemeine, auf andere Kontexte übertragbare Aspekte eines individuellen Falles von weniger übertragbaren Besonderheiten unterscheiden lassen.

Viele Lehrformate, die mit der Diskussion von Fällen arbeiten, gehen zudem von einem dialogischen Prozess moralischer Deliberation unter den Kurs-Teilnehmenden aus, so dass neben der eigentlichen Fallgeschichte mit ihren inhaltlichen Fragen und Themen auch methodische Fähigkeiten wie Perspektivenwechsel, Konfrontation mit abweichenden moralischen Urteilen und das Argumentieren für den eigenen moralischen Standpunkt eingeübt werden können. Im Rahmen der Arbeit an und mit einem Fall sowie den unterschiedlichen Varianten, in denen dieser präsentiert werden kann (paradigmatische versus komplexe Fälle, kasuistische Fallreihen, spiel- und simulationsbasiertes Lernen, mit oder ohne Simulationspatient:innen, um hier nur einige zu nennen) können Ethik-Dozierende die unterschiedlichen Komponenten ethischer Kompetenz besonders gut vermitteln – und schließlich auch prüfen. Gerade das Prüfungsformat der OSCEs, der Objective Structured Clinical Examination, bietet sich an, für die Evaluation klinisch-ethischer Fähigkeiten und Kompetenzen eingesetzt zu werden. Obwohl international Ethik-OSCEs bereits zur Prüfung von ethischen Kompetenzen des medizinischen Absolvent:innenprofils herangezogen werden (zu einer frühen Implementierung siehe Singer et al. 1993, 1994), werden sie im deutschsprachigen Raum noch nicht flächendeckend eingesetzt.

Mit der international weiten Verbreitung des Einsatzes fallbasierten Lernens in der Ethik-Lehre (McLean 2016) und der grundsätzlich attestierten Wirksamkeit ist jedoch noch wenig darüber gesagt, wie Fälle konstruiert sein müssen, um ethische Kompetenzen erfolgreich zu vermitteln. Hierzu liegen gerade in Bezug auf die Ethik-Lehre in der Medizin weitaus weniger wissenschaftliche Studien vor. In der Forschung zu fallbasiertem Lernen und Lehren werden zumeist recht grob einige Grundvoraussetzungen formuliert: Fälle müssen an die Lernziele angepasst werden, zudem realistisch und praxisnah sein, sie müssen ethische Normen abbilden und Falldiskussionen müssen durch die Lehrperson als facilitator angeleitet werden, um hier nur einige Punkte zu nennen (Dong et al. 2018). Auch hier hilft ein Blick in den Bereich Forschungsethik-Trainings. Anhand zweier Standard-Beispiele (der Big Pharma Case und der Tight Schedule Low-Fidelity Task) haben einige Evaluationsstudien verglichen, welche Auswirkungen eine Veränderung bestimmter Variablen in der Fallbeschreibung auf den Lernzuwachs von Studierenden haben. So ergab eine solchermaßen angelegte Studie, dass Fälle, welche Emotionen der Charaktere („emotional case content“) beschreiben und den Fokus auf interpersonelle Beziehungsstrukturen („socio-relational power case content“) legen, eine höhere Wirksamkeit im ethischen Kompetenzzuwachs haben (Thiel et al. 2013). Zurückgeführt wurde dieses Ergebnis darauf, dass abstrakte und emotionslose Fallkonstruktionen unrealistisch wirkten und sich Studierende besser davon distanzieren könnten. Sehr starke Effekte wurden insgesamt den Lehrformaten bescheinigt, welche eigene Motive, Werte und Emotionen berücksichtigten (Torrence et al. 2017). Von großem Interesse ist in diesem Zusammenhang der Befund einer kürzlich erschienenen Metaanalyse zur Forschungsethik-Lehre (Katsarov et al. 2021a). Die Autor:innen kommen hier zum Schluss, dass fallbasierte Ethiklehre dann am wirksamsten ist, wenn Lernende sich z. B. im Rahmen von Rollenspielen oder digitalen Spielen damit auseinandersetzen müssen, wie sie in schwierigen Situationen selbst handeln würden, und wenn hierbei auch die Rolle von Emotionen und Kontextfaktoren beleuchtet wird. Nüchterne, systematische Falldiskussionen, die eher prinzipienbasiert vorgingen, erzielten signifikant schlechtere Lernergebnisse in Hinblick auf alle untersuchten Lernziele.

In einer anderen Studie, die ebenfalls unterschiedliche Variablen in den zwei forschungsethischen Fallgeschichten auf die Lerneffektivität untersuchte, wurden eine mäßige kausale Komplexität („causal complexity“) in der Vorhersage von möglichen Konsequenzen der Entscheidungen angemahnt (Johnson et al. 2012). Dadurch könnten Studierende die Konsequenzen einer Handlung besser einschätzen und Problemlösungen bei ethischen Entscheidungsfindungen identifizieren. Grundsätzlich weisen die in der Forschung bislang vorhandenen Erkenntnisse darauf hin, wie wichtig es ist, sich bei der Konzipierung und dem Einsatz von Fallbeispielen das jeweilige Lernziel vor Augen zu führen: Eher paradigmatische, „holzschnittartig“ konzipierte Fälle sind dann sinnvoll, wenn didaktisch auf die Identifizierung einer ethischen Fragestellung oder auf die Begründung für moralische Entscheidungen gezielt wird. Komplexer gestaltete Fälle entsprechen oftmals mehr der Realität, können jedoch auch zu Gefühlen von moralischer Beliebigkeit führen und damit das eigentliche Lernziel verfehlen. Sie können jedoch zusätzlich andere Lernziele vermitteln, etwa das Einüben von Ambiguitätstoleranz, den Umgang mit Unsicherheit oder die realitätsnahe Vorbereitung auf den zukünftigen Berufsalltag.

Neben der formalen, narrativen Konstruktion von Fällen bezieht sich eine weitere Frage zum fallbasierten Lernen darauf, in welchen Lehrkonzepten die Methode konkret umgesetzt wird, um einen Effekt auf ethischen Kompetenzzugewinn zu erzielen. Einer solchen Fragestellung geht die genannte Pilotstudie von der LMU München nach, in der anhand eines validierten Moral Competence Tests in einem Vergleichsdesign mit einer Kontrollgruppe untersucht wird, ob eine prinzipien-basierte strukturierte Falldiskussion beim Einsatz in der Ethik-Lehre zu einer erhöhten moralischen Kompetenz führt (Friedrich et al. 2017). Wenn die Studie auch aufgrund geringer Fallzahlen zu keinem abschließenden Urteil kommt, so stellt sie doch wegweisend Methoden für eine zukünftige Lehrforschung auf, mit denen die Wirksamkeit bestimmter Formate systematisch untersucht werden kann. Schließlich gibt es einige Erfahrungen und Erkenntnisse zu Lehrformaten, welche die Studierenden selbst zu den Produzenten von Fällen werden lassen (Donaldson et al. 2010). Hier kann direkt an bereits existierenden klinischen Erfahrungen angeknüpft werden, so dass die Relevanz und der Praxisbezug von den Teilnehmenden selbst festgelegt und gestaltet werden können. Gerade weil fallbasiertes, praxisnahes Lernen aus der Ethik-Lehre in der Medizin nicht mehr wegzudenken ist, sind Forschungen zur Wirksamkeit dieser Methode, sowohl was die formale, narrative Struktur von Fällen selbst betrifft, als auch was die Lehrkonzepte, die fallbasiertes Lernen integrieren, angeht, besonders dringlich.

Lehrkräfte

Kompetente Lehrkräfte sind für erfolgreiches Anwendungstraining wichtig. Erfahrene Trainer erzielen tendenziell bessere Ergebnisse als unerfahrene Trainer (Watts et al. 2017). Lehrkräfte, die ihrerseits Aus- oder Fortbildungen zu guter Lehre absolviert haben, fühlen sich tendenziell eher imstande, Lernende zu motivieren und Kompetenzen aufzubauen. Für den Aufbau von moralischer Sensitivität als Fähigkeit, ethische Probleme erkennen zu können, ist Expertenfeedback besonders fruchtbar, wohingegen konstruktivistische Lehrformate, bei denen Lernende auf sich selbst angewiesen sind, eher unproduktiv sind.

Daneben gibt es Hinweise darauf, dass Studierende zu Beginn des Studiums von klinisch-ethischen Fallbesprechungen in Kleingruppen profitieren, die von nur wenig fortgeschritteneren Studierenden angeleitet und moderiert werden („near-peer-facilitated“). Sowohl die Fähigkeit, ethische Dilemmas zu bewältigen, als auch die Entwicklung der professionellen Identität konnten im Rahmen einer Pilotstudie in den USA signifikant verbessert werden (DeFoor et al. 2020).

Dass die Lehrerfahrung der Dozierenden einen wesentlichen Bestandteil gelingender Ethik-Lehre darstellt, ist nicht sehr überraschend. Allerdings zeigen die Erkenntnisse aus den Meta-Studien auch, dass Peer-learning durch Diskussionen und den Austausch gegenseitiger moralischer Wertvorstellungen immer auch davon flankiert sein sollte, dass die Ethik-Lehrperson sich selbst nicht zu sehr zurückhält, sondern als Expert:in einbringt, etwa auf Schwächen in der Argumentation moralischer Begründungen hinweist und generell orientierendes Feedback gibt. Dabei ist es wichtig, zwischen einem – zu vermeidenden – inhaltlichen Vertreten moralischer Positionen oder gar einem moralisierenden Auftreten einerseits und einer – gebotenen – Klarheit und Unbestechlichkeit im methodischen Urteil und didaktischen Feedback andererseits zu unterscheiden.

Schluss

Erkenntnisse aus Evaluations- und Meta-Studien zu Wirksamkeit von Ethik-Lehre, auch wenn sie aus anderen, angrenzenden Bereichen wie der Forschungsethik und anderen Lehrkontexten kommen, helfen demnach, Eckpunkte für die Gestaltung wirksamer Ethik-Lehre in der Medizin im deutschsprachigen Raum zu definieren. Das entbindet jedoch Ethik-Dozierende nicht davon, die eigenen Lehreinheiten zu evaluieren, und dies nicht nur in Form eines studentischen Feedbacks, sondern in wissenschaftlich fundierten Wirksamkeitsstudien, welche im Prä-Post-Format oder vergleichend mit einer Kontrollgruppe den Kompetenzzuwachs valide einzuschätzen erlauben. Ob dies dann in einem standardisierbaren Verfahren, mittels eines validierten Tests oder in qualitativer Form erfolgt, erscheint zunächst nachrangig. Gerade weil Lehrkontexte sehr verschieden sind, muss vielmehr ausdifferenziert werden: nach Einpassungen in Lehrkonzepte oder in größere nicht-ethische Module, nach strukturellen Rahmenbedingungen und hinsichtlich der zu erreichenden Lernziele. Wirksamkeitsanalysen können dann durchaus der Heterogenität der Lehrlandschaft Rechnung tragen.

Ethik-Dozierenden steht mittlerweile ein bunter Strauß an unterschiedlichen Lehrmethoden und Lehrformaten zur Verfügung, welche in diesem Beitrag nicht alle eingehend gewürdigt werden konnten. Das Beispiel des fallbasierten Lernens zeigt jedoch, dass auch ein flächendeckend und schon lange eingesetztes Format durchaus noch nicht in allen seinen Aspekten hinsichtlich der Wirksamkeit erforscht ist. Auch was die tatsächlichen Effekte und Vorteile des Blended-Learning-Konzepts in der Ethik-Lehre angeht, ist die Durchführung entsprechender methodisch anspruchsvoller Untersuchungen dringend erforderlich – nicht zuletzt, um die Relevanz einer weitreichenden Implementierung angesichts eines erhöhten Ressourcenaufwands wissenschaftlich zu untermauern.