Zur Notwendigkeit qualitätssichernder Maßnahmen in der strafrechtsrelevanten Begutachtungspraxis

Einschätzungen zu Schuldfähigkeit und Kriminalprognose gehören zu den wesentlichen Aufgabenbereichen bei der Rechtsanwendung im strafrechtlichen Erkenntnis- und Strafvollstreckungsverfahren (Basdekis-Jozsa et al. 2013; Dahle 2005a; Gretenkord 2013). Regelmäßig werden dazu Sachverständige hinzugezogen (Boetticher et al. 2019), um die juristischen Entscheidungen bei fehlender eigener Sachkenntnis der zuständigen Entscheider in relevanten psychologischen, psychiatrischen oder kriminologischen Fragen auf eine wissenschaftlich fundierte Grundlage zu stellen (Dahle 2010; Dreßing und Foerster 2020). Gutachten zur Schuldfähigkeit und zur Kriminalprognose stehen dabei u. a. deshalb besonders im öffentlichen und gesellschaftspolitischen Fokus, weil sie weitreichende Konsequenzen für die Begutachteten, aber auch für die Allgemeinheit haben können. So beeinflusst beispielsweise die Schuldfähigkeitsbeurteilung maßgeblich die Form der Unterbringung sowie die Dauer eines möglichen Freiheitsentzugs (Müller und Nedopil 2017; Prüter-Schwarte et al. 2019; Verrel 1995, 2015), und kriminalprognostische Beurteilungen dienen nicht zuletzt als Grundlage für freiheitsentziehende Maßnahmen. Schuldfähigkeits- und Prognosegutachten sind damit auch ein wichtiger Bestandteil der Planung und Durchführung möglichst wirksamer Risikomanagementmaßnahmen (Rettenberger 2019).

Schon diese wenigen Aspekte sprechen ebenso für die Notwendigkeit qualitätssichernder Maßnahmen in der strafrechtlichen Begutachtungspraxis (Wertz et al. 2020b) wie die Kritik, die in den letzten Jahrzehnten an der Qualität psychowissenschaftlicher Gutachten aufkam. Diese Qualität erwies sich in wissenschaftlichen Untersuchungen zur prognostischen Begutachtungspraxis wiederholt als sehr heterogen (u. a. Dahle et al. 2009, 2012; Fegert et al. 2003; Schläfke et al. 2006; Schnoor 2009; Suhling 2003; Haarig et al. 2012), wobei sich ganz unterschiedliche Defizite wie unzureichende Anamnesen (Nowara 1995; Suhling 2003), zu knapp bemessene Untersuchungszeiten (Kury und Adams 2010), unvollständig dokumentierte Explorationsergebnisse (Nowara 1995; Wulf 2005), defizitäre Methodenkenntnisse (Nedopil 2005) oder eine generell fehlende wissenschaftliche Basis (Galli 2011) zeigten. Genauso fanden Forschungsarbeiten zu Schuldfähigkeitsbeurteilungen zahlreiche Hinweise auf Gutachtenmängel (u. a. Dahle et al. 2012; Kunzl et al. 2009; Kunzl und Pfäfflin 2011), und von juristischer Seite wird nicht selten die Aufhebung von Urteilen mit Fehlern in Gutachten begründet (etwa Mosbacher 2020).

Zugleich deutet einiges darauf hin, dass auch von juristischer Seite Probleme in die Begutachtungspraxis hineingetragen werden. So enthalten z. B. relevante Gesetzestexte unkonkrete Formulierungen zu normativen Merkmalen wie die „Erheblichkeit“ von Taten, die „Gefährlichkeit“ bzw. die „Verantwortbarkeit unter Berücksichtigung des Sicherheitsinteresses der Allgemeinheit“ oder eine „hinreichende Erfolgsaussicht“, deren Auslegung beteiligten Experten Schwierigkeiten bereitet (Dahle 2010; Boetticher et al. 2019). Zudem gibt es Hinweise darauf, dass konkrete Gutachtenaufträge mitunter nicht geeignet sind, Sachverständige in der gebotenen Weise anzuleiten und die Grenzen der gutachterlichen Tätigkeit zu verdeutlichen (Puhlmann und Habermeyer 2010). Dies legt nahe, als Adressaten von Maßnahmen der Qualitätssicherung auch die Auftraggeber von Schuldfähigkeits- und Prognosegutachten zu berücksichtigen.

Anforderungsprofile und Empfehlungen

Infolge der fortwährenden Diskussion um Gutachtenqualität und Qualitätssicherung publizierte eine – von Juristen, forensischen Psychiatern, Psychologen, Kriminologen und Sexualmedizinern gebildete – Arbeitsgruppe in den Jahren 2006 bzw. 2007 konkrete „Mindestanforderungen“ an Prognose- und Schuldfähigkeitsgutachten (Boetticher et al. 2006, 2007), die eine Orientierungshilfe für alle Verfahrensbeteiligten schaffen und empirisch-wissenschaftlich fundierte Erkenntnisse mit der gutachterlichen Praxis verbinden sollten. Diese „Mindestanforderungen“ wurden im Jahr 2019 als „Empfehlungen für Prognosegutachten“ (Kröber et al. 2019; Boetticher et al. 2019) aktualisierend fortgeschrieben, um den aktuellen Stand der Wissenschaft und den aktuellen Anforderungen der Gesetzgebung und Rechtsprechung gerecht zu werden.

An empirischen Belegen, inwieweit die Mindestanforderungen für Schuldfähigkeits- und Prognosegutachten (Boetticher et al. 2006, 2007) bzw. deren Fortschreibung als „Empfehlungen“ (Boetticher et al. 2019) auch in der gutachterlichen sowie richterlichen Praxis umgesetzt werden, und inwieweit qualitätssichernde Maßnahmen wie die Veröffentlichung der Mindeststandards zu einer Qualitätsverbesserung entsprechender Gutachten im Zeitverlauf führen, fehlte es zunächst weitgehend.

Empirisches Forschungsprojekt

Als Reaktion auf diese Forschungslücke wurde 2018 in dieser Zeitschrift eine Untersuchung zur „Umsetzung von Mindestanforderungen für Prognosegutachten in der Praxis“ vorgestellt (Wertz et al. 2018), wonach die Publikation der Mindestanforderungen für Prognosegutachten (Boetticher et al. 2006) die Gutachtenpraxis in Richtung einer stärkeren Berücksichtigung von Qualitätsanforderungen beeinflusst hat, allerdings große Unterschiede bei der Orientierung am Anforderungsprofil feststellbar sind. Erkennbar wurde sowohl eine Institutions- als auch Professionsabhängigkeit bei der Orientierung an den Mindestanforderungen. Zudem zeigte sich ein signifikant positiver Zusammenhang zwischen der Umsetzung der Mindestanforderungen an Prognosegutachten und der Trefferquote günstig gerichteter Prognosen (Wertz et al. 2018).

Diese Befunde gingen in ein iteratives, im Folgenden näher beschriebenes Forschungsprojekt ein, das sich in weiteren Teilstudien der Qualität strafrechtsrelevanter Gutachten widmete. So ist beispielsweise mit der Qualität von Gutachten die Frage nach der Methodik in der Prognose- und Schuldfähigkeitsbeurteilung verknüpft. Darum geht es insbesondere in der anhaltenden Diskussion um die Überlegenheit strukturierter Beurteilungen im Vergleich zu einer intuitiv-unstrukturierten Urteilsbildung (u. a. Viljoen et al. 2021). Dabei wird beispielsweise in der Prognosepraxis der Einsatz von kriminalprognostischen Verfahren vor dem Hintergrund unterschiedlicher methodischer Zugänge (wie etwa einer statistisch-aktuarischen oder idiographischen Urteilsbildung, Rettenberger 2018) sowohl im internationalen (u. a. Archer et al. 2006; Singh et al. 2014; Viljoen et al. 2010) als auch deutschsprachigen Raum (Leygraf 2015; Müller und Nedopil 2017; Rettenberger 2018; Rettenberger und von Franqué 2013) uneinheitlich gehandhabt. Dies gilt auch für sozialtherapeutische Einrichtungen (Etzler und Rettenberger 2019), die Praxis der ambulanten Nachsorge (Gregório Hertz et al. 2019) und die Lockerungspraxis in Maßregelvollzugseinrichtungen (Sklenarova et al. 2020).

Unter anderem diesen Themen widmete sich das iterative Forschungsprojekt zur Qualität strafrechtlicher Gutachten, das nun zum Abschluss gekommen ist und im Folgenden in einer Zusammenschau der Hauptergebnisse vorgestellt werden soll. Für das Projekt wurden insgesamt über 1000 Prognose- und Schuldfähigkeitsgutachten über Sexual- und Gewaltstraftäter der Justizvollzugsanstalt Freiburg, der Abteilung für Forensische Psychiatrie der Klinik und Poliklinik für Psychiatrie und Psychotherapie der Ludwig-Maximilians-Universität München (LMU) und der Charité Berlin aus dem Erstellungszeitraum von 1999 bis 2016 hinsichtlich unterschiedlicher Fragestellungen retrospektiv analysiert. Hierbei konnten Gutachten von um die 150 verschiedenen Sachverständigen herangezogen werden. Zudem konnten für Teilstichproben Auskünfte aus dem Bundeszentralregister (Stand: Juni 2016) sowie aus gerichtlichen Verfahrensausgängen eingeholt und mit in die Analysen einbezogen werden. Das Gesamtkontingent der untersuchten Gutachten verteilte sich auf unterschiedliche externe Auftraggeber wie Amtsgerichte, Strafvollstreckungskammern, Bezirkskliniken und -krankenhäuser, Justizministerien, Justizvollzugsanstalten, Landgerichte, Oberlandesgerichte, Staatsanwaltschaften und private Rechtsanwaltkanzleien. Zur Absicherung der Güte sämtlicher retrospektiver Ratings wurde jeweils an einer zufällig ausgewählten Gutachtensichprobe die Interrater-Reliabilität bestimmt. Die Analysen ergaben für sämtliche Einschätzungen Reliabilitätskoeffizienten, die gemäß dem üblichen Standard als hoch bis sehr hoch eingestuft werden konnten.

Im Einzelnen gehörten zu dem Projekt – neben der bereits angesprochenen Untersuchung zur „Umsetzung von Mindestanforderungen für Prognosegutachten in der Praxis“ (Wertz et al. 2018) – fünf weitere empirische Teilstudien, die sich dem Einfluss des richterlichen Auftrags auf die Gutachtenerstellung, der Gefährlichkeitsprognose bei der Schuldfähigkeitserstellung, dem Einsatz testpsychologischer Verfahren bei Schuld- und Prognosegutachten, der Verwendung von Prognoseinstrumenten in der Praxis sowie der prädiktiven Validität von Prognosegutachten in Abhängigkeit von ihrer methodischen Strukturierung widmeten.

Einfluss der Gutachtenaufträge

In der ersten dieser Nachfolgeuntersuchungen ging es dabei konkret um die Frage, inwieweit sich auch Auftraggeber an den Mindestanforderungen bzw. Empfehlungen (Boetticher et al. 2006, 2019) bei der Formulierung der Gutachtenaufträge orientieren. Ergebnis waren weitere Hinweise auf eine Beeinflussung der Gutachtenpraxis durch die Publikation der Mindestanforderungen. Feststellbar war, dass sowohl die Gutachtenaufträge als auch die damit korrespondierenden Gutachten, im Ganzen gesehen, auf relevante prognostische Fragen (mit Effektstärken zwischen Cramérs φ = 0,15 und 0,87 für verschiedene Fragestellungen wie etwa zu Wahrscheinlichkeit und Art erneuter Straftaten oder zu risikominimierenden Maßnahmen) stärker nach Erscheinen der Mindestanforderungen im Jahr 2006 als davor ausgerichtet waren. Allerdings gab es insoweit z. T. große Unterschiede zwischen den untersuchten Gutachtenaufträgen und dem Umgang damit in den Gutachten. Biseriale rangkorrelative Zusammenhänge zwischen dem richterlichen Auftrag und der Beantwortung der wesentlichen prognostischen Fragen (bis zu r = 0,33**) verdeutlichten den Einfluss des Gutachtenauftrags auf die Arbeit von Sachverständigen (Wertz et al. 2020a).

Gefährlichkeitsprognose bei der Schuldfähigkeitsbeurteilung

Auch die Mindestanforderungen für Schuldfähigkeitsgutachten wurden zunehmend in der gutachterlichen Praxis umgesetzt (bei einer Effektstärke von d = 0,84), wie die Untersuchungsbefunde einer weiteren Teilstudie des vorgestellten Forschungsprojekts (Wertz et al. 2021) zeigten. Allerdings stellte sich die Gefährlichkeitsprognose zur Frage der Unterbringung im Maßregelvollzug ebenso wie die Berücksichtigung der gutachterlichen Feststellungen im Urteil äußerst heterogen dar. So konnte nur in etwa der Hälfte der untersuchten Gutachten eine Gefährlichkeitsprognose identifiziert werden, die – wenn überhaupt vorhanden – nur sporadisch auf einer methodisch-strukturierten Urteilsbildung fußte. Ebenso fehlten in über der Hälfte der herangezogenen Urteilsabschriften eine Zuordnung zu den Eingangsmerkmalen des § 20 StGB sowie eine Beurteilung der Einsicht- und Steuerungsfähigkeit. Beide Befunde unterlagen keiner signifikanten Veränderung im Zeitverlauf (Wertz et al. 2021).

Einsatz testpsychologischer Verfahren bei Schuld- und Prognosegutachten

Empirisch nahezu ungeklärt schien bisher auch der Einsatz von testpsychologischen Verfahren und strukturierten Prognoseverfahren in der allgemeinen Begutachtungspraxis (u. a. Neal et al. 2019; Rettenberger 2019), da bisherige Untersuchungen meist auf Selbstauskünften von im forensischen Kontext tätigen Personen beruhten und somit keine Aussagen über die tatsächliche Anwendung in der Praxis getroffen werden konnten (Archer et al. 2006; Lally 2003). Dabei sprachen solche Selbstauskünfte für einen regelhaften, jedoch in Bezug auf Art und Anwendung heterogenen Einsatz einer Bandbreite an testpsychologischen Verfahren bei Schuldfähigkeits- und Prognosebeurteilungen (Archer et al. 2006; Habermeyer 2005; Lally 2003; Neal und Grisso 2014; Serafim et al. 2015; Viljoen et al. 2010), der stark vom institutionellen Setting, der Fragestellung und dem Untersuchungsfokus abzuhängen scheint (Archer et al. 2006; Lally 2003).

Dies bestätigte sich im Rahmen des jetzigen Projekts zur Gutachtenqualität teilweise: Eine eigene Teilstudie dazu erbrachte, dass regelmäßig eine Bandbreite an testpsychologischen Verfahren in der allgemeinen externen Begutachtungspraxis zum Einsatz kommt, was auch schon für forensische Einrichtungen aufgezeigt werden konnte (Etzler und Rettenberger 2019; Gregório Hertz et al. 2019; Sklenarova et al. 2020). In knapp drei Viertel der Prognose- und in knapp der Hälfte der untersuchten Schuldfähigkeitsgutachten wurden testpsychologische Verfahren herangezogen, wobei sich eine ausgeprägte Heterogenität (auch) in der Anwendung von je über 100 verschiedenen Testverfahren in beiden Begutachtungsbereichen widerspiegelte. Während dabei in der Kriminalprognostik vornehmlich (multidimensionale) Persönlichkeitsfragebogen eingesetzt wurden, lag der testpsychologische Fokus in den Schuldfähigkeitsgutachten vermehrt auf Testverfahren zur Bestimmung der intellektuellen und kognitiven Leistungsfähigkeit der Probanden. Auffallend war, dass trotz signifikanter Abnahme über die Zeit nach wie vor regelmäßig „(semi-)projektive Verfahren“ zur Anwendung kamen, die anhand von auslegungsfähigem Material Projektionen des Probanden für Rückschlüsse über die Persönlichkeit abrufen sollen, bei denen eine standardisierte Auswertung allerdings kaum möglich ist. Aber auch bei den eingesetzten Persönlichkeitsfragebogen und Performancetests fehlten mitunter geeignete und aktualisierte Normstichproben. Im Hinblick auf den Umgang mit den erzielten Testergebnissen zeigte sich, dass die testpsychologischen Befunde in über der Hälfte der Gutachten nicht nur deskriptiv berichtet, sondern im Sinne von Risiko- und protektiven Faktoren im Rahmen der finalen prognostischen Beurteilung herangezogen und diskutiert wurden (Wertz et al. 2022).

Verwendung von Prognoseinstrumenten in der kriminalprognostischen Praxis

Eine Folgestudie widmete sich dann dem Einsatz aktuarischer und klinisch-strukturierter Prognoseinstrumente im Zeitverlauf, für den ebenfalls eine (weiterhin) heterogene Anwendungspraxis offenbar wurde: Knapp die Hälfte der untersuchten Prognosegutachten nahm auf strukturierte Prognoseverfahren Bezug, wobei vornehmlich Checklisten sowie Kriterienkataloge des sog. Structured Professional Judgement (SPJ) und lediglich vereinzelt aktuarische Verfahren der zweiten oder dritten Generation zum Einsatz kamen. Psychologische Sachverständige verwendeten signifikant häufiger standardisierte Prognoseinstrumente als die psychiatrischen Kollegen (bei einer Effektstärke von V = 0,234), wobei dies eher von einer institutionellen Angebundenheit der Untersucher als von der fachlichen Herkunft beeinflusst zu sein schien (Wertz und Rettenberger 2021).

Methodische Strukturierung und prädiktive Validität

Die letzte der Teilstudien im Rahmen des vorgestellten Forschungsprojekts widmete sich der Frage, inwieweit eine methodische Strukturierung der Urteilsbildung die prädiktive Validität von Prognosegutachten verbessert. Im Hintergrund stand dabei, dass in der Forschung explizit der Mehrwert eines methodisch kontrollierten Vorgehens betont und wissenschaftlich fundierten Prognoseinstrumenten eine signifikant höhere Vorhersageleistung im Vergleich zu Urteilsbildungen auf der Basis von Intuition oder eines unsystematischen Rückgriffs auf Erfahrungswerte zugeschrieben wird (z. B. Rettenberger 2018, 2019). Dennoch scheint ein intuitives Vorgehen weiterhin verbreitet (Haubner-Maclean und Eher 2014) und das Fehlen einer (methodischen) Kontrolle bei der Urteilsbildung für die heterogene Gutachtenqualität in der Praxis mitverantwortlich zu sein (Rettenberger und Eher 2016; Wertz et al. 2018).

Die jetzige Teilstudie identifizierte und klassifizierte zunächst verschiedene methodische Ansätze in den kriminalprognostischen Gutachten, um sie anschließend direkt hinsichtlich der prädiktiven Validität miteinander zu vergleichen. Dabei war festzustellen, dass in knapp der Hälfte der Gutachten die Orientierung an einem strukturierten Prognoseverfahren fehlte, weshalb diese Gutachten als unstrukturiert eingestuft wurden. Für diese intuitive, unstrukturierte Urteilsbildung ergaben sich anhand der Berechnung der Area under the Curve (AUC) mittels Receiver-Operating-Characteristic(ROC)-Analysen geringe Effektstärken (je nach Outcome-Kriterium von AUC = 0,59 bis 0,62) lediglich für den generellen Rückfall, während sich der rein aktuarische Ansatz (mittels retrospektiven Ratings des Violence Risk Appraisal Guide – Revised [VRAG-R]) mit signifikant moderaten bis großen Effekten für den generellen, Gewalt- und Hands-on-Sexualrückfall (AUC = 0,66–0,79) und der SPJ-Ansatz mit signifikant moderaten bis großen Effekten für den generellen, Sexual- und Hands-on-Sexualrückfall (AUC = 0,69–0,86) verknüpfen ließ.

Zusammenfassend war unabhängig von Outcome-Kriterium (genereller, Gewalt- oder Sexualrückfall), Indexdelikt (Gewalt- oder Sexualstraftäter) oder den herangezogenen Beobachtungszeiträumen („fixed follow-up“ von 5 Jahren oder mittleres Follow-up von über 7 Jahren) eine höhere prädiktive Validität strukturierter Kriminalprognosen im Vergleich zu klinisch-intuitiver Urteilsbildung feststellbar, insbesondere bei der Kombination aktuarischer und SPJ-Instrumente (im Sinne einer klassischen Anwendung zur klinischen Strukturierung der Befunde) (AUC = 0,79–0,89) (Wertz et al. 2023).

Diskussion

Damit ergaben sich nach der bereits vorgestellten Untersuchung zur „Umsetzung von Mindestanforderungen für Prognosegutachten in der Praxis“ (Wertz et al. 2018) im Rahmen des jetzt abgeschlossenen Forschungsprojekts weitere Anhaltspunkte dafür, dass die publizierten „Mindestanforderungen“ die Prognosepraxis beeinflusst haben und auch im Bereich der Schuldfähigkeitsbeurteilungen zunehmend umgesetzt werden, auch wenn es insoweit in der Praxis noch große Unterschiede gibt (Wertz et al. 2018, 2020a, 2021). Heterogen ist die Praxis ebenfalls im Hinblick auf den Einsatz testpsychologischer Verfahren (Wertz et al. 2022) und standardisierter Risikoinstrumente (Wertz et al. 2021) sowie die Anwendung methodischer Ansätze der Kriminalprognose (Wertz et al. 2022).

Qualitätssichernde Potenziale seitens der Auftraggeber

Deutlich wurde überdies, dass sich auch Auftraggeber von Gutachten an den Mindestanforderungen orientieren und die Formulierung des gerichtlichen Auftrags von Bedeutung für die Qualität der Arbeit von Sachverständigen ist (Wertz et al. 2020). Wenn der Gutachtenauftrag die wesentlichen Fragen enthielt, wurden diese auch vermehrt von den Sachverständigen beantwortet. Schon die Auftragsstellung beeinflusst also (erwartbar) die Ausführlichkeit und den Inhalt der Ausführungen im Gutachten. Zugleich erweist sich die Praxis der Gutachtenbeauftragung bzw. die Formulierung der Aufträge auch nach der Publikation der Mindestanforderungen in qualitativer wie in quantitativer Hinsicht weiterhin als sehr heterogen (Wertz et al. 2020).

Dies wiederum legt nahe, dass wichtige qualitätssichernde Potenziale auch seitens der Auftraggeber kriminalprognostischer und Schuldfähigkeitsgutachten weitergehend genutzt werden könnten. Adressaten der publizierten Mindestanforderungen bzw. Empfehlungen sind nicht nur durch Sachverständige, sondern auch die Auftraggeber von Gutachten (Wertz et al. 2020). Zudem könnten vor dem Hintergrund allgemeiner Überlegungen zur Qualitätssicherung auch im Bereich der Schuldfähigkeitsbeurteilung Überlassungen von Urteilsabschriften gemäß § 475 Abs. 4 StPO für Sachverständige hilfreich sein, um auf Basis der Kenntnis der Verarbeitung des Gutachtens im Urteil die Fähigkeit zu verbessern, psychowissenschaftliche Erkenntnisse gegenüber dem Gericht zu vermitteln (Pfister 2019; Wertz et al. 2021).

Fragestellungsübergreifende Berücksichtigung kriminalprognostischer Forschungserkenntnisse

Daneben legen die jetzt erzielten Untersuchungsergebnisse nahe, dass die Prognoseerstellung im Rahmen von Schuldfähigkeitsbeurteilungen weniger an (publizierten) Prognoseanforderungen orientiert ist als im Bereich der Prognosebegutachtung selbst. Die entsprechenden Mindeststandards wurden in den jeweiligen Begutachtungsbereichen, für sich genommen, zunehmend umgesetzt, fragestellungsübergreifend aber scheinen kriminalprognostische Forschungserkenntnisse in der Schuldfähigkeitsbeurteilung weniger angekommen zu sein. Lediglich der Hälfte der Gutachten, in denen eine prognostische Einschätzung indiziert gewesen wäre, war eine dezidierte Gefährlichkeitsprognose zu entnehmen. Auch zeigten sich eine zumindest lückenhafte Beantwortung der wesentlichen prognostischen Fragestellungen sowie ein lediglich sporadischer Einsatz von standardisierten Prognoseinstrumenten. Dabei ergaben sich keine nennenswerten Veränderungen im Zeitverlauf. Diese Studienergebnisse sprechen für einen Handlungsbedarf bei der Qualitätssicherung in diesem Bereich, auf den bereits in der Vergangenheit hingewiesen wurde (Schmitt und Rettenberger 2015). Forschungserkenntnisse sollten bereichsübergreifend auch bei der Gefährlichkeitsprognose zur möglichen Unterbringung im Maßregelvollzug in Schuldfähigkeitsgutachten verstärkt berücksichtigt werden, und dies auch in Anlehnung an die kürzlich fortgeschriebenen Empfehlungen für Prognosegutachten (Wertz et al. 2021).

Zunehmende Standardisierung der Begutachtungspraxis

Auch sind testpsychologische Untersuchungen in der strafrechtsrelevanten Begutachtungspraxis anerkannt und weit verbreitet. In diesem Sinne bestätigten die jetzt erzielten Befunde zur tatsächlichen Anwendung von testpsychologischen Verfahren bei Schuldfähigkeits- und Prognosebeurteilungen die bisher vorliegenden Selbstauskünfte von im forensischen Kontext tätigen Personen (Archer et al. 2006; Neal und Grisso 2014; Serafim et al. 2015). Institutions- und fragestellungsübergreifend kommt eine Bandbreite an testpsychologischen Verfahren bei Schuldfähigkeits- und Prognosebeurteilungen zum Einsatz, zugleich bietet die Praxis insoweit ein sehr heterogenes Bild (Archer et al. 2006; Neal und Grisso 2014; Serafim et al. 2015). Wenn allerdings im Rahmen einer Begutachtung testpsychologische Verfahren zum Einsatz kamen, dann flossen ihre Ergebnisse auch regelhaft in die finale prognostische Beurteilung ein.

Darüber hinaus ist nach den jetzt erzielten Forschungsergebnissen von einer fortschreitenden Standardisierung in der Prognosebegutachtung auszugehen, die im Einklang mit früheren empirischen Analysen von Prognosegutachten (z. B. Haubner-Maclean und Eher 2014) und Umfrageergebnissen zur kriminalprognostischen Praxis in Deutschland (Rettenberger et al. 2017) steht, indem im Betrachtungszeitraumzunehmend strukturierte Prognoseinstrumente zum Einsatz kamen. Dies ist nicht zuletzt mit Blick darauf von Bedeutung, dass sich im Rahmen der jetzigen Untersuchung eine höhere prädiktive Validität von methodisch strukturierten Kriminalprognosen gegenüber einer intuitiven Urteilsbildung zeigte (Wertz et al. 2022). Dies stützt empirisch die Forderung nach einer methodischen Kontrolle der prognostischen Urteilsbildung. Gleichwohl war der Anteil von Vorhersagen auf Grundlage eines unstrukturierten Vorgehens im jetzigen Untersuchungsmaterial vergleichsweise hoch (Wertz et al. 2021).

Grenzen der Qualitätsbeurteilung

Aus alldem können allerdings nicht unmittelbar Aussagen über Qualität und Qualitätssicherung in der strafrechtlichen Begutachtungspraxis abgeleitet werden. So sagt weder der Rückgriff auf ein testpsychologisches Verfahren noch der Einsatz von Prognoseinstrumenten per se etwas über die Qualität eines Gutachtens aus. Auch kann nicht ohne Weiteres von einem Qualitätsmangel gesprochen werden, wenn sich Auftraggeber und -nehmer nicht an den „Mindestanforderungen“ oder „Empfehlungen“ für Prognosegutachten orientieren. Die Einhaltung der Mindestanforderungen stellt weder eine „richtige“ und sachkundige Beurteilung (Konrad 2010) noch eine zutreffende Vorhersage (Dahle 2005b) sicher. Auch sind die Mindestanforderungen selbst (z. B. im Hinblick auf ihren Nutzen bei der Beurteilung des Schweregrades von psychischen Störungen, Konrad et al. 2019; Dobbrunz et al. 2020; Fuß et al. 2020) Gegenstand von Diskussionen, zu denen hier schon aus Platzgründen nicht Stellung bezogen werden kann.

Ohnehin stehen Aussagen zur Qualität von strafrechtsrelevanten Gutachten vor grundsätzlichen Herausforderungen. So ist ein Beleg für die qualitative Hochwertigkeit von Prognosegutachten nicht darin zu sehen, dass die im Gutachten prognostizierte Weiterentwicklung eintritt oder zu späteren Bundeszentralregisterauszügen passt. Nicht einmal über die Treffsicherheit der Aussagen im Gutachten ist auf diese Weise Gewissheit zu erlangen. Denn gerade die Vorhersage einer unerwünschten Entwicklung fordert zu einem Gegensteuern auf. Bei Vorliegen einer Gefahr sind im Strafverfahren Gegenmaßnahmen zu ergreifen, damit es gerade nicht zu einer Realisierung der festgestellten Gefahr kommt. Der Erfolg liegt hier in einer Abwendung der Gefahr, mit der zugleich die prognostizierte Weiterentwicklung ausbleibt. Zwar sollen Prognosegutachten oft auch die Maßnahmen benennen, mit denen eine festgestellte Gefährlichkeit reduziert oder beseitigt werden kann. Wenn diese Maßnahmen dann allerdings zum Erfolg führen, liegt selbst darin schon deshalb kein eindeutiger Beleg für die Treffsicherheit oder Qualität eines Gutachtens, weil eine biografische Weiterentwicklung nicht allein von einzelnen Maßnahmen, sondern von weiteren Faktoren beeinflusst wird. Hier treffen die Einschätzungen zur Qualität von Prognosegutachten schon wegen der Vielzahl potenzieller Einflussfaktoren auf generelle Schwierigkeiten der Rückfallforschung. Dies gilt auch für den umgekehrten Fall einer prognostizierten Positiventwicklung. Bleibt sie aus, und eine Legalbewährung gelingt doch nicht, so kann dies Gründe haben, die von Qualität oder Treffsicherheit des Gutachtens völlig unabhängig sind, etwa weil ein unvorhersehbares Ereignis wie der unerwartete Tod einer wichtigen Bezugsperson der Entwicklung eine völlig neue Richtung gegeben hat. Weil (auch deshalb) künftiges Verhalten allenfalls wahrscheinlich, aber nicht gewiss ist, kann eine vorhergesagte Weiterentwicklung ausbleiben, ohne dass ihre Vorhersage als Fehler zu gelten hat. Ähnliche Schwierigkeiten mit der Definition von Qualität bestehen auch bei Schuldfähigkeitsgutachten. Auch hier bestätigt kein greifbarer Einzelumstand, Parameter oder Vorgang per se die Qualität oder Richtigkeit der gutachterlichen Aussagen, zumal Schuldfähigkeit ein normatives Konstrukt ohne ontologisches Substrat ist.

Diese grundsätzlichen Schwierigkeiten der Erfolgsmessung geben allerdings keinen Freibrief für qualitative oder methodische Beliebigkeit: So ist zwar beispielsweise die Qualität eines Prognosegutachtens nicht ohne Weiteres über den Einklang der Vorhersage mit der künftigen Weiterentwicklung zu definieren. Qualitative Anforderungen hat ein Gutachten gleichwohl zu erfüllen, z. B. damit es überprüfbar, nachvollziehbar und in sich widerspruchsfrei ist – und damit die im Gutachten getroffenen Feststellungen der Wirklichkeit möglichst nahekommen. Was zur Erreichung dieser Ziele geboten ist, hat ein Gutachten zu berücksichtigen, woraus sich ein Anforderungsprofil ableiten lässt, das auch Aussagen über die Qualität eines Gutachtens ermöglicht. Denn je mehr ein Gutachten diesem Anforderungsprofil gerecht wird, desto höher ist seine Qualität. Die Qualität eines Gutachtens wird also vom Einklang mit dem maßgeblichen Anforderungsprofil bestimmt. Dieses Anforderungsprofil wiederum erhält seine Prägung durch die Zielsetzungen bei der Begutachtung. Für die maßgeblichen Anforderungen dabei – und damit für Aspekte, die in „Mindestanforderungen“ oder „Empfehlungen“ zusammengefasst wurden – gibt es also sachliche Gründe. Sie können nicht zuletzt auf die gesetzlichen Vorgaben zurückgeführt werden, die für die Begutachtung im Strafverfahren gelten: Die Feststellungen in einem Gutachten müssen aktuell, vollständig, zutreffend und einzelfallgerecht sein.

Ausblick

Für weitere Studien zur Qualitätssicherung gibt es zahlreiche Anschlussmöglichkeiten. Zu denken ist beispielsweise an die Validierung weiterer qualitätssichernder Maßnahmen wie postgradualer Weiterbildungscurricula samt Zertifizierungen, interdisziplinär erarbeiteter Fragenkataloge oder (moderierter) Peer-review-Verfahren für Sachverständigengutachten (im Kontext familienrechtspsychologischer Gutachten: u. a. Banse 2017; Kannegießer 2018, Kannegießer et al. 2021). Relevant erscheinen z. B. auch insbesondere Zusammenhänge zwischen Merkmalen von Sachverständigen (wie z. B. das Innehaben forensischer Zusatzausbildungen, deren Bedeutung im familienrechtlichen Kontext aufgezeigt werden konnte; Salewski und Stürmer 2014), institutionellen Gegebenheiten und prognostischer Vorgehensweise, da die in der vorliegenden Studie untersuchten Gutachten keine repräsentative oder Zufallsstichprobe der allgemeinen Gutachtenspraxis in Deutschland darstellen und unter besonderer Berücksichtigung der Sonderstellung universitärer Einrichtungen zu sehen sind. Denn die Ergebnisse, die im vorgestellten Forschungsprojekt erzielt wurden, sprechen für weiteren Forschungs- und Handlungsbedarf im Hinblick auf die Qualitätssicherung bei der Erstellung von Schuldfähigkeits- und Prognosegutachten.