Einleitung

Die Feststellung der Schuldfähigkeit wird im deutschen Strafrecht über die Paragraphen §20 und §21 StGB geregelt. Grundsätzlich geht das Gesetz davon aus, dass erwachsene Menschen in der Regel schuldfähig sind, Abweichungen müssen geprüft werden (Schneider, Frister, & Olzen 2020). Die Feststellung der Schuldunfähigkeit bezieht sich dabei immer nur auf eine konkrete Situation eines Menschen, sie kann somit nicht generalisiert und auf andere Situationen übertragen werden (Nedopil 2007). Bei der Prüfung der Schuldunfähigkeit wird in einem ersten Schritt ermittelt, ob bei einer Person zum Zeitpunkt der Tat eine Einschränkung vorlag, die sich unter einem der in §20 StGB genannten Eingangsmerkmale subsumieren lässt. Es handelt sich nach Gesetzestext um die „tiefgreifende Bewusstseinsstörung“, die „krankhafte seelische Störung“, die „schwere andere seelische Abartigkeit“ und den „Schwachsinn“. In einem zweiten Schritt muss anschließend geprüft werden, ob die psychische Störung zum Zeitpunkt der Tat dazu führte, dass der Täter nicht fähig war, das Unrecht der Tat einzusehen (Einsichtsfähigkeit) oder nach dieser Einsicht zu handeln (Steuerungsfähigkeit) (Nedopil 2007; Schneider et al. 2020). Somit bedeutet eine Diagnose nach den Klassifikationssystemen allein nicht direkt, dass Schuldunfähigkeit vorliegt, sie weist jedoch auf eine nichtgeringfügige Beeinträchtigung hin (Theune 2002).

Aus heutiger Sicht sind insbesondere Begriffe wie „Schwachsinn“ oder „seelische Abartigkeit“ ungebräuchlich, stark negativ konnotiert und damit nicht mehr zeitgemäß. Die Begriffe wurden im Rahmen des 2. Strafrechtsreformgesetzes 1969 eingeführt und orientierten sich am Krankheitsbegriff Kurt Schneiders (Bundesministerium der Justiz und für Verbraucherschutz, BMJV 2020). Laut Schneider lassen sich psychopathologische Diagnosen in krankhafte und nichtkrankhafte, d. h. nicht auf organische Ursachen rückführbare, Diagnosen unterteilen (Schneider 2007). Schon damals galt dieser Krankheitsbegriff als umstritten und war nicht in der gesamten Medizin anerkannt. Er wurde jedoch aus juristischen Gründen für die Paragraphen gewählt, da er den engsten und schärfsten Krankheitsbegriff darstellte (Krümpelmann 1976). Heute gilt Schneiders Krankheitsbegriff eindeutig als überholt, und auch die gebräuchlichen Klassifikationssysteme für psychiatrische Diagnosen orientieren sich nicht an ihm (Schiemann 2019), denn hier wird durchgängig von „Störungen“ gesprochen. Dennoch sind die §§ 20 und 21 weiterhin sowohl in Wortwahl als auch Systematik an ihm orientiert; die Subsumption muss sich also weiterhin danach ausrichten.

Der Begriff des Schwachsinns war in den 1970er-Jahren in der Medizin noch gebräuchlich, ist jedoch mittlerweile aus medizinischer sowie psychologischer Sicht veraltet und wird aufgrund seiner „historisch und umgangssprachlich bedingten sozial diskriminierenden Tönung“ in der Medizin seit Jahren nicht mehr verwendet (Wegener 1989, S. 320). Mit dem Begriff der Abartigkeit verhält es sich jedoch anders. Dieser war bereits zum Zeitpunkt der Einführung 1975 aufgrund seines Bezugs zum Nationalsozialismus und zu Musterungsbestimmungen der Wehrmacht stark umstritten (Wegener 1989; Janßen 1994). Laut Wegener (1989) hat „der Gesetzgeber […] einen historisch belasteten Begriff verwendet“ (S. 325). Er fasst zusammen: „Man fragt sich, wie es möglich war, einen Begriff mit solcher Vergangenheit aufzunehmen, welcher dazu noch in jener Zeit als Schimpfwort in Gebrauch war?“ (S. 317). Zusätzlich zu diesem historischen Hintergrund empfahl bereits Schneider selbst, den Psychopathiebegriff im juristischen Kontext zu vermeiden, der lange Zeit in enger Verbindung mit der seelischen Abartigkeit stand. Grund hierfür war, dass die von Schneider „strikt betonte Wertneutralität dieser Diagnose in praxi nicht aufrecht zu erhalten war“ (Krümpelmann 1976; Meyer 1976, S. 53).

Im Laufe der Jahre wurde vermehrt die diskriminierende und stigmatisierende Wirkung der Begriffe bemängelt und eine Überarbeitung gefordert (z. B. Meyer 1976; Janßen 1994; Wegener 1989; Schiemann 2019). Auch der Referentenentwurf zur Änderung des Strafgesetzbuches, der am 04.09.2019 vorgelegt wurde, räumt dies ein. Hier wird genannt, dass die Begriffe Schwachsinn und Abartigkeit „zunehmend als stigmatisierend oder gar diffamierend“ angesehen werden und teilweise deren Abschaffung gefordert wird (BMJV 2019, S. 24). Der 2019 vorgelegte Entwurf zur Gesetzesänderung sieht eine Änderung des Eingangsmerkmals Schwachsinn in „Intelligenzminderung“ vor sowie die Änderung der schweren anderen seelischen Abartigkeit in die „schwere andere seelische Störung“.

Obwohl es also zahlreiche Stimmen gibt, die die alten Begriffe als stigmatisierend kritisieren und deren Novellierung fordern, ist diese Debatte bis dato unerwartet frei von Empirie. Ob ein Begriff stigmatisierend ist in dem Sinne, dass er als negativ empfunden wird und die Wahrnehmung einer Person negativ einfärbt, ist aus Sicht der Sozialwissenschaften eine empirische Frage. Die vorliegende Studie überprüft deshalb erstmals, ob die veralteten Begriffe des Schwachsinns und der schweren anderen seelischen Abartigkeit als stigmatisierend empfunden werden, und ob sie zu unterschiedlicher Personenwahrnehmung führen.

Letzteres ist insbesondere relevant, da, unabhängig von einer normativ-ethischen Diskussion um die Angemessenheit unterschiedlicher Begrifflichkeiten, Sprache Realitäten schaffen kann. So geht der modifizierte Labeling-Ansatz (Link et al. 1989) davon aus, dass das Label über die eigentliche Symptomatologie hinaus, negative Effekte haben kann. Dies gilt insbesondere auch für die Fremdwahrnehmung. Eine identisch beschriebene Person wird z. T. als aggressiver, gefährlicher, weniger vertrauenswürdig und kompetent eingestuft, wenn dieser Beschreibung das diagnostische Label „Schizophrenie“ hinzugefügt wird (Imhoff 2016). Ebenso macht es einen messbaren Unterschied, ob Menschen als „pädophil“ oder aber „sexuell an präpubertären Kindern interessiert“ bezeichnet werden, wobei Ersteren mit drastischeren Bestrafungswünschen begegnet wird (Imhoff 2015). Zu dem Grad, zu dem die Eingangsmerkmale an sich also einen nachweisbaren Einfluss auf die Wahrnehmung der mit ihnen bezeichneten Person haben, wäre die Fairness des Verfahrens infrage zu stellen.

So könnte es zu einem Halo-Effekt kommen, unter dem die Tendenz verstanden wird, „faktisch unabhängige oder nur mäßig korrelierte Eigenschaften von Personen fälschlicherweise als zusammenhängend wahrzunehmen“ (Schweizer 2005, S. 230). Die Bezeichnung als schwachsinnig oder abartig führt demnach potenziell zur Assoziation diverser eigentlich hiervon unabhängiger Eigenschaften und somit zum Nachteil der beschuldigten Person.

Die vorliegende Studie soll einen empirischen Beitrag zur stigmatisierenden Wirkung der Begriffe „schwere andere seelische Abartigkeit“ und „Schwachsinn“ auf zwei Ebenen leisten. In einem ersten Schritt soll eruiert werden, inwiefern die Begriffe tatsächlich als stigmatisierend erlebt werden. Hierzu werden direkte Bewertungen herangezogen, ebenso wie offene Nennung von Assoziationen. Die zweite Fragestellung ist der kritischere Test und bezieht sich auf die tatsächliche Wirkung der Begriffe, sowohl bezogen als Schuld- und Einsichtsfähigkeit als auch auf die drei relevanten Dimensionen der Stigmatisierung (Gefährlichkeit, Seltenheit, eigene Verantwortlichkeit; Feldman und Crandall 2007). Hierzu wird in einem experimentellen Ansatz die aus der modifizierten Labeling-Theorie abgeleitete Hypothese überprüft, dass Straftäter als schuldfähiger wahrgenommen werden, wenn die modernisierten Begriffe genutzt werden (Hypothese 1). Zusätzlich bestehen die jeweils auf die spezifischen Eingangsmerkmale bezogenen Hypothesen, dass Straftäter als einsichtsfähiger wahrgenommen werden, wenn der Begriff Intelligenzminderung verwendet wird (im Vergleich zu „Schwachsinn“) (Hypothese 2) und als gefährlicher wahrgenommen werden, wenn der Begriff schwere andere seelische Abartigkeit (im Vergleich zu „Störung“) verwendet wird (Hypothese 3). Da es Personen, die mit den konkreten Begrifflichkeiten vertraut sind, möglich ist, die tatsächliche Äquivalenz des bezeichneten Eingangsmerkmals zu erkennen, wurde erwartet, dass alle Unterschiede unter Laien ausgeprägter ausfallen als unter Personen mit Vorwissen (Hypothese 4).

Zu Explorationszwecken wurden zusätzlich die wahrgenommene Sympathie, Therapieempfänglichkeit, Rückfallrisiko sowie Abweichung von den geltenden Normen, Vollbesitz geistiger Kräfte sowie Impulssteuerung beschriebener Täter erhoben. Angedachte explorative Analysen zu Unterschieden zwischen Juristen und Psychologen wurden aufgrund der geringen Anzahl teilnehmender Juristen (n = 7) nicht durchgeführt.

Methode

Stichprobe

Die Probanden wurden über universitätsinterne E‑Mail-Verteiler der Johannes Gutenberg-Universität Mainz sowie soziale Medien rekrutiert. Insgesamt umfasste die Stichprobe n = 218 abgeschlossene Fragebogen. Im Einklang mit den in der PräregistrierungFootnote 1 angegebenen Ausschlusskriterien (Abschluss des Fragebogens unter 5 min, unvollständige Fragebogen, Nennung des Studienziels bei der Zwischenüberprüfung) wurden 10 Personen ausgeschlossen. Die endgültige Stichprobe umfasste somit n = 208 Personen (165 Frauen, 41 Männer, 2 Personen, die sich als divers identifizierten) im Alter von 18 bis 72 Jahren (M = 26,59; SD = 9). Für die Studie wurde eine Selbsteinschätzung des rechtspsychologischen Vorwissens erhoben. Unter den 208 Probanden befanden sich laut eigenen Angaben 131 rechtspsychologische Laien und 77 Personen mit Vorwissen. Ein Großteil der Stichprobe bestand aufgrund der Rekrutierung aus Studierenden (n = 178).

Direkte BewertungFootnote 2

Zur Messung der Einstellung zu den Begriffen wurden Probanden zunächst offen danach gefragt, was Personen mit den jeweiligen Begriffen assoziieren. Diese Abfrage diente dazu, anhand von Stichworten und Kategorien mittels Word Clouds einen Gesamtüberblick darüber erhalten zu können, ob die unterschiedlichen Begrifflichkeiten mit verschiedenen Ausdrücken und Themen in Verbindung gebracht werden. Anschließend wurde auf einer 10-Punkte-Ratingskala nach Konnotation, abwertender Wirkung, juristischer Angemessenheit und stigmatisierender Wirkung der Begriffe gefragt. Zuletzt wurde in einer direkten Gegenüberstellung für jedes Eingangsmerkmal abgefragt, ob der neue oder modernisierte Begriff als stigmatisierender empfunden wird.

Experimentelle Überprüfung der Wirkung

Manipulation

Allen Probanden wurden im ersten Teil der Studie nacheinander 4 Fallvignetten präsentiert, in denen jeweils eine verurteilte Person und ihr Vergehen beschrieben wurden. Probanden sollten auf Basis dieser Texte eine Reihe von Einschätzungen vornehmen (z. B. „Für wie gefährlich halten Sie die beschriebene Person?“ oder „Wie sehr glauben Sie, kann die beschriebene Person die Folgen ihrer Handlung absehen?“). Die Fallvignetten waren inhaltlich angelehnt an Urteile des Bundesgerichtshof (BGH) sowie eine Fallstudie der Deutschen Heilpädagogischen Gesellschaft (DHG, 2013; Rechtsanwaltskanzlei Strate und Ventzke 2020a, 2020b, 2020c)Footnote 3. Die Fälle wurden stark gekürzt und enthielten neben einer kurzen klinischen sowie strafrechtlichen Vorgeschichte der beschriebenen Personen Informationen zur Tat sowie eine kurze klinische Beschreibung, die zur Einschätzung der jeweiligen Eingangsmerkmale durch die Sachverständigen führten. Die Fälle wurden parallelisiert, indem die Delikte in allen Fallvignetten Körperverletzung oder Diebstahl darstellten. Jeweils 2 der 4 Fälle befassten sich mit Personen, die durch einen forensisch-psychiatrischen Sachverständigen Schwachsinn bzw. Intelligenzminderung bescheinigt bekamen, sowie 2 Fälle, in denen die Beschriebenen eine schwere andere seelische Abartigkeit (SASA)/Störung (SASS) bescheinigt bekamen. Es wurde randomisiert zugeordnet, welche Bezeichnung die Fallvignetten enthielten. Während die Begriffe der SASA bzw. SASS als Zwischensubjektfaktor manipuliert wurden, sodass Probanden jeweils den einen oder anderen Begriff in beiden Vignetten präsentiert bekamen, wurde jedem Probanden aufgrund eines Programmierungsfehlers bei der Randomisierung jeweils eine Vignette mit dem Begriff „Schwachsinn“ und „Intelligenzminderung“ präsentiert (die Begriffe wurden hier also als Innersubjektfaktor realisiert).

Abhängige Variablen

Als abhängige Variablen wurden im Rahmen dieser Studie Schuldfähigkeit, Einsichtsfähigkeit sowie Gefährlichkeit betrachtet. Schuldfähigkeit ergibt sich direkt aus dem Item: „Für wie schuldfähig für seine Tat halten Sie die beschriebene Person?“ Die Variablen Einsichtsfähigkeit und Gefährlichkeit wurden mittels Skalenbildung erstellt. Unter Einsichtsfähigkeit wird im Sinne des §20 StGB die Fähigkeit verstanden, das Unrecht der eigenen Tat einzusehen. Es wurde hierzu eine Skala über Mittelung der Itemwerte der Items: „Wie sehr ist die beschriebene Person Ihrer Meinung nach dazu fähig, das Unrecht ihrer Tat einzusehen?“ „Wie sehr, glauben Sie, kann die beschriebene Person abstrakte Regeln verstehen?“ sowie „Wie sehr glauben Sie, kann die beschriebene Person die Folgen ihrer Handlung absehen?“ gebildet. Einsichtsfähigkeit ergab somit eine 7‑Punkte-Skala, auf der höhere Werte höhere Einsichtsfähigkeit bedeuten. Für die Skala Gefährlichkeit wurden die Itemwerte der Items: „Für wie gefährlich halten Sie die beschriebene Person?“ und „Als wie stark ausgeprägt schätzen Sie das Rückfallrisiko der beschriebenen Person ein?“ gemittelt. Hier ergab sich ebenfalls eine 7‑Punkte-Skala, auf der höhere Werte höhere Gefährlichkeit bedeuten.

Ablauf

Nach der Begrüßung bearbeiteten die Teilnehmenden zuerst die Fallvignetten zur experimentellen Überprüfung der Wirkung, bevor sie im direkten Anschluss gefragt wurden, ob sie eine Vermutung bezüglich des Ziels der Studie hatten. Erst anschließend wurden sie direkt zu der stigmatisierenden Konnotation der Begriffe befragt. Diese Reihenfolge wurde gewählt, damit die experimentelle Überprüfung der tatsächlichen stigmatisierenden Wirkung unbeeinflusst vom Wissen über das Ziel der Studie blieb. Im Folgenden wird, von der Chronologie der Studie abweichend, zuerst die Bewertung der Begriffe und anschließend ihre Wirkung berichtet.

Ergebnisse

Direkte Bewertung der Begrifflichkeiten

Übereinstimmend mit der Hypothese zeigt sich deutlich, dass sowohl im Falle der SASA/SASS als auch im Falle Schwachsinn/Intelligenzminderung die alten Begriffe jeweils als signifikant abwertender, stigmatisierender, negativer konnotiert und weniger juristisch angemessen beurteilt wurden als die modernisierten Begriffe (Tab. 1 und 2).

Tab. 1 Ergebnisse des t‑Tests für abhängige Stichproben für den Vergleich der Bewertung der Begriffe „SASA“ und „SASS“
Tab. 2 Ergebnisse des t‑Tests für abhängige Stichproben für den Vergleich der Bewertung der Begriffe „Intelligenzminderung“ und „Schwachsinn“

In der direkten Gegenüberstellung zeigte sich noch einmal deutlich, dass im Falle beider Eingangsmerkmale die alten Begriffe als stigmatisierender bzw. negativer wahrgenommen wurden (Abb. 1).

Abb. 1
figure 1

Direkte Gegenüberstellung bei der Frage „Welchen Begriff halten Sie für negativer/stigmatisierender?“ für Schwachsinn vs. Intelligenzminderung bzw. SASA vs. SASS; n = 208

Neben der direkten Abfrage zur Stigmatisierung der Begriffe konnten die Probanden in einem freien Textfeld ihre Assoziationen zu den einzelnen Begriffen eintragen. In der qualitativen Analyse dieses freien Antwortformats wurden die Assoziationen zunächst zu Stichworten gekürzt und nach inhaltlichen Kategorien sortiert (z. B. wurden die Antworten „alter Ausdruck“, „veraltet“, „altmodisch“, „nicht mehr zeitgemäß“ usw. zusammengefasst). Durch die Kategorien konnte zum Zwecke der Übersichtlichkeit sichergestellt werden, dass keine genannten Assoziationen verloren gingen. Anschließend wurden die Begriffe nach der Häufigkeit ihrer Nennung geordnet und aus den gebildeten Kategorien Word Clouds angelegt (Zusatzmaterial online: Abb. A1–A4), um die Unterschiede in den Assoziationen und die Häufigkeit der Nennung der Begriffe zu veranschaulichen. Dem Zusatzmaterial kann die entsprechende Word Cloud zu jedem Eignungsmerkmal entnommen werden. (Aus Darstellungsgründen werden die Begriffe, die nur einmal genannt wurden, nicht dargestellt.) In Tab. 3 sind die 10 am häufigsten genannten Assoziationen je Eingangsmerkmal aufgelistet. Wie bereits in der direkten Gegenüberstellung der Begriffe ersichtlich, zeigt sich auch hier, dass mit den alten Begriffen eine negativere Konnotation einhergeht. Insbesondere bei der Gegenüberstellung der Begriffe der SASA und SASS wird dies deutlich: Mit der alten SASA wurden von den Probanden im Vergleich zur neuen SASS eher Begriffe assoziiert, die die beschriebene Person als unmenschliche, zur Vergewaltigung fähige und gefährliche Person darstellen. Unter anderem die Begriffe bösartig, grauenvoll und Ekel werden genannt. Dagegen wurden mit SASS eher spezifische psychiatrische Krankheitsbilder, Leidensdruck oder traumatische Erfahrungen der beschriebenen Person assoziiert.

Tab. 3 Die 10 am häufigsten genannten Assoziationen je Eingangsmerkmal

Tatsächlich stigmatisierende Wirkung

Ausgehend von dieser deutlichen negativen Bewertung der Begriffe war die kritische Frage, ob die Begriffe tatsächlich unterschiedliche Personenwahrnehmung nach sich zogen – abhängig vom Vorwissen der Probanden. Dazu wurden getrennt für die beiden Eingangsmerkmale separate 2 (Begriff: alt vs. neu) × 2 (Vorwissen: Laie vs. Vorwissen) ANOVA für jede abhängige Variable durchgeführt (Tab. 456 und 7).

Tab. 4 Ergebnisse einer zweifaktoriellen ANOVA für SASA/SASS
Tab. 5 Mittlere Bewertungen der AV bei SASA/SASS
Tab. 6 Ergebnisse einer rmANOVA für Schwachsinn/Intelligenzminderung
Tab. 7 Mittlere Bewertungen der AV bei Schwachsinn/Intelligenzminderung

Entgegen der Hypothese hatte die Verwendung des Begriffes SASA oder SASS keinen signifikanten Einfluss auf die Einschätzung der Schuldfähigkeit. Die einzigen systematischen Zusammenhänge zeigten sich mit dem Vorwissen, insofern, als dass rechtspsychologisch oder juristisch vorgebildete Teilnehmer deskriptiv insgesamt ein geringeres Maß an Schuldfähigkeit, ein höheres Maß an Einsichtsfähigkeit und ein geringeres Maß an Gefährlichkeit annahmen. Für die zusätzlichen – explorativ erhobenen – Variablen Sympathie, Therapieempfänglichkeit, Rückfallrisiko sowie Abweichung von den geltenden Normen, ergaben sich für das Eingangsmerkmal SASA/SASS ebenfalls keine Effekte (Zusatzmaterial online: Tabelle A5). Es gab jedoch signifikante Unterschiede in der Einschätzung des Vollbesitzes der geistigen Kräfte, t(186,16) = −2,49, p = 0,014, d = −0,352, sowie der Einschätzung der Impulssteuerung, t(206) = 2,42, p = 0,016, d = 0,337. Für den Vollbesitz geistiger Kräfte fielen die Einschätzungen für den alten Begriff der SASA höher aus (M = 4,07, SD = 1,02) als für den Begriff der SASS (M = 3,67, SD = 1,25). Impulssteuerung wurde für den alten Begriff der SASA geringer eingeschätzt (M = 5,26, SD = 0,91) als für den Begriff der SASS (M = 5,58, SD = 0,97).

Die Begriffe Schwachsinn bzw. Intelligenzminderung wurden als Innersubjektfaktor manipuliert, sodass Probanden jeden Begriff einmal präsentiert bekamen. Im Folgenden wird für die jeweiligen Skalen verglichen, ob die Begriffe unterschiedliche Personenwahrnehmung nach sich zogen – abhängig vom Vorwissen der Probanden.

Auch in diesem Falle ergab die Verwendung der Begriffe Schwachsinn oder Intelligenzminderung entgegen der Hypothese weder signifikante Unterschiede in der Bewertung der Schuldfähigkeit noch in Einsichtsfähigkeit oder Gefährlichkeit (Tab. 7 für deskriptive Werte). Thematisches Vorwissen wirkte sich hier allerdings signifikant auf die Bewertungen der Schuldfähigkeit aus, jedoch nicht auf die Bewertung von Einsichtsfähigkeit oder Gefährlichkeit. Keine Effekte des Eingangsmerkmals Schwachsinn/Intelligenzminderung wurden signifikant durch Vorwissen moderiert. Für die zusätzlichen – explorativ erhobenen – Variablen Sympathie, Therapieempfänglichkeit, Rückfallrisiko, Abweichung von den geltenden Normen, Vollbesitz geistiger Kräfte sowie Impulssteuerung ergaben sich für dieses Eingangsmerkmal keine Effekte (Zusatzmaterial online: Tabelle A6).

Diskussion

Die schon seit Langem geforderte Reformierung der Begriffe Schwachsinn und Abartigkeit in §20 StGB, die 2019 vom BMJV in einem Entwurf zur Gesetzesänderung vorgelegt wurde, bildete den Ausgangspunkt für die vorliegende Studie. Ziel war es, näher zu beleuchten, für wie stigmatisierend die Begriffe tatsächlich gehalten werden, und in welchem Ausmaß sich die stigmatisierende Wirkung der Begriffe im Sinne des Labeling-Effekts auf die Personenwahrnehmung auswirkt. In den Ergebnissen zeigt sich deutlich, dass sowohl Schwachsinn als auch die schwere andere seelische Abartigkeit für stigmatisierender als ihre modernisierten Alternativen gehalten werden und dass sie als abwertender, negativer konnotiert und weniger juristisch angemessen empfunden werden. Auch in den Ergebnissen der qualitativen Analyse ist sichtbar, dass mit den alten Begriffen negativere Assoziationen verbunden werden.

Dennoch findet sich in unseren Daten keine starke Evidenz dafür, dass die Begriffe tatsächlich zu einer Einfärbung der Personenwahrnehmung führen (lediglich für die explorativ erfassten Einschätzungen finden sich im Falle des alten Begriffs der seelischen Abartigkeit eine höhere Einschätzung für den Vollbesitz geistiger Kräfte und geringere Einschätzungen der Impulssteuerung als für den novellierten Begriff der seelischen Störung). Für juristische und psychologische Experten ließe sich das damit erklären, dass sie die Begriffe als veraltet einordnen und ihre negative Wirkung neutralisieren können. Jedoch zeigten sich in unserer Studie auch für Laien, für Menschen also, die den Gebrauch dieser Terminologie weder gewohnt sind noch ihn kontextualisierend „entschärfen“ können, keinerlei Auswirkungen auf die eingeschätzte Schuld- und Einsichtsfähigkeit sowie Gefährlichkeit. Tatsächlich fand sich für keine der untersuchten Variablen eine Moderation in dem Sinne, dass die Begriffe eine unterschiedliche Wirkung je nach Vorwissen hatten (Hypothese 4). Theoretisch weniger relevante Haupteffekte geben einen Hinweis darauf, dass Befragte mit Vorwissen zuweilen weniger Schuldfähigkeit (für Intelligenzminderung) und weniger Gefährlichkeit (für seelische Störung) attestieren, dies jedoch unabhängig von der Terminologie der Eingangsmerkmale (Hypothesen 1–3).

Fraglich ist, weshalb die Begriffe so deutlich als stigmatisierend empfunden werden und dennoch keine Auswirkung auf die Personenwahrnehmung zu haben scheinen. Es kann ausgeschlossen werden, dass die in den Vignetten enthaltenen Informationen u. a. über Tat und Biografie der Täter das durch die Gutachter bestätigte Eingangsmerkmal überlagern. Da die Vignetten jeweils zufällig mit den Begriffen gepaart waren, sollten sich Effekte der genauen Beschreibung herausmitteln. Es ist jedoch möglich, dass die Begrifflichkeit in den Fallvignetten nicht ausreichend hervorstach, um die Personenwahrnehmung zu beeinflussen. Dies könnte einerseits als Schwäche des Designs interpretiert werden, da nicht ganz sichergestellt werden kann, ob Probanden die genauen Begriffe überhaupt ausreichend wahrgenommen haben. Andererseits ließe sich dies auch auf die Realität übertragen. Auch vor Gericht ist es durchaus möglich, dass das nur kurz erwähnte Eingangsmerkmal nur wenig Einfluss auf die Einschätzung der Beurteilten haben. Da dort ebenfalls eine Fülle von Informationen zu den Beurteilten vorliegt und die Entscheidungen vor Gericht nur zu einem Bruchteil auf den Eingangsmerkmalen basieren, ist es durchaus plausibel, dass sich die Begrifflichkeiten nur wenig auswirken. Eine weitere Erklärung für die mangelnde Auswirkung der Begriffe könnte die Tatsache sein, dass sich Probanden darüber im Klaren sein könnten, dass juristische Formulierungen häufig nicht umgangssprachlichen Formulierungen entsprechen. So ist es möglich, dass Probanden die Formulierungen zwar (negativ) auffallen, sie es aber im Rahmen der Personenbeurteilung ausblenden.

Interessanterweise gab es deutlich weniger Unterschiede durch juristisches bzw. rechtspsychologisches Vorwissen, als zunächst erwartet wurde. Es wurde von 77 der Probanden berichtet, solch thematisches Vorwissen zu haben. Die Forschung weist darauf hin, dass Experten unterschiedlich urteilen. Experten (i.d.F. Personen mit Vorwissen) und Laien unterscheiden sich dabei bezüglich ihres Wissens u. a. in ihren mentalen Repräsentationen von bestimmten Konzepten. Abhängig davon, welche Informationen zu einem Wissensgebiet oder einem Konzept verfügbar sind, werden spezifische oder weniger spezifische Vorstellungen abgerufen (Köhler 2009). Dieses domänenspezifische Wissen zu einem Wissensgebiet ist dabei bei Experten strukturierter als das Wissen von Laien. Fachbegriffe dienen bei Experten als Grundlage für kategoriale Wahrnehmung und haben demnach nicht nur eine rein kommunikative Funktion (Bromme und Rambow 2001). Trotz dieser Forschungslage unterstützen die Ergebnisse dieser Studie diese Unterschiede zwischen Laien und Experten nicht. Dies kann u. a. dadurch begründet sein, dass sich Vorwissen fast ausschließlich auf psychologisches Vorwissen beschränkte und somit wenig juristisches Vorwissen vorhanden war. Zusätzlich waren die Gruppen in ihrer Größe nicht ausgeglichen.

Limitationen und Ausblick

Trotz des vielseitigen Studiendesigns gibt es verschiedene Limitationen, die beachtet werden müssen. Obwohl die Fallvignetten an Gutachten orientiert waren und somit so realitätsgetreu wie möglich gestaltet wurden, kann die Studie einer Situation vor Gericht nicht vollständig gerecht werden. So war die Studiensituation einer Kurzbeschreibung der Personen und ihrer Fälle nicht mit der Fülle an Informationen in Begutachtungen im Rahmen gerichtlicher Prozesse zu vergleichen. Ebenfalls waren der Anteil der Rechtswissenschaftler in der vorliegenden Stichprobe sehr gering, sodass hier kein Vergleich zu Psychologen und Laien gezogen werden konnte. Es handelt sich bei unserer Studie zusätzlich um eine hauptsächlich studentische Stichprobe. Zukünftige Studien sollten die Studiensituation stärker in einen gerichtlichen Rahmen bringen. Zuletzt sollte angemerkt werden, dass es durch den entstandenen Fehler bei der Randomisierung nicht für beide Eingangsmerkmale möglich war, einen Zwischensubjektvergleich zu berechnen.

Die vorliegende Studie zeigt deutlich, dass die Terminologie des §20 StGB als stigmatisierend wahrgenommen wird. Dennoch wirkt sich diese Stigmatisierung im Sinne des Labeling-Effektes nicht auf die Personenwahrnehmung aus und scheint so faire Verfahren nicht zu gefährden. Dennoch wird deutlich, dass eine Modernisierung der Terminologie angebracht und sinnvoll ist. Sollte der Gesetzesentwurf des BMJV angenommen werden, wäre nach der Einführung der modernisierten Begriffe eine empirische Überprüfung des tatsächlichen Einflusses vor Gericht denkbar.