Einleitung

Kriminalprognostische Einschätzungen sind Grundlage vieler strafrechtlicher und strafvollzuglicher Entscheidungen, für die mittlerweile eine Reihe von standardisierten und validierten Prognoseinstrumenten zur Verfügung steht (Rettenberger und von Franqué 2013; Rettenberger 2018). Insbesondere Prognoseinstrumente, mit denen die Rückfallgefahr nach Haftentlassung reliabel und valide eingeschätzt werden kann, sind in ausreichender Anzahl vorhanden. Doch auch während der Haft müssen im Rahmen der Vollzugsplanung und Entlassvorbereitung immer wieder Risikoeinschätzungen vorgenommen werden. Dabei kann die Prognose von intramuralem Fehlverhalten und Lockerungsmissbräuchen einen wichtigen Bestandteil der Vollzugsplanung sowie der intramuralen Betreuung und Behandlung darstellen, um beispielsweise Hochrisikopersonen möglichst früh zu identifizieren und das vorhandene Risikopotenzial durch die Integration statischer und dynamischer Risikofaktoren verlaufsdiagnostisch abzubilden. Prognostische Überlegungen sind zudem Bestandteil der Überlegungen zur Gewährung freiheitsbezogener Maßnahmen, die insbesondere auch möglichen negativen Effekten der Inhaftierung entgegenwirken sollen (Laubenthal 2015). Daher ist es notwendig, Gefahren des Lockerungsmissbrauchs frühzeitig zu erkennen, weswegen evidenzbasierte Prognosen auch im intramuralen Kontext von hoher Relevanz sein können.

Dabei ist zunächst darauf zu verweisen, dass der Anteil genehmigter Lockerungsmaßnahmen bei gleichzeitig stabil niedrigen Regelverstößen in den letzten Jahren weiterhin eine deutlich abnehmende Tendenz zeigte (Dünkel und Geng 2003; Etzler et al. 2020; Lösel 2014; Lamott 2016; Ministeriums der Justiz Rheinland-Pfalz 2017). Beispielsweise berichtete das Ministerium der Justiz Rheinland-Pfalz (2017) in einem entsprechenden Bericht, dass die Anzahl an genehmigten Freigängen zwischen 2012 und 2016 um 72,0 % sank, während die Quote an Nichtrückkehrern im selben Zeitraum lediglich von 0,4 % auf 0,3 % sank. Im gleichen Zeitraum ging die Anzahl an genehmigten Langzeitausgängen um 31 % zurück, wobei die Missbrauchsquote nahezu unverändert bei 0,05 % blieb. Hinsichtlich der Ausgänge erhöhte sich die Rate an Nichtrückkehrern marginal von 0,02 % auf 0,03 % bei einem Rückgang der Genehmigungen um 6,0 %. Diese Zahlen verdeutlichen, dass die Rate an Lockerungsverstößen nicht bzw. kaum durch die restriktivere Genehmigungspraxis beeinflusst wurde. Gleichzeitig verdeutlichen diese Zahlen, warum Lockerungsprognosen aus statistischer Sicht (noch) schwieriger zu stellen sind als Rückfallprognosen nach vorheriger Entlassung: Zwar kann auch bei letztgenanntem Bereich teilweise (z. B. im Bereich der Rückfallraten von Sexualstraftätern) von sehr niedrigen Basisraten ausgegangen werden, die berichteten Basisraten im Bereich der Lockerungsprognosen sind aber nochmals deutlich niedriger, sodass extrem hohe Fallzahlen benötigt werden würden, um aktuarische Entwicklungsprozesse zu ermöglichen (d. h. Instrumente zu entwickeln, die spezifisch für diesen Bereich der Verhaltensvorhersage konzipiert wurden). Dies verweist direkt auf eine weitere methodische Schwierigkeit im Bereich der Lockerungsprognose, der in der internationalen Literatur mit dem Begriff der Outcome Specificity beschrieben wird (Rettenberger et al. 2017): Aus naheliegenden Gründen weisen Prognoseinstrumente für die Verhaltensbereiche die größte Vorhersageleistung auf, für die sie empirisch entwickelt wurden; für Lockerungsprognosen können in den meisten Fällen nur Instrumente herangezogen werden, die für die „klassische“ Kriminalrückfallprognose entwickelt wurden. Mittlerweile liegen allerdings auch spezifische Instrumente für die Prognose von Lockerungsmissbräuchen vor, wie z. B. das Short-Term Assessment of Risk and Treatability (START; O’Shea und Dickens 2014), das Leave Risk Assessment (LRA; Hilterman et al. 2011) oder die Waypoint Elopement Risk Scale (WERS; z. B. Penney et al. 2022). Der (inter-)nationale Stand der Forschung zu den psychometrischen Eigenschaften dieser Verfahren ist allerdings noch vergleichsweise überschaubar, zudem liegen teilweise noch keine offiziellen deutschsprachigen Übersetzungen vor, wodurch ihre Anwendbarkeit hierzulande gegenwärtig noch eingeschränkt ist.

Trotz der genannten Relevanz liegen– im Vergleich zur Prognose von Rückfällen nach der Entlassung – nach wie vor nur wenige empirische Studien über die Eignung standardisierter Methodenzugänge bei der Prognose von intramuralen Verstößen und Lockerungsmissbräuchen vor, wobei insbesondere in den letzten Jahren eine zunehmende Tendenz hinsichtlich der Veröffentlichung empirischer Studien dazu konstatiert werden kann. So konnten Kroner und Mills (2001) hinsichtlich der Vorhersage intramuraler Verstöße zeigen, dass standardisierte Prognoseinstrumente durchaus in der Lage waren, intramurale Verstöße unterschiedlicher Schweregrade signifikant vorherzusagen, wobei die berichteten Effektstärken mehrheitlich in einem moderaten Bereich anzusiedeln waren. In einer US-amerikanischen Untersuchung von Powers et al. (2018) wurde unter Verwendung einer umfangreichen Stichprobe von über 30.000 Personen die Vorhersagemöglichkeit von Flucht(-versuchen) geprüft, wobei sich zeigte, dass empirisch fundierte kriminologische Konstrukte durchaus in der Lage waren, die Prognoseleistung zu erhöhen. Im forensisch-psychiatrischen Kontext publizierten Watson und Choo (2020) ein systematisches Literaturreview zur Frage von Flucht bzw. unautorisierten Nichtrückkehr in die Klinik und berichteten, dass diese neben der erwartbaren niedrigen Frequenz derartiger Zwischenfälle häufig spontan und ungeplant durch situative Aspekte wie Langeweile oder Frustration ausgelöst werden würden. Gleichzeitig plädierten sie für weitere empirische Bemühungen, die Vorhersageleistung standardisierter Prognoseinstrumente für diese und ähnlich gelagerte Fragen zu untersuchen. Bestätigung fand diese Überlegung durch eine kanadische Studie von Wilkie et al. (2014), in der gezeigt werden konnte, dass nichtzurückkehrende Patienten höhere Werte in einem standardisierten Prognoseinstrument aufwiesen als Patienten, die ihre Lockerungen vorschriftsmäßig durchliefen. Schließlich berichteten Chan und Chow (2014) in einer Studie aus Hong Kong, in der aggressive Verhaltensweisen im Zuge der Unterbringung untersucht wurden, dass standardisierte Diagnostik- und Prognosezugänge durchaus in der Lage waren, einen relevanten Beitrag zur Vorhersage zu leisten. Auch in der Metaanalyse von Iozzino et al. (2015) zeigte sich, dass unterschiedliche statische (z. B. männliches Geschlecht) und dynamische (z. B. problematischer Alkoholkonsum) Risikofaktoren prädiktiv hinsichtlich aggressiven Verhaltens in forensisch-psychiatrischen Einrichtungen waren. In einer Untersuchung aus der Schweiz konnte gezeigt werden, dass sowohl statische als auch dynamische Risikofaktoren zur Vorhersage von Gewalttaten innerhalb des Gefängnisses beitrugen (Abbiati et al. 2019).

Innerhalb Deutschlands finden sich nur wenige Studien, die sich mit Verstößen und Fehlverhalten innerhalb des Gefängnisses beschäftigten. Hausam et al. (2020) verdeutlichten in ihrer Studie die Bedeutung intramuraler Beobachtungen – nicht nur durch akademisch ausgebildete interne oder externe Fachkräfte – für die Vorhersage von Verstößen, Fehlverhalten und Rückfällen, die wiederum einen wesentlichen Beitrag für eine erfolgreiche Resozialisierung leisten können. Stück et al. (2022) untersuchten die Vorhersage von Lockerungsrücknahmen unter Verwendung standardisierter Prognoseinstrumente in der Sozialtherapeutischen Anstalt Hamburg, wobei auch hier die verwendeten Instrumente ihr prädiktives Potenzial andeuten konnten. Die Autor/‑innen konstatierten zum einen das Potenzial protektiver Faktoren und verdeutlichten zum anderen das Potenzial von Interaktionseffekten zwischen unterschiedlichen Prädiktorkategorien (z. B. von Risiko- und Schutzfaktoren).

Die vorliegende Untersuchung baut auf eine empirische Studie auf, in der Biedermann und Rettenberger (2020) u. a. die prädiktive Validität der 3. Version der Offender Group Reconviction Scale (OGRS 3; Breiling et al. 2022; Howard et al. 2009) und des Screeninginstrument zur Vorhersage des Gewaltrisikos (SVG‑5; Eher et al. 2012; Rettenberger et al. 2010) im Bereich der Sozialtherapie überprüften. Im Ergebnis zeigten sich beide aktuarischen Instrumente als valide für die Vorhersage von intramuralem Fehlverhalten, wobei die OGRS 3 (AUC = 0,77) die besten Werte erzielte. Für die Prognose von Lockerungsmissbräuchen waren die Ergebnisse von OGRS 3 und SVG‑5 ebenfalls vielversprechend, wobei auch hier die OGRS 3 (AUC = 0,77) am besten abschnitt. Damit konnten Studienergebnisse aus dem angloamerikanischen Sprachraum bestätigt werden, die ebenfalls eine grundsätzliche Eignung standardisierter Prognoseinstrumente für diesen Anwendungsbereich nahelegten (z. B. Campbell et al. 2009; Kroner und Mills 2001). In der vorliegenden Studie sollte nun überprüft werden, inwiefern sich diese Ergebnisse hinsichtlich des Regelvollzugs replizieren lassen würden. Dabei wurden neben den etablierten Instrumenten OGRS 3 und SVG‑5 weitere potenzielle Prädiktorvariablen in die Analysen aufgenommen, die aus ökonomischen Gründen nach Aktenlage zu erheben waren (eine Exploration war aus studientechnischen Gründen nicht möglich) und bei denen entweder aus empirischen und/oder aus theoretischen Gründen angenommen werden konnte, dass sie hinsichtlich der Outcome-Variablen prädiktiv sein könnten.

Methode

Die Daten wurden anhand einer retrospektiven Aktenanalyse von Gefangenenpersonalakten der JVA Frankenthal (Rheinland-Pfalz) erhoben. Bei der JVA Frankenthal handelt es sich um eine Einrichtung des Regelvollzugs, in der männliche, erwachsene Personen im geschlossenen oder im offenen Vollzug sowie in Untersuchungshaft untergebracht sind. Sie zählt mit etwa 440 Haftplätzen zu den größeren Justizeinrichtungen in Rheinland-Pfalz. Neben den genannten Prognoseinstrumenten SVG‑5 und OGRS 3 wurden 7 zusätzliche potenzielle Prädiktorvariablen sowie verschiedene demografische Variablen zur Beschreibung der Stichprobe erhoben. Die statistische Auswertung wurde mittels SPSS Version 23 (IBM Corp. Released 2015. IBM SPSS Statistics for Windows, Version 23.0. Armonk, NY, USA: IBM Corp.) und Excel 365 (Microsoft Corporation, 2018, Redmond, WA, USA. Microsoft Excel 365, verfügbar unter: https://office.microsoft.com/excel) durchgeführt.

Die zentrale Effektstärke, die in der vorliegenden Untersuchung verwendet wurde, ist die aus den Receiver-Operating-Characteristic(ROC)-Analysen ableitbare Area Under the Curve (AUC; Metz 1978). Da es im Bereich der forensischen Prognoseforschung besonders relevant ist, wird darauf hingewiesen, dass AUC-Werte den Vorteil aufweisen, dass sie relativ wenig anfällig gegenüber vergleichsweise niedrigen Basisraten sind (Mossman 1994). Der aus den ROC-Analysen resultierende AUC-Kennwert stellt die Wahrscheinlichkeit dar, dass eine zufällig ausgewählte rückfällige Person einen höheren Wert (z. B. bei dem infrage stehenden Prognoseinstrument) aufweist als eine zufällig ausgewählte nichtrückfällige Person. AUC-Werte sind eine Maßzahl für die Stärke des Zusammenhangs zwischen Prädiktor (z. B. der Gesamtwerte eines Prognoseinstruments) und dem jeweiligen Outcome (z. B. der Rückfälle innerhalb einer Stichprobe) und gelten als das wichtigste Effektstärkemaß im Bereich der forensischen und allgemein-klinischen Diagnose- und Prognoseforschung. Zur Interpretation einzelner AUC-Werte übertrugen Rice und Harris (2005) die mittlerweile international etablierte Richtlinien von Cohens d bzw. r wie folgt: AUC-Werte von 0,72 und größer gelten als „gut“, AUC-Werte zwischen 0,64 und 0,71 als „moderat“ und darunter liegende signifikante AUC-Werte als „schwach“. Lockerungsmissbräuche, intramurales Fehlverhalten und die weiteren potenziellen Prädiktoren wurden dichotomisiert, wobei Lockerungsmissbräuche und intramurales Fehlverhalten in allgemeine und schwerwiegende Verstöße bzw. Missbräuche unterteilt wurden.

Allgemeine Lockerungsmissbräuche

Darunter wurden alle Regelverstöße subsumiert, die während der Vollzugslockerung von Angehörigen der Vollzugsdienste im internen Verwaltungsprogramm verzeichnet wurden. Diese umfassten sowohl schwere Verstöße wie beispielsweise die Nichtrückkehr von Ausgängen oder das Begehen einer Straftat als auch kleinere Vergehen, wie z. B. die verspätete Rückkehr, ein Meldeversäumnis, Verstöße gegen den Gesundheitsschutz oder die Verschleierung von Telefonaten durch Nutzung von Fremdsprachen.

Schwerwiegende Lockerungsmissbräuche

Als schwerwiegend wurden demgegenüber nur gravierende Regelverstöße subsumiert, die die Rückführung in den geschlossenen Vollzug oder die Aussetzung der vollzugslockernden Maßnahmen zur Folge hatten. Dazu zählten die Nichtrückkehr, das Verüben einer Straftat, die Haftentweichung bzw. Flucht, der Substanzmissbrauch (z. B. Rauschmittelkonsum) oder der Besitz verbotener Gegenstände (z. B. Handys, Waffen etc.).

Allgemeines intramurales Fehlverhalten

Damit wurde jegliches Fehlverhalten definiert, das vom Vollzugspersonal registriert und aufgezeichnet wurde. Dazu gehörten insbesondere der Besitz unerlaubter Gegenstände, Rauschmittelkonsum, Sachbeschädigung, Bedrohung/Erpressung, Widerstand gegen Haftmaßnahmen, Schmuggel bzw. Verkauf illegaler Gegenstände, erneute Verurteilung während der Haft, körperliche Auseinandersetzungen mit dem Wachpersonal, körperliche Auseinandersetzungen mit Mithäftlingen.

Schwerwiegendes intramurales Fehlverhalten

Darunter wurden Verhaltensweisen subsumiert, die von der Anstaltsleitung mit Disziplinarmaßnahmen sanktioniert wurden.

Die Daten, die von zentraler Bedeutung für die Auswertung der kriminalprognostischen Instrumente waren, wie z. B. die Art des Anlassdelikts, Art und Anzahl der Vorstrafen und früheren Verurteilungen oder psychische Auffälligkeiten, wurden psychiatrischen bzw. psychologischen Berichten, Vollzugsplänen und deren Fortschreibungen oder dem jeweiligen Bundeszentralregisterauszug entnommen. Ergänzend wurden Informationen zu Vollzugslockerungen, Lockerungsmissbräuchen, Anzahl und Art der intramuralen Verstöße sowie Disziplinarmaßnahmen aus dem anstaltsinternen Verwaltungsprogramm der JVA erhoben.

Stichprobe

Die Gesamtstichprobe bestand aus N = 200 männlichen Insassen der JVA Frankenthal, die zum Untersuchungszeitpunkt im Sommer 2019 durchschnittlich M = 37,98 Jahre (SD = ± 10,94; Min= 20; Max= 73) alt waren. Von den Untersuchten besaßen 131 (65,5 %) Probanden die deutsche Staatsbürgerschaft, 69 (34,5 %) hatten eine andere Staatsangehörigkeit. Der Anteil an Gefangenen mit Migrationshintergrund – unabhängig von ihrer Staatsbürgerschaft – lag bei zusätzlicher Berücksichtigung der Staatsbürgerschaft der Eltern und Großeltern bei 50,5 %. Insgesamt waren 66,5 % der Probanden aufgrund von Gewaltdelikten inhaftiert (davon 7,52 % aufgrund von Sexualdelikten), 13 % wegen Betrugsdelikten und 10,5 % aufgrund von nichtgewalttätigen Eigentumsdelikten. Die durchschnittliche Haftdauer betrug M = 34,65 Monate (SD= ± 35,18; Min= 6; Max= 300).

Die Auswahl der Gesamtstichprobe (N = 200) erfolgte zweistufig: Zum einen wurden n = 100 Gefangenenpersonalakten von Straftätern mit genehmigten Vollzugslockerungen (regelmäßige Außenbeschäftigung und Freigänge, Unterbringung im offenen Vollzug) ausgewählt, zum anderen n = 100 Gefangenenpersonalakten von Insassen ohne Gewährung von Lockerungen. Im Vorfeld der Rekrutierung wurden zudem einige Ausschlusskriterien definiert, um mögliche Verzerrungen zu verhindern. Nicht berücksichtigt wurden z. B. Gefangene, deren gesamte Haftdauer weniger als 6 Monate betrug oder deren aktuelle Haftdauer zum Zeitpunkt der Datenerhebung unter 3 Monaten lag. So sollte sichergestellt werden, dass die Insassen überhaupt die Möglichkeit hatten, intramurale Verstöße bzw. Lockerungsmissbräuche zu begehen. Weiterhin wurden keine Straftäter in die Untersuchung eingeschlossen, die eine Ersatzfreiheitsstrafe aufgrund einer nichtgezahlten Geldstrafe verbüßten, da dieses Anlassdelikt keiner der in den kriminalprognostischen Instrumenten definierten Straftaten entspricht. Um die Anwendung des SVG‑5 zu ermöglichen, wurden Insassen mit Gewaltdelikten bevorzugt ausgewählt und die übrigen Probanden ohne Gewaltdelikt zufällig aus der Substichprobe gezogen.

Zur Überprüfung der prädiktiven Validität des OGRS 3 hinsichtlich intramuraler Verstöße stand demnach eine Stichprobe von n = 200 Probandenakten und hinsichtlich der Lockerungsmissbräuche eine Stichprobe von n = 100 Fällen zur Verfügung. Die Vorhersagegüte des SVG‑5 in Bezug auf intramurale Verstöße wurde hingegen anhand einer Stichprobe von n = 134 Probanden, die aufgrund eines Gewaltdelikts inhaftiert waren, untersucht, während hinsichtlich der Lockerungsmissbräuche eine Stichprobe von n = 46 Probanden mit Gewaltdelikt zur Verfügung stand.

Prognoseinstrumente und zusätzliche potenzielle Prädiktoren

OGRS 3

Die in Großbritannien entwickelte 3. Version der OGRS wird dort standardmäßig eingesetzt und zählt somit zu den etabliertesten statistisch-aktuarischen Prognoseverfahren der 2. Generation (Howard et al. 2009; Wakeling et al. 2011; Fitzgerald et al. 2011). In ihrer aktuellen Version wurde die OGRS 3 an Stichproben bis zu 80.000 straffällig gewordenen Personen validiert (Howard et al. 2009) und konnte dabei prädiktive Validitätsindizes zwischen AUC = 0,70 bis hin zu AUC = 0,90 für die Vorhersage der allgemeinen Rückfälligkeit erzielen. Bezüglich gewalttätiger Rückfälligkeit wurden Werte zwischen AUC = 0,85 und AUC = 0,86 erreicht (Howard et al. 2009; Wakeling et al. 2011; Fitzgerald et al. 2011). Das Prognoseinstrument besteht insgesamt aus 6 statischen Items (Geschlecht, Alter bei der letzten Verurteilung, Alter zum Beginn des Prognosezeitraums, Anzahl an Vorstrafen, Alter bei der ersten Verurteilung und Art des Anlassdelikts), die den Gefangenenpersonalakten entnommen werden können. Mittlerweile liegt eine offizielle deutsche Version des Instruments vor (Breiling et al. 2022; Manual und Berechnungstool sind unter https://www.krimz.de/publikationen/bm-online/bm-online-30.html frei verfügbar), die ebenfalls in unterschiedlichen Anwendungskontexten erfolgreich validiert werden konnte (Biedermann und Rettenberger 2020; Breiling et al. 2021; Dahle 2005). Bei der praktischen Anwendung werden über ein regressionsanalytisches Modell Rückfallwahrscheinlichkeiten für einen Ein- oder Zweijahreszeitraum berechnet (Breiling et al. 2022; Francis et al. 2007; Howard et al. 2009), wobei für die hier aufgeführten Berechnungen nur die Erhebungen aus dem ersten Jahr verwendet wurden. Das Instrument gibt die Rückfallwahrscheinlichkeit in einem Wertebereich von 0 bis 100 an und kann unabhängig vom Indexdelikt sowohl bei Frauen als auch bei Männern eingesetzt werden.

SVG-5

Ein statistisch-aktuarisches Instrument der 2. Generation, das im deutschsprachigen Raum entwickelt wurde, ist der SVG‑5 (Eher et al. 2012; Rettenberger et al. 2010). Mithilfe des SVG‑5 lässt sich die Rückfallwahrscheinlichkeit neuerlicher Gewaltdelikte für einen Zeitraum von 5 Jahren ermitteln, wobei neben diesen absoluten Risikomaßen auch relative Risikomaße in Form von Prozenträngen und Relative Risk Ratios zur Verfügung stehen. Die bisherigen Validierungsstudien aus dem österreichischen Strafvollzug ergaben überwiegen hohe Effektstärken für die Vorhersage neuerlicher Gewaltdelikte (zwischen AUC = 0,79 und AUC = 0,82; Eher et al. 2012), während die Anwendung in Deutschland überwiegend niedrige bis moderate Vorhersageleistungen nahelegte (z. B. Breiling et al. 2021). Die 5 statischen Items (Anzahl früherer Gewaltdelikte, Deliktfrequenz, Verurteilung aufgrund eines vorsätzlichen Tötungsdelikts, psychische Auffälligkeiten und Alter zum Zeitpunkt des ersten Gewaltdelikts) werden unter Verwendung unterschiedlicher Itemgewichtungen bewertet (Eher et al. 2012). Durch Aufsummieren der einzelnen Punktwerte wird ein Summenscore ermittelt, der Werte zwischen −22 und +16 annehmen kann und der eine Zuordnung des Probanden zu einer von 5 Risikokategorien ermöglicht: niedrig (Gesamtscore < −14), niedrig-moderat (Gesamtscore −14 bis −7), moderat-hoch (Gesamtscore −6 bis +1), hoch (Gesamtscore +2 bis +9) und sehr hoch (Gesamtscore > +9).

Zusätzliche potenzielle Prädiktoren

Die 7 zusätzlich erfassten potenziellen Prädiktoren, Suchtproblematik, stabile Lebenssituation, Verstöße gegen Bewährungsauflagen, Beziehungsstatus, soziale Unterstützung, stabile Arbeitsverhältnisse und Haftdauer, wurden ebenfalls retrospektiv anhand der Gefangenenpersonalakten erhoben. Alle potenziellen Prädiktoren wurden als dichotome Variablen mit den Ausprägungen trifft zu (1) und trifft nicht zu (0) erfasst. Eine Ausnahme stellt die Haftdauer von Inhaftierungsbeginn bis zum Zeitpunkt der Datenerhebung dar, die in Monaten angegeben wurde, wobei bei einer kürzeren Haftdauer von einem geringeren Risiko ausgegangen wird. Den Hintergrund dieser Annahme bilden unterschiedliche Überlegungen: Grundsätzlich gilt, dass bei einer längeren Haftdauer auch mehr Zeit für die Begehung von Verstößen besteht. Dabei können sich Labeling- und Prisonisierungseffekte sowie der negative Einfluss von Gefängnissubkulturen zusätzlich ungünstig auf das Verhalten auswirken (z. B. Laub et al. 1995). Ferner ist es denkbar, dass besonders lange Haftstrafen zu einem Gefühl der Perspektivlosigkeit führen können und so eine gewisse Akzeptanz gegenüber regelverletzendem Verhalten evozieren könnten. Bei den folgenden Variablen wurde, soweit dies möglich war, auf bestehende und bewährte Operationalisierungen standardisierter Prognoseinstrumente zurückgegriffen. Insbesondere das Historical-Clinical-Risk Management-20 (HCR-20, das aktuell in der Regel in der 3. Version verwendet wird [HCR-20V3]; Douglas et al. 2014), das international am häufigsten eingesetzte Prognoseinstrument (Singh et al. 2014), diente als Ausgangspunkt, wobei Anpassungen zwangsläufig dort vorgenommen werden mussten, wo die Aktenlage lediglich beschränkte Informationen zur Verfügung stellte. Der Prädiktor stabile Arbeitsverhältnisse wurde in Anlehnung an den HCR-20V3 als vorliegend definiert, wenn der Proband in der Zeit vor Haftantritt keine längeren oder häufigen Phasen der Arbeitslosigkeit aufwies. Angaben hierzu konnten meist aus den Urteilen oder der Eingangsdiagnostik entnommen werden. Das Vorhandensein einer stabilen Lebenssituation wurde verneint, wenn – auch hier unter Rückgriff auf den HCR-20V3 – mindestens 2 der folgenden Aspekte erfüllt waren: unsichere oder chaotische Wohnsituation, unzureichende finanzielle Mittel oder Arbeitslosigkeit, ungünstiges soziales Entlassungsumfeld (z. B. kriminelle Freunde oder Verwandte, Zugang zu Drogen und Waffen, Bandenstrukturen) sowie keine sozialpsychiatrischen Kontroll- und Unterstützungsstrukturen. Das mögliche Vorliegen einer Suchtproblematik wurde über die Ergebnisse des internen Drogenscreenings sowie über Berichte des Anstaltsarztes ermittelt, wobei entscheidend war, inwiefern aus diesen Erhebungen vonseiten der Institution offiziell ein behandlungswürdiges Vollzugsziel abgeleitet wurde (z. B. indem eine entsprechende Diagnose gestellt wurde und/oder dem Probanden eine Suchtbehandlung nahegelegt wurde). Ob der Proband soziale Unterstützung erhielt, wurde sowohl anhand von bestehenden sozialen Kontakten während der Inhaftierungszeit (z. B. Telefon- und Besuchskontakte) als auch durch die Bereitschaft des sozialen Netzes zu (finanzieller oder anderweitiger) Unterstützung, wie z. B. dem Angebot einer Wohnmöglichkeit im Anschluss an die Entlassung erhoben. Als nichtunterstützend wurden Bezugspersonen betrachtet, die unabhängig von den zuvor genannten Kriterien gegenwärtig oder in der Vergangenheit selbst strafrechtlich in Erscheinung getreten sind (Douglas et al. 2014). Die Variable Partnerschaft wurde bejaht, wenn der Proband eine Partnerschaft oder Ehe zum Zeitpunkt der Datenerhebung führte, wobei inhaltlich ähnliche Operationalisierungen aktuarischer Prognoseinstrumente den empirischen Hintergrund dieser Annahme, der in einer Vielzahl an Studien bestätigt werden konnte (z. B. Hanson und Thornton 2000; Rice et al. 2013), bildeten.

Ergebnisse

Zunächst erfolgt ein Überblick über die deskriptiven Statistiken, anschließend werden Korrelationen und ROC-Analysen des SVG‑5, der OGRS 3 und der weiteren Prädiktorkombination hinsichtlich der Vorhersage von allgemeinen und schwerwiegenden Lockerungsmissbräuchen bzw. intramuralen Verstößen betrachtet. Unter den 100 Probanden mit genehmigten Lockerungen begingen insgesamt 43 % mindestens einen Regelverstoß, wobei 24 % der Gelockerten mindestens einen schwerwiegenden Lockerungsmissbrauch begingen. Bezüglich intramuraler Verstöße wiesen 121 (60,5 %) der 200 untersuchten Insassen mindestens einen registrierten Verstoß gegen die Haftordnung auf, 71 (35,5 %) begingen einen schwerwiegenden intramuralen Verstoß, der mit einer Disziplinarmaßnahme geahndet wurde.

Zwischen der OGRS 3 (M = 0,35; SD = ± 0,19; Md = 0,38) und dem SVG‑5 (M = 3,63; SD = ± 1,12; Md = 4,00) zeigte sich erwartungsgemäß eine hohe Produkt-Moment-Korrelation der Gesamtwerte beider Instrumente (r = 0,596, p < 0,01). Aus Tab. 1 wird ersichtlich, dass weder die OGRS 3 noch der SVG‑5 allgemeine und schwerwiegende Lockerungsmissbräuche in der vorliegenden Stichprobe signifikant prognostizieren konnten.

Tab. 1 Prädiktive Validität der OGRS 3 und des SVG‑5 für die Vorhersage allgemeiner und schwerwiegender Lockerungsmissbräuche

Wie Tab. 2 zeigt, war das Ergebnismuster hinsichtlich der Vorhersage allgemeiner und schwerwiegender intramuraler Verstöße ähnlich. Auch hier konnte weder die OGRS 3 noch der SVG‑5 signifikante Vorhersagen leisten, abgesehen von dem im niedrigen Effektstärkebereich zu verortenden AUC-Wert des SVG‑5 für die Vorhersage allgemeiner intramuraler Verstöße.

Tab. 2 Prädiktive Validität der OGRS 3 und des SVG‑5 für die Vorhersage allgemeiner und schwerwiegender intramuraler Verstöße

Korrelationen und prädiktive Validität der einzelnen Items

In Tab. 3 sind die bivariaten Zusammenhänge der einzelnen Items der OGRS 3, des SVG‑5 und der zusätzlichen Prädiktorvariablen mit den beobachteten schwerwiegenden Lockerungsmissbräuchen und intramuralen Verstößen dargestellt. Für diesen letzten explorativen Analyseteil wurden ausschließlich die schwerwiegenden Lockerungsmissbräuche und Regelverstöße betrachtet, da diese Verhaltensbereiche die größte Bedeutung für sicherheitsrelevante Entscheidungen im Vollzugsalltag aufwiesen. Dabei zeigten sich ein signifikanter, moderater Zusammenhang zwischen Item 3 der OGRS 3 (aktuelles Alter) sowie ein starker Zusammenhang zwischen Item 5 (Alter zum Zeitpunkt des ersten Gewaltdeliktes) des SVG‑5 mit schwerwiegenden Lockerungsmissbräuchen. Mit den schwerwiegenden intramuralen Verstößen korrelierten die Items 2 (aktuelles Alter), 3 (Anzahl an Vorstrafen) und 5 (aktuelles Hauptdelikt) der OGRS 3 in niedriger bis moderater Effektstärke. Item 5 (Alter zum Zeitpunkt des ersten Gewaltdeliktes) des SVG‑5 erzielte einen moderaten Zusammenhang, während bei den zusätzlichen potenziellen Prädiktoren die stabilen Arbeitsverhältnisse, Suchtproblematik, stabile Lebenssituation, soziale Unterstützung und eine kurze Haftdauer jeweils einen niedrig bis moderat ausgeprägten signifikanten Zusammenhang aufwiesen.

Tab. 3 Korrelationen der OGRS 3, des SVG‑5 und der zusätzlichen potenziellen Prädiktoren mit schwerwiegenden Lockerungsmissbräuchen und intramuralen Verstößen

Diskussion

Die Überprüfung der Vorhersageleistung der OGRS 3 und des SVG‑5 in Bezug auf Lockerungsmissbräuche und intramurale Verstößen führte zu vergleichsweise geringen und nichtsignifikanten AUC-Werten. Lediglich der SVG‑5 zeigte sich als signifikanter Prädiktor für die Vorhersage allgemeiner intramuraler Verstöße, wobei die Effektstärke als gering einzustufen war. Entgegen den Erwartungen basierend auf deutschsprachigen und internationalen früheren Studien (z. B. Biedermann und Rettenberger 2020; Campbell et al. 2009; Kroner und Mills 2001) erwiesen sich in der vorliegenden Studie somit weder die OGRS 3 noch der SVG‑5 als prädiktiv in Bezug auf die Vorhersage von Lockerungsmissbräuchen und intramuralen Verstößen. Die meist vergleichsweise hohen prädiktiven Validitätswerte der OGRS 3, wie sie in zahlreichen Studien aus dem englischsprachigen Raum für die Vorhersage neuerlicher Delinquenz nach Haftentlassung berichtet wurden (Howard et al. 2009; Wakeling et al. 2011; Fitzgerald et al. 2011), konnten somit für den intramuralen Bereich des Regelvollzugs nicht repliziert werden. Dass die OGRS 3 auch im deutschsprachigen Raum erfolgreich eingesetzt werden kann, wurde hingegen in unterschiedlichen Studien bereits nachgewiesen (Breiling et al. 2021; Dahle 2005), weshalb grundsätzliche Zweifel an der Übertragbarkeit auf nichtbritische Jurisdiktionen und andere Sprachräume daraus nicht abgeleitet werden können. Auch konnte eine vorherige Studie mit Probanden aus der Sozialtherapie, die ebenfalls in Rheinland-Pfalz durchgeführt wurde, eine ansprechende Vorhersagegüte auch und insbesondere für intramurales Fehlverhalten bestätigen (Biedermann und Rettenberger 2020), wodurch die Frage in den Mittelpunkt rückt, welche Besonderheiten die vorliegende Stichprobe und Studiendesign aufwiesen, die die Diskrepanzen zu früheren Untersuchungen begründen könnten.

Eine Möglichkeit könnte darin bestehen, dass im Regelvollzug üblicherweise eine stärker ausgeprägte Heterogenität an Probanden(-merkmalen) anzunehmen ist als im Bereich der Sozialtherapie, die schwerpunktmäßig auf Personen ausgerichtet ist, die aufgrund vergleichsweise schwerwiegender Sexual- und Gewaltdelikte inhaftiert sind (Etzler et al. 2020). Damit im Zusammenhang stehen möglicherweise unterschiedlich umfangreiche Dokumentations- und Berichtspflichten, die die Reliabilität der retrospektiven Erfassung mancher Prädiktorvariablen beeinträchtigt haben könnten. Gleichzeitig könnte vermutet werden, dass sich die Sanktionspraxis im Regelvollzug und der Sozialtherapie unterscheiden, wodurch die Reliabilität der retrospektiven Erfassung der Outcome-Variablen angesprochen wäre. Letztere könnte eine – therapeutisch begründete – ausgeprägtere Nachsicht insbesondere bei minderschweren Regelverstößen besitzen, um die durch vorzeitige Rückverlegungen bedingten negativen Auswirkungen des Abbruchs eines therapeutischen Prozesses zu vermeiden (Brunner et al. 2019; Olver et al. 2011). Insgesamt muss jedenfalls berücksichtigt werden, dass v. a. bei den allgemeinen Outcome-Variablen (d. h. nicht die selektierten schwerwiegenden Lockerungsmissbräuche und intramurale Regelverstöße) z. T. auch vergleichsweise minderschwere Regelverstöße erfasst werden (z. B. Rauchen in untersagten Bereichen, Unpünktlichkeit oder zu beanstandendes Verhalten im Arbeitsbereich), die – und dies ist aus diagnostisch-methodischer Sicht von Bedeutung – relativ weit von dem Outcome entfernt sind, für die die Instrumente ursprünglich entwickelt wurden (die Vorhersage neuerlicher Gewaltdelikte oder allgemeine Rückfälle).

Da die zusätzlich erhobenen potenziellen Prädiktorvariablen in den korrelativen Berechnungen z. T. hoch signifikante Werte erzielten, liegt es nahe, diese in zukünftigen Forschungsprojekten gemeinsam mit etablierten Prognoseinstrumenten auf ihre Stabilität und Generalisierbarkeit zu untersuchen. Auch in der bereits genannten Studie, die im Rahmen der Sozialtherapie durchgeführt wurde, zeigte sich, dass über die Prognoseinstrumente hinausgehende Variablen durchaus einen positiven Vorhersageeffekt aufweisen können (Biedermann und Rettenberger 2020). Im Rahmen von zukünftigen Untersuchungen könnten die Ergebnisse unterschiedlicher vorangegangener Studien integriert und so beispielsweise auch das Potenzial von Interaktionseffekten, der Integration statischer und dynamischer sowie der Berücksichtigung protektiver Faktoren untersucht werden (Neumann und Klatt 2021). Bei aller gebotenen Zurückhaltung aufgrund der unten genannten methodischen Beschränkungen der vorliegenden Arbeit legen die Ergebnisse zumindest zwei Schlussfolgerungen nahe: Zum einen erscheint es grundsätzlich möglich zu sein, Lockerungsmissbräuche und intramurales Fehlverhalten mittels aktuarisch-statistischer Methoden einschätzen zu können, wodurch Probandengruppen mit niedrigerem und höherem Risiko zuverlässig identifiziert werden können. Zum anderen deuten die Ergebnisse daraufhin, dass es sich um einen Prognosebereich handelt, bei dem über die aus dem Bereich der Rückfallforschung hinlänglich bekannten Prädiktoren möglicherweise weitere Risikofaktoren (und ggf. protektive Faktoren) vorliegen könnten, die die Vorhersagemöglichkeiten verbessern könnten. Dafür wären weitere empirische Forschungsarbeiten mit möglichst heterogenen Stichproben notwendig, um die Stabilität und Übertragbarkeit der bisher vorliegenden Ergebnisse zu prüfen. Darüber hinaus wäre es in jeden Fall sinnvoll, in zukünftigen Untersuchungen auch (akut- und stabil-)dynamische Risikofaktoren zu berücksichtigen.

Die Generalisierbarkeit der Resultate der vorliegenden Studie ist aufgrund der Studienmethodik wie folgt methodisch eingeschränkt: Im Rahmen der vorliegenden Untersuchung konnte keine randomisierte Auswahl an Probanden, die aufgrund von Gewaltdelikten inhaftiert waren, vorgenommen werden. Unabhängig davon basierte die Untersuchung insgesamt auf einer vergleichsweise geringen Stichprobengröße, insbesondere hinsichtlich der einzelnen Teilstichproben. Bei der Erhebung der abhängigen Variablen der Lockerungsmissbräuche und intramuralen Verstöße ist zudem anzumerken, dass die Erfassung in hohem Maße von der Operationalisierung und den jeweils vorherrschenden Praktiken der JVA Frankenthal abhängig war. So konnten selbstredend lediglich diejenigen Verstöße in der Datenanalyse berücksichtigt werden, die tatsächlich durch das Vollzugpersonal dokumentiert wurden. So wäre u. a. eine einheitliche Regelung mit genauer Abgrenzung, ab wann ein Nichtrückkehren zu den allgemeinen bzw. zu den schwerwiegenden Lockerungsmissbräuchen zu zählen ist, sowie eine klare Definition, ab wann ein in einer Fremdsprache geführtes Telefonat als Verschleierung zu werten ist, wünschenswert. Auch inwiefern in der Vergangenheit straffällig gewordene Bezugspersonen einen Risikofaktor darstellen, wäre idealerweise differenzierter zu betrachten, als dies in der vorliegenden Studie möglich war. Diese Art der Beurteilung ist nicht aufgrund von Aktenlage möglich und auch mit den begrenzten Ressourcen des Vollzugspersonals kaum zu bewältigen. Darüber hinaus ist die psychometrische Qualität der zusätzlichen (potenziellen) Prädiktorvariablen weitgehend unklar. Zwar wurde versucht, diesem Problem entgegenzuwirken, indem auf Operationalisierungen standardisierter Prognoseinstrumente zurückgegriffen wurde – zumindest dort, wo dies möglich war –, trotzdem bestehen diesbezüglich methodische Unsicherheiten, die Gegenstand zukünftiger Studien sein könnten. Zudem ist es naheliegend, dass die Anzahl und Häufigkeit der Registrierung von Disziplinarmaßnahmen immer auch von der subjektiven Einschätzung des Vollzugspersonals abhängig ist und sehr wahrscheinlich zwischen unterschiedlichen Haftanstalten in deutlicher Weise variieren dürfte. Unabhängig von diesen methodischen Beschränkungen konnte die vorliegende Studie das Potenzial aktuarischer Prognoseinstrumente für die Vorhersage von Lockerungsmissbräuchen und intramuralem Fehlverhalten zeigen. Darüber hinaus konnte gezeigt werden, dass zusätzliche Prädiktoren vorliegen könnten, die die Vorhersageleistung weiter steigern könnten.