Einleitung

Als Reaktion auf unterschiedliche Rückfalltaten von Gewalt- und Sexualstraftätern wurde, beginnend mit einem Modellversuch in den Jahren 2010–2013, in den Kantonen der Ost‑, West- und Innerschweiz bis 2018 das Konzept Risikoorientierter Sanktionenvollzug (ROS) eingeführt. Basierend auf dem Risk-Need-Responsivity-Prinzip nach Andrews und Bonta (2010) hat ROS zum Ziel, Rückfälle größtmöglich zu reduzieren, die Ressourcen der Straftäter*innen zu stärken und damit eine nachhaltige Resozialisierung zu fördern.

Um die Ziele bestmöglich umzusetzen, durchläuft jeder Fall im ROS 4 Prozessschritte: Triage, Abklärung, Planung und Verlauf. In der Triage wird anhand des Fall-Screening-Tools (FaST) der weitere Abklärungsbedarf festgestellt (für vertiefte Informationen zum FaST: Treuthardt und Kröger 2019). Entsprechend dem Resultat der Triage werden dann in den Schritten Abklärung und Planung mithilfe strukturierter Hilfsmittel der Veränderungsbedarf und das weitere Vorgehen zur Rückfallreduzierung und Ressourcenstärkung geplant. Im Verlauf erfolgen standardisierte Rückmeldungen durch die beteiligten Arbeitspartner (Vollzugseinrichtungen, Therapierende, Betreuende und andere Beteiligte). Für einen vertieften Überblick über ROS: Loewe-Baur (2017) und Treuthardt et al. (2018).

Seit der Konzipierung wurde ROS mehrfach evaluiert und überarbeitet (Ruflin et al. 2013; Schwarzenegger et al. 2013; Loewe-Baur 2017; Treuthardt und Kröger 2019). Bislang wurden insbesondere bereits bestehende Bestandteile evaluiert und überarbeitet. Im Folgenden soll nun mit der Evaluation einer Veränderungsmessung ein Schritt dahin unternommen werden, Veränderungsmessung standardisierter in den Prozess zu implementieren. Aufgrund der großen Menge und Komplexität der dabei berücksichtigten Variablen wurde die Konzipierung der Veränderungsmessung bereits in einem eigenständigen Artikel ausführlich dargestellt (Treuthardt und Kröger 2021). Im Folgenden werden die Aspekte zur besseren Übersicht kurz aufgegriffen und im Abschn. „Methode“ weiter ausgeführt. Zudem werden Erkenntnisse zu den Variablen aus einer vorab durchgeführten Erhebung der Interrater-Reliabilität ergänzt.

Personenbezogene Veränderung

Die Veränderung der personenbezogenen Denk- und Verhaltensmuster setzt sich aus folgenden Komponenten zusammen: Veränderungspotenzial, delinquenzbezogene Prozessvariablen und Stufen der Verhaltensänderung („stages of change“ [SoC]). Das Veränderungspotenzial (bestehend aus Veränderungsfähigkeit und Veränderungsmotivation) und die daran angelehnten delinquenzbezogenen Prozessvariablen fragen nach den Ebenen Wollen (motivationale Aspekte), Wissen (kognitive Aspekte) und Können (Handlungskompetenzen) in Bezug auf die deliktpräventive Bearbeitung des spezifischen Problemprofils der Person. Die SoC sind angelehnt an das Transtheoretische Modell der Verhaltensänderung nach Prochaska und DiClemente (1984, 1986) und die daraus resultierte Violence Risk Scale nach Haubner-MacLean et al. (2013). Laut dem Transtheoretischen Modell erfolgt Verhaltensänderung stufenförmig. Auf der ersten Stufe, Absichtslosigkeit, ist kein Problembewusstsein oder keine Absicht zur Verhaltensänderung vorhanden. Gelangt eine Person auf die nächste Stufe, Absichtsbildung, ist ein Problembewusstsein vorhanden, und erste Überlegungen werden angestellt, wie Verhalten und Umwelt verändert werden könnten. Laut der Faktorenanalyse des URICA (DiClemente und Hughes 1990) – eines gängigen Selbstbeurteilungsfragebogens zur Messung der SoC – wird die dritte Stufe Vorbereitung nicht berücksichtigt. Dementsprechend ist die nächste Stufe Handlung, auf der aktiv am Verhalten gearbeitet wird. Die Veränderungen sind jedoch instabil. Erst auf der nächsten Stufe, Aufrechterhaltung, ist ein nachhaltiges Veränderungsstreben erkennbar.

Umweltbezogene Veränderung

Die umweltbezogene Veränderung bezieht sich ebenfalls auf die Ebenen Wollen, Wissen und Können. Auch hier werden die Items auf einer 4‑stufigen Likert-Skala eingeschätzt. Es werden zentrale Lebensbereiche betrachtet, in denen Probleme auftauchen, wie beispielsweise Arbeit, Finanzen, Partnerschaft und Familie oder sonstiges soziales Umfeld.

Ausprägung des umwelt- und personenbezogenen Problemprofils

Die Ausprägung betrachtet übergeordnet, wie gravierend das umwelt- und personenbezogene Problemprofil sich auf das Leben der Person auswirkt. Hierbei wird nicht nur deliktspezifisch auf die Rückfallgefahr geachtet, sondern auch die Auswirkung auf das alltägliche Leben miteinbezogen. Mit der Ausprägung wird das Ausmaß der Beeinträchtigung des psychosozialen Funktionsniveaus in verschiedenen Lebensbereichen bezeichnet, welches durch das Vorliegen von risikorelevanten Denk- und Verhaltensmustern verursacht wird. Sie ist angelehnt an die Global Assessment of Functioning Scale nach Saß und der American Psychiatric Association (1998). Die Ausprägung hat folgende Abstufungen: sehr gering, gering, moderat, stark, sehr stark. Bei einer sehr geringen Ausprägung liegen keine risikorelevanten Denk- und Verhaltensmuster vor. Bei einer geringen Ausprägung liegen risikorelevante Denk- und Verhaltensmuster vor, die hin und wieder bei spezifischen Umständen auftreten. Bei einer moderaten Ausprägung liegen risikorelevante Denk- und Verhaltensmuster vor, die bei spezifischen Umständen sehr wahrscheinlich auftreten. Bei einer starken Ausprägung liegen risikorelevante Denk- und Verhaltensmuster vor, die sich bei Umständen auswirken, die wahrscheinlich und häufig auftreten. Bei einer sehr starken Ausprägung liegen alltagsrelevante risikorelevante Denk- und Verhaltensmuster vor, die unabhängig von Umständen auftreten.

In Tab. 1 sind beispielhafte Tatsituationen für die Ausprägungen ausgeführt.

Tab. 1 Beispielhafte Tatsituationen für die Ausprägungen

Passung von forensischem Bedarf und juristischen Rahmenbedingungen

Ein wichtiger Aspekt bei der Betrachtung von deliktpräventiver Veränderung ist die Passung zwischen forensischem Bedarf und juristischen Rahmenbedingungen. Je nach Ausprägung des umwelt- und personenbezogenen Problemprofils besteht ein forensischer Bedarf. Ist dieser niedrig ausgeprägt, ist in der Regel keine forensische Intervention wie beispielsweise eine forensisch orientierte Therapie notwendig. Ist der forensische Bedarf jedoch hoch ausgeprägt, ist meist eine längerfristige intensive forensische Behandlung, mitunter auch stationär, angezeigt.

Grundsätzlich ist jedoch immer ein juristischer Rahmen im Sinne eines bestimmten Urteils oder einer Weisung gegeben, der den Umfang und die Art der Sanktion klar definiert. So kann es vorkommen, dass eine Person, bei der laut forensischem Bedarf eine Therapie deutlich angezeigt wäre, lediglich eine kurze Haftstrafe antreten muss. Ebenso kann es, wenn auch selten, vorkommen, dass eine Person mit geringem forensischem Bedarf eine stationäre Maßnahme absolvieren mussFootnote 1.

Ein aus forensischer Sicht unzureichender juristischer Rahmen ist insofern problematisch, als dass angenommen werden muss, dass bis zum Ende der ausgesprochenen Sanktion mutmaßlich keine ausreichende deliktpräventive Veränderung erfolgen kann.

Ziel und Hypothesen

Die vorab konzipierte Veränderungsmessung wurde evaluiert, um die Eignung der verwendeten Parameter für die Implementierung in ROS zu überprüfen. Hierbei wurde die Erhebung in 4 Dimensionen unterteilt: Veränderung, Rückfälligkeit, Passung und Wirksamkeit von ROS. Bezüglich der Veränderung soll betrachtet werden, inwieweit sich die betrachteten Personen am Ende der Sanktion im Vergleich zum Anfang der Sanktion entwickelt haben. Die Dimension Rückfälligkeit untersucht den Zusammenhang der Variablen am Ende der Sanktion mit der Rückfälligkeit in der Stichprobe. Im Bereich Passung wird der Zusammenhang zwischen den Variablen und der Passung forensischer Bedarf – juristischer Rahmen analysiert. In der Dimension Wirksamkeit von ROS soll in einem abschließenden Schritt ein Vergleich zu den Rückfallraten vor der Implementierung von ROS gezogen werden.

Aufgrund der großen Anzahl an Interaktionen und daraus resultierenden Hypothesen werden die aufgestellten Hypothesen in Tab. 2 dargestellt und in Kategorien eingeteilt.

Tab. 2 Hypothesen

Methode

Datenerhebung

Die Datenerhebung erfolgte vom 01.05.2016 bis zum 30.04.2019. Die Einschätzungen erfolgten auf Basis von Dossiers, die von den fallführenden Personen der Bewährungs- und Vollzugsdienste Zürich erstellt wurden. Die Erhebung der demografischen Daten erfolgte mithilfe von Strafregisterauszügen und Einträgen in dem Rechtsinformationssystem (RIS), einer Datenbank der Justizdirektion des Kantons Zürich.

Stichprobe

Die Stichprobe besteht aus Straftäterinnen und Straftätern des Kantons Zürich, die von den Bewährungs- und Vollzugsdiensten des Kanton Zürichs betreut und anschließend (bedingt) entlassen wurden. Die Entlassung führt im Rahmen des internen Prozesses dazu, dass die Fälle nach gewisser Zeit abgeschlossen werden.

Die Stichprobe umfasst Fälle, die zwischen dem 01.05.2016 und dem 30.04.2018 abgeschlossen wurden.

Aufgrund unzureichender Informationen konnte in einigen Fällen keine umfangreiche Einschätzung vorgenommen werden. Speziell konnten hier die personenbezogenen Variablen, die umweltbezogene Veränderung und die Ausprägung des Problemprofils nicht eingeschätzt werden. Die demografischen Daten, die Passung zwischen forensischem Bedarf und juristischen Rahmenbedingungen sowie die Rückfälligkeit wurden erhoben. Anhand von t-Tests wird überprüft, ob sich die Gruppe der eingeschätzten Fälle von der Gruppe der nichteingeschätzten Fälle signifikant unterscheidet.

Interrater-Reliabilität

Für die Interrater-Reliabilität-Prüfung wurden unter den Fällen mit ausreichender Aktenlage 4 Fälle zufällig ausgesucht.

Für die zufällig ausgesuchten Fälle wurden die Variablen Veränderungsmotivation, Prozessvariablen, SoC zu Beginn der Sanktion, SoC am Ende der Sanktion, umweltbezogene Veränderung, Ausprägung zu Beginn der Sanktion und Ausprägung am Ende der Sanktion eingeschätzt. Die Einschätzung wurde von 4 Angestellten der Bewährungs- und Vollzugsdienste (BVD) des Kantons Zürich durchgeführt. Bei den BVD des Kantons Zürich handelt es sich um eine einweisende Behörde, welche gemäß schweizerischer Gesetzgebung den korrekten Vollzug der gerichtlich angeordneten Sanktionen zu planen hat. In diesem Zusammenhang entscheidet sie über die Gewährung von Vollzugsprogressionen wie beispielsweise Beziehungsurlauben, Versetzungen in offenere Vollzugsregime bis hin zur bedingten Entlassung und der Anordnung von Bewährungshilfe. Um den diversen Berufshintergründen der in einer einweisenden Behörde tätigen Personen gerecht zu werden, wurden die Einschätzungen von einer Psychologin und 3 Fallverantwortlichen durchgeführt. Die Fallverantwortlichen waren hierbei Personen mit einerseits juristischem und andererseits sozialarbeiterischem Ausbildungshintergrund.

Die Übereinstimmung der Rater wird anhand von Krippendorffs α bestimmt. Eine perfekte Übereinstimmung würde einem Wert von α = 1 entsprechen. Krippendorf (2004) schlägt vor, dass α ≥ 0,8 sein sollte; mindestens jedoch ≥ 0,667, um von einer gegebenen Interrater-Reliabilität ausgehen zu können.

Personenbezogene Veränderungsmessung

Veränderungspotenzial

Das Veränderungspotenzial wurde zu Beginn der Sanktion erfasst. Der erste Aspekt des Veränderungspotenzials, die Veränderungsfähigkeit, fragt nach grundlegenden, veränderungseinschränkenden Faktoren. Diese sind ausgeprägte dissoziale/impulsive Züge, Vorstrafen sowie frühere abgebrochene psychologisch/psychiatrische Behandlungen.

Der zweite Aspekt, die Veränderungsmotivation, bezieht sich auf die Ebenen Wissen, Wollen und Können in Bezug auf die deliktpräventive Bearbeitung des spezifischen Problemprofils der Person. Die Items der einzelnen Ebenen werden auf einer 4‑stufigen Likert-Skala eingeschätzt. Im Anschluss an die Wertung der Items der Ebenen wird eine Gesamteinschätzung vorgenommen, ebenfalls auf einer 4‑stufigen Likert-Skala. Diese bezieht neben den Item-Einschätzungen auch übergeordnet weitere Einflüsse mit ein (beispielsweise früheres Verhalten im Vollzug, mögliche Manipulationstendenzen, früheres Verhalten nach Entlassung). Die Variablen können als kaum vorhanden, etwas vorhanden, überwiegend vorhanden oder deutlich vorhanden eingeschätzt werden. Der Erhebungsbogen zu der Veränderungsmotivation ist in Abb. 1 dargestellt.

Abb. 1
figure 1

Veränderungsmotivation

Die Abstufungen wurden wie folgt kodiert: 0: kaum vorhanden, 1: etwas vorhanden, 2: überwiegend vorhanden, 3: deutlich vorhanden. In Fällen, in denen keine Zuordnung zu 1 oder 2 erfolgen konnte, da positive und negative Faktoren sich die Waage halten, wurde eine 1,5 kodiert.

Delinquenzbezogene Prozessvariablen

Die delinquenzbezogenen Prozessvariablen beruhen auf der Veränderungsmotivation und stellen die vertiefte Erfassung im Verlauf und am Ende der Sanktion dar. Die Erhebung der Prozessvariablen gleicht der Erhebung der Veränderungsmotivation, allerdings werden die Ebenen Wissen und Können detaillierter erfasst. Der Erhebungsbogen zu den delinquenzbezogenen Prozessvariablen ist in Abb. 2 dargestellt.

Abb. 2
figure 2

Delinquenzbezogene Prozessvariablen

Die Abstufungen wurden ebenfalls wie folgt kodiert: 0: kaum vorhanden, 1: etwas vorhanden, 2: überwiegend vorhanden, 3: deutlich vorhanden. In Fällen, in denen keine Zuordnung zu 1 oder 2 erfolgen konnte, da positive und negative Faktoren sich die Waage halten, wurde eine 1,5 kodiert.

Veränderung auf Basis der Veränderungsmotivation und Prozessvariablen

Die Veränderung wird über die Differenz zwischen Prozessvariablen und Veränderungsmotivation ermittelt. Mit einem t-Test für abhängige Stichproben, der die Mittelwertsunterschiede zwischen Veränderungsmotivation und Prozessvariablen betrachtet, wird die Signifikanz überprüft. Anhand von Cohens d wird die Effektgröße ermittelt. Cohen (1988) schlägt für die Interpretation vor, dass d = ǀ0,2ǀ einem kleinen, d = ǀ0,5ǀ einem mittleren und d = ǀ0,8ǀ einem großen Effekt entspricht.

Stufen der Verhaltensänderung

Die SoC wurden jeweils zu Beginn und zum Ende der Sanktion eingeschätzt. Hierbei wurden die Stufen wie folgt kodiert: 0: Absichtslosigkeit, 2: Absichtsbildung, 3: Handlung, 4: Aufrechterhaltung. In seltenen Fällen, in denen keine klare Zuordnung zu einer Stufe erfolgen konnte, wurden entsprechend Zwischenwerte gegeben (0,5; 1,5; 2,5; 3,5).

Umweltbezogene Veränderungsmessung

Die umweltbezogene Veränderungsmessung wurde ebenfalls auf einer 4‑stufigen Likert-Skala erfasst und entsprechend kodiert: 0: kaum vorhanden, 1: etwas vorhanden, 2: überwiegend vorhanden, 3: deutlich vorhanden. Die Veränderung wurde aufgrund der hohen Anzahl an unzureichenden Beschreibungen der Entwicklung folgendermaßen eingeschätzt und kodiert: 0: keine oder negative Veränderung, 0,5: leichte Verbesserung, 1: deutliche Verbesserung.

Ausprägung des umwelt- und personenbezogenen Problemprofils

Die Ausprägung wurde folgendermaßen kodiert: 0: sehr stark, 1: stark, 2: moderat, 3: gering, 4: sehr gering. In Fällen, in denen keine klare Zuordnung zu den jeweiligen Ausprägungen erfolgen konnte, wurden Zwischenstufen mit 0,5, 1,5, 2,5 oder 3,5 kodiert.

Die Veränderung wird über die Differenz zwischen der Ausprägung am Ende der Sanktion und der Ausprägung am Anfang der Sanktion berechnet.

Passung forensischer Bedarf und juristische Rahmenbedingungen

Die Passungen wurden folgendermaßen kodiert: 0: keine ausreichende Passung, 0,5: teilweise ausreichende Passung, 1: ausreichende Passung.

Zusammenhänge zu Passung und Rückfall

Die Zusammenhänge zwischen den personen- und umweltbezogenen Variablen und der Passung sowie dem Rückfall wurden mit einer ordinalen Regression bzw. mit einer logistischen Regression ermittelt und anhand von „odds ratios“ vorgestellt. Die Erklärungsgüte wird anhand Nagelkerke R2 bestimmt. Hierbei entspricht R2 = 0,1 einer schlechten, R2 = 0,3 einer mittleren und R2 = 0,5 einer guten Erklärungsgüte. Zur Bestimmung der Effektstärke wird Cohens f herangezogen. Nach Cohen (1988) entspricht f = 0,1 einem kleinen Effekt, f = 0,25 einem mittleren und f = 0,4 einem starken Effekt.

Rückfallraten vor Einführung von ROS

Die Vergleichsdaten beruhen auf Fällen, in denen zwischen 2004 und 2005 ein Geschäftsabschluss stattgefunden hat. Die im Folgenden verwendeten Daten wurden Loewe-Baur (2017) entnommen. Loewe-Baur betrachtet anhand von Strafregisterauszügen die Rückfälligkeit nach einem und nach 3 Jahren „time at risk“.

Für den Vergleich werden die Rückfallraten für diese Erhebung anhand des Strafregisterauszugs vom 01.05.2019 herangezogen. Da die Entlassungen in den hier untersuchten Fällen größtenteils weniger als 3 Jahre zurückliegen (M = 1,95 Jahre), kann die Time at risk nicht zum 3‑Jahres-Zeitpunkt betrachtet werden. Dementsprechend wird der Vergleich in Time at risk nach einem Jahr und Time at risk nach mehr als einem Jahr unterteilt. Der Vergleich nach einem Jahr ist dementsprechend methodisch identisch mit Loewe-Baur (2017). Der Vergleich nach mehr als einem Jahr kann nur begrenzt interpretiert werden. Um die Vergleichbarkeit möglichst hoch zu halten, wird neben dem Vergleich der Rückfälle nach einem Jahr auch ein Vergleich mit dem gemittelten Rückfall nach Loewe-Baur (2017) herangezogen. Die statistische Signifikanz wird anhand von t-Tests für unabhängige Stichproben bestimmt. Für die Effektstärke wird Cohens d herangezogen.

Resultate

Stichprobe und demografische Daten

Nach Ausschluss von 2 verstorbenen Personen besteht die Gesamtstichprobe aus 302 Personen. Die Stichprobe setzt sich aus 269 Männern (89,1 %) und 33 Frauen (10,9 %) zusammen.

Das durchschnittliche Alter am Stichtag der Datenerhebung (01.05.2019) beträgt 39,29 Jahre (Standardabweichung [SD] = ± 11,13). Das Alter variierte hierbei zwischen 21 Jahren und 73 Jahren.

Der Großteil der Personen besitzt eine Schweizer Staatsbürgerschaft (n = 161; 53,3 %) oder eine andere europäische Staatsbürgerschaft (n = 76; 25,1 %). Die verbleibenden Personen teilen sich wie folgt auf: Afrika (n = 35; 11,6 %), Asien (n = 22; 7,3 %), Südamerika (n = 5; 1,7 %) und Nordamerika (n = 3; 1,0 %).

Die deutliche Mehrheit der Personen ist ledig (n = 175; 57,9 %). Verheiratet sind 63 Personen (20,9 %) und 62 Personen (20,5 %) sind geschieden oder leben getrennt. Eine Person ist verwitwet (0,3 %), und bei einer weiteren Person konnte der Zivilstand nicht festgestellt werden.

Insgesamt 262 Personen (86,8 %) haben eine oder mehrere Vorstrafen. Die Verteilung der Vorstrafen nach Deliktart sind in Tab. 3 abgebildet.

Tab. 3 Vorstrafen

Vergleich eingeschätzter zu nichteingeschätzter Fälle

Aufgrund unzureichender Informationen konnte in 101 Fällen (33,4 %) keine umfangreiche Einschätzung vorgenommen werden.

Betrachtet man die Gruppenunterschiede zwischen eingeschätzten und nichteingeschätzten Fällen, so sind die Unterschiede in der Verteilung der Geschlechter (p = 0,989), des Alters (p = 0,926) und des Zivilstandes (p = 0,820) nicht signifikant. Die Verteilung der Nationalitäten weicht von der Verteilung in der Gesamtstichprobe ab. Unter den eingeschätzten Fällen befinden sich 59,7 % (n = 120) Schweizer und 40,3 % (n = 81) Nichtschweizer. Bei den nichteingeschätzten Fällen sind es 40,6 % (n = 41) Schweizer und 59,4 % (n = 60) Nichtschweizer. Der Gruppenunterschied ist signifikant (p = 0,002).

Bezüglich der Vorstrafen weisen 85,1 % (n = 171) der eingeschätzten Fälle eine Vorstrafe auf. Bei den nichteingeschätzten Fällen liegt das Vorkommen von Vorstrafen bei 90,1 % (n = 91). Der Gruppenunterschied beim Vorkommen einer Vorstrafe ist nicht signifikant (p = 0,226). Betrachtet man die Gruppenunterschiede zwischen den einzelnen Arten von Vorstrafen, zeigt sich, dass unter den nichteingeschätzten Fällen eine Vorstrafe im Bereich Verstoß gegen das Ausländergesetz signifikant häufiger vorliegt als bei den eigeschätzten Fällen (p < 0,001).

Die Verteilung der Nationalitäten nach Gruppenzugehörigkeit ist in Tab. 4 abgebildet; die Verteilung der Vorstrafen nach Deliktart in Tab. 5.

Tab. 4 Nationalitäten nach Gruppenzugehörigkeit
Tab. 5 Vorstrafen

Auch die Anzahl der Rückfälle laut Strafregisterauszug unterscheidet sich signifikant zwischen den Gruppen (p < 0,001). Bezüglich der angeklagten Rückfälle (laufende Verfahren) gibt es keinen signifikanten Gruppenunterschied (p = 0,339). In Tab. 6 sind die Rückfälle und angeklagten Rückfälle, aufgeteilt nach eingeschätzten und nichteingeschätzten Fällen, abgebildet.

Tab. 6 Rückfälle und Anklagen, aufgeteilt nach Einschätzung

Aufgrund der signifikanten Gruppenunterschiede müssen die eingeschätzten Fälle bei der Prüfung der Hypothesen zu Passung und Rückfälligkeit gesondert von den nichteingeschätzten Fällen betrachtet werden.

Die folgenden Ergebnisse beziehen sich dementsprechend auf die Teilstichprobe der eingeschätzten Fälle (n = 201).

Erkenntnisse aus der Erhebung der Interrater-Reliabilität

In der vorab durchgeführten Erhebung zur Interrater-Reliabilität wurden die vorgestellten Variablen jeweils zu Beginn und am Ende der Sanktion eingeschätzt. Es hat sich gezeigt, dass nicht alle Variablen zu allen Zeitpunkten reliabel eingeschätzt werden konnten.

Das Veränderungspotenzial und die Prozessvariablen wurden zu Beginn und am Ende der Sanktion signifikant übereinstimmend eingeschätzt. Krippendorffs α beträgt hier α = 0,834 und α = 0,982.

Die SoC wurden in der Studie lediglich zum Zeitpunkt des Sanktionsbeginns signifikant übereinstimmend eingeschätzt (α = 0,744). Zum Ende der Sanktion war die Übereinstimmung nicht signifikant (α = 0,607). Somit ist die Voraussetzung der Reliabilität teilweise nicht erfüllt. Da für die Überprüfung einer signifikanten Veränderung im Sanktionserlauf die Reliabilität der Variablen zu beiden Zeitpunkten und für die Analyse der weiteren Hypothesen zumindest zum Ende der Sanktion gegeben sein muss, wird diese Variable nicht in die weitere Analyse miteinbezogen werden. Die Hypothesen Ib, IIb und IIIb müssen folglich als nichtbeantwortbar eingeschätzt werden.

Die Einschätzung der umweltbezogenen Veränderung wurde zu beiden Zeitpunkten nicht signifikant übereinstimmend eingeschätzt (α = 0,453). Somit ist die Voraussetzung der Reliabilität nicht erfüllt und die umweltbezogene Veränderung kann ebenfalls nicht miteinbezogen werden. Die Hypothesen Ic, IIc und IIIc sind dementsprechend nicht beantwortbar.

Die Ausprägung des umwelt- und personenbezogenen Problemprofils wurde zum Ende der Sanktion signifikant übereinstimmend eingeschätzt (α = 0,774). Am Anfang der Sanktion war die Übereinstimmung nicht signifikant (α = 0,409). Diese Variable ist somit nicht in die Analyse der Veränderungsmessung miteinzubeziehen; Hypothese Id ist also nicht beantwortbar. Die reliabel eingeschätzte Ausprägung zum Ende der Sanktion kann jedoch in der Überprüfung der weiteren Hypothesen Verwendung finden.

Veränderung

Veränderungsmotivation und Prozessvariablen

In Tab. 7 sind die Häufigkeiten der einzelnen Ausprägungen dargestellt. Die Veränderungsmotivation stellt hierbei die Ausprägung der Veränderungsmotivation zu Beginn der Sanktion dar. Mit der Ausprägung der Prozessvariablen wird abgebildet, wie stark die risikorelevanten Denk- und Verhaltensmuster auf den Ebenen Wollen, Wissen und Können am Ende der Sanktion ausgeprägt sind.

Tab. 7 Häufigkeiten der Veränderungsmotivation und der Prozessvariablen

Zu Beginn der Sanktion wurde die Veränderungsmotivation der deutlichen Mehrheit als kaum (54,0 %) oder etwas vorhanden (29,7 %) eingestuft. In keinem der betrachteten Fälle war die Ausprägung der Veränderungsmotivation deutlich vorhanden. Der Mittelwert der Veränderungsmotivation liegt bei M = 0,59 (SD = 0,71).

Am Ende der Sanktionen, wurde die Ausprägung der Prozessvariablen bei der Mehrheit der Personen (51,8 %) als überwiegend vorhanden eingestuft. Während die Prozessvariablen ähnlich häufig kaum (9,4 %), etwas bis überwiegend (7,1 %) und deutlich vorhanden (11,8 %) waren, war auch hier die Ausprägung etwas vorhanden (20,0 %) noch verhältnismäßig häufig. Der Mittelwert der Prozessvariablen liegt bei M = 1,69 (SD = 0,79).

Der t-Test ist hochsignifikant (p = < 0,001). Die Effektgröße (Cohens d) liegt bei d = −1,3, was einem großen Effekt entspricht. Die durchschnittliche Differenz zwischen den Prozessvariablen und der Veränderungsmotivation liegt bei M = 0,92 (SD = 0,82). Im Schnitt verbessert sich die Ausprägung der Variablen im Verlauf der Sanktion also um eine Stufe.

Ausprägung des personen- und umweltbezogenen Problemprofils

In Tab. 8 sind die Häufigkeiten der einzelnen Ausprägungen am Ende der Sanktion dargestellt. Aufgrund der fehlenden Interrater-Reliabilität werden die Ausprägungen zu Beginn der Sanktion nicht berücksichtigt.

Tab. 8 Häufigkeiten der Ausprägungen

Am Ende der Sanktion war das Problemprofil in den meisten Fällen moderat (31,2 %) ausgeprägt. Häufig waren außerdem die Ausprägungen stark (23,3 %) oder gering (16,9 %). Weniger häufig ausgeprägt waren die Zwischenstufen (sehr stark bis stark = 2,1 %, stark bis moderat = 9,0 %, moderat bis gering = 5,3 % und gering bis sehr gering = 1,1 %). Der Mittelwert der Ausprägung am Ende der Sanktion liegt bei M = 1,85 (SD = 0,97).

Rückfälligkeit

Signifikanztests

Die Signifikanztests wurden mit den laut Strafregister verurteilten Rückfällen durchgeführt. Anklagen wurden nicht miteinbezogen. In Tab. 9 sind die Zusammenhänge der Variablen mit Rückfall dargestellt.

Tab. 9 Zusammenhänge, Rückfall

Personen mit positiverer Ausprägung der Prozessvariablen am Ende der Sanktion haben eine um 59 % gesenkte Chance (OR = 0,41), rückfällig zu werden. Die Erklärungsgüte des Zusammenhangs ist hierbei moderat (R2 = 0,12) bei einer geringen Effektstärke von f = 0,02.

Bezüglich der Ausprägung des personen- und umweltbezogenen Problemprofils, ist die Chance, rückfällig zu werden, bei den Personen mit einer höheren Ausprägung am Ende der Sanktion um 2,79 erhöht. Die Erklärungsgüte des Zusammenhangs ist moderat (R2 = 0,17) bei einer geringen Effektstärke von f = 0,03.

Passung

In Tab. 10 sind die Einschätzungen der Passung zwischen forensischem Bedarf und juristischen Möglichkeiten abgebildet. Hier werden zunächst auch die Fälle abgebildet, in denen keine Einschätzung der weiteren Variablen vorgenommen werden konnte. Anschließend wird jedoch erneut auf die Teilstichprobe der eingeschätzten Fälle Bezug genommen.

Tab. 10 Häufigkeiten der Passungen

Unter den nichteingeschätzten Fällen war die Passung zwischen forensischem Bedarf und juristischen Rahmenbedingungen etwas häufiger ausreichend (56,1 %) als nichtausreichend (42,7 %). Bei den Fällen, in denen eine Einschätzung möglich war, war eine ausreichende Passung (70,1 %) deutlich häufiger als eine nichtausreichende Passung (28,3 %).

Die Zusammenhänge zwischen Passung und Prozessvariablen sowie zwischen Passung und Rückfall sind nicht signifikant. Der Zusammenhang zwischen Passung und Ausprägung des Problemprofils am Ende der Sanktion ist zwar hochsignifikant (p < 0,001), weist jedoch eine geringe Erklärungsgüte (R2 = 0,102) auf.

Wirksamkeit von ROS

In Tab. 11 und 12 sind die Rückfallraten nach Loewe-Baur (2017), also die Rückfallraten vor der Einführung von ROS aus den Jahren 2004 und 2005, nach einem Jahr und gemittelter TaR (2 Jahre) mit den Rückfallraten aus dieser Erhebung nach einem Jahr TaR und mehr als einem Jahr TaR gegenübergestellt. Hierbei werden die eingeschätzten Fälle, die nichteingeschätzten Fälle sowie die kombinierte Stichprobe aus eingeschätzten und nichteingeschätzten Fällen berücksichtigt. In Tab. 13 sind die statistischen Kennwerte der t-Tests aufgeführt.

Tab. 11 Vergleich der Rückfallraten nach TaR, 1 Jahr
Tab. 12 Vergleich der Rückfallraten nach TaR, mehr als 1 Jahr
Tab. 13 Statistische Kennwerte

Rückfälligkeit in der kombinierten Stichprobe

Vergleicht man die Rückfallraten mit denen von Loewe-Baur (2017) nach einem Jahr Time at risk, so kann man sehen, dass die Rückfallraten in der kombinierten Stichprobe aus eingeschätzten und nichteingeschätzten Fällen von 34,7 auf 18,2 % gesunken sind. Der Gruppenunterschied ist hochsignifikant (p < 0,001), bei einer kleinen Effektstärke von d = 0,4. Vergleicht man die gemittelten Rückfallraten von Loewe-Baur (2017) mit den Rückfallraten nach Einführung von ROS, ist ein noch gravierenderer Unterschied zu erkennen. So ist der Rückfall in der kombinierten Stichprobe um etwa die Hälfte geringer (von 44,3 auf 22,9 %, p < 0,001). Dies entspricht einem mittleren Effekt von d = 0,5.

Insbesondere der Rückfall im Bereich der Allgemeindelinquenz ist gesunken (von 30,4 bzw. 37,3 auf 14,6 bzw. 18,9 %), bei einem jeweils signifikanten Gruppenunterschied (p < 0,001) und kleiner Effektstärke (d = 0,4). Die Rückfallraten im Bereich der Gewalt- und Sexualdelinquenz nach einem Jahr sind annährend gleich geblieben (von 4,3 auf 3,6 %), bei nichtsignifikantem Gruppenunterschied (p = 0,649). Beim Vergleich mit der gemittelten TaR sind die Rückfallraten gesunken (von 6,8 auf 4,0 %). Allerdings ist diese Senkung nicht signifikant (p = 0,061). Ergänzend ist zu erwähnen, dass es in der gesamten Stichprobe nach der Einführung von ROS keinen Rückfall im Bereich der Sexualdelinquenz gab.

Rückfälligkeit bei nichteingeschätzten Fällen

Bei den nichteingeschätzten Fällen ist die Rückfälligkeit im Vergleich zu einem Jahr TaR bei Loewe-Baur (2017) zwar annährend gleichgeblieben (von 34,7 auf 28,7 %, p = 0,228), jedoch im Vergleich zur gemittelten Rückfälligkeit deutlich geringer (von 44,3 auf 33,7 %, p = 0,043, d = 0,2). Im Bereich der Allgemeindelinquenz stellt sich ein ähnliches Bild dar (von 30,4 auf 21,8 % bei p = 0,059 bzw. von 37,3 auf 25,7 % bei p = 0,016, d = 0,2). Bei den Gewalt- und Sexualdelikten hingegen sind die Gruppenunterschiede jeweils nicht signifikant (4,3 % zu 7,8 %, p = 0,320 nach einem Jahr, bzw. 6,8 % zu 7,9 %, p = 0,683 gemittelt).

Rückfälligkeit bei eingeschätzten Fällen

Bei den eingeschätzten Fällen sind die Rückfallraten in allen Bereichen und zu beiden Zeitpunkten deutlich geringer seit Einführung von ROS. So ist die generelle Rückfälligkeit um die Hälfte bzw. um das Dreifache gesunken (von 34,7 bzw. 44,3 auf 12,9 bzw. 17,4 %). Ebenso ist die Rückfälligkeit bei Allgemeindelinquenz um die Hälfte bzw. um das Dreifache gesunken (von 30,4 bzw. 21,8 auf 10,9 bzw. 15,4 %). Alle Gruppenunterschiede sind jeweils hochsignifikant (p < 0,001), bei mittlerer Effektstärke (d = 0,5 bzw. 0,6 für Rückfall nach gemittelter TaR). Die Rückfälligkeit im G‑ und S‑Bereich ist bei den eingeschätzten Fällen im Vergleich zur TaR von einem Jahr bei Loewe-Baur (2017) nicht signifikant gesunken (von 4,3 auf 2 %, p = 0,074). Im Vergleich zur gemittelten TaR ist der Gruppenunterschied jedoch hochsignifikant (von 6,8 auf 2 %, p = 0,001), bei kleiner Effektstärke (d = 0,2).

Diskussion

Für eine verbesserte Übersicht sind die Hypothesen nachfolgend in Kurzform und nach Dimension in Tab. 14 dargestellt. Zusätzlich ist die Erkenntnis vermerkt, ob die Hypothese bestätigt oder nicht bestätigt werden kann. Als nichtbeantwortbar sind die Hypothesen gekennzeichnet, welche nicht überprüft wurden, weil die Variablen nicht reliabel eingeschätzt werden konnten.

Tab. 14 Hypothesen mit Kurzbezeichnung und Erkenntnis

Veränderung

Hypothese Ia (Veränderung, Prozessvariablen) kann bestätigt werden. Dementsprechend wird die Gesamteinschätzung der personenbezogenen Bereiche der Ebenen Wollen, Wissen und Können im Verlauf der Sanktion im Schnitt positiver. Konkret wird die Ausprägung um eine Einheit verbessert. Dies kann als Hinweis darauf gewertet werden, dass während der Sanktion zielführend mit den Straftäterinnen und Straftätern gearbeitet wird.

Wie bereits im ROS verankert, beinhaltet dieser Ansatz nicht nur therapeutische und psychologische Arbeit (personenbezogene Aspekte), sondern auch sozialarbeiterische und umweltbezogene Aspekte, die gezielt an der Lebenssituation der Straftäterinnen und Straftätern ansetzen. Die Veränderung dieser umweltbezogenen Aspekte kann entsprechend den Erkenntnissen aus der IRR-Erhebung jedoch mit der hier verwendeten Erfassungsmethode nicht reliabel eingeschätzt werden. Mögliche Gründe hierfür sind einerseits die große Diversität der Aspekte und andererseits der sich verändernde Fokus während der Sanktion. Beide Gründe können mitunter zu einer schwer quantifizierbaren Aktenlage führen. Umweltbezogene Aspekte sind potenziell schnell veränderbar. So kann beispielsweise eine zu Beginn stabile Familienkonstellation während des Vollzugs belastet werden. Dementsprechend wäre dieser Aspekt einer deutlichen Schwankung ausgesetzt und folglich schwer reliabel zu quantifizieren.

Auch Veränderungen in der finanziellen und der Arbeitssituation sind nicht einfach einzuschätzen, weil sie häufig zu Beginn des Vollzugs eine untergeordnete Rolle spielen und demnach wenig dazu dokumentiert wird. Gegen Ende des Vollzugs rücken Umweltfaktoren jedoch generell stärker in den Fokus, um eine potenzielle Bewährungshilfe sinnvoll und unterstützend gestalten zu können. Der verschobene Fokus kann dazu führen, dass die Aktenlage keine oder nur eine eingeschränkte Veränderungseinschätzung zulässt. Entsprechend umgekehrt stellt es sich bei den SoC dar, die einen starken Fokus auf Veränderungsbereitschaft legen. Diese wird insbesondere zu Beginn der Sanktion intensiv betrachtet; zum Ende der Sanktion spielt sie dann eine eher untergeordnete Rolle und wird folglich weniger ausführlich dokumentiert.

Rückfälligkeit

Hypothese IIa und IId (Rückfälligkeit, Prozessvariablen und Ausprägung) kann ebenfalls bestätigt werden. Sowohl eine höhere Ausprägung der Prozessvariablen als auch eine geringere Ausprägung des personen- und umweltbezogenen Problemprofils hängt signifikant mit geringerer Rückfälligkeit zusammen.

Die Bestätigung der Hypothesen liefert einen Hinweis darauf, dass die Integration der Variablen in das Konzept des ROS sinnvoll sein könnte. Prozessvariablen wie auch die Ausprägung des personen- und umweltbezogenen Problemprofils scheinen in Bezug auf die Bewertung potenzieller Rückfälligkeit, vielversprechende prädiktive Variablen zu sein, auch wenn die gefundenen Effektstärken eher gering sind.

Passung

Hypothese III (Passung) kann nur teilweise bestätigt werden. Die Hypothesen IIIa und IIIc werden verworfen. Folglich muss angenommen werden, dass kein Zusammenhang zwischen der Passung von forensischem Bedarf und juristischen Rahmenbedingungen und der Ausprägung der Prozessvariablen besteht; ebenso wie kein Zusammenhang zwischen der Passung und Rückfälligkeit besteht.

Dahingegen scheint es einen Zusammenhang zwischen der Passung und der Ausprägung des personen- und umweltbezogenen Problemprofils zu geben. Demnach kann angenommen werden, dass sich eine ausreichende Passung zwischen forensischem Bedarf und juristischen Rahmenbedingungen positiv auf die Veränderung der verschiedenen personen- und umweltbezogenen Variablen auswirkt. Aufgrund der geringen Erklärungsgüte müssen diese Ergebnisse jedoch zurückhaltend interpretiert werden.

Relativierend ist im ROS verankert, dass auch bei unzureichender Passung darauf geachtet wird, die vollzugspraktischen Möglichkeiten möglichst gut zu nutzen, um dennoch am individuellen Problemprofil und dem risikorelevanten Veränderungsbedarf zu arbeiten.

Folgerichtig sollte also weiterhin eine möglichst adäquate Passung angestrebt werden und, bei unzureichender Passung, unter Nutzung sämtlicher vollzugspraktischer Möglichkeiten, die delinquenzbezogenen personen- und umweltbezogenen Bereiche bearbeitet werden.

Wirksamkeit von ROS

Hypothese IV (Wirksamkeit von ROS) kann bestätigt werden. Vergleicht man die Rückfallraten nach Loewe-Baur (2017) mit den aktuellen Rückfallraten, so kann man feststellen, dass die Rückfälligkeit in der kombinierten Stichprobe aus eingeschätzten und nichteingeschätzten Fällen von 34,7 % (TaR = 1 Jahr) bzw. 44,3 % (gemittelte TaR) vor der Einführung von ROS auf insgesamt 22,9 % nach der Einführung von ROS gesunken ist. Betrachtet man spezifisch die eingeschätzten Fälle, sinkt die Rückfälligkeit sogar auf 17,4 %. Auch bei der Rückfälligkeit der nichteingeschätzten Fälle ist eine Senkung von 10 % zu beobachten (von gemittelten 44,3 % bei Loewe-Baur (2017) zu 33,7 %). Allerdings ist diese Senkung erst signifikant, wenn man die Rückfallraten vor Einführung von ROS mit der gemittelten TaR vergleicht. Mögliche Gründe hierfür werden im Folgenden näher erläutert.

Betrachtet man die Vorgeschichte der nichteingeschätzten Fälle, kann man sehen, dass hier anteilig gleich viele Personen wegen eines Gewaltdelikts verurteilt wurden wie bei den eingeschätzten Fällen (65,2 % der eingeschätzten zu 65,3 % der nichteingeschätzten Fälle). Es kann vermutet werden, dass die nichteingeschätzten Personen mit Gewaltdelikt in der Vorgeschichte häufiger einschlägig rückfällig geworden sind. Dafür spräche der erhöhte Anteil der Rückfälle im Bereich Gewaltdelikte der nichteingeschätzten Fälle (7,8 % der nichteingeschätzten zu 2,0 % der eingeschätzten Fälle). Bezüglich des verhältnismäßig geringen Unterschieds in den Rückfallzahlen im Bereich der Gewaltdelikte gilt es Folgendes zu berücksichtigen.

Einerseits haben Gewalt- und Sexualdelikte (G/S-Delikte) eine geringere Basisrate als Allgemeindelinquenz – sprich, sie werden seltener begangen. Bereits eine geringfügige Senkung der Zahlen ist also als Erfolg zu sehen.

Andererseits ist es so, dass die Fälle häufig dann nicht eingeschätzt werden konnten, wenn keine bedingte Entlassung gewährt wurde. Gemäß schweizerischer Gesetzgebung ist dadurch die juristische Voraussetzung für die Anordnung von Bewährungshilfe nicht gegeben. Dies verändert die Aktenlage insofern, als dass den Abschlussberichten der Bewährungshilfe in der Regel die für eine Einschätzung notwendigen Informationen entnommen werden können. Die Abschlussberichte aus den Institutionen dahingegen haben einen anderen Fokus und sind nicht so umfangreich, weswegen sie meist keine ausreichende Informationsgrundlage für eine Einschätzung der Variablen darstellen. Eine bedingte Entlassung wird häufig dann verwehrt, wenn das Verhalten während des Vollzugs als mangelhaft eingeschätzt wird; wenn beispielsweise der Umgang mit dem Personal der Vollzugseinrichtung oder Mitinsassen unangemessen war oder bereits neue Delikte begangen wurden. Dies ist häufig ein Zeichen für eine problematische Einstellung in Bezug auf Normen und Gesetze und dementsprechend ein Indikator für künftige Delinquenz.

Zusätzlich kann Bewährungshilfe auch dann nicht angeordnet werden, wenn kein Resozialisierungsauftrag in die Schweiz besteht. Dies ist dann der Fall, wenn eine gerichtlich angeordnete Landesverweisung oder eine migrationsrechtliche Ausweisung im Raum steht. Nicht selten ist es jedoch so, dass diese Personen aus politischen oder völkerrechtlichen Gründen nicht ausgeschafft werden können (beispielsweise aufgrund von Ausschaffungen in Kriegs- und Krisengebiete oder wenn das Heimatland die Aufnahme verweigert). Unter den nichteingeschätzten Fällen befinden sich einerseits überproportional viele Personen ohne Schweizer Staatsbürgerschaft und andererseits viele Personen ohne angeordnete Bewährungshilfe. Ebenfalls ist in dieser Gruppe das Vorkommen von Verstößen gegen das Ausländergesetz (das das Aufenthaltsbestimmungsrecht in der Schweiz regelt) sowohl in der Vorstrafe als auch in der Rückfälligkeit deutlich höher. Insbesondere bezüglich der Rückfälligkeit können diese Verstöße nur von Personen begangen worden sein, die sich illegal in der Schweiz aufgehalten haben oder illegal in die Schweiz zurückgekehrt sind. Die Definition der exakten Zahl der Personen, die irgendwann im Verlauf des Untersuchungszeitraumes tatsächlich des Landes verwiesen wurden, ist aufgrund der migrationsrechtlichen Praxis in der Schweiz erheblich erschwert (Einspruchsmöglichkeiten mit aufschiebender Wirkung der Ausschaffung). Es bleibt grundsätzlich abzuwägen, ob Personen, die des Landes verwiesen werden sollen, in die Analyse einbezogen oder ausgeschlossen werden. In der vorliegenden Stichprobe hat der Miteinbezug oder Ausschluss dieser Population, aufgrund der oben dargelegten Zusammenhänge, kaum Einfluss auf die Rückfalldaten der eingeschätzten Personen. In Bezug auf die nichteingeschätzten Personen sind folgende Auswirkungen anzunehmen. Bei Nichtberücksichtigung werden potenziell Personen ausgeschlossen, die in der Schweiz rückfällig werden, weil sie das Land nicht verlassen (können). Zudem können Rückfälle, die im Ausland begangen wurden, nicht erfasst werden. Bei einem Miteinbezug bleiben diese Rückfälle im Ausland ebenfalls unerkannt. Erneute Delinquenz von Personen, die trotz geplanter Ausweisung in der Schweiz bleiben, fließt jedoch in die Berechnungen mit ein. In beiden Fällen wird die tatsächliche Rückfälligkeit potenziell unterschätzt. In Loewe-Baur (2017) wurden Personen, welche die Schweiz nach Verbüßen der Sanktion potenziell verlassen müssen, aus den Berechnungen zur Rückfälligkeit ausgeschlossen, in der vorliegenden Erhebung hingegen mitberücksichtigt, weil obige Erläuterungen nahelegen, dass die Verzerrung dadurch geringer ausfällt.

Grundsätzlich lässt sich festhalten, dass der Unterschied in den Rückfallraten zwischen eingeschätzten und nichteingeschätzten Fällen ein potenzieller Hinweis darauf ist, dass, insbesondere im Bereich der Allgemeindelinquenz, eine Bewährungshilfe einen zusätzlichen, wertvollen Beitrag zur Senkung des Rückfallrisikos leistet.

Kritik

Bezüglich der Validität lässt sich festhalten, dass die Variablen zwar alle auf ausgiebiger Literaturbasis beruhen (hierzu Treuthardt und Kröger 2021) und an andere bestehende, validierte Tests angelehnt sind, jedoch keine explizite Validierung derselben stattgefunden hat.

Die Untersuchung der Interrater-Reliabilität kann nur eingeschränkt interpretiert werden. Dies ist der Tatsache geschuldet, dass die Einschätzung durch die Rater lediglich in 4 der ursprünglich 201 eingeschätzten Fällen erfolgen konnte. Wünschenswert wäre die Einschätzung einer größeren Stichprobe. Jedoch ist es üblich und legitim, bei zeit- oder kostenaufwendigen Untersuchungen, die Interrater-Reliabilität anhand kleinerer Stichproben zu betrachten (Hallgren 2012). Aufgrund der hohen Zeitintensität der Einschätzung der Variablen wurde dies hier so praktiziert.

Bezüglich der Interrater-Reliabilität zeigt sich generell, dass nicht alle ursprünglich zur Veränderungsmessung konstruierten Variablen zu beiden Messzeitpunkten übereinstimmend eingeschätzt werden konnten. Ein entscheidender Grund für die Unterschiede der Reliabilität zu den verschiedenen Zeitpunkten könnte, wie oben ausgeführt, sein, dass die Bewertung auf der Basis sehr unterschiedlicher Informationsgrundlagen erfolgten musste. Dies ist in den unterschiedlichen Foci zu Beginn bzw. am Ende einer Sanktion begründet.

Ergänzend ist zu erwähnen, dass ein reger Austausch zwischen den fallbeteiligten Personen im ROS-Prozess verankert ist. Dies bedeutet insbesondere, dass Fälle regelmäßig besprochen und Einschätzungen begründet werden müssen. Wichtig ist hierbei, dass alle Beteiligten dieselben Begrifflichkeiten und Konzepte verwenden. Explizit bedeutet das nicht, dass jede Person dieselbe Einschätzung treffen soll. Eine Diskrepanz zwischen Wertungen bedeutet also weniger ein Problem, sondern kann vielmehr als Hinweis für einen intensiveren Austausch gewertet werden.

Ein weiterer Kritikpunkt ist, dass zwar die Zusammenhänge der einzelnen Variablen im Verlauf sowie zur Passung und zum Rückfall untersucht werden konnten, die Erstellung eines Modells zur Varianzaufklärung jedoch nicht möglich war. Dies ist darin begründet, dass die Variablen untereinander hoch korrelieren und dementsprechend nicht unabhängig voneinander in einem Modell gerechnet werden können.

Fazit und Ausblick

Die konzipierte Veränderungsmessung scheint grundsätzlich sinnvoll zu sein, erkennbar an der Bestätigung des Großteils der auswertbaren Hypothesen. Sowohl die personenbezogenen Veränderungsmaße des Veränderungspotenzials bzw. der Prozessvariablen als auch die übergeordnete Ausprägung des personen- und umweltbezogenen Problemprofils weisen stabile, wenn auch geringe, Zusammenhänge zur Rückfälligkeit auf.

Bei einer potenziellen Einführung der vorgestellten Variablen in ROS wäre einerseits entscheidend, eine einheitlichere Bewertungsgrundlage zu schaffen. Dies könnte beispielsweise eine weitere Standardisierung von Eintrittserhebungen, Fallbesprechungen und Berichterstattungen umfassen. Andererseits sollte die Einschätzung der Variablen gezielt geschult werden. Schulungen sind bereits ein wichtiger Bestandteil des ROS-Konzepts und werden regelmäßig für die (neuen) Mitarbeitenden durchgeführt, um den Qualitätsstandards gerecht zu werden. Eine Erweiterung könnte nun einerseits eine einheitlichere Datengrundlage in den Dossiers bewirken. Andererseits könnte so – auch auf Basis der dann neu fokussierten Dokumentation – gezielt die Einschätzung der Variablen trainiert werden.

Insbesondere in Bezug auf Vollzugslockerungen oder Entlassungen liefern die Prozessvariablen dahingehend einen Mehrwert, als dass sie kurzfristigere Veränderungen abbilden können, als dies die Ausprägung des umwelt- und personenbezogenen Problemprofils ermöglicht. So können v. a. die einzelnen Faktoren der Bereiche Wollen, Wissen und Können Entwicklungen beispielsweise innerhalb des letzten Jahres anschaulich darstellen. Dies ermöglicht es, Lockerungsentscheidungen standardisierter und nachvollziehbarer zu begründen.

Insgesamt scheinen die Variablen der Veränderungsmessung in Form von Veränderungsmotivation und Prozessvariablen eine sinnvolle, aussagekräftige und bereichernde Erweiterung im ROS-Prozess zu sein. Im Bereich der umweltbezogenen Messung besteht bezüglich einer reliablen Erfassungsmethode noch deutlicher Verbesserungsbedarf.

Des Weiteren stützen die Erkenntnisse den holistischen Ansatz aus personen- und umweltbezogener Arbeit mit den Straftäterinnen und Straftätern. Dies bestätigt einerseits das Konzept von ROS und kann andererseits ein Anstoß sein, die Auswirkungen der Bearbeitung umweltbezogener Aspekte vertieft zu betrachten und zu integrieren.

Ebenfalls kann festgehalten werden, dass die Rückfälligkeit seit Einführung von ROS deutlich zurückgegangen ist. Das ist insofern enorm wichtig, als dass ROS mit dem Ziel eingeführt wurde, Rückfälle zu vermeiden sowie eine nachhaltige Resozialisierung der verurteilten Person zu fördern. Die gewonnenen Erkenntnisse können also als Erfolg gewertet und gleichzeitig als Ziel genommen werden, ROS weiter zu optimieren.