Hintergrund und Fragestellung

Wirksamkeitsforschung ist neben Wirkungsforschung, Versorgungsforschung und Grundlagenforschung eine relevante Komponente der Psychotherapieforschung (Rieß 2013). Evaluation ist sowohl aus der Perspektive der PatientInnen wie auch aus jener der BehandlerInnen und Kostenträger essentiell. Lutz (2018, in Wampold et al. 2018) plädiert für die Verbesserung der Evidenzbasierung von Psychotherapie, damit diese weiterentwickelt und als wissenschaftlich fundiertes Verfahren zur Behandlung psychischer Störungen gesellschaftlich anerkannt wird.

Klinische Studien stellen eine häufige Methode der Wirksamkeitsforschung dar und werden wegen des Einsatzes trainierter TherapeutInnen und homogenisierter Klientel häufig kritisiert (Wampold et al. 2018). Studien in naturalistischen Settings sind daher wichtig um zu prüfen, ob die in klinischen Studien gefundenen Effekte auch unter realen Bedingungen erzielt werden können. Dabei sind Kontrollgruppendesigns schwer realisierbar. Die Bemühungen zur Psychotherapieforschung in Österreich sind vielfältig, aber die Studienlage ist noch ausbaufähig.

In einer Wartelistenkontrollstudie der ambulanten Rehabilitation in der BBRZ-MED aus dem Jahr 2015 konnte zwischen Beginn und Ende der Behandlung in der Reduktion der depressiven Symptomatik ein Effekt von d = 0,75 belegt werden. In der Wartekontrollgruppe zeigte sich ein kleiner Effekt von d = 0,30 (Rabenstein et al. 2015). In einer Meta-Analyse für die psychiatrische Rehabilitation in Österreich wurde in neun Studien ein mittlerer Effekt (Hedges’g = 0,53) zwischen Beginn und Ende der Behandlung ermittelt (Sprung et al. 2019).

Evaluationsergebnisse für Psychotherapie im stationären Setting werden z. B. von Liebherz und Rabung (2013) berichtet. Sie fanden in 103 Studien einen mittleren Effekt von g = 0,71 (vergleichbar mit Cohen’s d) und für die psychische Symptomatik einen mittleren Effekt von g = 0,84 (KI: 0,78–0,89). Bei den Studien mit katamnestischen Befragungen zeigte sich sogar ein etwas größerer Effekt als beim Entlassungszeitpunkt, was für die Stabilität der Ergebnisse spricht. Die Autoren empfehlen für die Bewertung von Prä-Post-Effekten ohne Vergleichsgruppe den Richtwerten von Cohen den Wert von d = 0,1 hinzuzufügen (Cohen 1988), weil dieser Effekt auch ohne Behandlung zu erwarten wäre. Danach sind folgende Grenzwerte für die Interpretation von Effekten anzuwenden: d > 0,3 (kleiner Effekt), d > 0,6 (mittlerer Effekt) und d > 0,90 (großer Effekt) (Liebherz und Rabung 2013). Einen Effekt von d = 0,8 beim Vergleich von Psychotherapie vs. keiner Behandlung berichten auch Wampold et al. (2018) in einer Zusammenfassung über die Resultate von über 500 Studien.

Eine wichtige Vergleichsstudie für das Setting der Rehabilitation ist die MESTA-Studie, in der zwischen Aufnahme und Entlassung ein mittlerer Effekt von d = 0,57 angegeben wird, der allerdings beim Katamnesezeitpunkt mit d = 0,49 etwas geringer ist (Steffanowski et al. 2007). Bei diesen Studien kann aber davon ausgegangen werden, dass viele in einem naturalistischen Setting durchgeführt wurden.

Zur Bewertung der Wirksamkeit werden von der DKPM-Arbeitsgruppe „Klinische Psychodiagnostik und Psychometrie“ fünf zentrale Dimensionen vorgeschlagen: Symptomschwere, gesundheitsbezogene Lebensqualität, Interpersonelle Beziehungsgestaltung, Affektregulation und Selbstwirksamkeit. Diese Dimensionen sollen zu einer Harmonisierung der Therapie-Wirksamkeitsmessung im deutschsprachigen Raum beitragen (Rabung et al. 2019).

Verhaltenstherapie im Setting ambulante Rehabilitation

Psychiatrische Rehabilitation wird in Österreich in ambulanter und stationärer Form entlang des sog. medizinischen Leistungsprofils der Pensionsversicherungsanstalt (dem hauptsächlichen Kostenträger medizinischer Rehabilitation in Österreich) durchgeführt und entspricht einer WHO Phase 2 Rehabilitation (Reiter et al. 2012). Während stationäre psychiatrische Rehabilitationsaufenthalte ggf. auf 8 Wochen verlängert werden können, ist dies, entsprechend den Vorgaben der Pensionsversicherungsanstalt, für die ambulante psychiatrische Rehabilitation nicht möglich.

Im Rahmen der 6‑wöchigen ambulanten psychiatrischen Rehabilitation werden insgesamt 142 Einheiten mit folgender Verteilung angeboten: Psychotherapie 54, Ergotherapie 36, Physiotherapie 18, Sozialarbeit 12, flexible Einheiten 15, sog. nicht-therapeutischen Einheiten, z. B. (Fach‑)Ärztliche Untersuchungen 7.

Das Zentrum für seelische Gesundheit BBRZ-Med Wien-Leopoldau (http://www.bbrz-med.at) wurde 2010 als erste ambulante psychiatrische Rehabilitationsklinik in Österreich gegründet (Lenz und Reschauer 2012). Therapien in der 6‑wöchigen Phase 2 Rehabilitation finden ganztags (Montag bis Freitag), in störungsspezifischen Gruppen von maximal 12 PatientInnen statt.

Die Therapien im multidisziplinären Rehabilitationsteam werden in den Zentren für seelische Gesundheit Wien (Standorte Wien-Leopoldau und Zweigstelle Wien-Simmering) entlang eines standardisierten verhaltenstherapeutischen Therapieprogramms durchgeführt. Die psychotherapeutischen Behandlungen bestehen aus zweimal pro Woche störungsspezifische (z. B. Schwerpunkt Depression oder Angst) Gruppenpsychotherapie (je 1½ Einheiten à 50 min), einmal pro Woche Einzelpsychotherapie (eine Einheit à 50 min), sowie wöchentliche störungsübergreifende Psychotherapien wie z. B. Achtsamkeitstraining, Skillstraining, oder Soziales Kompetenztraining (1½ Einheiten à 50 min).

Die psychotherapeutischen Gruppenangebote werden von erfahrenen PsychotherapeutInnen anhand von für das 6‑wöchige Programm erstellten bzw. adaptieren verhaltenstherapeutischen Manualen durchgeführt.

Die Messung des Behandlungserfolgs basiert primär auf „Patient reported Outcomes“ (PROs), also standardisierten Fragebögen. Durch das eingesetzte Assessment werden zentrale Dimensionen gut abgedeckt. Die Symptombelastung wird mittels BSI-18 – Brief Symptom Inventory-18 (Franke et al. 2017) – und BDI II – Beck Depressionsinventar (Hautzinger et al. 2006) – gemessen. Die Gesundheitsbezogene Lebensqualität wird mittels WHODAS 2.0 – World Health Organization Disability Assessment Schedule 2.0 (Üstün et al. 2010) erhoben. Die Selbstwirksamkeit wird mit dem ICF 3F AT – Fragebogen für Aktivitäten und Teilhabe (Nosper 2008) erfasst. Interpersonale Aspekte werden mit dem YSQ-S3 – Schema-Fragebogen (Young 2005) und dem SMI – Schema Mode Inventory (Reiss et al. 2012) umfangreich erhoben. Zusätzlich werden die subjektiv eingeschätzte Therapieziel-Erreichung sowie die Erfolgs- und Beziehungszufriedenheit mit dem HAQ – Helping Alliance Questionnaire (Nübling et al. 2017) erfasst. Dieses umfangreiche Assessment ermöglicht neben der Statusdiagnostik eine detaillierte Analyse von Verläufen und Zusammenhängen. Im Fokus dieser Studie steht jedoch nur die depressive Symptomatik.

Fragestellungen

  • Wie kann der Behandlungserfolg, gemessen an der Reduktion der depressiven Symptomatik, bei Behandlungsende und ein Jahr danach im Vergleich zu klinischen Studien und Ergebnissen aus der Psychotherapieforschung bewertet werden?

  • Welche Effektgrößen zeigen sich in Abhängigkeit von der Ausgangssymptomatik?

  • Wie ist die klinische Relevanz der Veränderungen zu bewerten?

Studiendesign und Untersuchungsmethoden

Die Diagnosen wurden bei Ende der Rehabilitation durch FachärztInnen für Psychiatrie und Psychotherapeutische Medizin nach ICD-10 (Dilling 2011) gestellt. Die Befragung erfolgte schriftlich bei Beginn und Ende sowie ein Jahr nach Ende der Rehabilitation. Neben Angaben zur Person und zur Erkrankung wurde das Beck Depressions-Inventar Revision (BDI–II) eingesetzt. Die 21 Items repräsentieren charakteristische Symptome und Einstellungen auf einer vierstufigen Skala. Die Aussagen stammen nicht aus einer spezifischen Depressionstheorie, sondern beruhen auf klinischen Symptombeschreibungen. Durch Addition wird ein Gesamtwert ermittelt, der in fünf Schweregrad-Klassen zusammengefasst werden kann, von „keiner Depression“ bis zu „schwere Depression“. Für signifikante Veränderungen wird ein cutoff-Wert von 8 Punkten angegeben (Hautzinger et al. 2006).

Die statistischen Analysen wurden mit SPSS 25.0 (IBM Corp 2017) durchgeführt und Graphiken zusätzlich mit tableau (Tableau Software Inc. 2017) angefertigt.

Veränderungen zwischen den Messzeitpunkten wurden mit Varianzanalysen mit Messwiederholung auf Signifikanz geprüft und die Bedeutsamkeit der Veränderung wird mit Cohen’s d angegeben.

Die klinische Signifikanz ermöglicht auf Einzelfall-Ebene Aussagen über das Erreichen des Mindestausmaßes einer reliablen Symptomreduktion verbunden mit dem Wechsel vom dysfunktionalen in den funktionalen Bereich. Sie ist gegeben, wenn PatientInnen vom auffälligen in den Bereich der „Normalpopulation“ wechseln, und damit als „geheilt“ klassifiziert werden können (Schmidt-Atzert et al. 2012).

Für die vorliegende Arbeit wird der Wechsel vom dysfunktionalen in den funktionalen Bereich am Unterschreiten der Ausprägung von 14 Punkten festgemacht. Der Wertebereich von 0 bis zu 8 Punkten wird von den Autoren mit „keine Depression“ und im Bereich von 9 bis 13 Punkten mit „minimaler Depression“ beschrieben. Ein Differenzwert von 8 oder mehr Punkten weist auf eine signifikante Veränderung hin. PatientInnen die sich innerhalb des unauffälligen Bereichs (signifikant) verändern, werden gesondert ausgewiesen. Daraus ergeben sich die in Tab. 1 dargestellten Ergebniskategorien.

Tab. 1 Definition von Veränderungskategorien im Beck Depressions-Inventar (BDI–II)

Stichprobenbeschreibung

Im Zeitraum 2014 bis 2018 haben 3901 PatientInnen eine ambulante psychiatrische Rehabilitation absolviert, in 16,8 % der Fälle wurde die Behandlung abgebrochen. Die Teilnahme an der schriftlichen Befragung ist grundsätzlich freiwillig, aber beinahe 90 % der PatientInnen bearbeiteten die psychometrischen Verfahren. Voraussetzung für den Einschluss in diese Studie war das Vorliegen aller drei Messzeitpunkte (Beginn und Ende sowie ein Jahr nach Ende der Rehabilitation). Bei der Befragung ein Jahr nach Reha-Ende haben 1032 PatientInnen teilgenommen (31,8 % der abgeschlossenen Fälle), allerdings konnten aufgrund fehlender Werte nur 837 Fälle in die Analyse einbezogen werden, das sind 25,8 % der abgeschlossenen Fälle (Abb. 1).

Abb. 1
figure 1

Patient-Flow Diagramm

Die Stichprobe setzt sich aus 64,5 % Frauen und 35,5 % Männern zusammen und weist ein Durchschnittsalter von 45,25 Jahren auf (SD = 9,49). Die Muttersprache ist überwiegend Deutsch (87,1 %) und 94 % besitzen die österr. Staatsbürgerschaft. Knapp 1/3 der Befragten ist verheiratet (31,3 %) und 4,9 % leben in einer eingetragenen Partnerschaft. Die übrigen PatientInnen sind ledig (35,5 %), leben getrennt/geschieden (26,1 %) oder sind verwitwet (2,2 %). Mehr als die Hälfte der Befragten hat Kinder (56,9 %).

Der größte Anteil der PatientInnen bezieht Arbeitslosen- oder Notstandsgeld (48,1 %) und 33,6 % sind berufstätig. Reha-Geld oder Pension wird von 14,3 % bezogen und 4 % haben sonstige Einkünfte.

Der überwiegende Anteil der PatientInnen weist als Hauptdiagnose eine affektive Störung (F3) auf (N = 589; 70,4 %) und 19,4 % weisen eine neurotische, Belastungs- oder somatoforme Störung auf (F4; N = 162). Eine Persönlichkeitsstörung (F6) wird bei 34 PatientInnen diagnostiziert (4,1 %) und in 52 Fällen liegt eine andere Diagnose vor (6,1 %).

Alle Diagnosen zusammengenommen (Hauptdiagnose und mögliche Komorbiditäten) zeigt sich bei 76,6 % eine depressive Störung (bei 29,4 % eine nicht-chronische und bei 47,2 % eine chronische Form) und nur 23,4 % weisen keine depressive Störung auf. Komorbiditäten werden bei 58,2 % der PatientInnen erhoben.

Ergebnisse

Bewertung des Behandlungserfolgs bei Reha-Ende gemessen an der Reduktion der depressiven Symptomatik

Bei Beginn der Behandlung weisen die PatientInnen im BDI–II im Durchschnitt einen Wert von 22,80 Punkten (SD = 10,98) auf (mittelschwere Depression). Bei der kategorialen Analyse zeigt sich, dass 9,9 % bei Beginn keine relevanten und 13,6 % minimale Depressionssymptome aufweisen. Weitere 16,6 % weisen leichte und 27,7 % Symptome einer mittelschweren Depression auf. Die größte Gruppe sind PatientInnen mit einer schweren Depression (31,2 %).

Bei Reha-Ende weist die Gruppe einen Mittelwert von 16,36 Punkten (SD = 11,17) auf (leichte Depression) und eine mittlere Effektgröße von d = 0,58 (CI: 0,48–0,68) auf. Am Ende der Behandlung fallen 27,7 % in die Kategorie „keine Depression“ und weitere 18,4 % in die Kategorie minimale Depressionssymptome (leichte Depression 18,8 % und mittelschwere Depression 18,9 %). Schließlich hat sich der Anteil in der Kategorie schwere Depression mit 16,2 % beinahe halbiert.

Nachhaltigkeit des Behandlungserfolgs ein Jahr nach Ende der Behandlung

Ein Jahr nach Ende der Behandlung weist die Gruppe im BDI–II einen Mittelwert von 18,18 Punkten (SD = 13,11) auf, das entspricht einem etwas kleineren Effekt von d = 0,38. Aber es finden sich immer noch 27 % in der Kategorie ohne und 15,1 % in der Kategorie mit minimaler Depression (16,4 % leichte und 18,6 % mittelschwere Depression). Schließlich finden sich in der Kategorie mit schweren Depressionssymptomen 22,9 %, das ist etwas mehr als bei Behandlungsende, aber deutlich weniger als bei Behandlungsbeginn.

Unterschiede in den Effektgrößen in Abhängigkeit von der Ausgangssymptomatik

Bei der Varianzanalyse mit Messwiederholung für die Messzeitpunkte A (Beginn), E (Ende) und Z (1 Jahr nach Ende der Behandlung) zeigt sich ein signifikanter Effekt für die Zeit und für die Interaktion Zeit*Depressionsschwere (Tab. 2). Die post hoc Tests zeigen, dass sich alle fünf Gruppen signifikant voneinander unterscheiden.

Tab. 2 Varianzanalyse mit Messwiederholung und Interaktionseffekt für die Depressionssymptomatik

Deutliche Unterschiede zeigen sich bei den Effektgrößen zwischen den fünf Gruppen (Tab. 3). Je stärker die depressive Symptomatik bei Behandlungsbeginn ausgeprägt ist, desto größer ist der Effekt. PatientInnen mit einer mittelschweren oder schweren Depression weisen sogar noch ein Jahr nach Ende der Behandlung große Effekte auf, während jene mit einer minimalen oder leichten Depression ein Jahr nach der Behandlung nur mehr einen mittleren Effekt aufweisen. PatientInnen mit einer schweren Depression am Beginn der Behandlung profitieren zwar sehr gut, weisen aber am Ende der Behandlung und ein Jahr später immer noch Symptome im Bereich einer mittelschweren Depression auf.

Tab. 3 Mittelwerte, Standardabweichungen und Effektgrößen für das BDI II in Abhängigkeit von der Depressionsschwere bei Beginn

Bewertung der klinischen Relevanz von Veränderungen

Das Konzept der klinischen Signifikanz erfordert die Erfüllung von zwei Bedingungen – eine reliable Verbesserung um ein Mindestmaß und den Wechsel vom dysfunktionalen in den funktionalen Bereich. Aus der Kombination dieser beiden Anforderungen ergeben sich sechs verschiedene Ergebniskategorien (Tab. 1). Zwei dieser Kategorien betreffen PatientInnen, die immer im unauffälligen Bereich liegen oder innerhalb dieses Bereichs signifikante Veränderungen zeigen. Diese beiden Gruppen machen am Ende der Behandlung immerhin 21,9 % und ein Jahr später 18,8 % der Stichprobe aus. Gut 1/3 der PatientInnen zeigt weder am Ende der Behandlung noch ein Jahr später eine signifikante Veränderung der depressiven Symptomatik (Abb. 2).

Abb. 2
figure 2

Klinisch signifikante Veränderungen zwischen Beginn und Ende der Behandlung sowie zwischen Beginn der Behandlung und ein Jahr danach

Ein kleiner Teil (3,5 %) verschlechtert sich zwischen Beginn und Ende der Behandlung, ein Jahr danach ist der Anteil mit 11,7 % größer. Diese Fälle verteilen sich auf alle Gruppen mit unterschiedlicher Ausgangsbelastung und machen jeweils zwischen 10,5 und 14,5 % aus. Man kann also nicht sagen, dass eine Verschlechterung der Symptomatik vom Ausgangswert abhängt.

Der berufliche Status hängt hingegen mit den Veränderungen zusammen. Unter den Berufstätigen verschlechtern sich nur 5 %, aber unter Reha-Geld-BezieherInnen sind es 21 %. Existenzielle Sorgen spielen offenbar eine Rolle bei der Entwicklung der Symptomatik, aber auch in dieser Gruppe verbessern sich 24,2 % signifikant.

Die beiden erfolgreichen Gruppen machen zusammengenommen bei Ende der Behandlung 37,3 % und ein Jahr später 32,5 % aller Fälle aus. Unter den Berufstätigen gibt es ein Jahr nach der Behandlung 40,6 % signifikante oder klinisch signifikante Verbesserungen, aber auch in der großen Gruppe der Arbeitslosen sind es immerhin 29,8 %.

Diskussion

Die Bewertung des Behandlungserfolgs anhand von Patient reported Outcomes hat sich bewährt. Eine Stärke der Studie ist die Stichprobengröße und die Gegebenheit, dass fast alle RehabilitandInnen an den Befragungen teilnehmen. Bei Beginn und Ende der Behandlung können beinahe vollständige Daten erhoben werden, und sogar ein Jahr später sind viele PatientInnen noch bereit an der Befragung teilzunehmen. Die Fragebögen können eine Herausforderung für stark depressive PatientInnen sein, sie erhalten aber Unterstützung und genügend Zeit für die Bearbeitung.

Zwischen Beginn und Ende der Behandlung zeigt sich ein mittlerer Effekt von d = 0,58 für die Gesamtstichprobe, der ein Jahr später etwas geringer immer noch nachgewiesen werden kann (d = 0,38). Hier offenbart sich aber auch die Schwäche des Ansatzes der Effektgrößen. Bis auf die Teilgruppe ohne relevante Depressionssymptome weisen alle Gruppen Effekte über d = 1,00 auf. Einzelne Subgruppen haben den Effekt der Behandlung auch ein Jahr nach Ende der Behandlung relativ gut halten können und die Effekte sind vergleichbar mit den Ergebnissen vieler Psychotherapiestudien (Liebherz und Rabung 2013; Sprung et al. 2019; Wampold et al. 2018). Beachtlich ist aber, dass die Veränderungen im naturalistischen Setting in nur sechs Wochen Behandlungszeit erzielt werden konnten.

Bei der Befragung ein Jahr nach Reha-Ende haben 56,5 % der RehabilitandInnen angegeben in regelmäßiger psychotherapeutischer Behandlung zu sein bzw. eine solche abgeschlossen zu haben. Der Differenzwert in der Depressionssymptomatik zwischen Beginn und Jahreskatamnese ist bei dieser Gruppe um einen Punkt höher als in der Gruppe ohne Psychotherapie, der Unterschied ist allerdings nicht signifikant (p = 0,195). Über 300 RehabilitandInnen haben angegeben, warum sie keine Psychotherapie in Anspruch nehmen: 23,6 % sehen keinen Bedarf, 4,5 % haben die Behandlung abgebrochen, 10,5 % stehen auf der Warteliste für einen Kassenplatz und dem größten Teil (42,4 %) fehlen die finanziellen Mittel. Sonstige Gründe wurden von 19,0 % angegeben, einige von ihnen absolvieren die Rehabilitation Phase 3. Die Leistbarkeit von Psychotherapie ist bei dieser Klientel der Hauptgrund für die Nicht-Fortführung der psychotherapeutischen Behandlung.

Psychotherapieforschung und Evaluation können einen wertvollen Beitrag für die Bewertung von Behandlungseffekten und für die weitere Behandlungsplanung leisten. PatientInnen mit schwerer Symptomatik profitieren sehr gut vom verhaltenstherapeutischen Setting, aber die Ergebnisse machen die Notwendigkeit einer weiteren (psychotherapeutischen) Behandlung deutlich. Die vollständige Evaluation aller Behandlungen ermöglicht zudem eine Vorhersage, welche Gruppen von PatientInnen ein höheres Risiko für eine Verschlechterung aufweisen. Wampold et al. (2018) sehen ein vorrangiges Ziel der Psychotherapieforschung darin, ein Augenmerk auf jene PatientInnen zu legen, die von einer Behandlung nicht profitieren. Hier müssen Methoden und Settings gefunden werden, damit auch diesen Menschen geholfen werden kann.

Für eine langfristige Stabilisierung chronifizierter PatientInnen ist eine Kurzzeittherapie wie etwa im vorgestellten ambulanten Rehabilitationssetting nicht ausreichend. Auch wenn ein Jahr nach Ende der Behandlung bei anfangs stark depressiven RehabilitandInnen immer noch große Effekte nachweisbar sind, zeigt sich die dringende Notwendigkeit einer nachfolgenden psychotherapeutischen Begleitung im niedergelassenen Bereich oder im Rahmen einer anschließenden Phase 3 Rehabilitation.

Die vorliegende Arbeit verdeutlich aber auch die Bedeutung der KlientInnenmerkmale und der extratherapeutischen Faktoren. Die Veränderung der Symptomatik hängt mit den Lebensumständen der PatientInnen zusammen, existenzielle Sorgen und ein wenig unterstützendes Umfeld erschweren Veränderungen.

Limitationen

Eine Limitation ergibt sich durch die Fragestellung zur Nachhaltigkeit, da nur Fälle mit katamnestischen Daten einbezogen werden konnten, und der Rücklauf ein Jahr danach nur bei 25 % liegt. Durch das multiprofessionelle Setting tragen Einflüsse verschiedener Berufsgruppen zur Verbesserung bei, und die Wirkung der Psychotherapie kann nicht isoliert betrachtet werden. Ein Vergleich mit einer Kontrollgruppe ist in diesem Setting nicht möglich, da Versicherte einen Rechtsanspruch auf die Rehabilitation haben und nicht einer Kontrollgruppe oder einer alternativen Behandlung zugewiesen werden können.