Im Folgenden wird die Entwicklung und Validierung der Therapeutenversion einer Prozessskala zur Erfassung der Behandlungstechnik in Katathym Imaginativer Psychotherapie (KIP), Hypnosepsychotherapie (HY) und Autogener Psychotherapie (ATP) vorgestellt. Wir zählen diese drei Therapieformen zu den imaginations- und trancebasierten tiefenpsychologischen Methoden.

Die Erfassung therapeutischer Interventionen in der Psychotherapieprozess- und Prozess-Ergebnisforschung konzentriert sich bislang vorrangig auf die traditionellen behandlungstechnischen Charakteristika von kognitiv behavioralen und tiefenpsychologischen Therapien. Die Integration von therapeutischen Techniken, die nicht genuin diesen beiden Therapieschulen zugerechnet werden, kann in solcher Forschung bislang nur schwer berücksichtigt werden. Für die spezifischen Merkmale vieler integrativer Methoden liegen gegenwärtig noch keine passenden Erhebungsinstrumente vor. Unter integrativen tiefenpsychologischen Methoden verstehen wir solche, die einerseits von einem psychoanalytisch begründeten Verständnis von Pathogenese ausgehen und ihre therapeutische Arbeit an psychodynamischen Grundprinzipien, wie der Arbeit mit Gegenübertragung, Abwehr und Widerstand, ausrichten, die aber andererseits auch Behandlungstechniken verwenden, die traditionell nicht zum festen Kanon tiefenpsychologischer Interventionen gehören. Hierzu zählen die imaginations- und trancebasierten tiefenpsychologischen Methoden, also Methoden auf Basis der systematischen Integration von dialogisch begleiteten Imaginationen oder hypnotischen Trancen in ein tiefenpsychologisches Behandlungskonzept.

Die spezifischen Auswirkungen von Imaginationen und Trancen auf Prozess und Ergebnis der Therapie in diesen Verfahren sind bislang nur vereinzelt systematisch untersucht worden. Die bestehende Forschung erfolgte dabei zumeist in konzeptuell orientierten Einzelfallstudien (z. B. Wilke 1982; vgl. Übersicht bei Stigler und Pokorny 2012). Wir gehen davon aus, dass der Anschluss dieser Verfahren an die gegenwärtigen Paradigmen der Psychotherapieforschung gleichermaßen ein Gewinn für die Verfahren wäre, wie auch eine Bereicherung des Wissens über die Wirkweise integrativer tiefenpsychologischer Psychotherapie im Allgemeinen. Eine wichtige Vorarbeit für eine solche Anbindung von KIP, HY und ATP an die Psychotherapieforschung ist die Entwicklung von Untersuchungsmethoden, die eine empirische Erfassung ihrer spezifischen Behandlungstechnik ermöglichen. Es braucht also Methoden, welche den therapeutischen Prozess in diesen Verfahren psychometrisch erschließen und somit auch als Maß für die, in kontrollierten Wirksamkeitsstudien oft geforderte, Verfahrenstreue (Adhärenz) in den entsprechenden Therapien eingesetzt werden könnten. Weiterhin eröffnen solche Messinstrumente, die beispielsweise einen Abgleich von geplanten und tatsächlich durchgeführten Interventionen erlauben, Möglichkeiten für eine empirisch fundierte Weiterentwicklung der Behandlungstechnik in den Methoden.

Psychotherapieprozessforschung: Die Comparative Psychotherapy Process Scale (CPPS)

Ein zentraler Ansatz in der aktuellen Prozessforschung besteht darin, jenseits der offiziellen Zugehörigkeit eines Therapeuten zu einer bestimmten Tradition oder Therapieschule, die konkret durchgeführten Techniken und Interventionen zu erfassen und in Zusammenhang mit relevanten Prozess- und Ergebnisvariablen zu bringen. Der Goldstandard ist hier die Fremdbeobachtung der Therapiesitzungen anhand von Audio- oder Videoaufzeichnungen. Eine ökonomische Alternative zu diesem sehr aufwendigen Vorgehen besteht im Einsatz von Therapeuten- oder Patientenversionen etablierter Messinstrumente zur Verfahrenstreue (Adhärenz; vgl. Wiltink, et al. 2010). Therapeuten und/oder Patienten geben hierbei an, inwiefern eine bestimmte Art des Vorgehens Teil der Behandlung gewesen war. Ein gut validiertes Instrument dieser Art stellt die Comparative Psychotherapy Process Scale (CPPS; Hilsenroth, et al. 2005) dar. Die CPPS erlaubt Aussagen darüber, inwiefern therapeutische Techniken und Interventionen, die in der Literatur klassischerweise entweder psychodynamisch-interpersonellen oder kognitiv-behavioralen Ansätzen zugeschrieben werden, im Rahmen eines spezifischen therapeutischen Prozesses oder einer bestimmten Therapiesitzung realisiert wurden. Dabei können sowohl geplante, als auch laufende und abgeschlossene Therapien untersucht werden.

In der Vergangenheit wurde die CPPS bereits erfolgreich um Items für andere Interventionsformen erweitert, z. B. um solche Techniken, die spezifisch relevant sind für die psychodynamische und kognitiv-behaviorale Behandlung von Bulimia Nervosa (CPPS-BN; Thompson-Brenner und Westen 2005).

Imagination und Trance: Katathym Imaginative Psychotherapie (KIP), Hypnosepsychotherapie (HY), Autogene Psychotherapie (ATP)

KIP, HY und ATP zählen zu den staatlich anerkannten wissenschaftlich-psychotherapeutischen Methoden in Österreich (Dittrich 2012). Laut dem österreichischen Bundesministerium für Gesundheit (2014) sind sie den Methoden mit psychodynamisch-tiefenpsychologischer Orientierung zuzuordnen. Die KIP ist darüber hinaus eine staatlich anerkannte Methode in der Schweiz, in Russland, der Ukraine, Weißrussland und Kasachstan. In Deutschland kann sie als zusätzliche Methode im Rahmen tiefenpsychologisch fundierter Psychotherapien eingesetzt werden. HY und ATP sind in der hier beschriebenen Form nur in Österreich als eigenständige Methoden staatlich anerkannt. In Deutschland und der Schweiz wird die HY als Weiterbildung für ärztliche und psychologische Psychotherapeuten angeboten. Darüber hinaus sind verschiedene psychotherapeutische Anwendungen von Hypnose und das Autogene Training als Entspannungsverfahren verbreitet. Alle drei Verfahren werden sowohl als Kurzzeit- (≤25 Sitzungen) wie auch als Langzeitpsychotherapie (≥45 Sitzungen) eingesetzt, die Stundenfrequenz in der Einzeltherapie liegt üblicherweise bei wöchentlichen oder zweiwöchentlichen Sitzungen, kann aber auch auf zwei Sitzungen in der Woche gesteigert werden.

Pichler (2011) definiert die KIP als „eine tiefenpsychologisch fundierte Psychotherapiemethode, bei der Imaginationen einen zentralen Stellenwert im therapeutischen Geschehen einnehmen“ (S. 109). Das technische Vorgehen in der Behandlung basiert maßgeblich auf den Arbeiten Hanscarl Leuners zum „Katathymen Bilderleben“ (1994). Dieter (2001) fasst es wie folgt zusammen: „In einem leichten Entspannungszustand wird der Patient zu Imaginationen (Tagträumen) angeregt, die dem Therapeuten unmittelbar berichtet werden und die zum Gegenstand einer dialogischen Untersuchung, Erforschung und Intervention werden“ (S. 15). Eine Behandlung im Rahmen der KIP besteht charakteristischerweise zum einen aus Stunden, in denen Imaginationen zu vorgegebenen Motiven stattfinden („Erlebnisraum“; vgl. Kottje-Birnbacher 1992), und zum anderen aus Stunden, in denen die Imaginationen therapeutisch aufgearbeitet werden sollen („Verarbeitungsraum“; ebd.). Diese Nachbereitung soll sich an psychodynamischen Grundprinzipien orientieren und die Arbeit mit Übertragung, Gegenübertragung, Abwehr und Widerstand umfassen (vgl. Pichler 2011).

Die HY wird von Kanitschar (2009) beschrieben als ein „integratives tiefenpsychologisch fundiertes Verfahren“, in ihm sollen „alle bekannten Anwendungsformen und Techniken psychotherapeutischer Hypnose Platz haben“ (S. 1). Das Verfahren fußt auf der Hypnoanalyse nach Brown & Fromm (1986; s. a. Watkins 1992; Watkins und Watkins 2003), und auf Ericksonschen, hypnosystemischen und hypnobehavioralen Ansätzen (Revenstorf und Peter 2015). Die systematische Induktion von und Arbeit mit hypnotischen Trancen – verstanden als entspannte Wachzustände, welche sich u. a. durch eine fokussierte Aufmerksamkeit und eine erhöhte Suggestibilität auszeichnen – stellt dabei ein zentrales psychotherapeutisches Agens dar (Harrer 2008). Nach einer „Anfangsphase“, in der neben der Diagnose- und Indikationsstellung v. a. die hypnotischen Fähigkeiten des Patienten erarbeitet werden, stellt die eigentliche „Arbeitsphase“ der Therapie durch hypnotische Trancen auf drei „Interventionsmodi“ ab: die Aktualisierung und den Aufbau von Ressourcen, Konfliktbearbeitung und korrigierende emotionale Erfahrung, sowie Zukunfts- und Lösungsorientierung (vgl. Kanitschar 2009).

Die ATP wird von Sedlak (2012) als tiefenpsychologisch fundierte Methode beschrieben, die „Äußerungen des Unbewussten durch Erinnern, Wiederholen, Durcharbeiten aufgreift“ (S. 12). Das Verfahren wird von Bischof (2012) in drei Therapieelementen, Grundstufe, Mittelstufe und (analytische) Oberstufe, beschrieben. Die Grundstufe basiert dabei auf dem Erlernen und Üben des Autogenen Trainings (Schultz 1930). Auf Basis der so erworbenen Grundfähigkeit des Patienten zum „seelisch-körperlichen Spannungsausgleich“ (Sedlak 2012, S. 12), wird in der Mittelstufe mit der Problemkonfrontation begonnen. Im Fokus stehen die während des Autogenen Trainings oft bildhaft aufsteigenden problembesetzten Gedanken und Gefühlen. In der (analytischen Oberstufe) schließlich, sollen diese Inhalte dann gemäß tiefenpsychologischer Prinzipien benannt und „durchgearbeitet“ werden (Müller-Hegemann 1972).

Methoden

Instrumententwicklung und -validierung

Die Prozessskala für imaginations- und trancebasierte tiefenpsychologische Methoden (PIT) orientiert sich ihrer Form nach an der etablierten CPPS und ist für den kombinierten Einsatz mit dieser Vorgesehen. Da es sich bei den drei untersuchten Verfahren um integrative tiefenpsychologische Methoden handelt, erwarten wir, dass ihre behandlungstechnischen Charakteristika sich zum einen anhand der CPSS-Subskala „psychodynamisch-interpersonell“ beschreiben lassen, zum anderen aber auch methodenspezifische Interventionen Verwendung finden, für deren Erfassung jeweils zusätzliche Subskalen für KIP-, HY- und ATP-Technik benötigt werden. Diese wollen wir im Rahmen der PIT entwickeln.

Die Entwicklung und Validierung der Therapeutenversion der PIT erfolgte im Rahmen einer naturalistischen Längsschnittstudie zur Untersuchung der Wirksamkeit von KIP, HY und ATP als ambulante Therapien innerhalb der österreichischen Gesundheitsversorgung [AUTOREN]. Mit der Zustimmung der Patienten erhielten die Studientherapeuten zu Beginn der Behandlung (Messzeitpunkt: prä) und nach Abschluss der Therapie (Messzeitpunkt: post) Fragebögen zu den geplanten, bzw. tatsächlich durchgeführten therapeutischen Interventionen und zur Behandlungstechnik. Auf Basis dieser Daten wurden zunächst die Faktorenstruktur (faktorielle Validität) und die Reliabilität der entwickelten Items, sowie der resultierenden Subskalen geprüft. Weiterhin wurde der Zusammenhang zwischen den CPPS-Faktoren und den methodenspezifischen PIT-Skalen geprüft. Hiervon ausgehend wurde untersucht, welche therapeutischen Interventionen und Techniken gemäß der Kombination aus CPPS und PIT in KIP-, HY- und ATP-Behandlungen geplant und tatsächlich durchgeführt werden. Hieraus sollen auch erste Informationen zu Kriteriums- und Konstruktvalidität, sowie Test-Retest-Reliabilität der PIT gewonnen werden – wenngleich dies anhand der vorliegenden Daten nicht abschließend beurteilt werden kann (s. Limitationen).

Itementwicklung & statistische Datenanalyse

Auf Basis der Literatur und in Zusammenarbeit mit Lehrtherapeuten der drei Verfahren wurde eine Reihe von möglichen Items formuliert, welche – in Ergänzung der CPPS-Items – das charakteristische Vorgehen im jeweiligen Verfahren abbilden sollten. Im Rahmen einer Vorstudie wurden die Items von insgesamt 20 Lehrtherapeuten der drei Methoden mit Bezug auf jeweils fünf eigene Behandlungen ausgefüllt und auf Verständlichkeit und Eindeutigkeit hin bewertet. Anschließend wurden einzelne Items reformuliert, zusammengefasst oder herausgenommen. Die für die eigentliche Erhebung verwendete Form der PIT enthielt insgesamt 21 Items, jeweils sieben für jede Methode. Die siebstufige Skala der CPPS von 0 = „überhaupt nicht zutreffend“ bis 6 = „besonders zutreffend“ wurde für die PIT übernommen. Die neu entwickelten Items wurden in den Fragebögen für die behandelnden Therapeuten durchmischt mit Items aus der CPPS dargeboten (insgesamt 41 Items). Wie in der CPPS erhielten die Therapeuten zu Beginn der Behandlungen (prä) eine Version, in der die Items als geplante Interventionen formuliert waren („Ich werde …“) und nach Abschluss der Behandlungen (post) eine Version mit den Items formuliert als durchgeführte Interventionen („Ich habe …“).

Die statistische Datenanalyse wurde mit IBM SPSS Statistics Version 22 sowie R (R Core Team 2016) durchgeführt. Das Signifikanzniveau für alle statistischen Analysen wurde auf α = 0,05 festgelegt. Es erfolgte eine explorative Datenanalyse und bei insgesamt drei Merkmalsträgern wurde jeweils ein Ausreißer (z-Wert > 2,5) auf Ebene der globalen Skalenkennwerte entsprechend der Empfehlungen von Fidell and Tabachnick (2003) manuell adjustiert. Bei allen Skalenberechnungen wurden fehlende Einzelitems mit Hilfe des Expectation Maximization (EM) Algorithmus geschätzt und imputiert. Die geschätzten Werte machten für beide Messzeitpunkte <3 % der jeweiligen Skalenwerte aus und waren, gemäß Littles Test, relativ zur Gesamtstichprobe zufällig verteilt (Missing Completely At Random, MCAR). Um zu prüfen, ob es eine systematische Veränderung der Stichprobe durch Dropouts gab, wurden Unterschiede hinsichtlich soziodemographischer und klinischer Merkmale zwischen der Stichprobe zu Therapiebeginn und der Stichprobe nach Abschluss der Behandlungen mittels Chi-Quadrat-, bzw. t‑Tests untersucht. Eine Inspektion der Itemverteilung in den neu zu entwickelnden Skalen ergab, dass die Items zum Teil bimodal verteilt sind und damit deutlich von einer multivariaten Normalverteilung abweichen. Weiterhin kann nicht von einer echten Intervallskalierung der Items ausgegangen werden. Entsprechend wurde zur Prüfung der Faktorenstruktur eine non-parametrische Faktorenanalyse durchgeführt, wobei die Parameter mittels der weighted-least-squares-means-and-variance-adjusted-Methode (WLSMV; Flora und Curran 2004) auf Basis der polychorischen Korrelationsmatrix geschätzt wurden. Der Model-Fit wurde anhand von drei Indizes eingeschätzt: Tucker Lewis Index (TLI), Comparative Fit Index (CFI) und Root Mean Square Error of Approximation (RMSEA). Den Empfehlungen von Schermelleh-Engel et al. (2003) folgend wurden TLI und CFI > 0,95 und RMSEA < 0,08 als Kriteriumswerte für einen akzeptablen Model-Fit festgelegt.

Messinstrumente

Die CPPS und die neu entwickelte PIT wurden zu Beginn (Prä) und am Ende (Post) der Therapie von den behandelnden Therapeuten ausgefüllt. PHQ-D und ADP-IV wurden zu Beginn der Therapie von den Patienten ausgefüllt.

Comparative Psychotherapy Process Scale (CPPS).

Die CPPS (Hilsenroth, et al. 2005) ist ein Messinstrument zur Erfassung der im Rahmen einer Psychotherapie geplanten oder tatsächlich eingesetzten therapeutischen Techniken und Interventionen. In der vorliegenden Studie wurde die Version zur Selbstauskunft durch die behandelnden Therapeuten eingesetzt. Die CPPS liegt darüber hinaus als Patienten-Version und als Fremdbeobachtungsinventar vor. Anhand von jeweils zehn siebenstufigen Items (Range: 0–6) werden charakteristische Merkmale von psychodynamisch-interpersonellem (PI) und kognitiv-behavioralem (KB) therapeutischem Vorgehen abgefragt. Tab. 1 enthält die Formulierungen der einzelnen Items, sowie die deskriptiven Kennwerte für die aktuelle Stichprobe. Als globales Maß dafür, inwieweit eine gegebene Psychotherapie Elemente der beiden Richtungen enthält, wird das arithmetische Mittel der beiden Subskalen berechnet. Die von Hilsenroth et al. (2005) bekannte gute interne Konsistenz der beiden Subskalen konnte in der aktuellen Stichprobe bestätigt werden: PIprä, Cronbachs α = 0,86; PIpost, Cronbachs α = 0,88; KBprä: Cronbachs α = 0,88; KBpost, Cronbachs α = 0,82.

Tab. 1 Itemformulierungen für die Comparative Psychotherapy Process Scale (CPPS) nach Hilsenroth et al. (2005) und deskriptive Kennwerte für die aktuelle Stichprobe; jeweils für geplante (Prä) und durchgeführten (Post) Interventionen

Gesundheitsfragebogen für Patienten (PHQ-D)

Der PHQ (Spitzer et al. 1999; deutsche Version: Löwe et al. 2002) ist die Fragebogenfassung des PRIME-MD. Es handelt sich um ein Screening-Instrument zur diagnostischen Erfassung verschiedener Störungsbilder gemäß Achse I des DSM IV. Anhand von insgesamt 78 verschieden gestuften Fragen, werden innerhalb mehrerer Module psychopathologische Symptome sowie psychosoziale Belastungen erfragt. Kategoriale Diagnosen werden dann mittels des DSM-IV-TR-Algorithmus berechnet. Die psychometrischen Eigenschaften des PHQ-D, inklusive Konstruktvalidität im Vergleich mit SKID-Daten, wurden insgesamt für gut befunden (Gräfe et al. 2004). Zusätzlich zur kategorialen Diagnostik enthält der PHQ drei dimensionale Subskalen zu Depression, Angst und somatischer Symptomschwere. Für diese wurde in der vorliegenden Stichprobe eine gute bis befriedigende interne Konsistenz gefunden: PHQ-9 Depression Severity, Cronbachs α = 0,87; GAD-7 Anxiety Scale, Cronbachs α = 0,74; PHQ-15 Somatic Symptom Severity, Cronbachs α = 0,81.

Fragebogen zur Erfassung von DSM-IV Persönlichkeitsstörungen (ADP-IV)

Der ADP-IV (Schotte et al. 1998; deutsche Version: Doering et al. 2007) erfasst und unterscheidet Persönlichkeitsstörungen gemäß Achse II des DSM IV anhand von 94 Items (Beispiel: „Es ist typisch für mich, dass ich andere auf sexuell verführerische oder herausfordernde Weise für mich zu gewinnen versuche.“). Der Patient gibt bei jedem Items zunächst auf einer siebenstufigen Skala (Trait-Skala, Range: 1–7) an, inwieweit ein bestimmtes Persönlichkeitsmerkmal für ihn zutrifft. Bei einem Wert von 5 oder mehr, wird zusätzlich auf einer dreistufigen Skala (Distress-Skala, Range: 1–3) erfragt, inwieweit durch dieses Merkmal bereits Leid oder Schaden für den Patienten oder andere entstanden ist. In der vorliegenden Stichprobe wurden die zehn Persönlichkeitsstörungen laut DSM IV jeweils anhand der manualisierten Cut-off-Werte als vorhanden oder nicht vorhanden bestimmt. Für die drei DSM Cluster von Persönlichkeitsstörungen wurden dann absolute und relative Häufigkeiten berechnet. Als dimensionales Maß für das Ausmaß pathologischer Persönlichkeitszüge wurde zudem der Gesamtsummenscore aller Trait-Items gebildet (Renn et al. 2008). Die deutsche Version des ADP-IV hat bei hoher Sensitivität und niedriger Spezifizität (Renn et al. 2008) zufriedenstellende Korrelationen mit SKID (Strukturiertes Klinisches Interview für DSM-IV)-Diagnosen und Experteneinschätzungen (Doering et al. 2007). In der vorliegenden Stichprobe reichte die interne Konsistenz der zehn relevanten Subskalen von 0,64 ≤ Cronbachs α ≤ 0,82. Diese Werte sind vergleichbar mit denen der ursprünglichen Validierungsstichprobe (Schotte et al. 1998).

Stichprobe und Behandlungsinformationen

Neben der informierten Einwilligung der Patienten waren die Einschlusskriterien wie folgt: Alter zwischen 18 und 65 Jahren und (gemäß dem diagnostischen Urteil der behandelnden Therapeuten) keine psychotische Erkrankung und keine Suchterkrankung im Vordergrund, keine schwere neurologische Erkrankung, mindestens eine behandlungsbedürftige psychische Störung und ausreichende Deutschkenntnisse zum Verständnis der Fragebögen.

Die Rekrutierung der Therapeuten und Patienten erfolgte in Kooperation mit der Österreichischen Gesellschaft für angewandte Tiefenpsychologie und allgemeine Psychotherapie (ÖGATAP), welche als Fachgesellschaft seit 1969 alle drei Methoden in Österreich lehrt und vertritt. Wir kontaktierten alle als Psychotherapeuten niedergelassenen Mitglieder der ÖGATAP und baten um ihre Teilnahme. Während einer Rekrutierungsphase von einem Jahr wurden alle neuen Patienten bei den teilnehmenden Studientherapeuten von diesen auf die Studie angesprochen und ausführlich aufgeklärt. Jene Patienten, die sich zur Teilnahme bereit erklärt hatten, erhielten einen Eingangsfragebogen und einen frankierten Rückumschlag. Die behandelnden Therapeuten erhielten zu Beginn und nach Abschluss jeder Behandlung einen Fragebogen, welcher unter anderem die CPPS und die PIT enthielt.

Tab. 2 stellt die soziodemographischen und klinischen Merkmale der Stichprobe dar. Die Stichprobe umfasste zu Beginn der Behandlungen N prä = 353 Patienten, n prä = 177 für KIP, n prä = 123 für HY und n prä = 53 für ATP. Durch Studienabbrüche seitens der Patienten (n = 18 Patienten widerriefen ihre Bereitschaft zur Studienteilnahme) und Dropouts seitens der Therapeuten (für n = 174 Patienten haben wir den Post-Fragebogen von den Therapeuten nicht zurück erhalten) reduzierte sich die Stichprobe zum Ende der Therapien auf N post = 161 Patienten, n post = 81 für KIP, n post = 60 für HY und n post = 20 für ATP. Hinsichtlich der zu Beginn der Therapie erhobenen Variablen wurden keine Unterschiede zwischen der Patienten-Footnote 1 bzw. der TherapeutenstichprobeFootnote 2 zu Beginn und der am Ende der Behandlung verbleibenden jeweiligen Stichproben festgestellt. Das Verhältnis von KIP-Behandlungen, HY- und ATP-Behandlungen unterlag ebenfalls keiner statistisch signifikanten Veränderung, χ2(2) = 0,71, p = 0,70, r φ  = 0,05. Wir konnten demnach anhand der uns zur Verfügung stehenden Informationen trotz der hohen Dropout-Rate keine Hinweise darauf finden, dass die Stichprobe systematisch verzerrt worden ist.

Tab. 2 Soziodemographische und klinische Merkmale der Stichprobe

Achtundfünfzig Prozent der Patienten waren zu Beginn der Therapie unter psychiatrischer Medikation und 55,5 % waren bereits zuvor in psychotherapeutischer Behandlung gewesen. Affektive Störungen waren laut PHQ-D die häufigste Störungsgruppe, gefolgt von Angststörungen und somatoformen Störungen. Fünfundzwanzig Prozent der Patienten hatten mindestens eine Persönlichkeitsstörung gemäß ADP-IV. Im Mittel hatten die Patienten M = 1,23 (SD = 1,35; Range: 0–5) Achse-I-Störungen M = 0,30 (SD = 0,87, Range: 0–4) Achse-II-Störungen. Die Mehrzahl der Patienten mit einer Persönlichkeitsstörung (85,9 %) wies eine Achse-I-Komorbidität auf.

Die Patienten wurden zu Beginn der Therapien von insgesamt N prä = 81 Studientherapeuten behandelt, n prä = 51 für KIP, n prä = 21 für HY und n prä = 9 für ATP. Durch Dropouts reduzierte sich für das Ende der Behandlungen auch die Anzahl der Therapeuten auf N post = 57, n post = 34 für KIP, n post = 16 für HY und n post = 7 für ATP. Das Patienten-Therapeuten-Verhältnis unterschied sich nicht signifikant zischen den drei Methoden, χ2(2) = 4,34, p = 0,11, r φ  = 0,11. Die Studientherapeuten waren vorrangig erfahrene Praktiker mit durchschnittlich mehr als 15 Jahren Berufserfahrung. Die Mehrzahl gab an, regelmäßig Supervision in Anspruch zu nehmen und mehr als ein Drittel hat selbst auch die Anerkennung als Supervisor für Psychotherapie.

Die Anzahl der Sitzungen in ATP-Behandlungen war im Mittel signifikant niedriger als in HY-Behandlungen, t(78) = 3,74, p < 0,001, d = 0,85, und marginal signifikant niedriger als in KIP-Behandlungen, t(99) = 1,74, p = 0,09, d = 0,72. Zwischen KIP- und HY-Behandlungen fand sich diesbezüglich kein signifikanter Unterschied, t(139) = 1,49, p = 0,14, d = 0,31. Die Unterschiede zwischen den Methoden hinsichtlich der Sitzungsfrequenz, χ2(2) = 29,23, p < 0,001, r φ  = 0,43, und der Art des Therapieendes, χ2(2) = 35,74, p < 0,001, r φ  = 0,47, waren statistisch signifikant: KIP-Behandlungen fanden häufiger wöchentlich statt als HY- und ATP-Behandlungen und HY-Behandlungen endeten seltener vorzeitig als KIP- und ATP-Behandlungen. Die Anzahl der HY-Sitzungen in denen hypnotische Trancen eingesetzt wurden, war signifikant höher als jene der KIP- bzw. ATP-Sitzungen in denen Imaginationen eingesetzt wurden, χ2(2) = 11,75, p = 0,003, r φ  = 0,27.

Ergebnisse

Itemkennwerte & Faktorenstruktur für die PIT

Nach der initialen Berechnung der rotierten Faktorladungen und der deskriptiven Itemkennwerte wurden zwei Items aus den weiteren Analysen ausgeschlossen: Zwei für die ATP konzipierte Items („Ich habe meine/n Patienten/in ermuntert, vor dem inneren Auge ein bestimmtes Motiv, z. B. eine Farbe, eine Form, die Reise auf einen Berg, entstehen zu lassen.“ und „Ich habe meine/n Patienten/in eingeladen die Imagination abzuschließen und ‚wenn es passt‘ aus der Entspannung wieder herauszugehen.“) luden für Prä wie für Post gemeinsam auf einem Faktor mit den für die KIP konzipierten Items und wiesen beide sehr geringe Trennschärfen (r it < 0,3) auf. Die Kennwerte legen nahe, dass die beiden Items so allgemein formuliert sind, dass sie nicht hinreichend zwischen verschiedenen imaginations- oder trancebasierten Verfahren diskriminieren. Nach einer erneuten Berechnung der Faktorladungen und der deskriptiven Kennwerte, wurde weiterhin ein für die KIP konzipiertes Item ausgeschlossen („Ich habe meine/n Patienten/in beim Aushalten von heftigen Gefühlen während der Imagination unterstützt.“). Das Item erwies sich in der Post-Messung als nicht hinreichend trennscharf (r it = 0,23) und führte zu einer erheblichen Minderung der internen Konsistenz der Skala (Cronbachs Alpha: α = 0,60 statt α = 0,78 ohne das Item).

Die finale Lösung der PIT enthielt entsprechend 18 Items (6 für KIP, 7 für HY und 5 für ATP). Für die interne Konsistenz (Cronbachs Alpha) der drei Subskalen wurden akzeptable bis sehr gute Werte erreicht: KIP (prä): α = 0,92, KIP (post): α = 0,78, HY (prä): α = 0,94, HY (post): α = 0,92, ATP (prä): α = 0,86, ATP (post): α = 0,81. Tab. 3 zeigt die deskriptiven Kennwerte der 18 verbleibenden Items, jeweils für Prä und Post, sowie die Itemformulierungen und Faktorladungen. Die Items wiesen durchweg eine ausreichende Varianz auf (1,65 ≤ SD ≤ 2,58), keine übermäßig hohen oder niedrigen Schwierigkeiten (1,33 ≤ M ≤ 4,51) und eine gute mittlere Trennschärfe von 0,69 (0,31 ≤ r it ≤ 0,85). Die Wölbung (Kurtosis) lag zwischen −1,78 und 1,91, die Schiefe zwischen −1,66 und 1,29. Die Faktorladungen lagen durchweg im wünschenswerten Bereich von >0,4 (0,57 ≤ k ≤ 0,98). Bedeutsame Kreuzladungen lagen einzig für das Item #11 vor, welches zusätzlich zu ATP hoch auf dem KIP-Faktor lud. Angesichts anderweitig akzeptabler Kennwerte wurde das Item im Modell belassen.

Tab. 3 Itemformulierungen, deskriptive Kennwerte und standardisierte rotierte Faktorladungen (WLSMV) für die PIT (18-Item-Lösung); jeweils für geplante (Prä) und durchgeführte (Post) Interventionen

Zur Beurteilung des Model-Fits wurde zunächst der exakte Modelltest betrachtet. Dieser wurde für Prä (WLSMV χ2 (117) prä = 401,9, p < 0,001) und Post (WLSMV χ2 (117) post = 200,6, p < 0,001) signifikant. Die aus dem Modell geschätzte Varianz-Kovarianz-Matrix konnte also die empirische Varianz-Kovarianz-Matrix der Stichprobe nicht exakt vorhersagen. Für die Prä-Messung lagen mit TLIprä = 0,97 und CFIprä = 0,98 zwei von drei Maßen der Anpassungsgüte in einem akzeptablen Bereich (RMSEAprä = 0,08), für die Post-Messung waren alle drei Fit-Indizes zufriedenstellend: TLIpost = 0,97, CFIpost = 0,98, RMSEApost = 0,07. Damit ist der Model-Fit des 3‑Faktoren-Modells insgesamt als ausreichend zu bezeichnen.

Beziehung der Faktoren KIP, HY und ATP zu den CPPS-Faktoren

Tab. 4 zeigt bivariate Korrelationen zwischen den CPPS-Skalen PI und KB, sowie den PIT-Skalen für KIP, HY und ATP. Sowohl zu Prä als auch zu Post zeigt sich dabei, dass die PI-Subskala der CPPS hoch mit der KIP-Skala korreliert (r prä = 0,68; r post = 0,55). Für HY (r prä = 0,19; r post = 0,24) und ATP (r prä = 0,04; r post = −0,28) ergeben sich hier Nullkorrelationen bis mittelgroße Zusammenhänge. Die KB-Skala hingegen ist nur gering mit der KIP-Skala (r prä = 0,14; r post = −0,11) korreliert, aber in hohem Maße mit HY (r prä = 0,60; r post = 0,60) und ATP (r prä = 0,67; r post = 0,47). Wir interpretieren diese Kennwerte als Hinweis darauf, dass in einer gegebenen Behandlung zwar häufig eine Kombination von Interventionen und Techniken der KIP mit solchen aus der tiefenpsychologisch fundierten Therapie stattfindet, HY- und ATP-Techniken allerdings eher in Kombination mit kognitiv-behavioralen Interventionen angewendet wurden (s. Limitationen für alternative Lesart).

Tab. 4 Pearson-Produkt-Moment Korrelationen für die CPPS-IT zu Beginn (Prä; oberhalb d. Diagonalen) und nach Abschluss der Behandlungen (Post; unterhalb d. Diagonalen)

Interkorrelationen zwischen den Subskalen der PIT sind wie folgt: KIP und HY sind nahe nullkorreliert (r prä = 0,03; r post = 0,11), zwischen KIP und ATP besteht ein mittelgroßer negativer Zusammenhang (r prä = −0,24; r post = −0,31) und HY und ATP variieren stark gemeinsam (r prä = 0,59; r post = 0,43). Damit sind die therapeutischen Techniken in KIP und HY weitgehend unabhängig voneinander, während Interventionen aus KIP und ATP sich offenbar zum Teil ausschließen und solche aus HY und ATP häufig gemeinsam angewendet werden.

Die Korrelation zwischen den Prä- und Post-Werten der neu entwickelten Skalen liegen bei r = 0,77 für KIP, r = 0,83 für HY und r = 0,72 für ATP. Diese Kennwerte werden als Hinweise auf eine annehmbare bis sehr gute Test-Retest-Reliabilität verstanden (s. Limitationen).

Therapeutisches Vorgehen und Interventionen bei KIP, HY und ATP

In Tab. 5 finden sich deskriptive Kennwerte (CPSS und PIT) der geplanten therapeutischen Techniken (Prä) und der tatsächlich durchgeführten Techniken (Post) in KIP-, HY- und ATP-Behandlungen. Zunächst ist festzustellen, dass in allen drei Behandlungsmethoden deutlich mehr tiefenpsychologische als kognitiv-behaviorale Techniken eingesetzt werden – wodurch sich der vorrangig tiefenpsychologische Charakter der Behandlungen empirisch bestätigt.

Tab. 5 Geplante therapeutische Techniken zu Beginn der Behandlungen (Prä) und durchgeführte Techniken (Post) in KIP-, HY- und ATP-Behandlungen, sowie in der Gesamtstichprobe

Weiterhin kommen in jeder Methode die methodenspezifischen Techniken vorrangig vor: Für beide Messzeitpunkte finden sich in den KIP-Behandlungen mehr Elemente aus der neu entwickelten Skala zur KIP-Behandlungstechnik als aus jener zu HY (t prä (147) = 21,00, p < 0,001, d = 3,43; tpost (43) = 7,18, p < 0,001, d = 2,39) oder zu ATP (t prä (112) = 20,61, p < 0,001, d = 4,10; t post (38) = 8,31, p < 0,001, d = 3,16). In HY-Behandlungen finden sich zu beiden Messzeitpunkten mehr Elemente aus der HY-Skala als aus der ATP-Skala (t prä (85) = 6,49, p < 0,001, d = 1,39; t post (31) = 4,88, p < 0,001, d = 1,70). In der Planung der HY-Behandlung finden sich auch mehr Elemente aus der HY Skala als solche aus der KIP-Skala (t prä (147) = 4,57, p < 0,001, d = 0,75), in den tatsächlich durchgeführten Behandlungen kann dieser Unterschied jedoch nicht nachgewiesen werden (t post (43) = 1,69, p = 0,09, d = 0,52). In den ATP-Behandlungen finden sich zu beiden Messzeitpunkten mehr Elemente aus der ATP-Skala als aus der der KIP Skala (t prä (112) = 9,47, p < 0,001, d = 2,20; t post (38) = 9,29, p < 0,001, d = 2,98) oder der HY-Skala (t prä (85) = 6,73, p < 0,001, d = 1,63; t post (31) = 4,87, p < 0,001, d = 1,72).

Zusammenfassend sprechen diese Befunde dafür, dass die Kombination aus CPPS und PIT, im Gegensatz zum alleinigen Einsatz der CPPS, signifikant zwischen dem Vorgehen in den verschiedenen Therapieverfahren diskriminieren kann – ein erster Hinweis auf erreichte Konstrukt- und Kriteriumsvalidität. Interessant ist dabei, dass in den HY-Behandlungen aber neben den tiefenpsychologischen und HY-Techniken auch relativ viele KIP- und kognitiv-behaviorale Techniken Verwendung finden, während KIP- und ATP-Behandlungen im Wesentlichen auf tiefenpsychologische und methodenspezifische Interventionen beschränkt sind.

Diskussion

In der vorliegenden Arbeit wurde mit der PIT eine die Therapeutenversion eines Instruments zur Erfassung der Behandlungstechnik in KIP, HY und ATP vorgestellt und anhand einer klinischen Stichprobe zu Beginn und nach Abschluss der Behandlungen validiert. Anhand der bereits etablierten Items der CPPS können geplante wie durchgeführte psychotherapeutische Techniken und Interventionen erfasst werden, die typischerweise in tiefenpsychologisch fundierten und verhaltenstherapeutischen Behandlungen vorkommen. Die PIT erlaubt in Ergänzung zur CPPS die Erfassung von spezifischen Techniken aus KIP, HY und ATP. Diese drei Verfahren sind zu den tiefenpsychologisch fundierten Therapiemethoden zu zählen, enthalten aber jeweils verfahrensspezifische imaginations- und trancebasierte Techniken, welche im verbreiteten Verständnis von psychodynamischen Behandlungen – wie es etwa auch der CPPS zugrunde liegt – nicht vorkommen. Es konnte gezeigt werden, dass die PIT intern konsistent ist und über gute Itemkennwerte verfügt. Die Faktorenstruktur ist zufriedenstellend und bildet die den Items zugrunde liegende Unterscheidung der drei Verfahren gut ab. Die Test-Retest-Reliabilität der neuen Items ist akzeptabel bis sehr gut. In den geplanten und durchgeführten Behandlungen in den drei Verfahren wurden Interventionen und Techniken aus der dem angewandten Verfahren entsprechenden Subskala signifikant häufiger angewendet als jene aus den beiden anderen Subskalen. Die neu entwickelten Skalen sind nur zum Teil unabhängig voneinander, vor allem Techniken aus HY und ATP korrelieren beträchtlich.

In Bezug auf die CPPS-Skalen ist überraschenderweise festzustellen, dass nur die Items für KIP deutlich mit den allgemeinen tiefenpsychologischen Techniken und Interventionen kovariieren, während die Items für HY und ATP eher gemeinsam mit kognitiv-behavioralem Vorgehen angewendet werden. Eine mögliche Erklärung hierfür ist, dass bestimmte Vorgehensweisen in diesen Verfahren, z. B. ichpsychologisch basierte Techniken in der HY, auf operationaler Ebene klassisch kognitiv-behavioralen Interventionen ähneln – wenngleich sie theoretisch anders eingebettet sind und interpretiert werden. Insgesamt wurden in allen drei Methoden im Mittel mehr tiefenpsychologische, als kognitiv-behaviorale Techniken verwendet.

Diese Ergebnisse geben erste Hinweise darauf, dass es gelungen ist, mit der PIT ein ökonomisches und valides Selbstauskunftsinstrument für die Erfassung von imaginations- und trancebasierten tiefenpsychologischen Techniken in KIP, HY und ATP zu entwickeln. Insofern dies durch weitere Studien bestätigt wird, steht für weitere Forschung zu den drei Methoden ein Instrument zur Erfassung der Verfahrenstreue (Adhärenz) zur Verfügung. Zukünftige Wirksamkeitsstudien werden damit aussagekräftiger. Dabei sind auf Basis der validierten Items Erweiterungen möglich, etwa um ein Instrument zur Beurteilung der Qualität der eingesetzten Techniken (Kompetenz).

Weiterhin erscheinen die Skalen eine vielversprechende Grundlage für verschiedene Ansätze der Prozessforschung in den Methoden zu sein. Speziell die Befunde zum Verhältnis der drei Skalen zu den tiefenpsychologischen-, bzw. kognitiv-behavioralen Items geben erste Hinweise darauf, dass – trotz einer eindeutig tiefenpsychologischen theoretischen Fundierung – auf der Ebene der Behandlungstechnik stärker integrative Modelle die Praxis der HY und ATP bestimmen. Es liegt nahe, dass die Komplexität der dort zusammentreffenden methodischen Traditionen über ein traditionelles Verständnis von tiefenpsychologischer Behandlungstechnik hinausgeht. Im Sinne einer empirisch gestützten Weiterentwicklung der Psychotherapiemethoden kann die PIT auch zum Abgleich von geplanten und durchgeführten Behandlungen eingesetzt werden. Die Forschungsfrage wäre hier, inwieweit die vermutlich eher theoriegeleiteten oder methodenüblichen geplanten Interventionen mit der tatsächlichen Gestaltung der Therapie übereinstimmen. Im Zusammenhang mit Ergebnissen zur Wirksamkeit oder auch mit qualitativen Ergebnissen zum Verlauf der einzelnen Behandlungen könnten solche Befunde einen wichtigen Beitrag zur empirischen Fundierung der methodenspezifischen Theorien zur Behandlungstechnik liefern.

Limitationen

Als Limitation der vorliegenden Studie ist an erster Stelle die fehlende externe Validierung zu nennen. Alle Angaben zu den durchgeführten Interventionen basieren auf der Selbstauskunft der Psychotherapeuten. Aus der Literatur ist bekannt, dass Psychotherapeuten dazu neigen, ihre eigene Effektivität im Vergleich mit externen Kriterien bedeutend höher einzuschätzen (Walfish et al. 2012). In vergleichbarer Weise ist denkbar, dass es in der vorliegenden Studie einen Bias dahingehend gibt, dass solche Items, die als konform mit der eigenen therapeutischen Orientierung wahrgenommen werden, bevorzugt angekreuzt wurden. Für eine umfassendere Konstrukt- und Kriteriumsvalidierung erscheint es entsprechend unbedingt notwendig, die Selbstauskunft der Therapeuten um die Befragung der Patienten und auch um Beobachtungsdaten zu ergänzen.

Das bisherige Vorgehen zur Erfassung der Test-Retest-Reliabilität durch Korrelation von Prä- und Post-Werten ist langfristig unbefriedigend, da hier streng genommen nicht dasselbe gemessen wird: Zu Beginn die geplanten Interventionen und am Ende die, gemäß Erinnerung oder Aufzeichnungen der Therapeuten, tatsächlich durchgeführten Interventionen. Eine Version für Fremdbeobachtungen würde die Bestimmung der Interrater-Übereinstimmung erlauben, was als Reliabilitätsmaß aussagekräftiger wäre.

Die hohe Dropout-Rate der Studientherapeuten schränkt die Generalisierbarkeit der Daten ein. Zwar konnten wir anhand der erhobenen Variablen keine systematische Verzerrung nachweisen, dennoch besteht die Möglichkeit, dass die Stichprobe anderweitig durch Dropouts verzerrt wurde. Über mögliche Ursachen für die hohe Abbruchquote liegen leider nur wenige Informationen vor: Eine Studientherapeutin ist im Laufe der Studie verstorben, andere waren postalisch nicht mehr erreichbar.

Zuletzt ist zu sagen, dass alle Aussagen zum Verhältnis der PIT-Subskalen zu den CPPS-Skalen mit einer Einschränkung zu versehen sind. Da die Stichprobengröße es nicht zuließ, beide Instrumente gemeinsam hinsichtlich der Faktorenstruktur zu prüfen, können Korrelationen zwischen PIT-Faktoren und CPPS-Faktoren nicht eindeutig interpretiert werden. Ein statistischer Zusammenhang kann einerseits bedeuten, dass beide Formen von Interventionen häufig gemeinsam Verwendung finden – von dieser Lesart sind wir im Text ausgegangen –, andererseits ist es aber auch möglich, dass die mit den beiden Faktoren bezeichneten Merkmale mit den verwendeten Items nicht ausreichend separat voneinander erfasst werden konnten.