Im Rahmen der Methode werden zunächst das Studiendesign und der Ablauf der Studie sowie die verschiedenen Erhebungsinstrumente, die zur Diagnostik und Beantwortung der Forschungsfragen eingesetzt wurden, beschrieben. Des Weiteren werden das Rekrutierungsprocedere, die Ein- und Ausschlusskriterien sowie eine deskriptive Beschreibung der entstandenen Stichproben dargestellt. Abschließend wird das Vorgehen bei der statistischen Auswertung der Ergebnisse vorgestellt.

4.1 Studiendesign

Zur Untersuchung der im vorherigen Kapitel dargestellten Fragestellungen wurde ein quantitativer Forschungsansatz gewählt, bei dem Daten einer klinischen Stichprobe (Gruppe 1 = Patient:innen in tagesklinischer Depressionsbehandlung) und einer nicht-klinischen Stichprobe (Gruppe 2 = Personen aus der Allgemeinbevölkerung) erhoben und anhand strukturierter Datenerhebungsmethoden ausgewertet wurden. Im Folgenden wird das Studiendesign sowie das forschungsmethodische Vorgehen detailliert beschrieben. Dabei erfolgt die Gliederung analog zu den Fragestellungen in Abschnitt 3.6.

Zur Beantwortung der Fragestellung 1 wurde eine Gruppe älterer Erwachsener aus der Allgemeinbevölkerung (Gruppe 2) hinsichtlich verschiedener Merkmale im Querschnitt untersucht. Um den Sachverhalt unter lebensweltlichen Bedingungen und im natürlichen Umfeld zu untersuchen, wurden die Daten willkürlich erhoben, sodass von einer naturalistischen Stichprobe ausgegangen werden kann (Scholz, 2008). Die Erhebung der relevanten Merkmale fand zu einem Messzeitpunkt statt, weshalb es sich bei dieser Untersuchung um eine aktuelle Bestandsaufnahme innerhalb einer Population handelt. Die Anordnung dieser Untersuchung entspricht einem Ex-post-facto-Design, da kein Stimulus manipuliert und keine Randomisierung vorgesehen war. Die Ergebnisse, die aus einem Ex-post-facto-Design resultieren, erlauben lediglich korrelative Aussagen, aus denen keine Kausalität ableitbar ist (Baur & Blasius, 2014). Dennoch ist die Beschreibung dieser Gruppe aufschlussreich – insbesondere, da die Erkenntnisse zur Klärung der aktuell heterogenen Studienlage, wie sie in Abschnitt 3.3.2.4 beschrieben wurde, beitragen und einen ersten Eindruck über die Zusammenhänge zwischen Depression und Emotionsregulation im höheren Erwachsenenalter ermöglichen.

Zur Überprüfung der Unterschiedshypothesen, die zur Fragestellung 2 formuliert wurden, wurden depressive Patient:innen (Gruppe 1) mit einer gesunden Kontrollgruppe verglichen. Im Vergleich zu echten Experimenten erfolgte die Zuteilung der Versuchspersonen zur klinischen Stichprobe und zur Kontrollgruppe anhand bereits vorhandener Merkmale (depressiv, nicht-depressiv). Eine Randomisierung war aufgrund dieser personenspezifischen Gruppencharakteristika nicht möglich und eine experimentelle Manipulation der interessierenden Variablen forschungspraktisch nur schwer umsetzbar, aber vor allem ethisch nicht vertretbar. Der Vergleich der beiden Gruppen wurde im Querschnitt vorgenommen, sodass es sich bei dieser Untersuchung um ein quasi-experimentelles Studiendesign ohne Messwiederholung handelt. Quasi-experimentelle Studien weisen im Vergleich zu experimentellen Studien eine geringere interne Validität auf, da eine Konfundierung der unabhängigen Variablen mit anderen Merkmalen (Störvariablen) nicht ausgeschlossen werden kann. Es besteht die Gefahr, dass sich die beiden Vergleichsgruppen systematisch also nicht nur hinsichtlich des untersuchten Merkmals, sondern auch bezüglich anderer Merkmale unterscheiden. Durch diese Störvariablen entstehen systematische Fehler bei der Interpretation der Ergebnisse (Döring & Bortz, 2016). Zur Kontrolle möglicher personengebundener Störvariablen wurde in dieser Untersuchung die gesunde Kontrollgruppe im Sinne von Matched Samples aus der Gruppe 2 extrahiert und es wurde eine gematchte Kontrollgruppe zusammengestellt. Bei den Matched Samples handelte es sich um gesunde, zuvor nicht depressive Personen, die nach den Kriterien Geschlecht, Alter, Familienstand, höchster Schulabschluss und berufliche Tätigkeit den depressiven Patient:innen zugeordnet wurden (für eine Erläuterung der Zuteilungskriterien und der Zusammensetzung der Matched Samples siehe Abschnitt 4.4).

Um den Zusammenhang zwischen Emotionsregulation und Depression und den Einfluss der Emotionsregulationskompetenz auf den Erfolg einer Depressionsbehandlung im höheren Erwachsenenalter zu untersuchen (Fragestellung 3), wurden depressive Patient:innen, die sich in klinischer Behandlung (Gruppe 1) befanden, untersucht. Die Überprüfung der Hypothesen erfolgte anhand einer korrelativen Analyse im Sinne eines Ex-post-facto-Designs sowie anhand eines quasiexperimentellen Studiendesigns mit Messwiederholung. Im Rahmen der korrelativen Analyse wurde der Einfluss der Emotionsregulation als unabhängige Variable auf die abhängige Variable Depression zu verschiedenen Messzeitpunkten untersucht. Um den Einfluss der Emotionsregulationskompetenz auf den Therapieeffekt zu untersuchen, wurde ein quasiexperimentelles Design mit Messwiederholung verwendet. In diesem Längsschnitt wurden Patient:innen mit hoher und niedriger Emotionsregulationskompetenz zu verschiedenen Zeitpunkten einer Depressionsbehandlung miteinander verglichen. Die Zuteilung der Versuchspersonen zu den beiden Gruppen wurde anhand bereits vorhandener Merkmale (Emotionsregulationskompetenz hoch, niedrig) vorgenommen. Die beiden Gruppen wurden zu Beginn und am Ende der Behandlung sowie nach einem Follow-up von drei Monaten untersucht. Die erhobenen Selbstberichtsdaten zu Emotionsregulationskompetenz und Depression wurden zudem mit Fremdbeurteilungen der psychotherapeutisch Behandelnden verglichen. Da zur Erfassung der emotionalen Kompetenz durch Fremdbeurteilungen aber bislang kaum Studien vorliegen, wurde der Frage nach der Übereinstimmung zwischen Selbst- und Fremdurteil explorativ nachgegangen. Nach Döring und Bortz (2016) eignen sich explorative bzw. erkundende empirische Untersuchungen insbesondere dann, wenn in einem Forschungsbereich erst wenige Befunde vorliegen und Hypothesen und Theorien generiert werden sollen.

4.2 Studienablauf

Im Folgenden werden die Konstruktion der Testmaterialien und der Ablauf der Erhebungen in der klinischen Stichprobe und in der Gruppe der Personen aus der Allgemeinbevölkerung detailliert beschrieben. Abschließend werden die ethischen und datenschutzrechtlichen Aspekte dieser Untersuchung erläutert.

Konstruktion der Testmaterialien

Aufgrund der Beschaffenheit der Stichprobe und aus praktischen Gründen wurde in beiden Gruppen eine Paper-Pencil-Befragung durchgeführt. Die Studienteilnehmenden erhielten Fragebögen in Papierform und füllten diese handschriftlich aus (Material einsehbar im Anhang im elektronischen Zusatzmaterial). Die Fragebögen wurden ausschließlich in deutscher Version vorgelegt. Aufgrund der Erfahrungen aus anderen Forschungsprojekten, in dem ebenfalls Personen im höheren Erwachsenenalter untersucht worden waren, und auf der Grundlage von Literaturempfehlungen (Dillman, Sinclair & Clark, 1993; Jenkins & Dillman, 1997) wurde bei der Konzeption der Fragebögen besonders auf Lesefreundlichkeit geachtet. In vorherigen Forschungsprojekten berichtete ein Großteil der Teilnehmenden von Problemen beim Lesen und Bearbeiten der Fragebögen, was häufig zum Abbruch der Teilnahme geführt hatte. Um das zu verhindern, wurde das Schriftbild des Informationsmaterials und der Messverfahren, die bei dieser Untersuchung eingesetzt wurden, verändert und so gestaltet, dass die Texte auf Dauer bequem und ermüdungsarm lesbar waren. Das wurde durch die Schriftgröße (16 pt), die Wahl einer Schriftart mit wenigen Serifen, einem mittleren Zeilenabstand, Zwischenüberschriften, Hervorhebungen von relevanten Informationen, anhand der häufigen Verwendung von Absätzen und durch einen hohen Kontrast von Schrift und Hintergrund erreicht. Zudem wurde beim Satzbau und Sprachstil darauf geachtet, dass die Texte verständlich und beim einmaligen Lesen nachvollziehbar waren. Dafür wurde eine mittlere Wort- und Satzlänge gewählt, die auf die Verständlichkeit eines Textes großen Einfluss haben. Zudem wurde der Anteil seltener Wörter und Fremdwörter reduziert bzw. wenn nicht anders möglich, wurden Fremdwörter in kurzen Worten erläutert.

Um Vorurteile und sozial erwünschte Antworttendenzen zu reduzieren, wurde im Titel der Studie auf das Wort Depression verzichtet und die Studie als ERimA – Emotionsregulation im höheren Erwachsenenalter bezeichnet. Darüber hinaus wurde bei der Bezeichnung der einzelnen Fragebögen auf pathologisierende Bezeichnungen verzichtet und stattdessen Begriffe wie Stimmungslage oder allgemeines Befinden verwendet (für eine Übersicht zu Arbeiten, die sich mit dem Zusammenhang von sozialer Erwünschtheit und Antwortverzerrungen beschäftigt haben, siehe zum Beispiel Paulhus, 1991, 2002).

Untersuchungsablauf und Beschreibung der Teilschritte

Vor Beginn der Studie wurde zunächst die Erlaubnis der teilnehmenden Klinik (Tagesklinik des Ameos Klinikums Lübeck – Klinik für Psychiatrie und Psychotherapie) eingeholt, in der die klinische Stichprobe (Gruppe 1) rekrutiert wurde. Nach der Genehmigung und vor Beginn der Datenerhebung wurde ein Treffen mit dem gesamten Behandlungsteam der Tagesklinik vereinbart. Bei diesem Treffen wurden die theoretischen Grundlagen, die Ziele und der Ablauf der Studie sowie die datenschutzrechtlichen Bestimmungen erläutert. Die verschiedenen Fragebogenverfahren wurden ausführlich vorgestellt und die psychotherapeutisch Behandelnden erhielten eine Unterweisung in die Fremdbeurteilungsverfahren. Eine Mitarbeiterin des Behandlungsteams der Klinik erhielt eine gesonderte Instruktion, um Aufgaben im Rahmen der Studienassistenz vor Ort auszuführen. Die Aufgaben der Studienassistenz vor Ort beinhalteten die Verteilung der Fragebögen an die jeweiligen Studienteilnehmenden und psychotherapeutisch Behandelnden sowie andere administrative Aufgaben. Die Studienassistenz erhielt für die Erledigung dieser Aufgaben keine finanzielle Vergütung oder Aufwandsentschädigung.

Die Untersuchung der klinischen Stichprobe (Gruppe 1) erfolgte durch die Autorin und wurde zu unterschiedlichen Messzeitpunkten durchgeführt. Diese Gruppe wurde zu Beginn einer tagesklinischen Behandlung bei Aufnahme (T1), bei Entlassung nach etwa sechs bis neun Wochen (T2) und bei einem Follow-up von drei Monaten (T3) untersucht. Die Untersuchung zum Messzeitpunkt T1 erfolgte in der ersten Behandlungswoche, nach dem Aufnahmegespräch durch die psychotherapeutisch Behandelnden. Die Untersuchung zum Messzeitpunkt T2 erfolgte in der letzten Behandlungswoche. Zum Messzeitpunkt T3 erhielten die Teilnehmenden einen Fragebogen per Post.

Um den Aufwand für die Studienteilnehmenden so gering wie möglich zu halten, fanden die Erhebungen zu den Messzeitpunkten T1 und T2 werktags zwischen 10:00 und 12:00 Uhr in der Klinik statt. Zur Vermeidung von Konfundierungen im Sinne eines unsystematischen Fehlers wurden der Versuchsablauf und die Instruktionen standardisiert und Situationsmerkmale bestmöglich kontrolliert (Hussy, Schreier & Echterhoff, 2013). Störvariablen wie z. B. Lärmbelastung oder Ablenkung durch Mitpatient:innen wurden reduziert, indem die Studienteilnehmenden ausschließlich einzeln und in einem ruhigen Raum untersucht wurden. Nach der Begrüßung wurden die Studienteilnehmenden gebeten sich auf einen Stuhl an einen Tisch zu setzen. Es erfolgte zunächst eine mündliche und schriftliche Information und Aufklärung über die Studie (Art und Ziele der Studie, Verwendungszweck der Daten, Freiwilligkeit, Kontaktdaten der Studienleitung etc.). Bezüglich des Datenschutzes wurden die Studienteilnehmenden anhand des datenschutzrechtlichen Informationsteils mündlich und schriftlich aufgeklärt (Material einsehbar im Anhang im elektronischen Zusatzmaterial). Dabei wurden generelle Erläuterungen zum Datenschutz, zur Veröffentlichung der Ergebnisse, zum Beschwerderecht, zur Freiwilligkeit und zum Widerruf gegeben. Die Studienteilnehmenden hatten im Anschluss an die Aufklärung und während der gesamten Erhebungsphase die Möglichkeit, Fragen zu stellen. Es folgte eine Erläuterung über den Ablauf und den zeitlichen Rahmen der Erhebung. Die Dauer der Erhebung belief sich jeweils auf etwa 40–60 Minuten. Um mögliche Fragen zu beantworten und um notwendige Erklärungen zu den einzelnen Testverfahren zu geben, wurde zum Messzeitpunkt T1 der Selbstbeurteilungsfragebogen von den Studienteilnehmenden im Beisein der Autorin ausgefüllt.

Zum Messzeitpunkt T2 wurde den Patient:innen der Fragebogen von einer Mitarbeiterin des Behandlungsteams vorgelegt, die mit der Studienassistenz beauftragt war. Die Erhebung zum Messzeitpunkt T2 fand im gleichen Raum und etwa zur gleichen Tageszeit statt wie zum Messzeitpunkt T1. Die Studienassistenz sorgte dafür, dass die Studienteilnehmenden in der Zeit der Bearbeitung ungestört waren. Die Studienteilnehmenden wurden erneut auf die Möglichkeit hingewiesen, während der gesamten Erhebung Fragen zu stellen.

Zum Messzeitpunkt T3 wurde den Studienteilnehmenden der Fragebogen und ein beiliegender, frankierter Rückumschlag per Post zugesendet. Die Sendungen wurde von der Autorin adressiert und an die Hausadresse der Studienteilnehmenden geschickt. Die Patient:innen stimmten der zweckgebundenen Herausgabe der Adressdaten zur Kontaktierung vorab zu. Die Studienteilnehmenden wurden in einem Anschreiben gebeten, den Fragebogen nach vollständiger Bearbeitung zurückzusenden. Wurde der Fragebogen nicht innerhalb einer bestimmten Frist zurückgesendet, erfolgte eine telefonische Erinnerung. Studienteilnehmende, die telefonisch nicht erreichbar waren, wurde ein weiteres Mal ein Fragebogen mit frankiertem Rückumschlag zugesendet.

Der Fragebogen wurde zum Messzeitpunkt T1 von 54 Studienteilnehmenden bearbeitet. Zwischen Messzeitpunkt T1 und Messzeitpunkt T2 mussten acht Studienteilnehmende aus der Studie ausgeschlossen werden. Die Hauptgründe für den Dropout waren eine vorzeitige Beendigung der Behandlung auf Wunsch der Patient:innen (38 %), die Verlegung auf die gerontopsychiatrische Station oder in eine andere klinische Einrichtung aufgrund einer Akutbehandlung (38 %), die Verlegung auf die allgemeinpsychiatrische Station (12 %) oder ein rückwirkender Ausschluss aufgrund zusätzlicher Diagnosen im Sinne eines Ausschlusskriteriums, die sich erst im Verlauf der Behandlung zeigten, z. B. dementielle Störungen (12 %). Der Fragebogen zum Messzeitpunkt T1 und T2 wurde von 46 Studienteilnehmenden komplett bearbeitet. Zwischen Messzeitpunkt T2 und T3 mussten vier Studienteilnehmende aus der Studie ausgeschlossen werden, da sie den ausgefüllten Fragebogen nicht zurücksendeten. Der Fragebogen zum Messzeitpunkt T3 wurde von 42 Studienteilnehmenden komplett bearbeitet. Insgesamt lagen nach Abschluss der Erhebungsphase von N = 42 Studienteilnehmenden komplett bearbeitete Datensätze zu allen drei Messzeitpunkten vor.

Die Fremdbeurteilungsverfahren wurden den jeweiligen psychotherapeutisch Behandelnden zum Messzeitpunkt T1 und T2 von der Studienassistenz vorgelegt. Die Studienteilnehmenden wurden vorab über die Fremdbeurteilung informiert. Bezüglich der im Fremdbeurteilungsverfahren erhobenen Daten entbanden die Studienteilnehmenden die Behandelnden anhand einer Einwilligungserklärung von der Schweigepflicht. Die Bearbeitungsdauer der Fremdbeurteilungsverfahren pro Messzeitpunkt betrug etwa 10 Minuten. Zum Messzeitpunkt T1 wurden Fragebögen zu 45 Studienteilnehmenden komplett bearbeitet, zum Messzeitpunkt T2 lagen Fragebögen zu allen 46 Studienteilnehmenden vor.

Die Personen aus der Allgemeinbevölkerung (Gruppe 2) wurden nur zu einem Messzeitpunkt untersucht. Die Rekrutierung dieser Gruppe fand im Rahmen verschiedener Veranstaltungen (siehe Tabelle 4.2) statt. Dafür wurde zunächst Kontakt mit den Verantwortlichen der jeweiligen Veranstaltung aufgenommen. Die wichtigsten Informationen zur Studie wurden vorab entweder telefonisch oder per E-Mail übermittelt. Mit der Einwilligung der Verantwortlichen wurden die verschiedenen Veranstaltungen von der Autorin oder einer Assistentin besucht. Zu Beginn oder am Ende der Veranstaltung wurden ausführliche Informationen und Aufklärung über die Studie gegeben. Dies beinhalte allgemeine Informationen, Ziele und Inhalt der Studie, Kontaktdaten der Studienleitung und der Ansprechpartnerinnen sowie eine Anleitung zum Ausfüllen und Zurücksenden des Fragebogens. Zudem wurde der datenschutzrechtliche Informationsteil, den alle Teilnehmenden schriftlich erhielten, auch mündlich erläutert. Im Anschluss daran hatten die Teilnehmenden der Veranstaltung die Möglichkeit, Fragen zu stellen. Fragebögen mit der Information zur Studie, dem datenschutzrechtlichen Informationsteil und einem frankierten Rückumschlag wurden vor oder nach der jeweiligen Veranstaltung an interessierte Teilnehmende ausgegeben (Material einsehbar im Anhang im elektronischen Zusatzmaterial). Die Fragebögen wurden von den Teilnehmenden außerhalb der Veranstaltung bearbeitet und nach der Bearbeitung zurückgesendet. Die Bearbeitungsdauer betrug etwa 20–30 Minuten. Die Erhebung der Daten fand in dieser Gruppe anonym statt.

Insgesamt wurden in dieser Gruppe 1 240 Fragebögen ausgegeben und 708 Fragebögen zurückgesendet, was einer Bruttorücklaufquote von 57 % entspricht. Zur Beurteilung der Höhe einer Rücklaufquote gibt es keine pauschalen Vorgaben, da sie von mehreren Faktoren wie dem Umfang der Befragung oder der Zielgruppe abhängt. Verschiedene Benchmark-Untersuchungen haben allerdings als grobe Orientierung eine Rücklaufquote von etwa 30 % bei Befragungen zwischen Unternehmen und Privatpersonen (B2C) ermittelt (Bischoff, 2001). Besonders in Anbetracht der vergleichsweise langen Bearbeitungsdauer, ist die erreichte Rücklaufquote damit als sehr gut zu bezeichnen. Dies kann an den Eigenschaften der Zielgruppe oder an generellen Merkmalen der Befragung liegen. Zu den generellen Merkmalen der Befragung gehören beispielsweise das informative Anschreiben mit einem verständlichen und klar formulierten Befragungsziel, eine ausführliche Anleitung zum Ausfüllen und Zurücksenden des Fragebogens, die Angabe von Telefonnummer und E-Mail-Adresse der Studienleiterin bei Rückfragen, der persönliche Kontakt zu einer Ansprechpartnerin bei der Rekrutierungsveranstaltung sowie ein für die Zielgruppe interessantes und aktuelles Thema.

Insgesamt wurden N = 684 Datensätze in die Studie eingeschlossen. Ein Dropout von N = 24 Fragebögen entstand aufgrund fehlender relevanter Werte wie Alter, Geschlecht oder aufgrund einer zu hohen Anzahl fehlender Werte, die eine Skalenbildung nicht mehr ermöglichte (zum Umgang mit fehlenden Werten siehe Abschnitt 4.5).

Ethische- und datenschutzrechtliche Aspekte

Die Durchführung dieser Untersuchung erfolgte auf Basis der ethischen Richtlinien der Deutschen Gesellschaft für Psychologie (DGPs), die die deutsche Adaptation der auf Forschung und Publikation bezogenen ethischen Richtlinien der American Psychology Association (APA; APA, 2016) darstellen. Zudem erfolgte eine ethische- und datenschutzrechtliche Überprüfung durch die Leitung der Klinik, in der die klinische Stichprobe (Gruppe 1) rekrutiert wurde. Im Rahmen dieser Überprüfung wurden u. a. die Fachkompetenz der Autorin, die Gestaltung der Untersuchungsbedingungen, die Verständlichkeit des Informationsmaterials, datenschutzrechtliche Aspekte und die Zumutbarkeit sowie die Risiken und der Nutzen der Untersuchung begutachtet. Die Begutachtung ergab ein positives Votum, wodurch die Freigabe zur Durchführung der Untersuchung erteilt wurde.

Über die ethischen Aspekte hinaus bestehen nach Datenschutz-Grundverordnung (DSGVO) in der Forschung Verpflichtungen zum Datenschutz im Umgang mit personenbezogenen Daten. Im Rahmen einer datenschutzrechtlichen Begutachtung wurde die Studie von der Datenschutzbeauftragten der Universität Rostock geprüft und die Freigabe zur Durchführung der Studie erteilt. Die Umsetzung der in Kapitel 1 Art. 4 DSGVO definierten datschenschutzrechtlichen Bestimmungen zum Umgang mit personenbezogenen Daten wird im Folgenden beschrieben.

Zur Durchführung des Längsschnitts (siehe Abschnitt 4.1) wurden in der klinischen Stichprobe (Gruppe 1) personenbezogene Daten erhoben. Bei der Erhebung, Verarbeitung und bei der allgemeinen Nutzung der personenbezogenen Daten wurde wie folgt vorgegangen: Die Datenerhebung begann erst nach ausführlicher mündlicher Information und Aufklärung über die Studie (Verwendungszweck der Daten, Hinweis auf Widerrufsmöglichkeit, Freiwilligkeit etc.), Aushändigung des datenschutzrechtlichen Informationsteils sowie nach eigenständig vom Studienteilnehmenden unterzeichneter rechtsgültiger Einwilligungserklärung. Die unterzeichnete Einwilligungserklärung dient zum Nachweis eines informed consent.

Für den Fall, dass Studienteilnehmende die Löschung ihrer Daten veranlassen wollten und um den Fragebogen zum Messzeitpunkt T3 zuzustellen, wurden Name und Kontaktdaten der Studienteilnehmenden erfasst. Damit die erhobenen Daten mit den jeweiligen Personen aber nicht in Verbindung gebracht werden konnten, wurden die Fragebögen durch die Zuteilung eines Codes pseudonymisiert. Der Code wurde elektronisch mithilfe eines Internetdienstes (www.randomcodegenerator.com) generiert und bestand aus einer Reihe zufälliger Ziffern und Zahlen, die keinen Rückschluss auf die Identität der Person zuließen. Für die korrekte Zuordnung der Datensätze zu den Studienteilnehmenden wurde eine Verschlüsselungsliste mit dem Code und Klarnamen angelegt (König, 2011). Die ausgefüllten Fragebögen, die nur mit dem Code, aber nicht mit Namen versehen wurden, und die Verschlüsselungsliste wurden sicher, d. h. unzugänglich für Unbefugte oder Dritte, an zwei unterschiedlichen Orten in abschließbaren Büroräumen und Schränken der Universität Rostock aufbewahrt.

Die Daten der Personen aus der Allgemeinbevölkerung (Gruppe 2) wurden anonym erhoben, sodass eine Pseudonymisierung der Fragebögen nicht notwendig war. Die ausgefüllten Fragebögen wurde ebenfalls an einem sicheren Ort an der Universität Rostock aufbewahrt.

Nach Abschluss der Erhebungsphase wurden die Fragebögen aus beiden Gruppen in den Räumen des Instituts für Pädagogische Psychologie händisch auf ein offizielles Medium der Universität Rostock (verschlüsselter Dienstlaptop) übertragen, ausgewertet und dort gespeichert. Der Dienstlaptop war mit den erforderlichen Verschlüsselungssystemen für Hardware, Dateien und Festplatten versehen (European Commission, 2009). Die Speicherung erfolgte nach den Richtlinien zur Speicherung von Forschungsdaten der Universität Rostock. Die erhobenen Daten werden entsprechend der Aufbewahrungspflicht von 10 Jahren bis spätestens Dezember 2029 gemäß § 2 Abs. 10 S. 3 Regeln zur Sicherung guter wissenschaftlicher Praxis und zur Vermeidung wissenschaftlichen Fehlverhaltens an der Universität Rostock vom 15. Januar 2019 aufbewahrt.

4.3 Psychologische Messverfahren

Beide Gruppen erhielten einen Fragebogen zu demografischen Daten (Fragebogen einsehbar im Anhang im elektronischen Zusatzmaterial). Im Rahmen dieser Selbstauskunft gaben die Studienteilnehmenden das Alter in Jahren, das Geschlecht (weiblich männlich), den Familienstand (ledig, verheiratet, feste Partnerschaft, geschieden, verwitwet), die Muttersprache (Deutsch, andere), den Schulabschluss (Kein Abschluss, Hauptschule, Volksschule, Realschule/POS, (Fach-)Abitur, Universität/FH, anderer) sowie die berufliche Tätigkeit (Vollzeit, Teilzeit, gelegentlich berufstätig, Rente, andere) an. Die Personen aus der Allgemeinbevölkerung wurden zudem befragt, ob sie sich im Laufe ihres Lebens jemals in psychiatrischer oder psychologischer Behandlung befunden haben, ob sie im Laufe ihres Lebens jemals die Diagnose einer psychischen Störung erhalten haben und ob im Verlauf ihres Lebens jemals eine depressive Episode oder anhaltend affektive Störung vorlag (Zusatzfragen zum Ausschluss einer affektiven Störung). In beiden Gruppen wurden mithilfe von Selbstbeurteilungsverfahren Emotionsregulationskompetenzen, Emotionsregulationsstrategien, die Schwere der depressiven Symptomatik, Aktivitäten und Kontakte sowie das psychische Wohlbefinden erfasst. In der klinischen Stichprobe wurde zudem zu Beginn und am Ende der Behandlung eine Beurteilung der Emotionsregulationskompetenzen sowie der Schwere der depressiven Symptomatik mithilfe von Fremdbeurteilungsverfahren durch den jeweiligen psychotherapeutisch Behandelnden vorgenommen.

Zur Überprüfung der Fragestellung und zur diagnostischen Differenzierung wurden die folgenden Selbst- und Fremdbeurteilungsverfahren eingesetzt:

EMO-Check

Der EMO-Check ist ein Selbstbeurteilungsverfahren zur Identifikation individueller Probleme bei der Regulation von Emotionen und wurde von Berking und Znoj (2008) entwickelt. Die theoretische und konzeptuelle Grundlage bildet das kompetenzorientierte Modell der adaptiven Emotionsregulation nach Berking (2017). Der EMO-Check setzt sich aus zwei Teilen zusammen, dem EMO-Check Teil I und dem Fragebogen zur Selbsteinschätzung emotionaler Kompetenzen (SEK-27).

Der erste Teil (EMO-Check Teil I) besteht aus einer Liste von 50 Emotionsadjektiven. Die zusammengefassten Werte ergeben neun Skalen, die die Emotionen Stress, Angst, Ärger, Traurigkeit, Depressivität und Scham sowie das Ausmaß für sogenannte Bewältigungsemotionen abbilden. Zudem ist es möglich, verschiedene Skalen zum positiven und negativen Affekt zu erheben. Es lassen sich u. a. die Werte für die deutsche Version der weit verbreiteten Positive Affect Schedule Negative Affect Schedule (PANAS) berechnen (Watson & Tellegen, 1985). In einem von den Autoren entwickelten und umfangreicheren Verfahren, in dem eine größere Anzahl von Emotionsadjektiven einbezogen wird, werden zusätzlich Werte für die Skalen Positiver Affekt EMO-Check Gesamt und Negativer Affekt EMO-Check Gesamt erhoben (Berking, 2017). Der emotionale Zustand wird auf einer 5-stufigen Likert-Skala von überhaupt nicht bis sehr beurteilt.

Der zweite Teil besteht aus dem SEK-27 (Berking & Znoj, 2008; Ebert, Christ & Berking, 2013). Anhand dieses Fragebogens werden unterschiedliche Emotionsregulationskompetenzen ökonomisch erfasst. Der Fragebogen besteht aus insgesamt 27 Items, die in neun Subskalen die grundlegenden Kompetenzen im Umgang mit Emotionen nach dem Modell der adaptiven Emotionsregulation (Berking & Znoj, 2008) erfassen. Zu den abgebildeten Subskalen, die das emotionale Befinden im Zeitraum der vergangenen Woche abfragen, gehören Aufmerksamkeit („… achtete ich auf meine Gefühle“), Klarheit („… war mir klar, was ich gerade fühlte“), Körperwahrnehmung („… hatte ich eine gute körperliche Wahrnehmung meiner Gefühle“), Verstehen („… verstand ich meine emotionalen Reaktionen“), Akzeptanz („… konnte ich auch negative Gefühle annehmen.“), Resilienz („… fühlte ich mich auch intensiven, negativen Gefühlen gewachsen“), Selbstunterstützung („… versuchte ich, mir in belastenden Situationen selber Mut zu machen“), Konfrontationsbereitschaft („… machte ich, was ich mir vorgenommen hatte, auch wenn ich mich dabei unwohl oder ängstlich fühlte“) und Regulation („… konnte ich positivere Gefühle gezielt herbei führen“). Die neun Subskalen werden zu einem Gesamtwert der emotionalen Kompetenz zusammengefasst. Die Emotionsregulationskompetenz wird auf einer 5-stufigen Likert-Skala von überhaupt nicht bis fast immer erfasst. Im Rahmen der Untersuchung wurde die Prolonged State-Version verwendet, in der sich die Studienteilnehmenden auf die zurückliegende Woche beziehen. Diese Version eignete sich für die Verlaufskontrolle der emotionalen Kompetenz.

Die Werte für die interne Konsistenz (Cronbachs Alpha) der einzelnen Skalen der Prolonged-State Version liegen zwischen α = .72 und α = .81 und sind damit im akzeptablen bis guten Bereich. Bei der Gesamtskala liegt die interne Konsistenz bei α = .90, was als sehr gut zu bewerten ist. Die Retest-Reliabilitäten für die Subskalen liegen zwischen r = .48 und r = .74 und die Werte für die Gesamtskala bei r = .75 und sind damit angemessen.

Das Instrument verfügt über eine gute Validität und Veränderungssensitivität und eignet sich zum einen aufgrund seiner befriedigenden bis sehr guten internen Konsistenz, aber besonders aufgrund seiner Kürze für die Erfassung emotionaler Kompetenzen in der untersuchten Stichprobe. Normwerte wurden für dieses Verfahren bisher noch nicht erstellt.

In seiner ursprünglichen Version stellt der EMO-Check ein Selbstbeurteilungsinstrument dar. Eine Fremdbeurteilungsversion wurde vom Autor der Skala, Prof. Dr. Matthias Berking, zu Forschungszwecken freundlicherweise zur Verfügung gestellt und wird in dieser Untersuchung als Messinstrument zur Fremdeinschätzung der emotionalen Kompetenz eingesetzt.

Cognitive Emotion Rating Questionnaire

Der Cognitive Emotion Regulation Questionnaire (CERQ; Garnefski et al., 2001) erfasst kognitive Emotionsregulation anhand von neun Skalen. Bei den Skalen handelt es sich um verschiedene Strategien der kognitiven Emotionsregulation, die gedankliche Reaktionen auf ein aversives Ereignis, welches mit belastenden Emotionen verbunden ist, darstellen. Es wird zum einen die kognitive Reaktion auf ein aversives Ereignis erfasst und darüber hinaus der Umgang mit den belastenden Emotionen, die aufgrund dessen entstehen. In der Instruktion werden die Studienteilnehmenden aufgefordert, die allgemeine Denkweise nach dem Erleben eines negativen oder unangenehmen Ereignisses anzugeben.

Das Verfahren besteht aus 36 Items, die den neun Skalen Selbstbeschuldigung, Akzeptanz, Rumination, positive Refokussierung, Refokussierung auf Planung, positive Neubewertung, Relativieren, Katastrophisieren und Andere beschuldigen zugeordnet werden. Jede der neun Skalen wird von vier Items repräsentiert. Höhere Werte entsprechen einer stärkeren Ausprägung der jeweiligen Strategie. Die neun verschiedenen kognitiven Emotionsregulationsstrategien werden im Folgenden beschrieben:

  1. 1.

    Selbstbeschuldigung: Sich für Ereignisse oder Erlebnisse gedanklich selber die Schuld geben („Ich denke, dass ich Schuld habe.“).

  2. 2.

    Akzeptanz: Gedanklich von dem zurücktreten, was passiert ist und das Erlebte akzeptieren („Ich denke, dass ich akzeptieren muss, was geschehen ist.“).

  3. 3.

    Rumination: Andauerndes Grübeln über negative Ereignisse und die Gefühle, die dadurch ausgelöst wurden („Ich denke darüber nach, wie ich mich wegen dem, was ich erlebt habe, fühle.“).

  4. 4.

    Positive Refokussierung: Gedanklich mit anderen, angenehmeren Dingen beschäftigen als mit dem negativen Ereignis („Ich denke an schönere Dinge als an das, was ich erlebt habe.“).

  5. 5.

    Refokussierung auf Planung: Überlegen, welche Schritte unternommen werden, um ein belastendes Ereignis zu überwinden („Ich überlege mir einen Plan, wie ich am besten vorgehen kann.“).

  6. 6.

    Positive Neubewertung: Gedankliche Neuausrichtung auf die positive Seite des Geschehenen. Im Sinne eines persönlichen Wachstums wird dem belastenden Ereignis gedanklich eine positive Bedeutung beimessen („Ich denke, dass ich aufgrund dessen, was geschehen ist, ein stärkerer Mensch werden kann.“).

  7. 7.

    Relativieren: Anhand des Vergleichs mit anderen negativen Ereignissen die Belastung eines Ereignisses aus einer anderen Perspektive betrachten oder gedanklich herunterspielen („Ich denke, dass andere Menschen viel schlimmere Erfahrungen machen.“).

  8. 8.

    Katastrophisieren: Negative Aspekte einer Situation oder mögliche negative Konsequenzen eines Ereignisses in übertriebenem Maße wahrnehmen und sich andauernd gedanklich mit diesen Inhalten auseinandersetzen („Ich denke, dass das, was ich erlebt habe das Schlimmste ist, was einem passieren kann.“).

  9. 9.

    Andere beschuldigen: Anderen gedanklich die Schuld für das belastende Ereignis geben („Ich denke, dass andere für das, was passiert ist, verantwortlich sind.“).

Die Items werden auf einer 5-stufigen Likert-Skala mit den Antwortkategorien von (fast) nie bis (fast) immer beantwortet.

Reliabilität und Validität des CERQ konnten in internationalen Studien belegt werden (D’Acremont & Van der Linden, 2007; Garnefki & Kraaij, 2007; Selby, Anestis & Joiner, 2008). Im Rahmen dieser Untersuchung wurde die deutsche Adaption des CERQ verwendet (Loch et al., 2011). Für die deutsche Version konnte in klinischen Stichproben eine gute interne Konsistenz zwischen α = .70 und α = .84 für die verschiedenen Skalen sowie eine gute faktorielle Validität nachgewiesen werden (Görgen, Loch, Hiller & Witthöft, 2015).

In verschiedenen Studien konnte gezeigt werden, dass Menschen im höheren Lebensalter im Vergleich zu jüngeren Altersgruppen häufiger kognitive als behaviorale Emotionsregulationsstrategien anwenden (Barnow et al., 2019; Nakamura & Orth, 2005; Scheibe et al., 2015). Zudem scheint die kognitive Reaktion auf ein belastendes Ereignis im Alter einen noch größeren Einfluss auf die psychische Gesundheit und das Wohlbefinden zu haben als in jüngeren Altersgruppen (Aldao et al., 2010; Nolen-Hoeksema, 2000). Diese Befunde rechtfertigen den Einsatz dieses vergleichsweise umfangreichen Verfahrens. Der CERQ erfasst im Vergleich zu anderen Testverfahren zudem eine hohe Anzahl verschiedener kognitiver Emotionsregulationsstrategien und erlaubt damit einen Einblick in ein breites Spektrum verschiedener Strategien und deren Auswirkung.

Geriatrische Depressionsskala

Derzeit existieren nur wenige diagnostische Verfahren im Bereich der affektiven Störungen, die speziell für geriatrische Patient:innen entwickelt und an entsprechenden Stichproben normiert oder validiert wurden (Hautzinger & Meyer, 2002). Die Geriatrische Depressionsskala (GDS; Yesavage et al., 1988) ist derzeit das einzige standardisierte Instrument, dass speziell für geriatrische Patient:innen entwickelt und im deutschen Sprachraum evaluiert wurde. Ziel der Autor:innen war es, ein Verfahren zu konzipieren, das ökonomisch einsetzbar ist und die Leistungsfähigkeit älterer Menschen berücksichtigt. Die GDS ist aufgrund ihrer Beschaffenheit und Praktikabilität vielfältig einsetzbar und besitzt eine hohe Akzeptanz bei Patient:innen und Behandelnden (Gauggel & Birkner, 1998).

Das Verfahren besteht aus 15 Items („Sind Sie grundsätzlich mit Ihrem Leben zufrieden?“), die mit Ja oder Nein beantwortet werden. In der Auswertung werden die Punkte zu einem Gesamtwert addiert, wobei ein höherer Wert für eine höhere Merkmalsausprägung steht. Der Maximalwert liegt bei 30 Punkten und kennzeichnet die Schwere der Depression. Eine Differenzierung zwischen schwerer (10–15 Punkte), leichter bis mäßiger Depression (5–10 Punkte) sowie ein unauffälliges Testergebnis (0–5 Punkte) kann vorgenommen werden. Zur Bestimmung eines Krankheitswerts wird die Kategorisierung der Summenwerte (depressiv vs. nicht depressiv) ab einem Cut-off Wert von ≥ 5 vorgeschlagen (Brink et al., 1982; D´Ath et al., 1994; Herrmann et al., 1996). Somatische Symptome werden in der GDS nicht erhoben, um eine mögliche Fehlerquelle falsch-positiver Diagnosen auszuschließen. Das Verfahren berücksichtigt außerdem die Tendenz depressiver älterer Menschen, kognitive Defizite im Rahmen einer depressiven Symptomatik zu überschätzen.

In Validierungsstudien zeigte sich die deutsche Version der GDS als zuverlässiges Messinstrument mit einer hohen internen Konsistenz von α = .91 und einer guten Split-Half-Reliabilität von r = .90. Das Verfahren zeigte sich als wenig störanfällig in Bezug auf den Erhebungskontext und auf den positiven Erinnerungseffekt (Brink et al., 1985; Gauggel & Birkner, 1999; Morishita et al., 1995; Yesavage et al., 1988).

In der ursprünglichen Version ist die GDS ein Selbstbeurteilungsinstrument. In der klinischen Praxis sowie im Rahmen dieser Untersuchung wurde sie zusätzlich als Fremdbeurteilungsinstrument eingesetzt.

Habituelle subjektive Wohlbefindensskala

Mit der Habituellen subjektiven Wohlbefindensskala (HSWBS) von Dalbert (1992) werden Stimmungsniveau und allgemeine Lebenszufriedenheit erfasst. Die Skala Stimmungsniveau stellt eine deutschsprachige Kurzfassung der Mood Level Scale von Underwood und Froming (1980) dar. Die HSWBS unterscheidet zwischen einer kognitiven und einer emotionalen Dimension und erfasst den Trait-Anteil des subjektiven Wohlbefindens (Diener, 1984). Die kognitive Dimension wird mit der Skala Allgemeine Lebenszufriedenheit erfasst. Dabei wird nach der Einschätzung der allgemeinen und nicht nach bereichsspezifischen Lebenszufriedenheiten gefragt. Die emotionale Dimension wird durch die Skala Stimmungsniveau erfasst und beinhaltet Items zur Anwesenheit positiver und zur Abwesenheit negativer Emotionen. Subjektives Wohlbefinden wird in diesem Verfahren als das Produkt von Stimmungsniveau und allgemeiner Lebenszufriedenheit verstanden und errechnet.

Die HSWBS besteht aus 13 Items, von denen sechs Items der Skala Stimmungsniveau („Ich fühle mich meist ziemlich fröhlich.“) und sieben Items der Skala Allgemeine Lebenszufriedenheit zugeordnet werden. Die Skala Allgemeine Lebenszufriedenheit setzt sich aus drei gegenwartsbezogenen („Ich bin mit meinem Leben zufrieden.“), zwei vergangenheitsbezogenen („Wenn ich so auf mein bisheriges Leben zurückblicke, bin ich zufrieden.“) und zwei zukunftsorientierten („Ich glaube, dass sich vieles erfüllen wird, was ich mir für mich erhoffe.“) Items zusammen. Jedes Item kann auf einer 6-stufigen Likert-Skala von stimmt überhaupt nicht bis stimmt genau beantwortet werden. Für jede Skala werden die Mittelwerte getrennt berechnet.

Die internen Konsistenzen der Skalen Stimmungsniveau von α = .82 und der Skala Allgemeine Lebenszufriedenheit von α = .88 können als gut bewertet werden, ebenso wie die Konstruktvalidität (Dalbert, 1992).

Das Verfahren wurde so konstruiert, dass es möglich ist, den aktuellen und habituellen Anteil sowie die emotionale und die kognitive Dimension des subjektiven Wohlbefindens getrennt voneinander zu erfassen. Durch die getrennte Erfassung beider Dimensionen ist es möglich, differentielle Veränderungen beispielsweise im Verlauf einer Therapie zu erheben (Dalbert, 1993). Aufgrund dieser Möglichkeit und weil das Verfahren in Bevölkerungsstichproben sowie in klinischen Stichproben eingesetzt werden kann (Hoyer, Heidenreich & Fecht, 2000), wurde es zur Erfassung des subjektiven Wohlbefindens in den untersuchten Stichproben ausgewählt.

Mannheimer Inventar der Lebensverhältnisse im Alter

Das Mannheimer Inventar der Lebensverhältnisse im Alter (MILVA; Adler et al., 2000) ist ein geriatrisches Assessment für eine standardisierte Erfassung der sozialen Situation älterer Menschen. Dabei werden die Skalen Aktivitäten, Kontakte, Wohnen und Finanzen durch jeweils vier bis zehn Items erfasst und entsprechende Gesamtwerte gebildet. Im Rahmen dieser Untersuchung wurden die Skalen Aktivitäten („Haben Sie Hobbies und wie häufig betreiben Sie diese?“) und Kontakte („Wie oft erhalten Sie Besuch von Menschen, die nicht in Ihrem Haushalt leben?“) verwendet. Die Skala Aktivitäten erfasst, ob und wie häufig die Befragten Hobbys ausüben, die Wohnung für Einkäufe oder zum Vergnügen verlassen und ob Interessen im letzten Monat abgenommen haben. Zudem wird nach der Haltung von Haustieren gefragt. Die Skala Kontakte erfasst das Vorhandensein und die Häufigkeit des Kontakts zur wichtigsten Bezugsperson. Die Lebensumstände der Betroffenen werden erfasst, die Häufigkeit von Besuch und Unternehmungen mit anderen Menschen und ob die Kontakte im Vergleich zum letzten Jahr abgenommen haben (Graf, 1999). In der Auswertung werden die jeweils fünf Items der beiden Skalen mit 0–2 Punkten bewertet. Dabei wird zwischen täglich (zwei Punkte), wöchentlich (ein Punkt) und selten bzw. nie (null Punkte) unterschieden. Ein Aktivitäten- und einen Kontakt-Score mit jeweils einem Maximalwert von zehn Punkten kann ermittelt werden. Die Autor:innen gehen bei Werten von 0–5 Punkten davon aus, dass die Betroffenen mit dem jeweiligen Bereich unzufrieden und bei Werten zwischen 6–10, dass sie mit dem jeweiligen Bereich zufrieden sind. Somit ist eine Trennung in unzufrieden und zufrieden möglich.

Eine Validierung des Instruments mit Lebenszufriedenheit fand an einer Stichprobe von 60 Personen aus der Allgemeinbevölkerung statt. Dabei zeigten sich akzeptable interne Konsistenzen zwischen α = .61 und α = .94 für die einzelnen Skalen (Adler et al., 2000).

DSM-5-Selbstbeurteilungsskala für Erwachsene

Bei der DSM-5-Selbstbeurteilungsskala handelt es sich um eine deutsche Übersetzung der englischen DSM-5 Self-Rated Level 1 Cross-Cutting Symptom Measure for Adults. Das Verfahren besteht aus 23 Items, die 13 Skalen abbilden: Depression („Geringeres Interesse an Dingen, die Ihnen gewöhnlich Freude machen?“), Reizbarkeit („Stärkeres Gefühl von Verärgerung, Gereiztheit und Missmut als gewöhnlich?“), Manie („Geringere Schlafdauer als gewöhnlich, aber trotzdem viel Energie?“), Angst („Gefühl von panischem Schrecken oder Angst?“), somatische Symptome („Unerklärliche Schmerzen z. B. Kopf-, Rücken-, Gelenk, Bauch- oder Beinschmerzen?“), Suizidgedanken („Drang sich selbst zu verletzen?“), Psychose („Hören von Dingen, die andere Menschen nicht hören können, wie z. B. Stimmen obwohl niemand in der Nähe ist?“), Schlafstörungen („Schlafprobleme, die die Qualität Ihres Schlafes betreffen?“), Gedächtnisstörungen („Gedächtnisprobleme z. B. bei neuen Informationen oder Probleme beim Erinnern von Orten z. B. Weg nach Hause?“), wiederkehrende Gedanken und Verhaltensweisen („Unangenehme Gedanken oder Bilder, die sich Ihnen wiederholt und ungewollt aufdrängen?“), Dissoziation („Gefühl der Entfremdung zu sich selbst, dem eignen Körper, der Umgebung oder den eigenen Erinnerungen?“), Persönlichkeitsstörungen („Ungewissheit, wer Sie eigentlich wirklich sind oder bezüglich Ihrer Lebensziele?“) und Substanzmissbrauch („Trinken von 4 oder mehr Gläsern Alkohol an einen Tag?“). Dabei erfasst jedes Item die Symptome der vergangenen zwei Wochen. Die Items werden auf einer 5-stufigen Likert-Skala von niemals bis fast jeden Tag beantwortet. Ein Summenscore für jede Skala kann berechnet werden. Bei den Skalen Suizidgedanken, Psychose und Substanzmissbrauch empfehlen die Autor:innen ab einem Summenscore von 1 von einem auffälligen Befund auszugehen, der weitere diagnostische Abklärung erfordert. Bei allen anderen Skalen gilt dies ab einen Summenscore von 2 oder höher. Die Skala kann als Screening-Instrument eingesetzt werden, um mittels Selbstbeurteilung einen Querschnitt über psychopathologische Merkmale in Form der in Psychiatrie und Psychologie relevanten Diagnosen zu bekommen.

Zwar stehen Validierungsstudien für dieses Instrument derzeit noch aus (APA, 2013), aber im Vergleich zu anderen störungsübergreifenden diagnostischen Instrumenten handelt es sich bei der DSM-5 Selbstbeurteilungsskala für Erwachsene um ein ökonomisches Verfahren, das aufgrund seiner Kürze in dieser Untersuchung zum Einsatz kam.

Therapeutenfragebogen – Fremdbeurteilung

Zur Erfassung der jeweiligen Diagnose erhielten die psychotherapeutisch Behandelnden zum Messzeitpunkt T1 einen gesonderten Fragebogen, mit der Bitte um die Angabe der Diagnose und möglicher Komorbiditäten nach ICD-10 (WHO, 2012). Im Rahmen der Fremdbeurteilung erhielten die Behandelnden zum Messzeitpunkt T1 und T2 den EMO-Check mit den beiden Teilen EMO-Check Teil I und SEK-27 sowie die GDS.

Tabelle 4.1 zeigt eine Übersicht über die diagnostischen Verfahren, die zu den jeweiligen Messzeitpunkten eingesetzt wurden.

Tabelle 4.1 Übersicht zu Messzeitpunkten, Gruppen, erhobenen Variablen und eingesetzten Testverfahren

4.4 Stichprobe

Im Folgenden wird die Rekrutierung der klinischen Stichprobe (Gruppe 1) und der nicht-klinischen Gruppe (Gruppe 2) beschrieben. Zudem werden die Ein- und Ausschlusskriterien für diese Gruppen sowie das Vorgehen zur Zusammenstellung der gesunden Kontrollgruppe (Matched Samples), die aus Gruppe 2 extrahiert wurde, erläutert. Abschließend erfolgt eine Beschreibung der verschiedenen Stichproben.

4.4.1 Rekrutierung der Stichproben

Die Rekrutierung der Studienteilnehmenden fand zwischen November 2018 und Dezember 2019 statt. Die Teilnahme an der Studie war für beide Gruppen freiwillig, die Studienteilnehmenden erhielten weder eine Aufwandsentschädigung noch eine andere finanzielle Vergütung.

Die klinische Stichprobe (Gruppe 1) wurde in der gerontopsychiatrischen Tagesklinik des Ameos Klinikums Lübeck – Klinik für Psychiatrie und Psychotherapie rekrutiert. Die gerontopsychiatrische Tagesklinik umfasst 18 tagesklinische Behandlungsplätze sowie eine angeschlossene Ambulanz. Das Behandlungsangebot besteht aus Psychotherapie, Pharmakotherapie, Ergotherapie, Sport- und Bewegungstherapie, Tanz- und Musiktherapie, psychiatrischer Pflege sowie sozialer Beratung und richtet sich an Menschen ab dem 60. Lebensjahr mit schweren persönlichen Krisen (Trauer- und Belastungsreaktionen), Schlafstörungen, Depressionen, Angsterkrankungen, psychosomatischen Erkrankungen, somatoformen Störungen, zunehmenden Gedächtnisstörungen oder wahnhaften Erkrankungen. Im Rahmen der Behandlung wurden in einer psychoedukativen Gruppe Themen wie innere und äußere Achtsamkeit, Emotionsentstehung sowie der Umgang mit verschiedenen Emotionen besprochen. Zudem wurden in den jeweiligen Sitzungen Achtsamkeits- oder Entspannungsübungen durchgeführt. Ein spezifisches Gruppen- oder Einzelbehandlungsangebot zur Förderung emotionaler Kompetenzen wurde im Rahmen der Behandlung nicht angeboten.

Bei der Rekrutierung der Studienteilnehmenden aus der Allgemeinbevölkerung (Gruppe 2) wurde unterschiedlich vorgegangen. Zum einen wurden Studienteilnehmende über Aushänge rekrutiert, die im Umkreis des Instituts für Pädagogische Psychologie „Rosa und David Katz“ der Universität Rostock angebracht wurden. Zudem wurden Mitarbeitende des Instituts rekrutiert, die Fragebögen an interessierte Teilnehmende verteilten und diese um die Rekrutierung weiterer Teilnehmender baten. Der Großteil der Studienteilnehmenden wurde allerdings im Rahmen verschiedener Veranstaltungen rekrutiert, die sortiert nach Bundesländern, in Tabelle 4.2 aufgeführt werden.

Tabelle 4.2 Rekrutierungsveranstaltungen für die Stichprobe aus der Allgemeinbevölkerung (Gruppe 2) sortiert nach Bundesländern

4.4.2 Ein- und Ausschlusskriterien

In diese Untersuchung wurden Männer und Frauen zwischen dem 55. und 85. Lebensjahr mit Deutsch als Muttersprache eingeschlossen. Im Sinne eines informed consent wurden nur Teilnehmende in die Studie eingeschlossen, die vor Beginn schriftlich und mündlich bezüglich datenschutzrechtlicher Bestimmungen, Freiwilligkeit der Teilnahme, über die Art, den Inhalt und den Ablauf und über andere wichtige Rahmenbedingungen der Studie aufgeklärt wurden.

Klinische Stichprobe (Gruppe 1)

Unabhängig von dieser Untersuchung erfolgte die Diagnosestellung der Patient:innen aus der klinischen Stichprobe durch die psychotherapeutisch Behandelnden, bei denen es sich um ärztlich oder psychologisch Ausgebildete in Psychotherapie handelte. Die Diagnose wurde im Rahmen einer umfassenden regelhaften Eingangsdiagnostik und anhand des in der Klinik etablierten Vorgehens mittels anerkannter diagnostischer Manuale und Verfahren gemäß ICD-10 gestellt. Studienteilnehmende, bei denen sich die Diagnose einer affektiven Störung im Verlauf der Behandlung nicht bestätigte und bei denen die jeweiligen Behandelnden die Eingangsdiagnose aufgrund weiterer diagnostischer Informationen, die sich während der Behandlung ergaben, änderten, wurden von der Studie rückwirkend ausgeschlossen.

Einschlusskriterien:

  • leichte, mittelgradige oder schwere depressive Episode oder rezidivierende depressive Störung nach ICD-10 bei Antritt einer tagesklinischen Depressionsbehandlung

  • Wert in der GDS ≥ 5

Ausschlusskriterien:

  • Akute Suizidalität

  • Bekannte Diagnose einer dementiellen Störung

  • Bekannte Diagnose einer Schizophrenie, schizotypen oder wahnhaften Störung

  • Bekannte Diagnose von Substanzmissbrauch oder Substanzabhängigkeit von Alkohol, Cannabinoiden, Sedativa, Kokain oder Halluzinogenen

Studienabbruchkriterium

  • Als Studienabbruchkriterium galt die Rücknahme der Einwilligungserklärung. Ein Abbruch der Studie war jederzeit möglich, ohne dass den Teilnehmenden dadurch Nachteile in der Behandlung entstehen.

Personen aus der Allgemeinbevölkerung (Gruppe 2)

Um eine möglichst naturalistische Stichprobe zu erhalten, wurden die Personen aus der Allgemeinbevölkerung auf verschiedenen Veranstaltungen willkürlich rekrutiert (siehe Abschnitt 4.2 & 4.4) und es wurden keine Personen aus der Allgemeinbevölkerung aufgrund von vorherigen oder aktuellen psychischen Störungen aus der Studie ausgeschlossen.

Gesunde Kontrollgruppe (Matches Samples)

Um Vergleiche zwischen der klinischen Stichprobe und gesunden Menschen im höheren Lebensalter vorzunehmen, wurde eine Subgruppe aus der Stichprobe der Allgemeinbevölkerung (Gruppe 2) extrahiert. Bei dieser Subgruppe handelte es sich um gesunde Kontrollen, die aufgrund bestimmter soziodemografischer Kriterien der klinischen Stichprobe paarweise zugeordnet wurden. Das Ziel der paarweisen Zuordnung (Matching) bestand darin, möglichst strukturgleiche Stichproben zu erhalten, um den Einfluss von Störvariablen bestmöglich zu eliminieren (Caliendo & Kopeinig, 2008). Bei der Identifikation der Matching-Partner:innen wurde nach der Methode des direkten Matchings vorgegangen, bei der die Zuteilung auf Basis einzelner Störvariablen erfolgt. Dabei werden typischerweise verschiedene soziodemografische Variablen für die Zuteilung der Gruppen gewählt (Hujer, Caliendo & Radic, 2005). Auf Basis aktueller Empfehlungen wurde jedem Studienteilnehmenden aus der klinischen Stichprobe ein:e Match-Partner:in nach Geschlecht und Alter (+ / - 5 Jahre) zugeteilt (Gensler, Skiera & Böhm, 2005; Hujer et al., 2001). Da Konfundierungen zwischen Emotionsregulation und Bildung, beruflicher Tätigkeit (Ochsner, Bunge, Gross & Gabrieli, 2002; Ochsner & Gross, 2005) sowie Familienstand (Gross, 2002; Gross & John, 2003; Gross et al., 2006) erwartet wurden, erfolgte die Zuteilung zusätzlich nach diesen Kriterien. Die Matched Samples wiesen zum Zeitpunkt der Untersuchung keine depressiven Symptome auf. Zudem bestand keine psychische Vorerkrankung oder die Diagnose einer psychischen Störung in der Gegenwart oder Vergangenheit (Zusatzfragen zum Ausschluss affektiver Störungen). Bei Paaren, bei denen eine exakte Parallelisierung nicht möglich war, wurden Matchpartner:innen nach dem Kriterium ausgewählt, das dem eigentlichen Kriterium am nächsten war. Beispielsweise wurde Hauptschule vereinzelt ersetzt durch Volksschule oder geschieden durch verwitwet. Das Auswahlverfahren wurde händisch vorgenommen und war unabhängig und zufällig gegenüber den Ergebnissen der Tests zur Erfassung der Emotionsregulationskompetenz.

Einschlusskriterien:

  • Wert in der GDS < 5

Ausschlusskriterien:

  • Bekannte Diagnose einer psychischen Störung in der Vergangenheit oder Gegenwart

  • Psychiatrische oder psychologische Behandlungen im Laufe des Lebens

4.4.3 Beschreibung der Stichproben

Im Folgenden werden die klinische Stichprobe (Gruppe 1), die nicht-klinische Gruppe (Gruppe 2) und die gesunde Kontrollgruppe (Matched Samples) hinsichtlich soziodemografischer und psychopathologischer Merkmale, Aktivitäten und Kontakte, der Schwere der depressiven Symptomatik sowie psychischer Vorerkrankungen und Behandlungen beschrieben. Zunächst erfolgt eine Beschreibung der Personen aus der Allgemeinbevölkerung. Daran schließt sich ein Vergleich zwischen der klinischen Stichprobe und der gesunden Kontrollgruppe an.

Die Gruppe 2 bestand aus N = 684 Personen aus der Allgemeinbevölkerung, wovon etwa zwei Drittel weiblich waren. Das mittlere Alter betrug zum Zeitpunkt der Erhebung 70.43 Jahre (SD = 7.43). In Tabelle 4.3 werden die soziodemografischen Merkmale deskriptiv dargestellt.

Tabelle 4.3 Soziodemografische Merkmale der Stichprobe aus der Allgemeinbevölkerung (N = 684)

In der Gruppe der Personen aus der Allgemeinbevölkerung betrug der Aktivitäts-Score im Mittel 5.78 (SD = 1.5) und der Kontakt-Score 6.32 (SD = 1.84). Somit werden die untersuchten Studienteilnehmenden bezüglich ihrer Aktivitäten und Kontakte im Durchschnitt als zufrieden beurteilt (zur Erläuterung der Kriterien siehe Abschnitt 4.3). Bei Betrachtung einzelner Items berichten 64 (9 %) Personen von einer Abnahme des Interesses im letzten Monat und 71 (10 %) der Studienteilnehmenden berichten von einer Abnahme der Kontakte im Vergleich zum vergangenen Jahr. Von den untersuchten Studienteilnehmenden besitzen 93 (14 %) ein Haustier. Zur Unterbringung geben 216 (32 %) an, allein zu leben, sechs (1 %) Personen leben in einer Institution und 458 (67 %) Personen leben mit dem oder der Partner:in, mit Familienangehörigen oder Bekannten zusammen.

Die durchschnittliche Schwere der depressiven Symptomatik betrug 1.71 Punkte (SD = 2.56, Min = 0, Max = 14). Damit konnten die Studienteilnehmenden bezüglich einer depressiven Symptomatik im Mittel als unauffällig angesehen werden (siehe Abschnitt 4.3). Erwartungsgemäß befanden sich 617 (90 %) Studienteilnehmende im unauffälligen Bereich, 50 (7 %) im Bereich einer leichten bis mäßigen Depression und 13 (2 %) im Bereich einer schweren Depression.

Bezüglich früherer oder aktueller psychischer Störungen oder Vorbehandlungen gaben 172 (25 %) Studienteilnehmende an, sich im Laufe ihres Lebens in psychiatrischer oder psychologischer Behandlung befunden zu haben. Die Diagnose einer psychischen Störung im Laufe ihres Lebens erhielten 120 (18 %) Studienteilnehmende. Von den untersuchten Studienteilnehmenden gaben 201 (29 %) an, die Kriterien einer depressiven Episode im Laufe ihres Lebens schon einmal erfüllt zu haben, 42 (6 %) gaben an, in den letzten zwei Jahren mindestens die Hälfte der Zeit unter einer depressiven Stimmung gelitten zu haben.

In Tabelle 4.4 werden die psychopathologischen Merkmalen der Personen aus der Allgemeinbevölkerung dargestellt. Es wird der durchschnittliche Summenscore der einzelnen Skalen abgebildet. Bei den Personen aus der Allgemeinbevölkerung wurde der höchste Summenscore bei der Skala Manie (M = 1.83, SD = 1.50) erreicht, gefolgt von der Skala Depression (M = 1.41, SD = 1.52).

Tabelle 4.4 Psychopathologische Merkmale der Stichprobe aus der Allgemeinbevölkerung (N = 684)

Anhand eines statistischen Vergleichs der Gruppenmerkmale zeigte sich, dass sich die Patient:innen aus der klinischen Stichprobe und die Personen aus der Allgemeinbevölkerung hinsichtlich des Bildungsniveaus (t(728) = -10.14; p < 0.001) signifikant voneinander unterschieden. Um den Einfluss des Bildungsniveaus auf mögliche Gruppenunterschiede zu bereinigen und um die Vergleichbarkeit der klinischen Stichprobe und der Kontrollgruppe zu erhöhen, wurde eine gesunde Kontrollgruppe gezogen (Matched Samples).

Die untersuchte Stichprobe bestand nach der Parallelisierung aus N = 92 Studienteilnehmenden, wovon 18 (20 %) männlich und 74 (80 %) weiblich waren. Der Stichprobenumfang orientierten sich an der Studie von Kraaij et al. (2002b), die in einem vergleichbaren Studiendesign Signifikanzen fand. Das mittlere Alter der Gesamtstichprobe betrug zum Zeitpunkt der Erhebung 70.58 Jahre (SD = 7.68). Die Gesamtstichprobe setzte sich aus der klinischen Stichprobe (n = 46) und der gesunden Kontrollgruppe (n = 46) zusammen. In Tabelle 4.5 werden die soziodemografischen Merkmale der beiden Gruppen deskriptiv dargestellt.

Tabelle 4.5 Soziodemografische Merkmale der klinischen Stichprobe und der gesunden Kontrollgruppe

In der klinischen Stichprobe betrug der Aktivitäts-Score zum Messzeitpunkt T1 im Mittel 3.67 (SD = 2.30) und der Kontakt-Score 4.02 (SD = 1.81). Bei einem Cut-off Wert von 5 kann die klinische Stichprobe als unzufrieden bezüglich ihrer Aktivitäten und Kontakte beurteilt werden (siehe Abschnitt 4.3). Bei der Betrachtung einzelner Items berichten 34 (74 %) Personen von einer Abnahme des Interesses im vergangenen Monat und 29 (72 %) Studienteilnehmende berichten von einer Abnahme der Kontakte im Vergleich zum vergangenen Jahr. Von den untersuchten Studienteilnehmenden besitzen 16 (35 %) ein Haustier. Zur Unterbringung geben 25 (54 %) von ihnen an, allein zu leben, zwei (4 %) Personen leben in einer Institution, 19 (41 %) Personen zusammen mit dem oder der Partner:in, mit Familienangehörigen oder Bekannten.

Bei der gesunden Kontrollgruppe betrug der Aktivitäts-Score im Mittel 6.02 (SD = 1.33) und der Kontakt-Score 6.30 (SD = 1.91), womit diese Gruppe als zufrieden bezüglich ihrer Aktivitäten und Kontakte beurteilt werden kann. Keiner der Studienteilnehmenden berichtete von einer Abnahme des Interesses im vergangenen Monat, vier (9 %) Personen von einer Abnahme der Kontakte im Vergleich zum vergangenen Jahr. In der gesunden Kontrollgruppe besitzen vier (9 %) Befragte ein Haustier. Keiner der Studienteilnehmenden gab an, in einer Institution zu leben. 22 (48 %) von ihnen leben zusammen mit dem oder der Partner:in, mit Familienangehörigen oder Bekannten, 24 (52 %) Befragte leben allein.

Die Schwere der depressiven Symptomatik in der klinischen Stichprobe wurde zu Beginn der tagesklinischen Depressionsbehandlung (T1) in der Selbst- und Fremdbeurteilung erhoben. Der Mittelwert der Selbstbeurteilung der Schwere der depressiven Symptomatik betrug in der klinischen Stichprobe 8.39 Punkte (SD = 4.04, Min = 0, Max = 14). Ausgehend von den Empfehlungen der Autor:innen, bei einem Punktwert von 6–10 Punkten von einer leichten bis mittelgradigen Depression auszugehen, wurden die Studienteilnehmenden in der Selbstbeurteilung als leicht bis mittelgradig depressiv eingeordnet. In der Selbstbeurteilung befanden sich zehn (22 %) Studienteilnehmende im unauffälligen Bereich, während sich 17 (37 %) im Bereich einer leichten bis mäßigen Depression und 19 (41 %) im Bereich einer schweren Depression befanden. Der Mittelwert der Fremdbeurteilung zum Messzeitpunkt T1 betrug 10.15 Punkte (SD = 2.31, Min = 6, Max = 14). Die Schwere der Depression wurde in der Fremdbeurteilung zwar höher eingeschätzt und befand sich dicht an der Grenze zur schweren Depression, aber nach Punktwert kann die Gruppe ebenfalls als leicht bis mittelgradig depressiv eingeschätzt werden. In der Fremdbeurteilung befand sich keiner der Studienteilnehmenden im unauffälligen Bereich, während sich 27 (59 %) Personen im Bereich einer leichten bis mäßigen Depression und 19 (41 %) Personen im Bereich einer schweren Depression befanden.

Bei der gesunden Kontrollgruppe betrug die Schwere der depressiven Symptomatik 0.59 Punkte (SD = 0.96, Min = 0, Max = 4), womit die Studienteilnehmenden erwartungsgemäß als unauffällig eingeschätzt werden konnten (siehe Abschnitt 4.3).

Es zeigten sich signifikante Unterschiede (p < .001) zwischen der klinischen Stichprobe und der gesunden Kontrollgruppe in der depressiven Symptomatik sowie in den Aktivitäten und Kontakten.

In Tabelle 4.6 wird die klinische Stichprobe mit der gesunden Kontrollgruppe hinsichtlich psychopathologischer Merkmale verglichen. In der klinischen Stichprobe wurde der höchste Summenscore in der Skala Angst (M = 5.85, SD = 3.40) und erwartungsgemäß in der Skala Depression (M = 5.00, SD = 2.16) erreicht. Die Mittelwerte der Skalen Depression, Reizbarkeit, Ängste, Somatische Symptome, Schlafstörungen und Persönlichkeitsstörungen befanden sich über einem Summenscore von 2 und somit in einem auffälligen Bereich.

In der gesunden Kontrollgruppe befinden sich die Mittelwerte aller Skalen unter einem Summenscore von 2 und somit in einem unauffälligen Bereich. Zwischen der klinischen Stichprobe und der gesunden Kontrollgruppe gab es keine signifikanten Unterschiede in den Skalen Manie, Suizidgedanken, Psychose und Substanzmissbrauch. In allen anderen Skalen unterschieden sich die beiden Gruppen signifikant (p < .001) voneinander.

Tabelle 4.6 Psychopathologische Merkmale der klinischen Stichprobe und der gesunden Kontrollgruppe

Die Behandlungsdauer der Studienteilnehmenden aus der klinischen Stichprobe betrug im Mittel 49.27 Tage (SD = 13.79 Tage).

4.5 Statistische Auswertung

Die statistische Auswertung der Daten wurde mit SPSS (Statistical Package for the Social Sciences for Windows, Version 26.0) durchgeführt. Zur vorherigen Aufbereitung wurden in den Rohdaten fehlende Werte durch Skalenmittelwerte ersetzt. Im nächsten Schritt wurden die Daten um solche Datensätze bereinigt, bei denen relevante soziodemografische Angaben wie das Alter fehlten oder bei denen aufgrund zu vieler fehlender Werte keine Skalenwerte gebildet werden konnten (Döring & Bortz, 2016). Die Kriterien zum Umgang mit fehlenden Werten wurden aus den jeweiligen Manualen der Messinstrumente entnommen.

Die vorliegende Untersuchung basiert auf einem korrelativen sowie auf einem quasiexperimentellen Kontrollgruppendesign. Anhand eines korrelativen Studiendesigns wurde die Forschungsfrage 1 beantwortet. Dafür wurden Zusammenhänge zwischen der Emotionsregulationskompetenz und verschiedenen Affektvariablen gesucht und systematisch analysiert. Eine nicht-klinische Gruppe (Gruppe 2 = Personen aus der Allgemeinbevölkerung) wurde dafür im Querschnitt untersucht (siehe Abschnitt 3.6.1). Im Rahmen einer quasiexperimentellen Untersuchung und zur Beantwortung der Forschungsfrage 2 (siehe Abschnitt 3.6.2) wurden Daten einer klinischen Stichprobe (Gruppe 1 = Patient:innen in tagesklinischer Depressionsbehandlung) und einer gesunden Kontrollgruppe (Matched Samples) miteinander verglichen. Die Forschungsfrage 3 wurde korrelativ sowie anhand eines quasiexperimentellen Studiendesigns mit Messwiederholung (siehe Abschnitt 3.6.3) beantwortet. In einer klinische Stichprobe (Gruppe 1 = Patient:innen in tagesklinischer Depressionsbehandlung) wurde in Form eines Quer- und Längsschnitts der Einfluss der Emotionsregulationskompetenz auf den Effekt einer Depressionsbehandlung untersucht.

Im Folgenden werden die statistischen Analysemethoden detailliert beschrieben, die zur Beantwortung der in Abschnitt 3.6 formulierten Forschungsfragen eingesetzt wurden.

Bei der Überprüfung der Forschungsfragen und der dazugehörigen postulierten Zusammenhangs- und Unterschiedshypothesen wurde ein Signifikanzniveau von α < .01 zugrunde gelegt, wobei ungerichtete Hypothesen zweiseitig getestet wurden. Um die Nullhypothese nicht fälschlicherweise (bedingt durch eine geringe Stichprobengröße) beizubehalten, wurde bei der Untersuchung der klinischen Stichprobe ein Signifikanzniveau von α < .05 angenommen. Im Falle einer möglichen α-Fehler-Kumulierung wurde eine Bonferroni-Korrektur durchgeführt.

Zur Beantwortung der Forschungsfrage 1 wurden anhand von Pearson-Korrelationskoeffizienten Zusammenhänge zwischen der Emotionsregulationskompetenz und verschiedenen Affektvariablen (positiver & negativer Affekt, Depression und Wohlbefinden) untersucht. Entsprechend der gängigen Einteilung wurden Korrelationskoeffizienten zwischen r = .10 und r = .29 als schwach, zwischen r = .30 und r = .49 als mittel/moderat und Korrelationskoeffizienten von r = .50 und größer als groß bewertet (Döring & Bortz, 2016). Als Maß für die Effektstärke und zur Bestimmung der Bedeutsamkeit wurde Cohens d berechnet. Dabei wurden Effektstärken < .50 als kleiner Effekt, .50–.80 als mittlerer Effekt und > .80 als großer Effekt interpretiert (Cohen, 1988). Im Rahmen zusätzlicher Analysen wurde die Beziehung zwischen Emotionsregulation und Wohlbefinden bei Menschen im höheren Lebenalter untersucht. Dafür wurde zum einen eine multiple lineare Regressionsanalyse durchgeführt. Voraussetzungen, die für diese Analyse erfüllt sein müssen, sind beispielsweise ein linearer Zusammenhang zwischen den metrischen Faktoren und den unabhängigen Variablen, keine Ausreißer und die Normalverteilung der Residuen. Diese Voraussetzungen wurden nach der Berechnung des Modells überprüft. Die Untersuchung der Unabhängigkeit der Residuen wurde mit dem Durbin-Watson-Test durchgeführt und die Multikollinearitätsdiagnose anhand von Variance Inflation Factor (VIF) und Toleranzwerten. Aus inhaltlichen Gründen wurde zudem eine blockweise, sequenzielle Regressionsanalyse durchgeführt. Dabei wurden nacheinander Blöcke von mindestens einem Prädiktor in die Regressionsanalyse aufgenommen. Hier wurde untersucht, ob durch den zusätzlichen Block ein bedeutsamer Teil an zusätzlicher Varianz aufgeklärt werden konnte. Die Blöcke wurden in vier Schritten nach einer vorab festgelegten Reihenfolge in das Modell aufgenommen. Im ersten Schritt wurden die Variablen Alter und Geschlecht in die Berechnung miteinbezogen, im zweiten Schritt Aktivitäten und Kontakte, im dritten Schritt Depression und Angst und im vierten Schritt wurde Emotionsregulationskompetenz miteinbezogen. Diese Strategie wurde gewählt, da unter den unabhängigen Variablen kausale Abhängigkeiten vermutet wurden, die möglicherweise einen Einfluss auf den Modellaufbau gehabt hätten (Diehl & Staufenbiel, 2007).

Zur Beantwortung der Forschungsfrage 2 wurden Mittelwertunterschiede zwischen der klinischen Stichprobe und den gesunden Matched Samples anhand von t-Tests für abhängige Stichproben untersucht. Der t-Test für abhängige Stichproben eignet sich zur Überprüfung von Mittelwertunterschieden zwischen zwei abhängigen oder verbundenen Stichproben. Von einer abhängigen Stichprobe kann u. a. dann gesprochen werden, wenn die Messwerte von Personen stammen, die aufgrund bestimmter Kriterien einander zugeteilt wurden (Matching; Döring & Bortz, 2016). Die Prüfung der Normalverteilung wurde anhand des Shapiro-Wilk-Tests vorgenommen, da dieser konservativer als der Kolmogorov-Smirnov-Test prüft. Zur Voraussetzung der Normalverteilung der abhängigen Variablen in beiden Gruppen ist anzumerken, dass bei kleinen Stichproben die bekannten Tests auf Normaltverteilung zu wenig sensitiv sind, um Abweichungen von der Normalverteilung zu identifizieren. Aufgrund dessen wurden zusätzlich Histogramme zur Beurteilung hinzugezogen. Grundsätzlich sollte der t-Test den nonparametrischen Verfahren vorgezogen werden, auch wenn die Voraussetzung der Normalverteilung verletzt ist (Bühner & Ziegler, 2009). Zusätzlich besagt der zentrale Grenzwertsatz, dass mit wachsender Stichprobengröße die Verteilung der Mittelwerte in eine Normalverteilung übergeht (Bortz, 1999). Daher wurden vorwiegend parametrische Verfahren eingesetzt. Die Voraussetzung der Varianzenhomogenität wurde anhand des Levene-Tests überprüft.

Um im Rahmen zusätzlicher Analysen zu überprüfen, welche Emotionsregulationskompetenzen und welche Strategien sich zur Vorhersage der Zugehörigkeit zur klinischen Stichprobe oder zur gesunden Kontrollgruppe (Depression ja/nein) eignen, wurde eine binäre logistische Regressionsanalyse durchgeführt. Die binäre logistische Regressionsanalyse gehört zu den multivariaten Verfahren. Sie wird angewendet, wenn überprüft werden soll, ob ein Zusammenhang zwischen einer binär kodierten abhängigen Variable und mehreren intervallskalierten unabhängigen Variablen besteht (Wentura & Pospeschill, 2015). Anhand dieses Verfahrens kann die Varianz einer binären abhängigen Variable und intervallskalierten unabhängigen Variablen vorhergesagt werden. Zudem werden Prädiktor-Variablen bestimmt, die vorhersagen, zu welcher von zwei diagnostischen Gruppen Studienteilnehmende mit einer höheren Wahrscheinlichkeit gehören. Dazu sind multiple Regressionsanalysen ungeeignet, da die Verteilungsannahmen, die der multiplen Regression zugrunde liegen, nicht gegeben sind. Die vorhergesagten Werte sind nicht sinnvoll zu interpretieren, da sie nicht auf den Wertebereich von null bis eins festgelegt sind (Wentura & Pospeschill, 2015). Bei der Interpretation der Regressionskoeffizienten der logistischen Regression gilt es, deren Vorzeichen zu beachten: Ein positives Vorzeichen zeigt an, bei Zunahme des Prädiktors zur Gruppe zu gehören, die mit 1 kodiert ist. Ein negatives Vorzeichen weist auf eine erhöhte Wahrscheinlichkeit hin, zur anderen Gruppe zu gehören. Um zu überprüfen, ob das Regressionsmodell insgesamt signifikant ist, wurde ein Chi-Quadrat-Test angewendet. Dieser Omnibus-Test überprüft, ob das Modell insgesamt eine signifikante Erklärungsgüte aufweist. Die Signifikanz der Regressionskoeffizienten (B) wurde für jeden Koeffizienten anhand eines Wald-Tests durchgeführt. Zur Beurteilung der Modellgüte wurden das Cox und Snell R2 und das Nagelkerke R2 verwendet. Das Cox und Snell R2 verhält sich relativ zur Stichprobengröße, was bedeutet, dass dieser Koeffizient nicht 1 werden kann. Das Nagelkerke R2 kann Werte zwischen 0–1 annehmen (Behnke, 2014). Zur Einschätzung des Nagelkerke R2 werden die folgende Konvention verwendet: Werte < .1 weisen auf eine schlechte und Werte zwischen .1–.3 auf eine mittlere Erklärungsgüte hin. Erst bei Werten > .5 kann von einer zufriedenstellenden Erklärungsgüte ausgegangen werden (Cohen, 1988).

Zur Beantwortung der Forschungsfrage 3 wurde der Einfluss der Emotionsregulationskompetenz auf den Therapieeffekt untersucht. Dafür wurde der Einfluss der Emotionsregulationskompetenz auf die depressive Symptomatik im Längsschnitt zu verschiedenen Zeitpunkten einer Depressionsbehandlung untersucht. Längsschnittuntersuchungen werden in Form von Trend- oder Panelstudien durchgeführt. Für diese Untersuchung wurde ein Panel ausgewählt. Im Vergleich zu einer Trendstudie, bei der Daten zu unterschiedlichen Messzeitpunkten von unterschiedlichen Stichproben untersucht werden, werden bei einem Panel die Daten derselben Stichprobe analysiert. Panelstudien sind somit aussagekräftiger, da auch intraindividuelle Veränderungen erfasst werden (Döring & Bortz, 2016). Die Analyse der Längsschnittdaten wurde mithilfe eines varianzanalytischen Analysemodells für Messwiederholungen (ANOVA) durchgeführt. Dafür wurden anhand der Emotionsregulationskompetenz zwei Gruppen gebildet. Als Maß für die Emotionsregulationskompetenz wurde der Mittelwert der Gesamtwerte des SEK-27 über die drei Messzeitpunkten bestimmt und anhand eines Mediansplits zwei Gruppen gebildet (Emotionsregulationskompetenz: hoch / niedrig). Es wurden Mittelwertunterschiede in der Depressionsschwere zwischen beiden Gruppen zu den verschiedenen Messzeitpunkten (vor Behandlungsbeginn, unmittelbar nach Behandlung und 3 Monate nach Behandlung) untersucht. Die Sphärizitätsannahme wurde anhand des Mauchly-Tests überprüft. Bei signifikanten Ergebnissen, die für eine Verletzung der Sphärizitätsannahme sprechen, wurde eine Greenhouse-Geisser-Korrektur durchgeführt. Als Maß für die Effektgröße wurde das partielle Eta-Quadrat (η2) bestimmt. Dabei wird der Anteil der aufgeklärten Varianz auf der Ebene der Stichprobe dargestellt. Während Effektgrößen bei Mittelwertvergleichen ohne Messwiederholung sinnvoll interpretierbar sind, ist die Interpretation bei messwiederholten Verfahren problematisch. Bei Messwiederholung ergeben sich die Effektgrößen in Abhängigkeit vom Aufbau und von den Bedingungen der jeweiligen Studie und werden deshalb nicht mit Effektgrößen aus Verfahren ohne Messwiederholung verglichen. Das η2 wird häufig für diese Art von Studien verwendet, es sollte aber darauf hingewiesen werden, dass die Aussagekraft eingeschränkt ist. Ein Grund dafür liegt u. a. darin, dass die Effektgröße bei Untersuchungen mit Messwiederholung häufig stark vom wahren Wert in der Population abweicht (für eine ausführlichere Erläuterung, siehe Rasch, Friese, Hofmann & Naumann, 2014). Des Weiteren sollte die Interpretation der Effektstärke nicht anhand der von Cohen (1988) vorgeschlagenen Konventionen vorgenommen werden. Insgesamt stellt das η2 bei Verfahren mit Messwiederholungen ein eher ungünstiges Maß dar, da keine sinnvolle Interpretation möglich ist und wissenschaftliche Untersuchungen mit und ohne Messwiederholung nicht sinnvoll miteinander vergleichbar sind. In Ermangelung an Alternativen werden die Effektstärken dennoch im Folgenden berichtet (Rasch et al., 2014).

Abschließend wurde explorativ untersucht, ob Unterschiede in den Einschätzungen zwischen Patient:innen und ihren Behandelnden zur depressiven Symptomatik und zur Emotionsregulationskompetenz bestehen. Dafür wurde ein Vergleich zwischen der Selbstbeurteilung der Patient:innen und der Fremdbeurteilung der Behandelnden vorgenommen und anhand von Intraklassenkorrelationen die Beurteilungsübereinstimmung bestimmt. Bei der Intraklassenkorrelation handelt es sich um ein Zusammenhangsmaß anhand dessen beurteilt werden kann, inwiefern zwei Beurteilende hinsichtlich einer Merkmalsausprägung (Depression und Emotionsregulation) übereinstimmen. Durch die Intraklassenkorrelation wird die Reliabilität der Beurteilung eingeschätzt. Für diese Analyse können ebenfalls Pearson-Korrelationskoeffizienten verwendet werden. Der Vorteil der Intraklassenkorrelation liegt allerdings darin, dass Unterschiede hinsichtlich der Streuung der Mittelwerte zwischen den Beurteilenden berücksichtigt werden. Zudem kann mit dem Pearson-Korrelationskoeffizienten nur der lineare Trend zweier Messreihen quantifiziert werden, nicht die absolute Übereinstimmung, sodass systematische Fehler unentdeckt bleiben würden. Als Modell wurde eine zweifaktorielle Intraklassenkorrelation gewählt, da die Studienteilnehmenden nicht alle von den gleichen Beurteilenden bewertet wurden. Es werden unjustierte Intraklassenkorrelationen (absolute Übereinstimmung) berichtet, da es sich hierbei um das strengere Maß handelt. Bei unjustierten wird im Vergleich zu justierten Intraklassenkorrelationen die Ähnlichkeit der absoluten Werte gefordert. Damit sind die unjustierte Intraklassenkorrelationen vom Effekt unterschiedlicher Mittelwerte bereinigt. Bei den justierten wird lediglich ein ähnliches Verhältnis der Abweichungen zwischen den einzelnen Urteilen gefordert. Aufgrund dessen ergeben sich bei den justierten tendenziell höhere Werte als bei den unjustierten Intrakorrelationen und es besteht die Gefahr, dass die Reliabilität der justierten Werte überschätzt wird. Zudem sollte behutsam bei der Interpretation der unjustierten Werte vorgegangen werden, da diese tendenziell unterschätzt werden. Die Intraklassenkorrelation kann Werte zwischen 0–1 annehmen. Bei einem Wert von 0 kann davon ausgegangen werden, dass kein Zusammenhang zwischen den beiden Beurteilungen vorliegt. Je höher der Wert der Intrakorrelation, desto höher die Reliabilität der Urteile und desto höher die Beurteilungsübereinstimmung (Wirtz & Caspar, 2002). Nach Nunnally (1978) kann ab einem Wert von .7 von einer hohen Übereinstimmung ausgegangen werden. Allerdings schlagen verschiedene Autor:innen unter bestimmten Bedingungen eine weniger restriktive Interpretation vor und betrachten bereits Werte zwischen .4–.7 als akzeptabel (Wirtz & Caspar, 2002). Zudem schlagen Wirtz und Caspers (2002) vor, dass die Ausprägung des Koeffizienten immer in Abhängigkeit des zu messenden Konstrukts und der zu untersuchenden Stichprobe interpretiert werden soll.