Die Diagnose Depression wird aufgrund von Bewertungen verschiedener Ebenen gestellt (kognitiv, emotional, verhaltensbezogen). Die nonverbale und die paraverbale Ebene werden bei diagnostischen Entscheidungen implizit bewertet, aber in Diagnosemanualen nicht differenziert. Studien aus jüngerer Zeit zeigen eindrücklich die Bedeutung nonverbalen und paraverbalen Verhaltens im Kontext psychischer Erkrankungen (Wiltshire et al. 2020), wobei die Berücksichtigung speziell paraverbaler Merkmale für diagnostische Entscheidungen noch genauer betrachtet werden sollte (Juslin und Scherer 2005).

Hintergrund

Untersuchungen zur Bedeutung paraverbaler Merkmale für diagnostische Entscheidungen könnten eine Überführung der aktuell implizit genutzten Merkmale in Diagnosemanuale ermöglichen. Definitionen expliziter paraverbaler Kriterien können zu besserer Übereinstimmung und Kommunikation zwischen Diagnostikern, zur Entwicklung standardisierter Erhebungsinstrumente und zu einer höheren Qualität der Ausbildung führen, da diese auf explizite Maße im Gegensatz zu subjektiven Empfindungen zurückgreifen können (Jablensky und Kendell 2002).

Grundlagen

Paraverbale Merkmale in medizinischem und psychotherapeutischem Kontext

Eine gelungene Kommunikation kann die Beziehung zwischen den Interaktionspartnern sowie den Behandlungserfolg in ärztlichen (Roter et al. 2006) und psychotherapeutischen Gesprächen (Westland 2015) positiv beeinflussen (Faller 2010; Lindemann 2015). Kommunikation findet auf verschiedenen Ebenen statt: linguistisch/verbal (sprachliche Inhalte), extralinguistisch (Mimik, Gestik, Körperkinetik usw.) oder paralinguistisch/paraverbal (Lautstärke, Stimmlage etc.; Tonti und Gelo 2016). Dabei werden die extralinguistischen und die paraverbalen Merkmale dem Oberbegriff des nonverbalen Verhaltens zugeordnet (Argyle 1979). Bis heute überwiegen Untersuchungen zur verbalen und speziell zur extralinguistischen Kommunikation (Schuller et al. 2013).

Paraverbale Phänomene spielen nicht nur beim Ausdruck und bei der Wahrnehmung von Emotionen eine zentrale Rolle, sondern geben auch Aufschluss über Aspekte wie Gesundheitszustand, Stresserleben oder Motivation der sprechenden Person (Schuller et al. 2013). Emotionsbezogene Kommunikationsfertigkeiten, wie das Wahrnehmen paraverbaler Informationen und das Bewusstsein für das Senden solcher Signale, beeinflussen die Qualität der medizinischen Betreuung erheblich (Pennacchini und Pensieri 2011; Roter et al. 2006). Dabei ist auffällig, dass 95 % der Studien zu nonverbalen Merkmalen fast ausschließlich die Mimik im Kontext von psychischen Störungen untersuchen und paraverbalen Merkmalen nur geringe Aufmerksamkeit zukommt (Balsters et al. 2012). Diese Tatsache geht nicht konform mit der Empfehlung, Interaktionen auf allen Kommunikationsebenen zu betrachten, um die Informationsgewinnung zu maximieren und trennschärfere Diagnosen zu stellen (Pennacchini und Pensieri 2011).

Paraverbale Korrelate der Depression

Paraverbale Merkmale können zusätzliche Indikatoren zur Beurteilung bestehender Depression sein (Cummins et al. 2015). Mehrheitlich wird ein Zusammenhang zwischen reduzierter F0-Spannweite (F0: Grundfrequenz der Stimme) und erhöhter Depressivität beschrieben (Cannizzaro et al. 2004; Mundt et al. 2007). Auch wird mehrfach eine Korrelation zwischen reduzierter Sprechgeschwindigkeit und dem Schweregrad der Depression berichtet (Cannizzaro et al. 2004; Mundt et al. 2012). Einerseits werden Zusammenhänge zwischen Behandlungserfolg und Steigerung der F0 bei Patient_innen mit Depression berichtet (Mundt et al. 2012), andererseits wurden keine signifikanten Gruppenunterschiede zwischen Patient_innen mit Depression und Gesunden bezüglich der F0 beschrieben (Taguchi et al. 2018). Dabei ist anzumerken, dass sich das Stimulusmaterial der beiden Studien deutlich unterschied: Mundt et al. (2012) untersuchten Gesprächsproben aus Telefonaten, Taguchi et al. (2018) das kontrollierte Vorlesen von Ziffern unter Laborbedingungen. Eine längere Pausendauer (i. e. Pausen zwischen Äußerungen) kann als der bisher vielversprechendste Indikator für die Depression angesehen werden, da dies über mehrere Studien übereinstimmend gezeigt werden konnte (Balsters et al. 2012).

Ziel der Arbeit

Im primären Fokus der vorliegenden Untersuchung stand der Vergleich einer psychiatrischen Stichprobe depressiver Patient_innen mit einer gesunden Kontrollgruppe im Hinblick auf paraverbale Merkmale. Als paraverbale Merkmale wurden die F0, ihre Spannweite, die Sprechgeschwindigkeit und Pausenlänge untersucht. Bisherige Studien zum Zusammenhang zwischen Depressivität und paraverbalen Merkmalen untersuchten dies stets unter Laborbedingungen, mit standardisiertem Material oder in Monologen von Patienten, sodass ein Transfer in den natürlichen Kontext erschwert ist.

Material und Methoden

Datenerhebung und Design

Die Untersuchung wurde als Sekundäranalyse einer Pilotstudie durchgeführt, die im quasiexperimentellen Design ohne Messwiederholung die Bedeutung der Synchronie von Körperbewegungen und Mimik in der Patient-Arzt-Kommunikation bei depressiven und gesunden Probanden untersuchte (Altmann et al. 2020a; 2020b). Die aktuelle Untersuchung ergänzt die vorhandenen Ergebnisse um Analysen paraverbaler Stimmparameter.

Stichprobe und Ablauf

An der Primärstudie nahmen insgesamt 30 Personen (20 bis 30 Jahre alt) teil, davon 15 Gesunde und 15 Patient_innen in stationärer Behandlung mit einer zum Studienzeitpunkt diagnostizierten depressiven Episode (unipolar nach Kriterien des ICD-10). Die Rekrutierung wurde in 2 Stufen durchgeführt: Erst wurde ein_e Patient_in mithilfe des Chef- und Oberarztes der Station für affektive Störungen des Universitätsklinikums Jena akquiriert. Einschlusskriterien waren das Vorliegen einer unipolaren depressiven Episode sowie ein Alter zwischen 20 und 30 Jahren. Es gab keine Restriktionen hinsichtlich der Komorbiditäten. Im zweiten Schritt wurde eine Kontrollperson durch Aushänge und Nutzen der sozialen Medien gesucht, die der/dem Patient_in in Geschlecht und Alter (±3 Jahre) glich. Somit wurde die Vergleichbarkeit beider Gruppen nach Geschlecht und Alter gewährleistet (genaue Informationen zu Rekrutierung und Studienfluss: Altmann et al. 2020a). Das Alter der Stichprobe betrug im Mittel 25,2 Jahre (Standardabweichung [SD] ± 3,1 Jahre; MKG = 25,5 Jahre, SDKG ± 3,3 Jahre; MPat = 24,9 Jahre, SDPat ± 3,1 Jahre). In beiden Gruppen befanden sich 60 % Männer und 40 % Frauen. Mindestens das Abitur hatten 80 % der Stichprobe (nKG = 93,3 %; nPat = 66,7 %, χ2 (1) = 3,3; V = 0,333, p < 0,05). In einer Partnerschaft befanden sich aktuell 26,7 % (nKG = 33,3 %; nPat = 20,0 %). Ausschlusskriterien für die klinische Stichprobe waren starke Einschränkungen der Kommunikation (Störungen der Wahrnehmung, des Seh- oder Hörvermögens nach subjektiver Einschätzung sowie mangelnde Deutschkenntnisse). Personen mit eingeschränkter Beweglichkeit der Kopf-Nacken-Region oder der Mimik, einer bestehenden manischen Episode, psychotischen Symptomen oder einer zu hohen Eigengefährdung wurden ebenfalls ausgeschlossen. Ausschlusskriterien für die gesunde Stichprobe waren: Medikation mit Psychopharmaka, diagnostizierte psychische Erkrankungen, Inanspruchnahme einer psychiatrischen oder psychotherapeutischen Behandlung oder starke Kommunikationseinschränkungen (Altmann et al. 2,3,a, b). Technische Einschlusskriterien waren: existierende Audiospuren und eine gute Qualität des Audiomaterials (wenig Hintergrundrauschen, kein starker Dialekt). Es mussten keine Dyaden aufgrund technischer Kriterien ausgeschlossen werden.

Alle aufgezeichneten Anamnesegespräche unterlagen den gleichen Aufnahmebedingungen (selber Raum, gleiche Sitz- und Kamerapositionierung, Kamera der Marke Canon Legria HFM52, Canon, Tokio, Japan) und dem gleichen Ablauf (Begrüßung, Fragebogen ausfüllen, Sektion G „Somatoforme Störungen“ aus dem Strukturierten Klinischen Interview für die Diagnose psychischer Störungen der Achse I des DSM-IV [SKID-I]). Sektion G wurde verwendet, da auch gesunde Probanden gelegentlich über körperliche Beschwerden klagen. Dementsprechend wurde in diesem Abschnitt eine Annäherung der Gesprächsanteile der beiden Gruppen erwartetet. Die Videos der Anamnesegespräche wurden auf die Fragen G16–G31 (Schmerzsymptome und gastrointestinale Symptome – Details: Zusatzmaterial online: Tabelle S1) des SKID‑I zugeschnitten, weil selbst gesunde Menschen gelegentlich über Schmerzen oder Verdauungsbeschwerden klagen (Häuser et al. 2013). Es handelt sich nur um einen Teil des Interviews, das für die Analysen der Bewegungs- und Mimikparameter genutzt wurde (Altmann et al. 2,3,a, b). Die Audiospuren wurden mithilfe eines VLC Players (Version 2.2.6) extrahiert und formatiert (Abtastrate 44.000 Hz, 2 Kanäle, Bitrate 128). Die konvertierten Audiodateien wurden in das Sprachanalyseprogramm Praat (Version 6.0.46; Boersma 2001) geladen und von einer kodierenden Person weiterverarbeitet. In einer TextGrid-Datei wurden die manuelle Segmentierung der Personensprechanteile (Annotation) und der Sprechpausen sowie die Transkription der gesprochenen Inhalte auf Grundlage von Kodierregeln (Zusatzmaterial online: Tabelle S2) gespeichert.

Die Studie wurde von der lokalen Ethikkommission bewilligt (ID 5043-01/17). Von allen beteiligten Patient_innen liegt eine Einverständniserklärung vor. Die Freiwilligkeit der Studienteilnahme wurde stets betont.

Erhobene Maße

Fragebogen

Es wurde die gesundheitsbezogene Lebensqualität mit dem Short-Form-36 Health Survey (SF-36; Bullinger et al. 1995), die Depressivität mit dem Patient Health Questionnaire (PHQ‑9; Kroenke et al. 2001) und die Angstsymptomatik mithilfe der Generalized Anxiety Disorder Scale (GAD‑7; Spitzer et al. 2006) erhoben. Für die Sekundäranalyse war v. a. der PHQ‑9 von besonderem Interesse. Aufgrund der hohen Komorbidität von Depression mit Ängstlichkeit sowie Somatisierungen wurden die oben genannten Fragebogen zusätzlich einbezogen. Anzumerken ist, dass Studien, die die Ängstlichkeit im Zusammenhang mit paraverbalen Merkmalen untersuchten, eine höhere F0 berichten; diese ist mit einem höheren Arousal assoziiert (Weeks et al. 2012).

Der PHQ‑9 besteht aus 9 Items und misst die Häufigkeit depressiver Symptome nach den Kriterien des DSM-IV für die Major Depression während der vergangenen 2 Wochen. Die Beantwortung der Items erfolgt auf einer 4‑stufigen Skala. Die Summenwerte von 0 bis 27 können als Kontinuum gesehen werden, bei dem Werte von 5–9 eine milde, von 10–14 eine moderate, von 15–19 eine mittelgradige und von 20–27 eine schwere depressive Symptomatik repräsentieren.

Mithilfe des SF-36 werden die selbsteingeschätzte gesundheitsbezogene Lebensqualität und die subjektive Gesundheit erfasst. Acht verschiedene Skalen der körperlichen und psychischen Gesundheit werden durch 35 Items in mehreren Antwortformaten erfragt. Das 36. Item erfragt die Veränderung des Gesundheitszustandes zum Vorjahr (genaue Informationen: Bullinger et al. 1995). In der vorliegenden Studie wurden die Summenskalen psychische Gesundheit sowie körperliche Gesundheit des SF-36 genutzt.

Die GAD‑7 erfasst mithilfe von 7 Items mit 4‑stufigem Likert-Skalen-Niveau die Ängstlichkeit der Patient_innen in Anlehnung an die Kriterien der generalisierten Angststörung des DSM-IV (Spitzer et al. 2006).

Paraverbale Merkmale

Um den Einfluss möglicher Ausreißer zu reduzieren, wurde für die F0 der Median analysiert. Die F0 wurde in Hertz (Hz) gemessen. Die Spannweite der F0 repräsentiert das Ausmaß der Monotonie im Stimmklang. Um die Verzerrung durch Hintergrundgeräusche zu reduzieren, wurde die Spannweite der F0 als Differenz des 5 %- und 95 %-Quantils der F0 operationalisiert (Schoenherr et al. 2021). Da die Spontansprache viele Unterbrechungen unter 200 ms beinhaltet (Stassen 1995), wurden nur Sprechpausen, deren Länge den Schwellenwert von 1s überschritt, berücksichtigt. Die Sprechgeschwindigkeit wurde als Quotient aus Silbenzahl und Dauer des Sprechanteils (Sprechanteil: Silben/s) operationalisiert. Die paraverbalen Parameter (Median der F0, 5 %- und 95 %-Quantil der F0, Dauer des Sprechanteils) sowie Transkripte wurden mithilfe des Praat-Skripts extrahiert (Schoenherr et al. 2021). Die Silbenzahl der Sprechanteile wurde mithilfe des R‑packages sylly.de (Version 0.1–6) aus den Transkripten bestimmt. Die paraverbalen Parameter wurden für jeden Sprechanteil bestimmt, sodass für jede/jeden Patient_in/Probanden mehrere Messungen der Parameter vorlagen.

Datenanalyse

Die Auswertung der Daten erfolgte mit IBM SPSS Statistics 24 und R 4.1.1. Für die Analysen wurden nur vollständige Datensätze verwendet; fehlende Werte wurden mithilfe der „listwise deletion“ ausgeschlossen. Für die Berechnung von F0, Range F0 und Sprechgeschwindigkeit mussten 5,46 % der Fälle aufgrund fehlender Stimmparameter ausgeschlossen werden. Für die Berechnung der Pausenlänge fehlten Daten von 3,8 % der Fälle. Für Gruppenvergleiche der deskriptiven Daten wurde je nach Verteilung der Daten parametrisch oder nichtparametrisch analysiert. Bei der Anwendung nichtparametrischer Daten wird statt des arithmetischen Mittels der Median der Skala berichtet. Zusätzlich dazu werden der Minimal- sowie Maximalwert angegeben, um die Verteilung besser zu charakterisieren. Fehlende Daten entstanden immer dann, wenn im Audiosignal zu viele überlagernde und störende Hintergrundgeräusche auftauchten; diese machten eine Differenzierung der Frequenzbänder unmöglich. Dementsprechend wurden auch diese ausgeschlossen. Aufgrund multipler Messungen der paraverbalen Merkmale pro Versuchsperson wurden die Zusammenhänge zwischen der Gruppenzugehörigkeit sowie den Fragebogenskalen (Depressivität, Ängstlichkeit, körperliche und psychische Gesundheit) und den paraverbalen Merkmalen mithilfe einzelner hierarchischer Regressionen (paraverbale Merkmale als Kriterien) analysiert. Zusätzlich wurde stets ein „random intercept“ modelliert, um die intraindividuelle Variabilität der paraverbalen Merkmale verschiedener Sprechanteile zu beachten (Level 1: Messungen pro Patient_in; Level 2: Patient_innen). In allen Regressionen wurde der dichotome Prädiktor Geschlecht (0: männlich, 1: weiblich) eingeschlossen, um für geschlechtsspezifische Unterschiede zu kontrollieren (Biemans (2000), durchschnittliche F0 der Männer bei ca. 125 Hz; durchschnittliche F0 der Frauen bei ca. 200 Hz).

Ergebnisse

Verglichen mit den Gesunden zeigten sich für die Patientengruppe mit Depression erwartungsgemäß höhere Werte für Depressivität (MPat = 15,47, SDPat ± 4,52; MKG = 3,40, SDKG ± 2,44; t (28) = −9,10, p < 0,001) und Ängstlichkeit (MPat = 11,87, SDPat ± 3,29; MKG = 1,73, SDKG ± 1,71; t(21,04) = −10,58, p < 0,001). Außerdem hatten die Patient_innen geringere Ausprägungen der körperlichen (MPat = 54,91, SDPat ± 8,33; MKG = 62,16, SDKG ± 3,33; t(18,37) = 3,13, p = 0,004) und psychischen Gesundheit (MPat = 13,66, SDPat ± 5,29; MKG = 35,68, SDKG ± 2,87; t(28) = 14,16, p < 0,001). Die Sprechdauer der Patient_innen im ausgewählten Gesprächsausschnitt war nicht signifikant länger als der Sprechanteil der Kontrollprobanden (Dauer: MedPat = 85,55 s, SDPat ± 55,75, MinPat = 18,42 s, MaxPat = 171,36 s; MedKG = 55,43 s, SDKG ± 37,91, MinKG = 14,54 s, MaxKG = 159,14 s, U (15,15) = 80,00, p = 0,19; Silbenanzahl: MedPat = 321,00, SDPat ± 303,60, MinPat = 99, MaxPat = 990; MedKG = 301,00, SDKG ± 217,96, MinKG = 84, MaxKG = 895, U (15,15) = 93,00, p = 0,44). Die Verteilungen der nichtparametrischen Skalen sind im Zusatzmaterial online: Abbildung S1 zu sehen. Die Häufigkeit einsilbiger Antworten (vorwiegend „Nein“) variierte zwischen den Gruppen (MPat = 11,36, SDPat ± 4,97, MKG = 7,43, SDKG ± 3,65; t(23,87) = −2,38, p = 0,03).

Die Ergebnisse der Multi-Level-Analysen sind in Tab. 1 zusammengefasst. Es zeigte sich ein signifikanter Gruppenunterschied in Bezug auf die Pausenlänge. Patient_innen machten signifikant längere Pausen (standardisierte Regressionskoeffizient [β] = 0,11, p = 0,02, r = 0,16). In Bezug auf die Fragebogenmaße fanden sich Zusammenhänge zwischen der Pausenlänge und der psychischen Gesundheit (β = −0,13, p < 0,01, r = −0,18)sowie auch im Besonderen zur Ängstlichkeit (β = 0,12, p < 0,01, r = 0,17). Kürzere Pausen scheinen demnach mit psychischer Gesundheit zusammenzuhängen. Die Sprechgeschwindigkeit konnte signifikant negativ durch Depressivität (β = −0,18, p = 0,04, r = −0,23) und Ängstlichkeit (β = −0,20, p < 0,01, r = −0,25) vorhergesagt werden. Es konnten keine signifikanten Zusammenhänge in Bezug auf die F0, die Spannweite der F0 und die körperliche Gesundheit gefunden werden. Die einsilbigen Antworten hatten eine geringere Spannweite der F0 (Mittelwert einsilbige Antworten: 30,25 Hz, Mittelwert sonstige Antworten: 45,68 Hz, t(422,63) = 6,00, p < 0,01). Die „Intraclass-correlation“(ICC)-Werte zeigen, dass innerhalb der frequenzbasierten Maße (F0, Spannweite der F0) im Vergleich zur Pausenlänge eine höhere intraindividuelle Variabilität zu sehen ist. Diese scheint in den verschiedenen Sprechanteilen ein eher konstantes Merkmal innerhalb einer Person zu sein. Frauen weisen erwartungskonform generell höhere Grundfrequenzen und eine höhere Spannweiten der Grundfrequenz auf. In Bezug auf die Sprechgeschwindigkeit und Pausenlänge gibt es keine Geschlechtsunterschiede.

Tab. 1 Ergebnisse der Multi-Level-Regressionen zum Zusammenhang zwischen paraverbalen Merkmalen und Gruppenzugehörigkeit sowie psychischen Variablen (Depressivität, Ängstlichkeit) und körperlicher Gesundheit

Diskussion

Interpretation der Ergebnisse

Die vorgestellten Ergebnisse zeigen, dass die Sprechgeschwindigkeit und teils die Pausenlänge auch in standardisierten Erhebungen mit Spontansprache Indikatoren für Ängstlichkeit und Depressivität sein können, da hier die wesentlichen Unterschiede zwischen depressiven Patient_innen und Gesunden deutlich wurden. Der Zusammenhang zwischen der Pausenlänge und Depressivität war nicht signifikant, weist aber explorativ auf eine mögliche Assoziation hin (β = 0,09, p = 0,07, r = 0,14). Im Hinblick auf die Depressivität zeigte sich, dass Patient_innen eine geringere Sprechgeschwindigkeit hatten. Auch die subjektive Ängstlichkeit konnte mit diesen Parametern in Verbindung gebracht werden. Eine stärkere Depressionsausprägung scheint mit einer monotoneren Sprechweise einherzugehen. Dieser Zusammenhang zeigte sich jedoch ausschließlich explorativ zum einen im Gruppenunterschied bezüglich der Spannweite der F0 (β = −0,12, p = 0,08, r = −0,17) und zum anderen in der Regressionsanalyse der kontinuierlichen Depressivitätsvariable (β = −0,12, p = 0,09, r = −0,17).

Bei Betrachtung der Depressionsausprägung wurde ersichtlich, dass die Verteilung in der klinischen Stichprobe sehr heterogen war. Möglicherweise waren einige der Patient_innen in ihrer Behandlung fortgeschritten, da die Patientengruppe in der Primärstudie lediglich danach ausgewählt wurde, ob zum Untersuchungszeitpunkt eine depressive Episode bestand. Hinzu kommt, dass die Fragebogenergebnisse bei 3 gesunden Probanden (20 % der Vergleichsgruppe) auf eine milde depressive Symptomatik hinwiesen. Die Überschneidung in der Verteilung von depressiven Patient_innen und gesunden Probanden könnte trotz der signifikanten Gruppenunterschiede in der Depressivität die geringen Effekte hinsichtlich der Gruppenunterschiede verursacht haben.

Das klinische Bild der Depression ist sehr heterogen, dementsprechend könnte es sinnvoll sein, paraverbale Merkmale in Bezug auf verschiedene Merkmale der Depression zu untersuchen. Dabei könnten die Zahl der depressiven Episoden, die Prominenz der Kardinalssymptome (Patient_innen mit vorwiegend trauriger Stimmung vs. Patient_innen mit Antriebslosigkeit und Gefühlsleere), die Schwere der Erkrankung sowie die medikamentöse Einstellung wichtige Einflussgrößen sein. Außerdem zeigen neuere Studien, dass nicht alle nonverbalen Merkmale (z. B. auch nicht alle Bewegungsparameter) für die Diagnostik der Depression gleich geeignet sind (Altmann et al. 2020b). Studienübergreifend besteht ein Zusammenhang zwischen Traurigkeit und einer geringen F0 sowie einer geringen Spannweite der F0 (Paeschke und Sendlmeier 2000). Da dieser Zusammenhang in Bezug auf die Depressivität nicht gezeigt werden konnte, kann angenommen werden, dass bei der vorliegenden Stichprobe nicht die niedergeschlagene Stimmung, sondern die Antriebslosigkeit im Vordergrund stand. Konform damit wurden signifikante Effekte in Bezug auf die Sprechgeschwindigkeit und explorative Befunde nachgewiesen; diese deuten auf einen Einfluss der Pausenlänge hin.

Bezogen auf die Spannweite der F0 könnte die vermehrte Beantwortung der Symptom- und Erkrankungsfragen im Interview mit „Nein“, die empirisch zu einer Einschränkung der natürlichen Spannweite der F0 geführt hat, ursächlich für die rein explorativen Befunde sein. Jedoch scheint gerade die Spannweite der F0 ein wichtiger Indikator für Depressivität zu sein, da dieser Zusammenhang auch in bisheriger Forschung mehrheitlich gezeigt wurde (Cannizzaro et al. 2004; Mundt et al. 2007).

Höhere Depressivität in der Gesamtstichprobe war signifikant mit einer geringeren Sprechgeschwindigkeit assoziiert (r = −0,23). Der Effekt ist als ein kleiner Effekt zu interpretieren. Mundt et al. (2007) haben einen stärkeren Zusammenhang zwischen Depressionsstärke und Sprechgeschwindigkeit gefunden (r = −0,53). Verschiedene Untersuchungsabläufe und -charakteristika können die voneinander abweichenden Effektstärken erklären (Mundt et al. 2007): Erhebung über 4 Wochen mit Sicherung einer Baseline für die F0 (n = 105). Die vorgestellten Ergebnisse lassen vermuten, dass die Pausen zwischen den Wörtern der Grund für die langsamere Sprechgeschwindigkeit sein können, was in vorliegender Forschung bereits beschrieben ist (Cannizzaro et al. 2004). Für zukünftige Forschung lässt sich ableiten, dass die Charakteristika, die zu einer veränderten Sprechgeschwindigkeit führen (e.g. Pausenlänge, Dauer des Sprechens der Vokale) wichtige Variablen sein können. Es ist nicht auszuschließen, dass sich ähnliche paraverbale Charakteristika auch bei anderen Störungen finden lassen. Ähnliche Befunde wurden für die untersuchte Ängstlichkeit erhoben. Da die Korrelation zwischen Depressivität und Ängstlichkeit in unserer Stichprobe sehr hoch ist, war es aufgrund des geringen Stichprobenumfangs nicht möglich, die Effekte differenzierter zu betrachten (e.g. durch die gleichzeitige Aufnahme der Parameter in das Regressionsmodell). Dies wäre ein Ansatzpunkt für zukünftige Forschung. Unter Hinzunahme einer größeren Stichprobe sowie mehrerer Indikatoren für psychische Gesundheit (e.g. Depressivität, Ängstlichkeit, Misstrauen gegenüber Menschen etc.) könnten Zusammenhänge zu den paraverbalen Merkmalen gegeneinander in umfassenden Regressionsmodellen geprüft werden. Aktuell scheinen die Ergebnisse bezüglich Sprechgeschwindigkeit und Pausenlänge darauf hinzudeuten, dass diese beiden Parameter gute Indikatoren für eine generelle psychische Gesundheit sind. Da die bisherigen Untersuchungen zeigten, dass die Zusammenhänge von Depressivität und der Sprechgeschwindigkeit über verschiedene Wörter hinweg bestehen (Cummins et al. 2015), wird nicht davon ausgegangen, dass unterschiedliche Wortkonnotationen der Grund der gefundenen Unterschiede sind.

Da in der vorliegenden Arbeit nur der sprachliche Beitrag des Probanden betrachtet wurde, kann nicht ausgeschlossen werden, dass das Interaktionsmuster des Diagnostikers die Ergebnisse möglicherweise beeinflusst hat. Die aktuelle Forschung zeigt, dass Synchronie von paraverbalen Merkmalen im Therapieverlauf entsteht und es einen wechselseitigen Einfluss gibt. Die Angleichung von paraverbalen Merkmalen im psychotherapeutischen Gespräch bei sozialen Ängsten scheint interessanterweise eher einen negativen Einfluss auf den Behandlungserfolg zu haben (Schoenherr et al. 2021). Weitere Untersuchungsmöglichkeiten sind die Inaugenscheinnahme der Wirkung der paraverbalen Synchronie zwischen Proband und Interviewer oder die subjektive Wahrnehmung paraverbaler Unterschiede.

Stärken und Limitationen der Studie

Stärken der Studie sind die standardisierte Gesprächsgrundlage und trotzdem mögliche Antwort in Spontansprache, die eine Generalisierung auf natürliche Kontexte ermöglicht. Dabei ist anzumerken, dass die analysierten Sprechanteile nicht standardisiert wurden, was die Interpretation der Befunde aktuell erschwert. Weiterhin wurde die Analyse der paraverbalen Merkmale softwarebasiert durchgeführt und bei der weiteren Untersuchung die Multi-Level-Struktur der Daten beachtet.

Die Untersuchung weist aufgrund des kleinen Stichprobenumfangs Limitationen bezüglich der Generalisierbarkeit der Ergebnisse und bezüglich der Power auf. Da es sich um eine Sekundäranalyse handelt, konnte die Wirkung wichtiger Einflussfaktoren, die im Rahmen der Pilotstudie nicht erhoben wurden, wie etwa nichtklassifizierter Komorbiditäten oder Dauer der bereits erfolgten Therapie, nicht ausgeschlossen werden. Weiterhin hätte die Qualität der Aufnahmen durch Ansteckmikrophone und einen Leitfaden ohne geschlossene Fragen verbessert werden können. Offene Fragen hätten in der Gesprächssituation ein vermehrtes einsilbiges Antworten wie „Nein“ vermieden.

Fazit für die Praxis

  • Die Analyse paraverbaler Parameter im wissenschaftlichen Kontext ist attraktiv, da sie kostengünstig, nichtinvasiv und objektiv durchgeführt werden kann. Gerade paraverbale Merkmale, die die Flüssigkeit des Gesprächsverlaufs abbilden (z. B. Sprechgeschwindigkeit oder die Pausenlänge) mögen eine dienliche Ergänzung zu den verbalen Äußerungen des Patient_innen bieten.

  • Werden diese Merkmale explizit definiert und in Diagnosemanuale aufgenommen, können Praktiker_innen schneller auch aufgrund paraverbaler Merkmale eine Diagnose stellen.

  • Paraverbale Merkmale könnten die Informationssammlung ergänzen und trennschärfere Diagnosen ermöglichen.

  • Treten eine geringe Sprechgeschwindigkeit und hohe Pausenlänge im Gespräch auf, sollte der/die Praktiker_in die Diagnosekriterien der Depression differenziert prüfen.

  • Um paraverbale Merkmale im klinischen Kontext noch besser zu verstehen, sind weitere Studien notwendig.