Einleitung

Der Beliefs About Voices Questionnaire – Revised [1] (BAVQ-R), die überarbeitete Version des BAVQ [2], ist ein Fragebogen, der Überzeugungen und emotionale und Verhaltensreaktionen von Personen bezüglich ihrer verbalen akustischen Halluzinationen erfasst. Im Rahmen der Entwicklung des bis heute wegweisenden kognitiven Modells des persistierenden Stimmenhörens [3] wurde der Fragebogen 1995 von Chadwick und Birchwood in einer Interviewstudie [2] mit 60 stimmenhörenden Personen mit Diagnosen einer Schizophrenie oder schizo-affektiven Störung kreiert. Die revidierte Fassung aus dem Jahr 2000 [1] verfeinerte die Beurteilungsmöglichkeiten und trug den Ergebnissen zur Bedeutung von Überzeugungen zur Omnipotenz der Stimmen mit zusätzlichen Items Rechnung. Es resultierten zufriedenstellende psychometrische Daten in einer Stichprobe von 71 stimmenhörenden Personen mit F2 und F3 Diagnosen.

Der BAVQ-R [1] kommt im englischsprachigen Raum und international sowohl in der klinischen Arbeit als auch in der Forschung zum Einsatz, da sich wiederholt gezeigt hat, dass Überzeugungen zum Stimmenhören die damit verbundenen Belastungen und die affektiven und Verhaltensreaktionen auf dieses Symptom erheblich prägen [3]. Der BAVQ-R mit seinen fünf Subskalen Böswilligkeit, Wohlwollen, Omnipotenz, Widerstand und Bindung (jeweils Emotion und Verhalten) dient der Evaluation von Interventionen [4, 5], der Beobachtung des Verlaufs [6] sowie der Forschung zur kognitiven Verhaltenstherapie, Compliance mit imperativen Stimmen und Unterschieden zwischen befehlenden und nicht-befehlenden Stimmen [7,8,9]. Er kann auch unabhängig von einer Schizophrenie-Diagnose, also z. B. bei PatientInnen mit Persönlichkeitsstörung vom Borderlinetyp und gesunden StimmenhörerInnen eingesetzt werden [10]. Hepworth et al. [11] untersuchten Personen mit schizophrenen Erkrankungen sowie Persönlichkeitsstörungen vom Borderlinetyp und fanden heraus, dass es keine Hinweise auf Unterschiedlichkeit in der Phänomenologie gibt, konnten aber Unterschiede in der affektiven Reaktion auf die Stimmen finden.

Auch einzelne Subskalen des BAVQ-R wurden in verschiedenen Untersuchungen verwendet. Für Böswilligkeit wurde im Rahmen einer Reliabilitätsprüfung der Subskala in einer norwegischen Studie (N = 31) ein Zusammenhang mit Aufmerksamkeitsdefiziten [12], und in einer Studie, die Korrelationen mit selbstverletzendem Verhalten bei Personen mit Schizophrenie und verbalen akustischen Halluzinationen untersuchte [13], eine positive Korrelation gezeigt. Validierte Übersetzungen liegen bisher in Französisch (N = 76) [14], Chinesisch (N = 33) [15] und Japanisch (N = 30) [16] vor.

Die vorliegende Studie prüft den Einsatz einer deutschen Version des BAVQ-R [1] an 93 stimmenhörenden PatientInnen mit Diagnosen von Psychosen aus dem schizophrenen Formenkreis.

Methoden

Prozedere

Der BAVQ-R [1] wurde durch unsere Arbeitsgruppe ins Deutsche übersetzt, die semantische Äquivalenz wurde durch Rückübersetzung durch eine zweisprachige englische Muttersprachlerin ermittelt, und dann durch einen der Autoren der englischen Originalversion, Paul Chadwick, geprüft und genehmigt.

Die Rekrutierung fand im Rahmen eines umfangreichen Projektes zu genderspezifischen Aspekten des Stimmenhörens, in welchem PatientInnen mit Erkrankungen aus dem schizophrenen Formenkreis (F2-Diagnose nach ICD10 [17]) rekrutiert wurden, statt. Weitere Einschlusskriterien neben der F2 Diagnose waren die Vollendung des 18. Lebensjahres sowie die Wahrnehmung von verbalen akustischen Halluzinationen innerhalb der letzten 4 Wochen vor Befragung. Als Ausschlusskriterien galten unzureichende Deutschkenntnisse und die Unfähigkeit die Einverständniserklärung zu erbringen.

Alle Prozeduren erfolgten nach den ethischen Standards entsprechend der Helsinki Deklaration. Nach Bewilligung durch die Ethikkommission der Medizinischen Universität Wien und die niederösterreichische Ethikkommission erfolgte die Rekrutierung an der Universitätsklinik für Psychiatrie und Psychotherapie der Medizinischen Universität Wien und an der Universitätsklinik Tulln (stationäres und tagesklinisches Setting), am sozialpsychiatrischen Zentrum der Caritas Wien und den Wiener Psychosozialen Diensten (ambulantes Setting). Die PatientInnen erhielten ausführliche Informationen über die geplante Befragung, eine Teilnahme an der Studie erforderte die Unterzeichnung einer schriftlichen Einverständniserklärung. Den TeilnehmerInnen stand es frei den Ort für die Befragung (Institution oder zu Hause) zu wählen.

Erhebungsinstrumente

Soziodemographische und klinische Variablen

Für die Datenakquirierung von soziodemographischen Merkmalen und der Krankheitsanamnese (Ersterkrankungsalter, Anzahl früherer psychiatrischer stationärer Aufnahmen, Alter bei erster stationärer Behandlung) wurde ein eigens erstellter Fragebogen verwendet.

The Beliefs About Voices Questionnaire – Revised (BAVQ-R) [1]

Der BAVQ-R [1] ist ein Selbsteinschätzungsfragebogen, welcher aus 35 Items besteht. Durch fünf Subskalen (Böswilligkeit, Wohlwollen, Omnipotenz, Widerstand und Bindung) können Details über Überzeugungen, Emotionen und Verhaltensweisen bezogen auf die wahrgenommene Stimme erfasst werden. Antworten werden mittels 4–Punkt–Likert-Skala (0 = stimme nicht zu, 1 = weiß nicht, 2 = stimme eher zu, 3 = stimme zu) erfasst. Im Falle dessen, dass StudienteilnehmerInnen mehr als eine Stimme vernehmen, wird der Fragebogen für die dominante Stimme ausgefüllt.

Psychotic Symptoms Rating Scale – Auditory Hallucinations (PSYRATS-AH) [18, 19]

Die PSYRATS-AH [18] ist ein semi-strukturiertes Interview, in dem mittels 11 Items Details über das Stimmenhören (Häufigkeit, Dauer, Lokalisierung, Lautstärke, Überzeugung bzgl. Herkunft, Grad und Menge negativer Inhalte, Menge und Intensität von Leid durch die Stimmen, Lebensbeeinträchtigung, Kontrolle über die Stimme) erfasst werden. Der Fragebogen ist 5‑Punkt-ordinalskaliert, nummeriert von 0–4.

Clinical Global Impression Scale – Schizophrenia (CGI-SCH) [20]

Die CGI-SCH [20] erfasst Negativ- und Positivsymptomatik, depressive und kognitive Symptome sowie einen Gesamtschweregrad einer Erkrankung. Jede der genannten Kategorien wird auf einer 7‑Punkt-ordinal-skalierten Skala (1 = nicht krank, 7 = sehr schwer erkrankt) erfasst.

Datenanalyse

Alle statistischen Analysen wurden mittels „Statistical Package for Social Science“ (Version 22, SPSS Incl., IBM Corporation, USA) durchgeführt. Die Stichprobe wurde deskriptivstatistisch mittels der Angabe von Absolutwerten und Prozentwerten beschrieben.

Zur Analyse der Reliabilität wurde die Interne Konsistenz (Cronbach’s alpha) herangezogen, wobei hier Werte über 0,7 als akzeptabel gelten. Die Test-Retest-Reliabilität wurde mittels Pearson-Korrelation berechnet, auch hier gelten Werte über 0,7 als akzeptabel.

Hinsichtlich Konstruktvalidität wurden Pearson-Korrelationen zur Beurteilung der Ähnlichkeit bzw. Unterschiedlichkeit mit verschiedenen Konstrukten berechnet. Diese wurden für alle Subskalen des BAVQ-R [1] errechnet, wobei mögliche Zusammenhänge mit einzelnen Dimensionen des PSYRATS-AH [18] und der CGI-SCH [20] interessierten.

Ergebnisse

Rekrutierung

Zwischen Februar 2014 und Februar 2017 wurden insgesamt 117 in Frage kommende PatientInnen eingeladen an der Studie teilzunehmen. Davon gaben 93 Personen ihr Einverständnis und konnten somit in die Studie eingeschlossen werden. Die Diagnosen lauteten wie folgt: Paranoide Schizophrenie (F20.0) (N = 84), und Schizo-affektive Störung (F25.9) (N = 9). Um die Test-Retest-Reliabilität zu prüfen, füllten 19 StudienteilnehmerInnen nach 7–15 Tagen (Mittelwert: 9 Tage ± 2,24) den Fragebogen ein zweites Mal aus.

Stichprobe

56 % der TeilnehmerInnen waren männlich, das mediane Alter des Samples betrug 33,0 Jahre (Spannweite: 19,0–84,0). 78,5 % der Teilnehmenden waren alleinstehend, nur 3 % waren berufstätig. Das Alter bei Ersterkrankung wurde von den TeilnehmerInnen mit 21 Jahren (Spannweite: 4–48) angegeben, die Dauer der Erfahrung des Stimmenhörens mit 10,5 Jahren (Spannweite: 4–48).

Deskriptive Statistik des BAVQ-R

Der Fragebogen konnte zügig, mit einem Zeitaufwand von unter 10 min ausgefüllt werden.

Tab. 1 zeigt die deskriptive Statistik der einzelnen Items und Subskalen des BAVQ-R. Hier wird ersichtlich, dass alle Subskalen Werte unterhalb des Mittelpunktes aufweisen. Daraus kann man schließen, dass die Fragen eher mit „ich stimme nicht zu“ oder „ich weiß es nicht“ oder (Werte 0 und 1 auf der Likert-Skala) beantwortet wurden.

Tab. 1 Deskriptive Statistik des BAVQ-R

Interne Konsistenz

Zufriedenstellende interne Konsistenzen konnten für die Subskalen Böswilligkeit (α = 0,83), Wohlwollen (α = 0,91), Widerstand (α = 0,85), Widerstand – Emotion (α = 0,84), Widerstand – Verhalten (α = 0,82), Bindung (α = 0,87), Bindung – Emotion (α = 0,88) und Bindung – Verhalten (α = 0,73) gezeigt werden. Lediglich die Subskala Omnipotenz zeigte mit α = 0,62 einen Wert unterhalb der Akzeptanzgrenze von 0,7. Die Ergebnisse werden in Tab. 2 dargestellt.

Tab. 2 Interne Konsistenz der BAVQ-R Subskalen

Test-Retest-Reliabilität

In Tab. 3 wird ersichtlich, dass die Subskalen Böswilligkeit, Wohlwollen, Omnipotenz, und Widerstand sowie die Subkategorie Widerstand-Verhalten die Akzeptanzgrenze von 0,7 erreichen. Die Subskala Bindung sowie deren Subkategorien Bindung-Emotion, Bindung-Verhalten und die Subkategorie Widerstand-Emotion erreichen den Wert von 0,7 nicht.

Tab. 3 Test-Retest-Reliabilität

Konstruktvalidität

Zur Ermittlung der Konstruktvalidität wurden Pearson-Korrelationen zur Beurteilung der Ähnlichkeit bzw. Unterschiedlichkeit der Konstrukte des BAVQ-R mit verschiedenen Dimensionen von PSYRATS-AH sowie CGI-SCH und dem Depressionsitem der CGI-SCH berechnet. Analysen wurden für alle Subskalen des BAVQ-R durchgeführt. Die Subskala „Böswilligkeit“ zeigte signifikante Korrelationen mit den PSYRATS-AH Items „negative Inhalte“ (r = 0,40; p ≤ 0,01), „Höhe der Belastung“ (r = 0,41; p ≤ 0,01), der „Intensität der Belastung“ (r = 0,33; p = 0,002) sowie mit der „Dauer“ (r = 0,21; p = 0,046).

Bei der Subskala „Wohlwollen“ gab es signifikante negative Korrelationen mit den Items des PSYRATS-AH „negative Inhalte“ (r = −0,43; p ≤ 0,01) und „Höhe der Belastung“ (r = −0,40; p ≤ 0,01) sowie mit dem Item „Intensität der Belastung“ (r = −0,39; p ≤ 0,01) und „Dauer“ (r = −0,21; p = 0,05) und Lautstärke (r = −0,25; p = 0,02).

Die Subskala „Omnipotenz“ des BAVQ-R zeigte signifikante Korrelationen mit „Dauer“ (r = 0,38; p ≤ 0,01), „negativen Inhalten“ (r = 0,36; p = 0,001), „Höhe der Belastung“ (r = 0,34; p = 0,001) und „Intensität der Belastung“ (r = 0,34; p = 0,002), „Häufigkeit“ (r = 0,25; p = 0,018) und „Kontrolle“ (r = 0,24; p = 0,028).

Die Subskala Widerstand korrelierte mit „Höhe der Belastung“ (r = 0,54; p ≤ 0,01), „Intensität der Belastung“ (r = 0,46; p ≤ 0,01), „negative Inhalte“ (r = 0,34; p = 0,001), „Dauer“ (r = 0,27; p = 0,011) und „Lautstärke“ (r = 0,22; p = 0,041).

Die Subskala „Bindung“ korrelierte negativ mit „negative Inhalte“ (r = −0,40; p ≤ 0,01), „Höhe der Belastung“ (r = −0,33; p = 0,002), „Intensität der Belastung“ (r = −0,35; p = 0,001), „Kontrolle“ (r = −0,36; p = 0,001) und „Lautstärke“ (r = −0,23; p = 0,028).

Korrelationen der Subskalen untereinander

Die Subskala „Böswilligkeit“ zeigte Korrelationen mit den Subskalen „Widerstand“ (r = 0,596; p < 0,01), „Omnipotenz“ (r = 0,493; p < 0,01), sowie negative Korrelationen mit „Wohlwollen“ (r = −0,564; p < 0,01) und „Bindung“ (r = −0,407; p < 0,01).

Bei der Subskala „Wohlwollen“ bestanden Korrelationen mit der Subskala „Bindung“ (r = 0,856; p < 0,01), sowie negative Korrelationen mit „Böswilligkeit“ (r = −0,564; p < 0,01), „Widerstand“ (r = −0,588; p < 0,01) und „Omnipotenz“ (r = −0,261; p = 0,015).

Die Subskala „Omnipotenz“ zeigte Korrelationen mit den Subskalen „Widerstand“ (r = 0,370; p < 0,01), „Böswilligkeit“ (r = 0,493; p < 0,01), sowie negative Korrelationen mit „Wohlwollen“ (r = −0,261; p = 0,015) und „Bindung“ (r = −0,211; p = 0,050).

Die Subskala Widerstand korrelierte mit der Subskala Bindung (r = 0,484; p < 0,01).

Korrelationen mit der CGI-SCH [20]

Der Mittelwert der CGI-SCH lag im vorliegenden Sample bei 3,97 ± 0,86. Es ergaben sich keine Korrelationen zwischen den Subskalen und dem Schweregrad der Erkrankung. Weder mit dem Gesamtscore der CGI-SCH, noch mit dem Item Depressivität.

Diskussion

Die vorliegende Stichprobe ist hinsichtlich der typischen sozialen und beruflichen Beeinträchtigungen repräsentativ für über längere Zeit an Schizophrenie erkrankte Personen [21]. Die Ergebnisse zeigten eine hohe Quote an alleinstehenden Personen sowie Arbeitslosigkeit und ein schlechtes soziales Netzwerk.

Der Fragebogen erweist sich hier als praktikabel für die untersuchte Personengruppe, da er selbstständig, großteils vollständig und zügig ausgefüllt werden konnte. Wie auch in der französischen Validierungsstudie von Zanello et al. [13], zeigt er sich sowohl inhaltlich als auch hinsichtlich des Zeitaufwandes als geeignet.

Die vorliegende Stichprobe ist mit einer Größe von N = 93 die bisher größte Fallzahl in einer BAVQ-R Validierungsstudie. Die Studie wurde ausschließlich mit Personen mit Erkrankungen aus dem schizophrenen Formenkreis durchgeführt. In die chinesische Validierungsstudie (N = 33) [15] und die japanische Validierungsstudie (N = 30) [16] wurden ebenfalls ausschließlich Personen mit F2-Erkrankungen einbezogen. In der Originalstudie (N = 71) [1] und der französischen Validierungsstudie (N = 76) [14] bestand die jeweilige Stichprobe aus Personen mit F2 und F3 Diagnosen nach ICD-10 [17].

Wie in der Originalstudie [1] zeigte in der vorliegenden Studie die Subskala Widerstand eher hohe Werte und die Subskala Wohlwollen eher niedrige Werte. Dies legt die Vermutung nahe, dass viele der TeilnehmerInnen ihre Stimme als nicht wohlwollend und als emotional belastend erlebten. In der Subskala Omnipotenz können einerseits sehr variable Mittelwerte zwischen den einzelnen Items, andererseits auch die höchste Anzahl an fehlenden Antworten (6,5 %) über die gesamte Subskala gesehen werden. Über die Items der anderen Subskalen verlaufen die Mittelwerte weitgehend stabil.

Ähnlichkeiten mit der Originalvalidierungsstudie [1] zeigten sich auch hinsichtlich der internen Konsistenz. In der Originalstudie wurden zwar für alle Subskalen akzeptable Werte erzielt, waren jedoch in der Subskala Omnipotenz mit r = 0,74 eher niedrig. In der vorliegenden Studie konnte die Subskala Omnipotenz im Gegensatz zu den anderen Subskalen den akzeptablen Wert von 0,7 nicht erreichen. In der französischen Studie von Zanello et al. [14] zeigte die Subskala Omnipotenz ebenfalls einen Wert unter der Akzeptanzgrenze (r = 0,64), ähnlich der vorliegenden Studie (r = 0,62). Diese Ergebnisse geben Anlass die Aussagen der Omnipotenzskala nochmals zu überdenken. Kürzlich wurde in England von Strauss et al. [22] eine Faktorenanalyse mit gepoolten Daten aus unterschiedlichen Studien (N = 450) durchgeführt, welche zu dem Ergebnis kam, dass die Skala modifiziert werden könnte, da die Subskalen Omnipotenz und Böswilligkeit zu einem Konstrukt ‚Verfolgungsüberzeugungen‘ zusammengefasst werden könnten.

In dem speziellen Datenset von Strauss et al. [22] wurde auch die Unterscheidung zwischen emotionalen und Verhaltensreaktionen sowohl in Bezug auf Bindung als auch in Bezug auf Widerstand in Frage gestellt. Die Subskala Bindung konnte in dem vorliegenden Subsample zur Test-Retest-Reliabilität als einzige Subskala keine signifikante Korrelation erreichen, die Subskala Widerstand konnte den akzeptablen Wert von 0,7 nur sehr knapp erreichen. Dies legt die Vermutung nahe, dass Überzeugungen bezüglich der Stimme zeitlich stabil sind, aber Emotionen und Verhalten im Bezug auf Bindung und Widerstand nicht so stabil sind. Die Subkategorien Bindung–Emotion und Bindung–Verhalten zeigten bei separater Betrachtung jeweils unterschiedliche, unter r = 0,7 (Pearson) liegende, aber signifikant korrelierte Werte. Dieses Ergebnis könnte in zukünftigen Erhebungen geprüft werden und im Rahmen der Entwicklungen der dritten Welle der kognitiven Verhaltenstherapie, die die Metakognitionen und deren Einfluss auf das Verhalten in den Vordergrund stellt [23], diskutiert werden, und mit den Schlussfolgerungen einer PSYRATS-Studie von Kronmüller et al. [24] in Beziehung gesetzt werden, in welcher gefunden wurde, dass akustische Halluzinationen über das 4‑Faktoren-Modell (Kognitive Interpretation, emotionale und Kontrollcharakteristika sowie körperliche Charakteristika).

Es konnten keinerlei Korrelationen mit dem generellen Schweregrad (CGI-SCH-Gesamt und CGI-Depressivität [20]) von Erkrankung und Depressivität gefunden werden. Mit mehr differenzierten Maßen zu einzelnen Aspekten der Symptomatik und ihren Schweregraden würden möglicherweise Zusammenhänge zu zeigen sein, wie es in der Originalstudie für depressive und Angstsymptome gemessen mit der Hospital Anxiety and Depression Scale [25] der Fall war.

In der Originalstudie, wie auch in der vorliegenden Untersuchung jedoch, wurden die theoretisch nachvollziehbaren positiven Korrelationen von Belastung und negativen Inhalten mit Böswilligkeit und Widerstand einerseits und negativen Korrelationen mit Wohlwollen und Bindung andererseits gefunden.

Auch in der Zusammenschau mit den Korrelationen zwischen den Subskalen wurde deutlich, dass Überzeugungen zur Böswilligkeit und Omnipotenz der Stimmen die Widerstandskräfte der Stimmenhörer strapazieren, während Überzeugungen zum Wohlwollen der Stimmen und Bindung positiv korreliert dem gegenüberstehen.

Mehr als vom Schweregrad der schizophrenen Erkrankung oder dem Ausmaß der Depressivität scheint hier also die Belastung und das resultierende Verhalten von den Überzeugungen über Macht und Intention der gehörten Stimmen abhängig. Insgesamt weisen die Ergebnisse darauf hin, dass der Fragebogen BAVQ-R ein robustes zugrundeliegendes Konzept abbildet, das auch von den ausfüllenden Personen so wahrgenommen wird.

Limitationen

In der vorliegenden Studie wurden Personen mit einer durchschnittlichen Stimmenerfahrung von 10,5 Jahren (Spannweite: 0,1–45 Jahre) eingebunden. Aus diesem Grund erlauben es unsere Ergebnisse nicht, Aussagen über Patientengruppen wie Ersterkrankte zu treffen. Weiters suggerieren die erhobenen Daten der Clinical Global Impression Scale – Gesamtscore [20] (N = 89, Mittelwert: 3,97 ± 0,86), dass das Sample einen mittelschweren Erkrankungsgrad aufwies und somit keine Aussagen über die Praktikabilität des BAVQ-R bei schwerstkranken Personen zulässt. Da in diese Studie nur Personen mit F2-Erkrankungen einbezogen wurden, können keine Aussagen über stimmenhörende Personen mit anderen Diagnosen wie z. B. affektive Störungen, post-traumatischen Belastungsstörungen oder gesunde StimmenhörerInnen getroffen werden. Auch liegen leider keine Daten zum Substanzkonsum vor, was gerade in der untersuchten Population und Symptomatik relevant erscheint.

Schlussfolgerungen für die Praxis

Die einzuschätzenden Dimensionen bilden relevante Aspekte des subjektiven Erlebens des Stimmenhörens ab. Sowohl aus therapeutischer Sicht als auch als Forschungsbedarf stellt sich weiterhin aktuell die Frage nach der Konzeptualisierung vom Zusammenhang zwischen Kognition, Emotion und Verhalten.