Zur Verwendung projektiver Verfahren in der Familienrechtspsychologie: ein Diskussionsbeitrag

Neuerburg, Charis R.; Banse, Rainer

doi:10.1007/s11757-022-00718-8

Zur Verwendung projektiver Verfahren in der Familienrechtspsychologie: ein Diskussionsbeitrag

On the use of projective measures in family law psychology: a contribution to the discussion

Übersicht
Open access
Published: 18 May 2022

Volume 16, pages 114–124, (2022)
Cite this article

Download PDF

You have full access to this open access article

Forensische Psychiatrie, Psychologie, Kriminologie Aims and scope Submit manuscript

Zur Verwendung projektiver Verfahren in der Familienrechtspsychologie: ein Diskussionsbeitrag

Download PDF

Charis R. Neuerburg M.Sc. Psychologie, M.Sc. Rechtspsychologie¹ &
Rainer Banse Dipl.-Psych.²

13k Accesses
1 Citation
Explore all metrics

Zusammenfassung

Projektive Verfahren werden auch heute noch in der familienrechtspsychologischen Diagnostik eingesetzt. Erfahrungsgemäß lassen sich 3 unterschiedliche Anwendungsarten unterscheiden: a) als klassisch diagnostisches Instrument, b) als informelle Verhaltensprobe oder c) als Explorationshilfe bzw. Gesprächseinstieg. In der folgenden Übersicht werden diese 3 Anwendungsarten dargestellt sowie ihr Nutzen für die familienrechtspsychologische Diagnostik kritisch diskutiert. Hierfür wird zunächst ein Überblick über die empirische Fundierung der am meisten genutzten projektiven Verfahren (des Thematischen Apperzeptionstests und zeichnerische Verfahren allgemein) gegeben. Es wird dann diskutiert, ob die klassischen psychometrischen Gütekriterien auf projektive Verfahren anwendbar sind. Hinsichtlich der Verwendung projektiver Verfahren als informelle Verhaltensprobe wird auf mögliche Urteilsverzerrungen hingewiesen, insbesondere den „confirmation bias“, den Effekt der illusorischen Korrelation und den möglichen Einfluss irrelevanter Informationen auf den diagnostischen Prozess. Angesichts der potenziell negativen Auswirkungen auf die Validität der Diagnostik empfehlen wir, projektive Verfahren nicht in der Einzelfalldiagnostik einzusetzen, wenn keine direkten empirischen Belege für die Validität des spezifischen Verfahrens für die genutzte Auswertungsart und das zu diagnostizierende Konstrukt vorliegen.

Abstract

Projective measures are still used today in forensic psychology in family law. Three different types of application can be distinguished: a) as a classical diagnostic test, b) as an informal behavior probe or c) as an exploration aid for building rapport. In the following overview, these three types of application are presented and their value for the assessment in family law cases is critically discussed. For this purpose, first an overview of the empirical foundation of the most commonly used projective tests (the Thematic Apperception Test, and projective drawings in general) is given. It is then discussed whether the classical psychometric criteria are applicable to projective tests. With respect to the use of projective measures as an informal behavior probe, attention is drawn to possible judgment biases, in particular confirmation bias, the effect of illusory correlations and the possible influence of irrelevant information on the diagnostic process. Given the potential negative impact on diagnostic validity, we recommend that projective measures should not be used in single case diagnostics unless there is clear empirical evidence for the validity of the specific measure, the type of coding used and the construct to be diagnosed.

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

Die Anwendung projektiver Verfahren in der Einzelfalldiagnostik wird seit Jahrzehnten sehr kritisch diskutiert, trotzdem erfreuen sie sich in der Praxis nach wie vor großer Beliebtheit. Dies gilt neben der klinischen Praxis auch für den forensischen Kontext (Archer et al. 2006) und insbesondere für die familienrechtspsychologische Diagnostik (Breeden et al. 2008; Lafortune und Carpenter 1998; Salewski und Stürmer 2015). In der Literatur finden sich viele positive und negative empirische Befunde zu Reliabilität und Validität verschiedenster projektiver Verfahren, und es wird kontrovers diskutiert, ob die psychometrischen Standardgütekriterien bei dieser Verfahrensklasse überhaupt anwendbar sind. Zu guter Letzt gibt es auch noch unterschiedliche Anwendungsarten projektiver Verfahren, die nach Meinung einiger Autor*innen mit unterschiedlichen Zielen und daher mit unterschiedlichen psychometrischen Anforderungen einhergehen. In diesem Beitrag versuchen wir, für Anwender*innen diagnostischer Verfahren eine begründete Antwort auf die Frage zu geben, ob es sinnvoll erscheint, projektive Verfahren in der familienrechtspsychologischen Einzelfalldiagnostik zu nutzen.

Erfahrungsgemäß werden projektive Verfahren auf 3 verschiedene Arten angewendet: a) als klassisch diagnostisches Instrument, b) als informelle Verhaltensprobe oder c) als Explorationshilfe bzw. als Gesprächseinstieg. Bei der klassisch diagnostischen Anwendungsart wird das Verfahren als reines Testverfahren vor dem Hintergrund der traditionellen Grundannahmen projektiver Verfahren und teils mit formalisierter Auswertung genutzt. Bei der Nutzung als informelle Verhaltensprobe spielt die strikte Orientierung an standardisierten Auswertungs- und Durchführungsvorgaben eine eher untergeordnete Rolle: Der*die Anwender*in legt z. B. eine individuelle Auswahl an Testmaterialien vor und nutzt diese während einer Verhaltensbeobachtung. Bei dieser Verwendungsart wird vor allem den Äußerungen Beachtung geschenkt, die während des Spiels oder der Durchführung des Verfahrens gemacht werden. Oft wird der Einsatz projektiver Verfahren hierbei auch als „hypothesengenerierend“ bezeichnet (z. B. Döpfner und Petermann 2012, S. 88).

Bei der letzten Anwendungsart, dem Gesprächseinstieg, setzen Diagnostiker*innen das Instrument v. a. bei der Exploration von Kindern als „Eisbrecher“ ein. Durch einen spielerischen Einstieg soll u. a. eine lockere Atmosphäre geschaffen und so die Gesprächsbereitschaft gesteigert werden. In den folgenden Abschnitten soll der Nutzen projektiver Verfahren in der Familienrechtspsychologie für diese 3 Anwendungsarten diskutiert werden.

Projektive Verfahren als Testverfahren

Um die Nützlichkeit projektiver Verfahren als tatsächliche Testverfahren beurteilen zu können, sollte zunächst ein Blick auf die empirische Fundierung der bekanntesten und am meisten genutzten projektiven Verfahren geworfen werden. International werden der Rorschach-Test (Rorschach 1921) und der Thematische Apperzeptionstest (TAT; Morgan und Murray 1935) häufig eingesetzt (Archer et al. 2006; Lubin et al. 1984; Piotrowski 2015; Watkins et al. 1995). Im deutschsprachigen Raum handelt es sich bei den beliebtesten Verfahren meist um zeichnerische, verbal-thematische Verfahren oder auch spielerische Gestaltungsverfahren, wie z. B. den Scenotest von Staabs (1964), Familie in Tieren von Brem-Gräser (2011) oder Die verzauberte Familie von Kos und Biermann (2017). In der Familienrechtspsychologie werden v. a. zeichnerische sowie sogenannte apperzeptive Verfahren genutzt (Salewski und Stürmer 2015), weshalb im Folgenden auf diesen beiden Arten von Verfahren genauer eingegangen wird.

Der Thematische Apperzeptionstest

Ein klassisches projektives Verfahren ist der TAT nach Morgan und Murray (1935), der in der aktuellen Forschung häufig unter dem Namen Picture Story Exercise (PSE) von McClelland et al. (1989) mit dem Kodiersystem von Winter (1994) verwendet wird (deutsche Version von Schultheiss 2008). Der TAT nach Morgan und Murray (1935) setzt sich aus insgesamt 31 Tafeln zusammen, welche mehrdeutige Darstellungen überwiegend alltäglicher Situationen zeigen und zu denen der*die Proband*in eine möglichst dramatische Geschichte erzählen soll. Das Verfahren wird primär zur Persönlichkeits- und zur Motivdiagnostik genutzt.

Die empirischen Befunde zu diesen Verfahren sind wenig vielversprechend, wie eine umfassende Metaanalyse von Lilienfeld et al. (2000) zeigte. Ein großes Problem bei der Untersuchung des TAT besteht in der uneinheitlichen Nutzung des Verfahrens. Wird jedoch ein standardisiertes Scoring-System verwendet, wie das System nach McClelland et al. (1953), die Social Cognition and Object Relations Scale (SCORS) nach Westen et al. (1990) oder das Defense Mechanism Manual (DMM) von Cramer (1991) lassen sich durchaus akzeptable bis hohe Interrater-Reliabilitäten erreichen (ca. .90 für das SCORS sowie .64–.81 für das DMM). Die internen Konsistenzen oder Test-Retest-Reliabilitätskoeffizienten sind jedoch selbst bei Nutzung dieser standardisierten Systeme eher niedrig (.59–.77 für die internen Konsistenzen des SCORS, .57–.83 für die internen Konsistenzen des DMM, .07–.46 für die Test-Retest-Reliabilität des DMM; zur Test-Retest-Reliabilität des SCORS existieren keine Angaben). Ein weiteres Problem sind fehlende Normen. Die Befundlage zur Validität des TAT ist heterogen, und die meisten Zusammenhänge sind nicht konsistent repliziert worden. Für die SCORS konnten jedoch einige Belege für die Konstruktvalidität erbracht werden. So zeigten sich z. B. in mehreren Studien Zusammenhänge mit der Borderline-Persönlichkeitsstörung (für eine Übersicht all dieser Befunde: Lilienfeld et al. 2000).

Diese Befunde verlieren allerdings an Bedeutung, da nur die wenigsten Praktiker*innen das standardisierte Kodierschema SCORS tatsächlich nutzen. Die Auswahl, Reihenfolge und Anzahl der Karten variieren über verschiedene Anwender*innen hinweg erheblich. Selbst in den einzelnen Studien ist dies der Fall (Groth-Marnat 1997; Pinkerman et al. 1993; Worchel und Dupree 1990). Diese Variationen machen eine allgemeine Aussage über die empirische Fundierung des TAT unmöglich. Solange dieses Problem besteht, bringt auch jede weitere Studie kaum Erkenntnisgewinn im Hinblick auf die allgemeine Frage der Validität.

Die Nützlichkeit des TAT zur Beantwortung familienrechtspsychologischer Fragestellungen ist allein schon vor dem Hintergrund fehlender Normwerte in Zweifel zu ziehen. Angesichts der sehr heterogenen Verwendungsweisen gibt es außerdem keine konsistente Studienlage, die einen Mehrwert der Anwendung des Verfahrens belegen würde. Von einer rein intuitiven Handhabung ist im Begutachtungskontext aufgrund fehlender Nachvollziehbarkeit eindeutig abzuraten. Dessen ungeachtet erfolgen seine Anwendung und Interpretation in den meisten Bereichen der Praxis erfahrungsgemäß ausschließlich auf Grundlage klinischer Intuition und eben nicht unter Nutzung standardisierter Kodiersysteme.

Zeichnerische Verfahren

Bei den zeichnerischen Verfahren ist die wissenschaftliche Fundierung als noch schwächer zu bewerten. Lilienfeld et al. (2000) beleuchten in ihrer Metaanalyse auch den wissenschaftlichen Status von Menschzeichnungsverfahren und unterscheiden hierbei zunächst zwischen zwei Ansätzen der Interpretation: dem globalen Interpretationsansatz nach Koppitz (1968), bei dem mehrere Indikatoren zu einem Gesamtwert zusammengefasst werden, und dem symbolischen Ansatz nach Machover (1949), bei dem nur einzelne, losgelöste Merkmale der Zeichnung interpretiert werden. Während der globale Ansatz hinsichtlich der Untersuchung von Psychopathologie noch vielversprechend scheint (wobei die Befunde dazu nicht eindeutig sind und noch weitere Studien benötigt werden), kommen Lilienfeld et al. (2000) jedoch hinsichtlich des Ansatzes nach Machover (1949) zu dem Schluss, dass die überwältigende Mehrheit der Symbole oder Zeichen, die in Menschzeichnungen interpretiert werden, unerhebliche oder gar keine Validität besitzen und es keine replizierten Befunde gibt, die systematische Beziehungen zwischen bestimmten Zeichenmerkmalen und Persönlichkeitseigenschaften oder psychischen Störungen aufzeigen. Lediglich mit künstlerischen Fähigkeiten oder Intelligenz wurden moderate Zusammenhänge gefunden (Kahill 1984; Motta et al. 1993). Darüber hinaus existierten keine Studien, die belegen, dass Menschzeichnungen psychologisch relevante Informationen über andere klinische Verfahren oder Informationen hinaus liefern, es gibt also keine Belege für inkrementelle Validität.

Speziell für den familienrechtspsychologischen Kontext sind die Ergebnisse zweier weiterer Studien aus dem deutschsprachigen Raum relevant. Ko (2004) untersuchte anhand einer Stichprobe von 344 deutschen Kindern und Jugendlichen im Alter von 4 bis 18 Jahren den Zusammenhang zwischen Merkmalen von Kinderzeichnungen im Zeichne-Einen-Mensch-Test (ZEM) von Koppitz und Kende (1972) und Lebens- sowie Verhaltensauffälligkeiten der Kinder, gemessen mit der Child Behavior Checklist (CBCL) von Döpfner et al. (1994b) und dem Youth Self-Report (YSR) von Döpfner et al. (1994a). Es konnte kein Zusammenhang zwischen den Analyseergebnissen des ZEM und den Summenscores und Syndromskalen des jeweiligen Kindes im CBCL bzw. YSR festgestellt werden. Keines der untersuchten Merkmale im ZEM trennte laut Ko (2004) zwischen psychisch auffälligen und psychisch unauffälligen Kindern.

Zumbach und Koglin (2016) untersuchten die Zusammenhänge von elterlichem Erziehungsverhalten, Belastungen und Verhaltensauffälligkeiten von 4‑ bis 6‑jährigen Kindern mit den Eigenschaften ihrer Familienzeichnungen. Es wurden 102 Familienzeichnungen einbezogen. Unter Kontrolle der Gesamtzahl der Figuren je Bild zeigte sich nach Berechnung von über 100 Korrelationskoeffizienten lediglich ein signifikanter Zusammenhang zwischen der von den Eltern berichteten Selbstständigkeit in der Erziehung und der Breite der Mutterfigur in der Familienzeichnung. Dies liegt deutlich unter der per Zufall erwarteten Anzahl von signifikanten Korrelationen.

In Gruppenvergleichen zeichneten sich Kinder ohne Geschwister außerdem signifikant breiter und häufiger zwischen die Eltern als Kinder mit Geschwistern, wobei dies laut den Autor*innen vermutlich auf den pro Familienmitglied vorhandenen Platz zum Zeichnen zurückzuführen war. In Bezug auf den Vater zeichneten 28,6 % der Kinder getrennt lebender Eltern ihren Vater nicht auf das Bild, bei den Kindern nicht getrennt lebender Eltern taten dies nur 7,6 %. Über diese Prozentangaben hinaus konnten keine weiteren Zusammenhänge zwischen den Merkmalen der Zeichnungen und diagnostisch relevanten Variablen, wie z. B. elterlichem Belastungsempfinden sowie von den Eltern berichteten Verhaltensweisen der Kinder, gefunden werden. Zumbach und Koglin (2016) raten aufgrund ihrer Ergebnisse von einer interpretativen Nutzung von Familienzeichnungen in der Begutachtung oder im klinischen Kontext ab.

Vor dem Hintergrund der ernüchternden Befunde ist dies nachvollziehbar. Die einzigen konsistent replizierten Zusammenhänge mit künstlerischen Fähigkeiten und Intelligenz sind für den familienrechtspsychologischen Kontext inhaltlich selten von Bedeutung. Dass sich außerdem ganz grundlegende Probleme bei zeichnerischen Verfahren ergeben, zeigt auch noch einmal sehr eindrücklich eine Studie von Kubinger et al. (2003). Basierend auf einer Stichprobe von 756 Kindern im Alter zwischen 6 und 12 Jahren wurde die Reliabilität des Verfahrens Familie in Tieren untersucht. Die Kinder fertigten zu 2 Messzeitpunkten insgesamt 4 Zeichnungen an. Zwei Zeichnungen erfolgten dabei immer unmittelbar nacheinander zum selben Messzeitpunkt. Zur Untersuchung der Test-Retest-Reliabilität wurde der Zusammenhang der direkt nacheinander angefertigten Zeichnungen berechnet; zur Untersuchung der Stabilität der Zusammenhang zwischen den Zeichnungen des ersten Messzeitpunkts und denen des zweiten Messzeitpunkts. Es zeigten sich keinerlei signifikante Zusammenhänge zwischen den kodierten Merkmalen der 4 Zeichnungen. Darüber hinaus zeigten sich kaum Übereinstimmungen zwischen den Beurteiler*innen, die dazu aufgefordert worden waren, auf Grundlage der Zeichnungen Hypothesen zu generieren.

Dass selbst unmittelbar nacheinander angefertigte Zeichnungen der Kinder in keinem feststellbaren Zusammenhang zueinanderstehen und Beurteiler*innen der Zeichnungen zu keinen übereinstimmenden Ergebnissen gelangten, deckt einen Mangel auf, der auch in der familienrechtspsychologischen Diagnostik von erheblicher Bedeutung ist. Denkt man an die grundlegenden Qualitätskriterien, ist der Nutzen eines Testverfahrens, dessen Ergebnis nicht ansatzweise replizierbar ist, eindeutig infrage zu stellen. Angesichts dieser Befunde kommen auch Baumgärtel und Thomas-Langel (2014) in ihrer Rezension zu Familie in Tieren zu einem vernichtenden Urteil: Aufgrund von Mängeln hinsichtlich der theoretischen Grundlagen, der Normierung, Objektivität, Reliabilität und Validität sei davon abzuraten, „aufgrund eines bestimmten Testergebnisses eine bestimmte Entscheidung über das Kind und für seine Eltern oder andere Instanzen zu treffen“ (S. 153).

Die Kritik an den psychometrischen Gütekriterien

Auf Grundlage der hier dargestellten Empirie wäre Sachverständigen von der „klassischen“ Anwendungsart des TAT und zeichnerischer Verfahren in der familienrechtspsychologischen Diagnostik abzuraten. Möglicherweise sollte sogar auf den klassischen Einsatz der allermeisten projektiven Verfahren verzichtet werden – zur Verdeutlichung sei hierfür zuletzt exemplarisch auf das Verfahren hingewiesen, welches empirisch am besten untersucht ist: der Rorschach-Test in Kombination mit dem strukturierten Auswertungssystem Comprehensive System (CS) von Exner (1974).

Denn selbst dieser Test weist hinsichtlich der psychometrischen Gütekriterien erhebliche Mängel auf. Gegenstand der Kritik sind v. a. fehlerhafte Normen mit Dubletten in der Normstichprobe (Exner 2001; Grove et al. 2002; Meyer et al. 2007; Shaffer et al. 1999; Wood et al. 2001) sowie von Exner zitierte Studien zur empirischen Fundierung, von denen sich herausstellte, dass die meisten nie einem Peer-Review unterzogen, nie publiziert oder sogar nie geschrieben worden waren (Grove et al. 2002; Wood et al. 81,82,a, b). Allerdings zeigen neuere Metaanalysen zumindest, dass einige Indizes des Rorschach-Tests valide sind, die Validität 4 weiterer Rorschach-Scores wird außerdem derzeit noch kontrovers diskutiert (Hunsley et al. 2015; Lilienfeld et al. 2000; Mihura et al. 2013, 2015; Wood et al. 2015).

Dies klingt zunächst zumindest für den Rorschach-Test vielversprechend. Zu beachten ist dabei jedoch, dass es sich bei diesen validen Indizes primär um Variablen handelt, die kognitive Prozesse oder Wahrnehmungsprozesse messen. Aus den empirischen Befunden ergibt sich somit zugleich, dass der Rorschach-Test ironischerweise gerade für die Persönlichkeitsdiagnostik ungeeignet ist und, wenn überhaupt, eher im Rahmen einer Intelligenzdiagnostik oder der Diagnostik von z. B. Schizophrenie zu verwenden wäre (Dao et al. 2008; Garb 1984). Grund dafür ist vermutlich, dass der Rorschach hier als Verhaltensprobe kognitiver Fähigkeiten fungiert, da das Testverhalten das zu messende Konstrukt in Form einer „Sprachprobe“ direkt abbildet (Wood et al. 2000). Die vermeintlich projektive Natur des Verfahrens kommt bei dieser Verwendung also gar nicht zum Tragen. Gleiches lässt sich auf die wenigen Bereiche übertragen, in denen Menschzeichnungsverfahren bisher Validität zeigten, nämlich wenn es um die Erfassung von Intelligenz oder künstlerischen Fähigkeiten geht. Trotz dieser ernüchternden Befunde zur empirischen Fundierung kommen projektive Verfahren jedoch in der Praxis nach Erfahrung der Autor*innen weiterhin auch als klassisch projektives Verfahren zum Einsatz. Festzustellen ist demnach eine starke Diskrepanz zwischen der empirischen Befundlage und der Verwendung im Feld. Wie lässt sich diese Diskrepanz erklären?

In den letzten Jahren werden von Befürworter*innen projektiver Verfahren vermehrt Bedenken hinsichtlich der grundsätzlichen Anwendbarkeit der Gütekriterien geäußert (z. B. Wienand 2016; Wittkowski 2011). In der deutschsprachigen Literatur behandelt v. a. Wittkowski (2011) in einem prominent in der Enzyklopädie der Psychologie publizierten Kapitel zu projektiven Verfahren die Problematik von Gütekriterien, primär bezogen auf zeichnerische Verfahren sowie den TAT. Er kommt in seiner Kritik zu dem Schluss, dass die klassischen, psychometrischen Gütekriterien sowohl für den TAT als auch für zeichnerische und spielerische projektive Verfahren nicht anwendbar seien. Im Folgenden soll auf die wichtigsten Argumente eingegangen werden.

Laut Wittkowski (2011) sei beim TAT sowie bei zeichnerischen Verfahren eine sinnvolle Berechnung der meisten Validitäts- und Reliabilitätskoeffizienten – mit Ausnahme der Auswerter*innen-Übereinstimmung – gar nicht möglich. So ergebe sich beispielsweise bei der Test-Retest-Reliabilität das Problem, dass diese sich nur für konstante Merkmale eigne. Die Stabilität der erfassten Merkmale sei jedoch umstritten, v. a. im Hinblick auf die Messung von Motiven mit dem TAT, aber auch bei zeichnerischen Verfahren aufgrund zufälliger Einflüsse oder aufgrund der momentanen Stimmungslage des*der Proband*in (Wittkowski 2011). Dieses Argument ist nachvollziehbar, denn bei zeitlich instabilen Merkmalen ist tatsächlich keine hohe Test-Retest-Reliabilität zu erwarten, und ein entsprechender Koeffizient ist nicht sinnvoll interpretierbar. Fraglich ist dann allerdings auch, welchen diagnostischen Wert die Erfassung instabiler Merkmale bieten soll. An sich lässt sich dieses Problem aber einfach umgehen: Bei Annahme zeitlicher Instabilität eines Merkmals empfiehlt sich hier z. B. die Berechnung konsistenzbasierter Reliabilitätskoeffizienten. Einleuchtend ist auch die Aussage, dass die Bestimmung der Validität von projektiven Verfahren vor Probleme gestellt sei, wenn sie mittels Korrelationen mit Fragebogenverfahren untersucht wird. Wenn die These zutrifft, dass projektive Verfahren und Selbstberichtsmaße ganz unterschiedliche Merkmalsanteile erfassen (z. B. McClelland 1980), erscheinen diese Validierungskriterien nicht geeignet. Allerdings ist diese These umstrittenen (für eine Zusammenfassung hierzu: Lilienfeld et al. 2000). Um dieses Problem zu lösen, sollten also zur Validierung andere Kriterien verwendet werden, wie z. B. objektive Verhaltensmerkmale.

Während die ersten beiden Argumente nachvollziehbar sind, erscheinen andere von Wittkowski (2011) vorgebrachte Argumente problematisch. So schildert er beispielsweise, dass auch die Berechnung anderer Reliabilitätskoeffizienten, wie die der internen Konsistenz oder der Split-Half-Reliabilität, beim TAT nicht gefordert werden könne; denn, um hier hohe Konsistenzen zu erreichen, sei es Voraussetzung, dass die Testitems parallel sind, d. h., dass die einzelnen eingesetzten Tafeln des TAT das Gleiche erfassen. Die Tafeln des TAT seien jedoch mit Absicht möglichst heterogen gestaltet (Cramer 1996, 1999), was das Erreichen hoher Koeffizienten an dieser Stelle von vornherein verhindere. Wittkowski (2011) führt hierbei den von Lundy (1985) vorgenommenen Vergleich einer Vorhersage durch TAT-Tafeln mit einer multiplen Regressionsanalyse an. Die Tafeln des TAT werden hierbei mit verschiedenen Prädiktoren einer Regressionsgleichung gleichgesetzt, welche alle einen spezifischen, eigenen Vorhersagebeitrag in Bezug auf das Merkmal leisten. Deshalb seien die Tafeln untereinander unkorreliert. Das geringe Cronbachs α der Tafeln sei also sogar eine methodische Stärke des Verfahrens. Das ist zwar theoretisch möglich, dieses Argument ist aber aus den folgenden zwei Gründen problematisch: Zum einen steht die Behauptung, es handle sich bei den einzelnen TAT-Tafeln um distinkte, voneinander unabhängige Prädiktoren, im Widerspruch zum Vorschlag vieler TAT-Auswertungssysteme, die zu den verschiedenen Karten produzierten Narrative auf Gemeinsamkeiten wie wiederkehrende Themen, Motive, Handlungskontexte oder allgemein Wiederholungen zu prüfen. Zum anderen würde diese Sichtweise laut Tuerlinckx et al. (2002) das Problem des Nachweises von Reliabilität lediglich auf eine andere Ebene verschieben. Anstelle der Reliabilität des gesamten Verfahrens müsste nun die Reliabilität der Kodierung einzelner Tafeln nachgewiesen werden. Zutreffend ist die Aussage von Wittkowski (2011), dass eine relativ hohe Validität auch bei geringer interner Konsistenz der Tafeln oder Items gegeben sein kann. Hiermit nimmt er Bezug auf die häufig geäußerte Kritik, eine hohe Validität sei schon allein aufgrund geringer Reliabilität nicht möglich. Man versucht jedoch z. B. auch bei aktuarischen, kriminalprognostischen Instrumenten durch die Kombination möglichst unkorrelierter Prädiktoren eine maximale Vorhersage des Rückfallkriteriums zu erreichen, was empirisch auch gelingt (Helmus und Babchishin 2017). Das Argument bleibt aber für projektive Verfahren auf einer rein theoretischen Ebene und dient hier eher als Immunisierungsstrategie. Denn eine niedrige Reliabilität ist nur dann akzeptabel, wenn eine substanzielle Validität tatsächlich empirisch nachgewiesen wird, denn eine niedrige Reliabilität allein kann sicher nicht als Nachweis für eine hohe Validität dienen. Ein empirischer Nachweis, dass die einzelnen Tafeln des TAT tatsächlich einen eigenständigen oder auch gemeinsamen substanziellen Vorhersagebeitrag leisten, steht jedoch aus.

Spezifisch zu zeichnerischen Verfahren führt Wittkowski (2011) außerdem aus: „Als Verfahren, die vom Probanden Entfaltung verlangen, wird – bei Auswertung auf der Merkmalsebene – das ‚Item‘ erst im Nachhinein und für jeden Einzelfall gesondert bestimmt“ (S. 351) sowie „Anders als bei Persönlichkeitsfragebögen (z. B. zur Erfassung von Lebenszufriedenheit, Aggressivität, Einstellungen zu Sterben und Tod) handelt es sich bei den Merkmalen, die zeichnerische Gestaltungsverfahren anzielen, nicht um Konstrukte mit einer mehr oder weniger klar umschriebenen mehrdimensionalen Struktur. So geht es um die Einschätzung eines (globalen) kognitiven Entwicklungsstands, nicht aber um die Abbildung eines bestimmten Intelligenzmodells“ (S. 352 f.). Dieses Argument kann von uns nur so verstanden werden, dass es insbesondere bei zeichnerischen Verfahren weder im Vorhinein bestimmbare zu kodierende Items noch Konstrukte gibt, die es zu messen gilt, und dass damit der Anspruch eines diagnostischen Verfahrens aufgegeben wird.

Wittkowski (2011) bringt zuletzt noch zwei weitere Argumente für die Unangemessenheit psychometrischer Gütekriterien zur Beurteilung des TAT vor, die bei genauerer Betrachtung jedoch grundlegende Probleme des TAT verdeutlichen und ebenso gut als Argumente gegen die Nutzung des TAT in der Praxis verwendet werden könnten. Erstens verweist Wittkowski (2011) bei der Begründung für niedrige Test-Retest-Reliabilitäten des TAT auf Fleming (1982). Demnach seien wiederholte TAT-Durchführungen nicht sinnvoll, weil Proband*innen bei einer zweiten Durchführung möglicherweise absichtlich eine andere Geschichte erzählten. Der auch „Sättigung“ genannte Effekt ist auch der Grund dafür, warum man die Reliabilität des TAT nicht einfach durch eine Testverlängerung durch Hinzunahme weiterer Tafeln verbessern kann wie bei anderen Tests (Asendorpf 2007). Der Sättigungseffekt impliziert auch, dass der TAT in einem bestimmten Zeitraum genau einmal und nicht wiederholt durchführt werden kann.

Zweitens verweist Wittkowski (2011) bei der Begründung für niedrige interne Konsistenzen des TAT auf die Befunde von Tuerlinckx et al. (2002) zur Stochastic Drop-Out Apperception Theory, die zeigen, dass Probanden im TAT ab und an Geschichten erzählen, die von der Motivstärke gar nicht beeinflusst werden und die damit keinerlei diagnostischen Wert besitzen. Beide Phänomene seien der Grund für eine geringe Korrelation zwischen den Geschichten. Daher sei es unangemessen, beim TAT die Ermittlung der Reliabilität psychometrisch zu fordern (Wittkowski 2011). Mit anderen Worten: Dass einzelne Tafeln des TAT und bei einer Wiederholung der ganze Test manchmal nicht messen, was sie eigentlich messen sollen (also nicht valide sind), ist an dieser Stelle die Begründung dafür, dass keine hohe Konsistenz oder Retest-Reliabilität erwartet werden kann. Zur Verdeutlichung der Implikationen dieses Arguments ist es an dieser Stelle hilfreich, sich als Analogie einen IQ-Test vorzustellen, bei dem eine geringe Inter-Item-Korrelation damit begründet würde, dass einzelne Items nur manchmal den IQ mäßen. Aus den Befunden von Tuerlinckx et al. (2002) ergibt sich damit ein gravierendes Problem im Umgang mit dem TAT, mit welchem Praktiker*innen konfrontiert sind und welches von den Autor*innen auch selbst angesprochen wird: Für den*die Untersucher*in ist es unmöglich, im Einzelfall bei einem*einer Proband*in festzustellen, ob die erzählte Geschichte nun diagnostischen Wert besitzt oder nicht. Überträgt man dieses Problem auf den Begutachtungskontext, wird einem schnell die Tragweite dieses Mangels bewusst.

Trotzdem erscheint es aufgrund dieser Argumente theoretisch möglich, dass der TAT trotz geringer Reliabilität eine hinreichende Validität aufweisen könnte. Bloße Zweifel an der Anwendbarkeit der klassischen Testtheorie allein entbinden jedoch nicht von der Verpflichtung, die diagnostische Brauchbarkeit eines Verfahrens, d. h. belastbare empirische Evidenz für seine Validität, auch nachzuweisen. Oft scheinen diese psychometrischen Argumente nur als Rechtfertigungs- und Immunisierungsstrategien zu dienen, welche zur Aufrechterhaltung des Problems anstatt zu seiner Lösung beitragen. Grundsätzlich ist es nämlich möglich, auch bei projektiven Verfahren empirische Belege für ihre Validität zu erbringen. Als Positivbeispiele können an dieser Stelle v. a. der Picture Frustration Test (PFT) von Rosenzweig et al. (1947) zur Erfassung von Frustrationstoleranz oder der Washington University Sentence Completion Test (WUSCT) von Loevinger (1976) zur Erfassung der Ich-Entwicklung angeführt werden, welche als gut validierte Verfahren gelten (für einen Auflistung der verschiedenen Befunde bzw. Reviews: Lilienfeld 1999; Lilienfeld et al. 2000). Zum PFT existieren z. B. sogar deutsche Normen für eine Stichprobe forensisch begutachteter Straftäter*innen. Das Verfahren zeigte in dieser Stichprobe außerdem signifikante, positive Zusammenhänge mit einem nichtprojektiven Verfahren zur Messung aggressiver Tendenzen (Köthe et al. 2020). Ebenfalls positiv zu erwähnen ist aus dem deutschen Sprachraum der partnerschaftsbezogene Agency- and Communion-Test (PACT) von Hagemeyer und Neyer (2012).

Auch mit der Sorge- und Umgangsrechtlichen Testbatterie (SURT) von Hommers (2009) existiert ein Verfahren für den familienrechtspsychologischen Bereich, bei dem Anstrengungen zur Validierung unternommen wurden und bei dem darüber hinaus neben einer Normalpopulation auch eine Stichprobe mit Kindern aus begutachteten Familien (n = 97) in die Normierungs- und Validierungsstudien eingeflossen ist. Neben dem nichtprojektiven Untertest Eltern-Wahrnehmungs-Unterschiede (EWU) zeigten auch der semiprojektive Untertest Semi-Projektive Entscheidungsfragen (SPEF) und einzelne Subskalen des projektiven Untertests Projektiver Familien-Szenen-Test (PFST) signifikante, positive Zusammenhänge mit dem Family Relations Test (FRT-R) von Hommers (2001) und dem Familien-Identifikations-Test (FIT) von Remschmidt und Mattejat (1999). Es wird aber auch hier im Manual argumentiert, dass die vorliegenden, geringen Korrelationen der Untertests der SURT untereinander dafür sprächen, dass jeder Test spezifische Varianzanteile messe und somit inkrementellen Informationswert biete (Hommers 2009). Diese Behauptung müsste allerdings in Bezug auf ein relevantes Kriterium empirisch belegt werden. Dass die Korrelationen niedrig sind, stellt für die Annahme der inkrementellen Validität der Testbatterie ein notwendiges, aber kein hinreichendes Kriterium dar.

Projektive Verfahren als informelle Verhaltensprobe

Als Lösung für die behauptete Nichtanwendbarkeit psychometrischer Gütekriterien schlägt Wittkowski (2011) vor, thematische Apperzeptions- sowie zeichnerische Verfahren eher als Beobachtungsverfahren zu verwenden und statt psychometrischer Gütekriterien das „qualitative Validierungskonzept der Triangulation“ nach Denzin (1987) bzw. die „klinische Validierung“ nach Alvarado (1994) zu verfolgen. Ergebnisse der projektiven Verfahren sollen hierbei direkt bei der Anwendung im Einzelfall mit Erkenntnissen aus anderen Quellen, wie beispielsweise Explorationsgesprächen, abgeglichen und so „validiert“ werden (Wittkowski 2011). Diese Vorgehensweise entspricht der Verwendung, die oben als „informelle Verhaltensprobe“ bezeichnet wurde. Auch andere Autor*innen schlagen unter verschiedenen Bezeichnungen eine ähnliche Verwendung vor. Schaipp und Plaum (2000) verwenden den Ausdruck „qualitativ-heuristische Verwendungspraxis“ nach Kleining (1995), bei der von einer Interpretation der Inhalte abgesehen und stattdessen in einem fortlaufenden Prozess Bedeutungen im Dialog mit dem*der Proband*in gemeinsam aufgeklärt werden. Döpfner und Petermann (2012) sprechen wiederum von einem „hypothesengenerierenden“ Einsatz der Verfahren und davon, dass die Ergebnisse nur in Kombination mit den Ergebnissen anderer diagnostischer Zugänge interpretiert werden sollten.

Hypothesengenerierung und „confirmation bias“

Neben der Tatsache, dass es logisch inkonsistent ist, einerseits einen Abgleich der Ergebnisse des projektiven Verfahrens mit anderen Quellen zu fordern, wenn andererseits behauptet wird, dass projektive Verfahren einen einzigartigen Zugang zu Informationen darstellen sollen, die im Selbstbericht oder in Fragebogen gerade nicht erhoben werden können, ergibt sich ein weiteres, gravierendes Problem: Diese Vorgehensweise öffnet dem Confirmation bias Tür und Tor. Da Ergebnisse projektiver Verfahren ihrer Natur nach mehrdeutig sind, besteht immer die Möglichkeit, eine passende Interpretation zu finden, die im Lichte der anderen verfügbaren Informationen stimmig erscheint. Da die Interpretation beliebig angepasst werden kann, entsteht aufseiten des Anwendenden subjektiv auch niemals der Eindruck, das Verfahren sei invalide. Je nach Bedarf können Befunde unabsichtlich einseitig interpretiert und Alternativerklärungen außer Acht gelassen werden. Wie mit ggf. bestehenden Diskrepanzen umgegangen werden soll, wird in der Literatur meistens nicht thematisiert, ebenso wenig die Möglichkeit, dass ein projektives Verfahren auch invalide, völlig irreführende Informationen liefern kann.

Inwiefern insbesondere projektive Verfahren für die Hypothesengenerierung nützlich sein sollen, ist ungeklärt. Es liegt der Verdacht nahe, dass durch den Einsatz projektiver Verfahren von vornherein v. a. Hypothesen aufgestellt werden, die dem*der Diagnostiker*in von Anfang an persönlich plausibel erscheinen und zum bisherigen Eindruck oder Vorwissen passen. Ob wirklich überraschende, neue Erkenntnisse durch diesen Zugang erzielt werden können, die nicht bloß der Projektion des*der Diagnostikers*in entspringen, bleibt fraglich. Es besteht die Gefahr, unter dem Stichwort der „Hypothesengenerierung“ eigene (mehr oder weniger bewusste) Vorurteile oder Voreinstellungen scheinbar zu bestätigen und damit zu legitimieren.

Die Empfehlung, anstelle der quantitativ bestimmten psychometrischen Gütekriterien qualitativ vorzugehen und so eine „Validierung“ innerhalb der Untersuchung zu erreichen, kann eine systematische, quantitativ ausgerichtete Evaluation der Verfahren nicht ersetzen. Die vorgeschlagene Vorgehensweise kann keine Informationen darüber liefern, ob projektive Verfahren tatsächlich und objektiv einen diagnostischen Mehrwert über andere Verfahren hinaus besitzen und ob sie zur Vorhersage von Merkmalen oder Verhaltensweisen geeignet sind.

Die illusorische Korrelation

Es ist nicht ausreichend, sich auf eine rein subjektive, „klinische“ Bewertung der Validität der Verfahren zu verlassen, da diese mit hoher Wahrscheinlichkeit von Wahrnehmungs- und Urteilsfehlern der Anwender*innen kontaminiert ist. Diese Fehler können vielmehr dazu führen, dass projektive Verfahren z. B. im klinischen oder forensischen Alltag wesentlich valider erscheinen, als sie tatsächlich sind. Dies ist vermutlich auch der Grund für das große Vertrauen und die anhaltende Beliebtheit von projektiven Verfahren trotz wenig überzeugender empirischer Befunde. Selbst wenn projektive Verfahren nur als informelle Verhaltensprobe eingesetzt und nicht direkt interpretiert werden, besteht die Gefahr, dass Verzerrungen dieser Art mit andauernder Verwendung über die Jahre ihre Wirkung entfalten und seitens des*der Diagnostikers*in der Eindruck entsteht, die Verfahren seien doch valide. Denn viele Anwender*innen sind auf Basis ihrer langjährigen Tätigkeiten von der Validität verschiedener projektiver Verfahren persönlich überzeugt, da sie vermeintlich positive Erfahrungen mit dem Einsatz projektiver Verfahren gemacht haben und der Meinung sind, selbst ausreichend Belege für ihre Gültigkeit und ihren Nutzen gesammelt zu haben. Eine solche Verzerrung ist beispielsweise der Effekt der illusorischen Korrelation.

Dabei handelt es sich um einen Mechanismus, der bewirkt, dass zwei Ereignisse als miteinander zusammenhängend wahrgenommen werden, obwohl in Wirklichkeit entweder ein geringerer Zusammenhang, gar kein Zusammenhang oder sogar ein umgekehrter Zusammenhang besteht (Chapman 1967). Dass dieser Effekt möglicherweise auch bei der Bewertung projektiver Verfahren eine Rolle spielt, konnten bereits Chapman und Chapman (1967) zeigen. In ihrer Studie legten sie 108 Studierenden 45 Zeichnungen des Draw-a-Person(DAP)-Test vor, welche zufällig verteilte Eigenschaften aufwiesen (z. B. breite Schultern, große Köpfe, usw.) und zufällig kombiniert waren mit jeweils 2 Aussagen über angebliche Symptome des Zeichners (z. B. Sorge über die eigene Männlichkeit, Sorge über die eigene Intelligenz, Sorge über die eigene Potenz usw.). Anschließend wurden die Studierenden dazu befragt, welche besonderen Merkmale Zeichnungen von Personen mit bestimmter Symptomatik aufwiesen. Obwohl die Materialien zufällig kombiniert waren und in Wirklichkeit keine Korrelationen existierten, berichteten die Proband*innen später, einen Zusammenhang zwischen bestimmten Zeichnungscharakteristiken und Symptomaussagen bemerkt zu haben. Hierbei handelte es sich um die gleichen wahrgenommenen Korrelationen, die zuvor auch schon von erfahrenen, praktizierenden Kliniker*innen berichtet wurden. Wie sich herausstellte, entsprach die wahrgenommene Diagnostizität der jeweiligen Zeichnungscharakteristiken ihrer semantischen Assoziation mit den Symptomen.

So berichteten die Proband*innen z. B., dass Patient*innen, welche sich über ihre Männlichkeit sorgten, eher maskuline Figuren zeichneten, oder dass Patient*innen, welche sich über ihre Intelligenz sorgten, große Köpfe zeichneten (Chapman und Chapman 1967). Die Befunde dieser Studie weisen darauf hin, dass viele der einzelnen Zeichnungscharakteristiken, welche von Praktiker*innen im Alltag für diagnostisch gehalten werden, möglicherweise gar keine validen Hinweisreize sind, sondern durch den Mechanismus der illusorischen Korrelation nur als solche wahrgenommen werden. Diese systematische Verzerrung kann auch erklären, warum verschiedene Praktiker*innen in Bezug auf diese Zeichnungscharakteristiken größtenteils in ihrer Einschätzung übereinstimmen, und warum sich eine solche Diskrepanz zwischen Forschungsergebnissen und klinischer Erfahrung ergibt.

Dass sich diese Problematik nicht nur auf zeichnerische Verfahren beschränkt, sondern auch für andere projektive Verfahren wie z. B. den Rorschach-Test gilt, und dass sich diese systematische Verzerrung nicht nur bei ungeschulten Studierenden ergibt, zeigte eine weitere Studie von Chapman und Chapman (1969). In dieser Studie berichteten bei der Einschätzung verschiedener Zeichen des Wheeler-Rorschach-Tests (Wheeler 1949) auch psychodiagnostisch geschulte Kliniker*innen nur jene Zeichen als ihrer Einschätzung nach valide, die über eine starke verbale Assoziation zwischen zu diagnostizierendem Merkmal und dem jeweiligen Rorschach-Zeichen verfügten – obwohl diese sich in vorherigen Forschungsbefunden bereits als invalide herausgestellt hatten. Nicht benannt wurden von ihnen hingegen Rorschach-Zeichen, bei denen es tatsächlich Hinweise auf Validität gab, die aber über keine starke Assoziation mit dem Merkmal verfügten (Chapman und Chapman 1969).

Weniger ist mehr

Auf die familienrechtspsychologische Diagnostik bezogen bedeuten diese Ergebnisse, dass klinische Erfahrungen oder positive subjektive Eindrücke keine geeignete Grundlage darstellen, mit deren Hilfe Sachverständige ihre diagnostischen Verfahren auswählen sollten. Vielmehr sollten Sachverständige bemüht sein, unnötige Fehlerquellen und Verzerrungen in ihren Begutachtungen zu vermeiden und daher von dem Einsatz projektiver Verfahren als „informelle Verhaltensprobe“ absehen, auch wenn dies unter der Vorgabe geschieht, sie nur „hypothesengenerierend“ und nur zusätzlich zu anderen Verfahren oder „mit Bedacht“ einzusetzen. Angaben oder Ratschläge dieser Art suggerieren, dass sich durch die Anwendung eines projektiven Verfahrens a) entweder weitere, verwertbare Anhaltspunkte ergeben oder b) die Daten schlimmstenfalls „umsonst“ erhoben wurden und im weiteren Verlauf ignoriert werden können. Diesem Vorschlag liegt die Prämisse „je mehr Informationen, desto besser“ zugrunde. Dabei wird jedoch außer Acht gelassen, dass die bloße Kenntnis von irrelevanter Information für den diagnostischen Prozess schädlich sein kann, weil sie die Bewertung valider Information mehr oder weniger beeinträchtigen kann (z. B. Dror 2017; Edmond et al. 2015; Kassin et al. 2013 für Beispiele im forensischen Kontext). Darüber hinaus sollte im psychodiagnostischen Vorgehen generell auf die Erhebung von für die Beantwortung der Fragestellung irrelevanten Informationen verzichtet werden (European Federation of Psychologists’ Association 2005, Abs. 3.1.2).

Projektive Verfahren für den Gesprächseinstieg

Eine weitere vorgeschlagene Verfahrensweise ist die, von einer Interpretation der Zeichnung abzusehen und Zeichnungen lediglich als Gesprächsbegleitung zu nutzen. Es gibt tatsächlich Hinweise darauf, dass sich bei Kindern die Möglichkeit, während eines Interviewprozesses zu zeichnen, positiv auf den Umfang der erhaltenen verbalen Informationen auswirken kann (Driessnack 2005; Katz et al. 2014; Woolford et al. 2015). Allerdings sind die Vorgehensweisen der Studien unterschiedlich: In manchen Studien zeichneten die Kinder während der Befragung, in anderen hingegen vor der Befragung und die entsprechenden Zeichnungen wurden als Erinnerungsstütze verwendet. Neben der äußerst niedrigen Stichprobengröße bei einem Großteil der Studien wurde außerdem nicht immer kontrolliert, ob die zusätzlichen Angaben der Kinder auch korrekt waren, oder ob das Zeichnen sich negativ auf die Genauigkeit der Berichte auswirkte, wie im Gegensatz zu den oben genannten Studien einige andere Untersuchungen zeigten (Bruck et al. 2000; Macleod et al. 2016; Otgaar et al. 2016; Strange et al. 2003). Es ist also zurzeit unklar, ob es wirklich ratsam ist, Kinder während eines Interviews zeichnen zu lassen. Sollten sich die förderlichen Effekte aber bestätigen lassen, wäre zumindest zur Verwendung neutralen Materials (d. h. nichtsymbolisch, z. B. durch das Zeichnen der Familie als Menschen) anstelle von projektiven zeichnerischen Verfahren zu raten, da diese immer noch zu einer Interpretation der Zeichnung verleiten könnten. Bis die Befundlage hier eindeutiger ist, sollte aufgrund des potenziell ablenkenden Effekts und der Möglichkeit, dass Aussagen von Kindern unter diesen Umständen ungenauer werden könnten, von der Nutzung von Zeichnungen als Explorationshilfe abgesehen werden.

Fazit

Nach aktuellem Kenntnisstand erscheint es in den allermeisten Fällen nicht sinnvoll, projektive Verfahren in der Einzelfalldiagnostik für familienrechtspsychologische Fragestellungen zu nutzen. Der Einsatz als klassisches „Testverfahren“ ist nur gerechtfertigt, wenn ausreichend empirische Belege für die Validität des jeweiligen Verfahrens für das zu diagnostizierende Konstrukt existieren. Hierbei sollte v. a. beachtet werden, für welche spezifischen Anwendungszwecke die Validität des Verfahrens theoretisch begründet und empirisch belegt ist. So lassen sich zeichnerische Verfahren möglicherweise für die Bewertung künstlerischer Fähigkeiten einsetzen (Kahill 1984), aber eben nicht für eine valide Diagnostik elterlichen Erziehungsverhaltens (Zumbach und Koglin 2016). Für viele der behaupteten Anwendungszwecke projektiver Verfahren, die oft in einer ganzen Liste verschiedenster Konstrukte und Kontexte bestehen, fehlen entsprechende empirische Belege zur Validität. Auch andere Anwendungsarten, wie beispielsweise der „hypothesengenerierende“ Einsatz projektiver Verfahren oder von Materialien aus projektiven Verfahren, sollten angesichts der hier diskutierten Bias-Möglichkeiten kritisch gesehen werden. Die Grundidee, durch das Vorgeben verschiedener Materialien Verhalten zu evozieren und so eine „Verhaltensprobe“ erhalten zu können, ist nachvollziehbar und plausibel. Möglicherweise wird durch das Vorlegen verschiedener Reize oder Aufgaben erst eine Möglichkeit zur Verhaltensäußerung geschaffen, die dann wiederum beurteilt werden kann, ähnlich wie bei einer strukturierten Verhaltensbeobachtung. Fraglich ist jedoch, ob Materialien aus projektiven Verfahren für diesen Zweck eine gute Wahl darstellen, da sie zu einer inhaltlichen Interpretation des Gesagten oder Beobachteten einladen.

Möglicherweise fehlt es für diesen Zweck bislang noch an „unbelastetem“ und neutralem Anregungsmaterial, das von Sachverständigen eingesetzt werden könnte. In der Familienrechtspsychologie wurde bereits mehrmals der Mangel an empirischer Grundlagenforschung und an standardisierten und validierten diagnostischen Verfahren für diesen Bereich thematisiert (z. B. Zumbach 2017). Diesem Mangel sollte sich die zukünftige rechtspsychologische Forschung und Testentwicklung verstärkt widmen. Bis mehr geeignete Verfahren zur Verfügung stehen, sollten jedoch mögliche Fallstricke bei der Verwendung von und dem Umgang mit projektiven Verfahren beachtet werden. Insbesondere sollte den Befunden Aufmerksamkeit geschenkt werden, die eindrücklich zeigen, dass auch irrelevante, zusätzliche Informationen bereits vorhandene, valide Informationen überlagern können (Dror 2017; Edmond et al. 2015; Kassin et al. 2013). Das Hauptziel von Sachverständigen (zu richtigen, diagnostischen Urteilen zu gelangen) kann nur erreicht werden, wenn es gelingt, relevante Informationen, die für die Beantwortung der Fragestellung benötigt werden, von irrelevanten Informationen zu unterscheiden und nur Erstere in die Diagnostik einzubeziehen. Um das zu erreichen, sollten aber auch nur Methoden angewendet werden, welche, empirisch belegt, Zugang zu diesen relevanten Informationen ermöglichen.

Literatur

Alvarado N (1994) Empirical validity of the thematic apperception test. J Pers Assess 63(1):59–79. https://doi.org/10.1207/s15327752jpa6301_5
Article Google Scholar
Archer RP, Buffington-Vollum JK, Stredny RV, Handel RW (2006) A survey of psychological test use patterns among forensic psychologists. J Pers Assess 87(1):84–94. https://doi.org/10.1207/s15327752jpa8701_07
Article PubMed Google Scholar
Asendorpf JB (2007) Psychologie der Persönlichkeit, 4. Aufl. Springer, Berlin https://doi.org/10.1007/978-3-540-71685-3
Book Google Scholar
Baumgärtel F, Thomas-Langel R (2014) TBS-TK Rezension: „Familie in Tieren“. Psychol Rundsch 66(2):152–154
Article Google Scholar
Breeden C, Olkin R, Taube DJ (2008) Child custody evaluations when one divorcing parent has a physical disability. Rehabil Psychol 53(4):445–455. https://doi.org/10.1037/a0013023
Article Google Scholar
Brem-Gräser L (2011) Familie in Tieren. Die Familiensituation im Spiegel der Kinderzeichnung. Reinhardt, München
Google Scholar
Bruck M, Melnyk L, Ceci SJ (2000) Draw it again Sam: the effect of drawing on children’s suggestibility and source monitoring ability. J Exp Child Psychol 77(3):169–196. https://doi.org/10.1006/jecp.1999.2560
Article CAS PubMed Google Scholar
Chapman LJ (1967) Illusory correlation in observational report. J Verbal Learning Verbal Behav 6(1):151–155. https://doi.org/10.1016/S0022-5371(67)80066-5
Article Google Scholar
Chapman LJ, Chapman JP (1967) Genesis of popular but erroneous psychodiagnostic observations. J Abnorm Psychol 72(3):193–204. https://doi.org/10.1037/h0024670
Article CAS PubMed Google Scholar
Chapman LJ, Chapman JP (1969) Illusory correlation as an obstacle to the use of valid psychodiagnostic signs. J Abnorm Psychol 74(3):271–280. https://doi.org/10.1037/h0027592
Article CAS PubMed Google Scholar
Cramer P (1991) The development of defense mechanisms: theory, research, and assessment. Springer, Berlin
Book Google Scholar
Cramer P (1996) Storytelling, narrative, and the thematic apperception test. Guilford, New York
Google Scholar
Cramer P (1999) Future directions for the thematic apperception test. J of Personality Assessment 72(1):74–92. https://doi.org/10.1207/s15327752jpa7201_5
Article Google Scholar
Dao TK, Prevatt F, Horne HL (2008) Differentiating psychotic patients from nonpsychotic patients with the MMPI‑2 and Rorschach. J Pers Assess 90(1):93–101. https://doi.org/10.1080/00223890701693819
Article PubMed Google Scholar
Denzin NK (1987) The research act: a theoretical introduction to sociological methods. McGraw-Hill, New York
Google Scholar
Döpfner M, Petermann F (2012) Diagnostik psychischer Störungen im Kindes- und Jugendalter. Hogrefe, Göttingen
Google Scholar
Döpfner M, Berner W, Lehmkuhl G (1994a) Handbuch: Fragebogen für Jugendliche. Forschungsergebnisse zur deutschen Fassung des Youth Self-Report (YSR) der Child Behavior Checklist (Arbeitsgruppe Kinder‑, Jugend- und Familiendiagnostik (KJFD))
Google Scholar
Döpfner M, Schmeck K, Berner W (1994b) Handbuch: Elternfragebogen über das Verhalten von Kindern und Jugendlichen. Forschungsergebnisse zur deutschen Fassung der Child Behavior Checklist (CBCL/4-18) (Arbeitsgruppe Kinder‑, Jugend- und Familiendiagnostik (KJFD))
Google Scholar
Driessnack M (2005) Children’s drawings as facilitators of communication: a meta-analysis. J Pediatr Nurs 20(6):415–423. https://doi.org/10.1016/j.pedn.2005.03.011
Article PubMed Google Scholar
Dror IE (2017) Human expert performance in forensic decision making: seven different sources of bias. Aust J Forensic Sci 49(5):541–547. https://doi.org/10.1080/00450618.2017.1281348
Article Google Scholar
Edmond G, Tangen JM, Searston RA, Dror IE (2015) Contextual bias and cross-contamination in the forensic sciences: the corrosive implications for investigations, plea bargains, trials and appeals. Law Probab Risk 14(1):1–25. https://doi.org/10.1093/lpr/mgu018
Article Google Scholar
European Federation of Psychologists’ Association (2005) Meta-code of ethics. EFPA. http://ethics.efpa.eu/metaand-model-code/meta-code/. Zugegriffen: 03.03.2022
Exner JE (1974) The Rorschach: A comprehensive system Bd. 1. Wiley, Hoboken
Google Scholar
Exner JE (2001) A Rorschach workbook for the comprehensive system, 5. Aufl. (Rorschach Workshops)
Google Scholar
Fleming J (1982) Projective and psychometric approaches to measurement: the case of fear of success. In: Stewart AJ (Hrsg) Motivation and society. Jossey-Bass, San Fransicso, S 63–96
Google Scholar
Garb HN (1984) The incremental validity of information used in personality assessment. Clin Psychol Rev 4(6):641–655. https://doi.org/10.1016/0272-7358(84)90010-2
Article Google Scholar
Groth-Marnat G (1997) Handbook of psychological assessment, 3. Aufl. Wiley, Hoboken
Google Scholar
Grove WM, Barden RC, Garb HN, Lilienfeld SO (2002) Failure of Rorschach-comprehensive-system-based testimony to be admissible under the Daubert-Joiner-Kumho standard. Psychol Public Policy Law 8(2):216–234. https://doi.org/10.1037/1076-8971.8.2.216
Article Google Scholar
Hagemeyer B, Neyer FJ (2012) Assessing implicit motivational orientations in couple relationships: The Partner-related Agency and Communion Test (PACT). Psychol Assess 24(1):114–128. https://doi.org/10.1037/a0024822
Article PubMed Google Scholar
Helmus LM, Babchishin KM (2017) Primer on risk assessment and the statistics used to evaluate its accuracy. Crim Justice Behav 44(1):8–25. https://doi.org/10.1177/009385481667889
Article Google Scholar
Hommers W (2001) Psychometrische Normen für eine standardisierte Vorschülerversion des Family Relations Test (FRT). Diagnostica 47(1):7–17
Article Google Scholar
Hommers W (2009) Sorge- und umgangsrechtliche Testbatterie (SURT). Huber, Bern
Google Scholar
Hunsley J, Lee CM, Wood JM, Tylor W (2015) Controversial and questionable assessment techniques. In: Lilienfeld SO, Lynn SJ, Lohr JM (Hrsg) Science and pseudoscience in clinical psychology. Guilford, New York, S 42–82
Google Scholar
Kahill S (1984) Human figure drawing in adults: An update of the empirical evidence, 1967–1982. Can Psychol 25(4):269–292. https://doi.org/10.1037/h0080846
Article Google Scholar
Kassin SM, Dror IE, Kukucka J (2013) The forensic confirmation bias: Problems, perspectives, and proposed solutions. J Appl Res Mem Cogn 2(1):42–52. https://doi.org/10.1016/j.jarmac.2013.01.001
Article Google Scholar
Katz C, Barnetz Z, Hershkowitz I (2014) The effect of drawing on children’s experiences of investigations following alleged child abuse. Child Abuse Negl 38(5):858–867. https://doi.org/10.1016/j.chiabu.2014.01.003
Article PubMed Google Scholar
Kleining G (1995) Von der Hermeneutik zur qualitativen Heuristik. Lehrbuch entdeckende Sozialforschung, Bd. 1. Beltz, Weinheim (https://ixtheo.de/record/1117854000)
Google Scholar
Ko S (2004). Zur klinischen Validität des Koppitz’schen ZEM-Analyseschemas: Ein empirischer Vergleich von CBCL- und Bilddaten [Dissertation]. Universität Hamburg, Hamburg
Koppitz EM (1968) Psychological evaluation of children’s human figure drawings. Grune & Stratton
Google Scholar
Koppitz EM, Kende E (1972) Die Menschendarstellung in Kinderzeichnungen und ihre psychologische Auswertung. Hippokrates, Stuttgart
Google Scholar
Kos M, Biermann G (2017) Die verzauberte Familie: Ein tiefenpsychologischer Zeichentest, 6. Aufl. Beiträge zur Psychodiagnostik des Kindes, Bd. 1. Reinhardt, München
Google Scholar
Köthe N, Wertz M, Steffanowski A, Yundina E (2020) Der Rosenzweig Picture-Frustration Test (PFT) im forensischen Kontext: Eine Validierungsstudie. Recht Psychiatr 38(2):84–92
Google Scholar
Kubinger KD, Schrott A, Maitz P (2003) Zur Null-Objektivität, Null-Reliabilität und daher Null-Validität der „Familie in Tieren“. Z Differ Diagn Psychol 24:114–115
Google Scholar
Lafortune KA, Carpenter BN (1998) Custody evaluations: a survey of mental health professionals. Behav Sci Law 16(2):207–224. https://doi.org/10.1002/(SICI)1099-0798(199821)16:2〈207::AID-BSL303〉3.0.CO;2‑P
Article Google Scholar
Lilienfeld SO (1999) Projective measures of personality and psychopathology: How well do they work? Skept Inq 23(5):32–39
Google Scholar
Lilienfeld SO, Wood JM, Garb HN (2000) The scientific status of projective techniques. Psychol Sci Public Interest 1(2):27–66. https://doi.org/10.1111/1529-1006.002
Article CAS PubMed Google Scholar
Loevinger J (1976) Ego development: Conceptions and theories. Jossey-Bass, San Fransicso
Google Scholar
Lubin B, Larsen RM, Matarazzo JD (1984) Patterns of psychological test usage in the United States: 1935–1982. Am Psychol 39(4):451–454. https://doi.org/10.1037/0003-066X.39.4.451
Article Google Scholar
Lundy A (1985) The reliability of the thematic apperception test. J Pers Assess 49(2):141–145. https://doi.org/10.1207/s15327752jpa4902_6
Article CAS PubMed Google Scholar
Machover K (1949) Personality projection in the drawing of the human figure: a method of personality investigation https://doi.org/10.1037/11147-000
Book Google Scholar
Macleod E, Gross J, Hayne H (2016) Drawing conclusions: the effect of instructions on children’s confabulation and fantasy errors. Memory 24(1):21–31. https://doi.org/10.1080/09658211.2014.982656
Article PubMed Google Scholar
McClelland DC (1980) Motive dispositions: the merits of operant and respondent measures. In: Wheeler L (Hrsg) Review of personality and social psychology, Bd. 1. SAGE, Thousand Oaks, S 10–41
Google Scholar
McClelland DC, Atkinson JW, Clark RA, Lowell EL (1953) The achievement motive
Book Google Scholar
McClelland DC, Koestner R, Weinberger J (1989) How do self-attributed and implicit motives differ? Psychol Rev 96(4):690–702. https://doi.org/10.1037/0033-295x.96.4.690
Article Google Scholar
Meyer GJ, Erdberg P, Shaffer TW (2007) Toward international normative reference data for the comprehensive system. J Pers Assess 89(S1):S201–S216. https://doi.org/10.1080/00223890701629342
Article PubMed Google Scholar
Mihura JL, Meyer GJ, Dumitrascu N, Bombel G (2013) The validity of individual Rorschach variables: systematic reviews and meta-analyses of the comprehensive system. Psychol Bull 139(3):548–605. https://doi.org/10.1037/a0029406
Article PubMed Google Scholar
Mihura JL, Meyer GJ, Bombel G, Dumitrascu N (2015) Standards, accuracy, and questions of bias in Rorschach meta-analyses: reply to Wood, Garb, Nezworski, Lilienfeld, and Duke (2015). Psychol Bull 141(1):250–260. https://doi.org/10.1037/a0038445
Article PubMed Google Scholar
Morgan CD, Murray HA (1935) A method for investigating fantasies. Arch Neurol Psychiatry 34(2):389–406
Article Google Scholar
Motta RW, Little SG, Tobin MI (1993) The use and abuse of human figure drawings. Sch Psychol Q 8(3):162–169. https://doi.org/10.1037/h0088273
Article Google Scholar
Otgaar H, van Ansem R, Pauw C, Horselenberg R (2016) Improving children’s interviewing methods? The effects of drawing and practice on children’s memories for an event. J Police Crim Psychol 31(4):279–287. https://doi.org/10.1007/s11896-016-9190-0
Article Google Scholar
Pinkerman JE, Haynes JP, Jeuser T (1993) Characteristics of psychological practice in juvenile court clinics. Am J Forensic Psychol 11(2):3–12
Google Scholar
Piotrowski C (2015) Projective techniques usage worldwide: A review of applied settings 1995–2015. J Indian Acad Appl Psychol 41(3):9–19
Google Scholar
Remschmidt H, Mattejat F (1999) Familien-Identifikations-Test (FIT). Hogrefe, Göttingen
Google Scholar
Rorschach H (1921) Psychodiagnostics: A diagnostic test based on perception. Grune & Stratton
Google Scholar
Rosenzweig S, Fleming EE, Clark HJ (1947) Revised scoring manual for the Rosenzweig picture-frustration study https://doi.org/10.1080/00223980.1947.9917347
Book Google Scholar
Salewski C, Stürmer S (2015) Qualität familienrechtspsychologischer Gutachten. Z Kindschaftsrecht Jugendhilfe 1:4–9
Google Scholar
Schaipp C, Plaum E (2000) Sogenannte projektive Techniken: Verfahren zwischen Psychometrie, Hermeneutik und qualitativer Heuristik. J Psychol 8(1):29–44
Google Scholar
Schultheiss OC (2008) Deutsches Kalibrierungsset für Winters (1994) „Manual for scoring motive imagery in running text“ [German calibration set for Winter’s (1994) “Manual for scoring imagery in running text”] (University of Nürnberg-Erlangen.)
Google Scholar
Shaffer TW, Erdberg P, Haroian J (1999) Current nonpatient data for the Rorschach, WAIS‑R, and MMPI‑2. J Pers Assess 73(2):305–316. https://doi.org/10.1207/S15327752JPA7302_8
Article Google Scholar
von Staabs G (1964) Der Scenotest. Huber, Bern
Google Scholar
Strange D, Garry M, Sutherland R (2003) Drawing out children’s false memories. Appl Cognit Psychol 17(5):607–619. https://doi.org/10.1002/acp.911
Article Google Scholar
Tuerlinckx F, de Boeck P, Lens W (2002) Measuring needs with the thematic apperception test: a psychometric study. J Pers Soc Psychol 82(2):448–461. https://doi.org/10.1037/0022-3514.82.3.448
Article PubMed Google Scholar
Watkins CE, Campbell VL, Nieberding R, Hallmark R (1995) Contemporary practice of psychological assessment by clinical psychologists. Prof Psychol Res Pr 26(1):54–60. https://doi.org/10.1037/0735-7028.26.1.54
Article Google Scholar
Westen D, Lohr N, Silk KR, Gold L, Kerber K (1990) Object relations and social cognition in borderlines, major depressives, and normals: a Thematic Apperception Test analysis. Psychol Assess 2(4):355–364
Article Google Scholar
Wheeler WM (1949) An analysis of Rorschach indices of male homosexuality. Rorschach Res Exch J Proj Tech 13(2):97–126. https://doi.org/10.1080/10683402.1949.10381453
Article CAS PubMed Google Scholar
Wienand F (2016) Projektive Diagnostik bei Kindern, Jugendlichen und Familien: Grundlagen und Praxis – ein Handbuch. Kohlhammer, Stuttgart
Google Scholar
Winter DG (1994) Manual for scoring motive imagery in running text (Version 4.2)
Google Scholar
Wittkowski J (2011) Projektive Verfahren. In: Amelang M, Hornke L (Hrsg) Verfahren zur Persönlichkeitsdiagnostik: Theoretische Grundlage und Anwendungsprobleme. Enzyklopädie der Psychologie: Psychologische Diagnostik, Bd. 4. Hogrefe, Göttingen, S 299–410
Google Scholar
Wood JM, Nezworski MT, Stejskal WJ (1996a) The comprehensive system for the rorschach: A critical examination. Psychol Sci 7(1):3–10. https://doi.org/10.1111/j.1467-9280.1996.tb00658.x
Article Google Scholar
Wood JM, Nezworski MT, Stejskal WJ (1996b) Thinking critically about the comprehensive system for the rorschach: A reply to Exner. Psychol Sci 7(1):14–17. https://doi.org/10.1111/j.1467-9280.1996.tb00660.x
Article Google Scholar
Wood JM, Lilienfeld SO, Garb HN, Nezworski MT (2000) The Rorschach test in clinical diagnosis: a critical review, with a backward look at Garfield (1947). J Clin Psychol 56(3):395–430. https://doi.org/10.1002/(SICI)1097-4679(200003)56:3〈395::AID-JCLP15〉3.0.CO;2‑O
Article CAS PubMed Google Scholar
Wood JM, Teresa PM, Garb HN, Lilienfeld SO (2001) The misperception of psychopathology: problems with the norms of the comprehensive system for the Rorschach. Clin Psychol 8(3):350–373. https://doi.org/10.1093/clipsy.8.3.350
Article Google Scholar
Wood JM, Garb HN, Nezworski MT, Lilienfeld SO, Duke MC (2015) A second look at the validity of widely used Rorschach indices: comment on Mihura, Meyer, Dumitrascu, and Bombel (2013). Psychol Bull 141(1):236–249. https://doi.org/10.1037/a0036005
Article PubMed Google Scholar
Woolford J, Patterson T, Macleod E, Hobbs L, Hayne H (2015) Drawing helps children to talk about their presenting problems during a mental health assessment. Clin Child Psychol Psychiatry 20(1):68–83. https://doi.org/10.1177/1359104513496261
Article PubMed Google Scholar
Worchel FF, Dupree JL (1990) Projective story-telling techniques. In: Reynolds CR, Kamphaus RW (Hrsg) Handbook of psychological and educational assessment of children: Personality, behavior, and context, 2. Aufl. Guilford, New York, S 70–88
Google Scholar
Zumbach J (2017) Psychische Störungen bei Kindern und Jugendlichen in familienrechtlichen Verfahren: Empirische Analysen psychologischer Sachverständigengutachten [Dissertation, Universität Oldenburg]. oops.uni-oldenburg.de. http://oops.uni-oldenburg.de/3402/
Zumbach J, Koglin U (2016) (Keine) Zusammenhänge zwischen Figurgrößen und Distanzen mit familiären-, elterlichen- und Verhaltensmerkmalen in Familienzeichnungen von 4‑ bis 6‑jährigen Kindern. Rechtspsychologie 1:82–104 (Sonderband)
Google Scholar

Download references

Funding

Open Access funding enabled and organized by Projekt DEAL.

Author information

Authors and Affiliations

Rheinische Friedrich-Wilhelms-Universität Bonn, Bonn, Deutschland
Charis R. Neuerburg M.Sc. Psychologie, M.Sc. Rechtspsychologie
Institut für Psychologie, Abt. Sozial- und Rechtspsychologie, Rheinische Friedrich-Wilhelms-Universität Bonn, Kaiser-Karl-Ring 9, 53111, Bonn, Deutschland
Rainer Banse Dipl.-Psych.

Authors

Charis R. Neuerburg M.Sc. Psychologie, M.Sc. Rechtspsychologie
View author publications
You can also search for this author in PubMed Google Scholar
Rainer Banse Dipl.-Psych.
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Rainer Banse Dipl.-Psych..

Ethics declarations

Interessenkonflikt

C.R. Neuerburg und R. Banse geben an, dass kein Interessenkonflikt besteht.

Rights and permissions

Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.

Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.

Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/licenses/by/4.0/deed.de.

Reprints and permissions

About this article

Cite this article

Neuerburg, C.R., Banse, R. Zur Verwendung projektiver Verfahren in der Familienrechtspsychologie: ein Diskussionsbeitrag. Forens Psychiatr Psychol Kriminol 16, 114–124 (2022). https://doi.org/10.1007/s11757-022-00718-8

Download citation

Accepted: 21 April 2022
Published: 18 May 2022
Issue Date: May 2022
DOI: https://doi.org/10.1007/s11757-022-00718-8

Schlüsselwörter

Keywords

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

Zur Verwendung projektiver Verfahren in der Familienrechtspsychologie: ein Diskussionsbeitrag

Zusammenfassung

Abstract

Projektive Verfahren als Testverfahren

Der Thematische Apperzeptionstest

Zeichnerische Verfahren

Die Kritik an den psychometrischen Gütekriterien

Projektive Verfahren als informelle Verhaltensprobe

Hypothesengenerierung und „confirmation bias“

Die illusorische Korrelation

Weniger ist mehr

Projektive Verfahren für den Gesprächseinstieg

Fazit

Literatur

Funding

Author information

Authors and Affiliations

Corresponding author

Ethics declarations

Interessenkonflikt

Rights and permissions

About this article

Cite this article

Share this article

Schlüsselwörter

Keywords

Search

Navigation