Einleitung

Die Entwicklung und das Wohl von Kindern aus Familien mit schweren psychosozialen Belastungen sind bereits ab dem Säuglingsalter durch Gewalt, Vernachlässigung und eine geringe Erziehungskompetenz der Eltern gefährdet. Als Folge können frühkindliche Deprivationssyndrome, Fehlentwicklungen, aber auch Beeinträchtigungen der psychischen Gesundheit im Jugend- und Erwachsenenalter auftreten [1, 2]. Trotz weltweit Millionen betroffener Kinder jährlich fällt es öffentlichen Institutionen schwer, effektive präventive Strategien gegen Kindesmisshandlungen zu entwickeln [3, 4].

Ein einzelner ökonomischer, psychosozialer oder medizinisch-anamnestischer Prädiktor konnte bisher nicht identifiziert werden. Die zuverlässige Vorhersage von Kindesmisshandlungen wird erschwert durch die oft komplexen familiären Umgebungen mit vielfältigen Risiken [1]. Insbesondere elterliche Charakteristika wie sehr junges Alter, niedriger Bildungsstatus, geringes Einkommen, alleinerziehend, Drogenmissbrauch, mütterliche Depressionen, aber auch eine große Zahl bereits vorhandener Kinder in der Familie und ein niedriges Geburtsgewicht des Kindes wurden häufig als Risikofaktoren beschrieben. Daraus abgeleitete Vorhersagemodelle wiesen bisher jedoch keine zufriedenstellende diagnostische Genauigkeit auf [57]. In einer kürzlich veröffentlichten Literaturübersichtsarbeit kommen Ridings et al. zu dem Schluss, dass der Fokus präventiver Strategien besonders auf den Risikofaktoren Gewalt zwischen den Eltern und mütterliche Depression sowie den protektiven Faktoren soziale Unterstützung und familiäre Ressourcen liegen sollte [8].

Einen neuen Public-Health-Forschungsansatz haben neuseeländische Wissenschaftler gewählt. Basierend auf Analysen umfassender Sekundärdatensätze ihres Ministeriums für Soziale Entwicklung wurden prädiktive Risikomodelle entwickelt, um bei Kleinkindern in den ersten 2 Lebensjahren Misshandlungen bis zum 5. Lebensjahr vorherzusagen. Vorläufige Ergebnisse zeigten das Potenzial der Entwicklung entsprechender Algorithmen für die Auswertung zusammengefügter, großer administrativer Datensätze. Es bedarf jedoch weiterer Studien, diese Risikomodelle zu verbessern und die wichtigsten Formen von Misshandlungen wie Vernachlässigung sowie physischer, psychischer und sexueller Missbrauch präziser vorhersagen zu können [9].

Die Anzahl der betroffenen Kinder ist statistisch schwer zu erfassen [10]. Nur für die schwerste Form, den Tod durch Misshandlung oder Vernachlässigung, gibt es Statistiken. Insgesamt schätzt „United Nations International Children’s Emergency Fund“ (UNICEF), dass in den Industrieländern jährlich fast 3500 Kinder durch Kindesmisshandlungen sterben. Für Deutschland wurden 2 Todesfälle pro Woche bei Kindern unter 15 Jahren angegeben [11]. Die negativen Auswirkungen frühkindlicher Risiken von Geburt an über die ersten 2 Lebensdekaden wurden prospektiv erstmals für Deutschland in der Mannheimer Risikokinderkohortenstudie untersucht. Dabei zeigte sich, dass organische Risiken langfristig v. a. die motorische und kognitive Entwicklung beeinträchtigten, psychosoziale Belastungen dagegen eher kognitive und emotionale Funktionen [12].

Geburtskliniken stehen zunehmend im Fokus präventiver Forschungsansätze zur Untersuchung der Wirksamkeit psychosozialer Frühwarnsysteme, da hier mit Hochrisikofamilien und insbesondere Schwangeren, die Vorsorgeuntersuchungen nur mangelhaft wahrgenommen haben, Kontakt aufgebaut und frühzeitig Unterstützung durch Weiterleitung zu Einrichtungen Früher Hilfen, d. h. interdisziplinären Unterstützungsangeboten für Familien, angeboten werden kann [1316]. Seit einigen Jahren wird in Hamburger Geburtskliniken im Projekt Babylotse ein Screeningbogen zur systematischen Erfassung psychosozialer Risikoindikatoren eingesetzt. Werden dabei Familien als auffällig eingestuft, evaluieren speziell ausgebildete Sozialpädagoginnen, die sogenannten Babylotsen, in einem persönlichen Elterngespräch den Unterstützungsbedarf der Familie. Angaben zur diagnostischen Genauigkeit dieses Screeninginstruments sind noch ausstehend [17]. In 11 südwestdeutschen Landkreisen wird im Projekt „Keiner fällt durchs Netz“ die Heidelberger Belastungsskala als Frühwarnsystem durch Hebammen sowie pflegerisches und ärztliches Personal eingesetzt. Nach Erfassung kindlicher, elterlicher, sozialer und materieller Belastungen werden auffällige Familien ggf. an Einrichtungen Früher Hilfen weitergeleitet. Einer sehr guten Interrater-Reliabilität stand eine eher mäßige Sensitivität der Belastungsskala in Bezug auf eine spätere Inobhutnahme gegenüber [18]. Im Projekt „Guter Start ins Kinderleben“ verwendet das Personal in süddeutschen Geburtskliniken den „Anhaltsbogen für ein vertiefendes Gespräch“ zur Erfassung von 5 familiären Belastungskonstellationen inklusive sozialer Belastungsfaktoren: mangelnde Wahrnehmung von Vorsorgeuntersuchungen, eine besondere Belastung durch Behinderung des Kindes oder Mehrlinge, Schwierigkeiten im Umgang oder der Bindung zum Kind und Vorhandensein elterlicher Gefühle der Angst oder Überforderung. Bei Bedarf werden u. a. Familienhebammen zur Unterstützung der Familien angeboten [19].

Trotz zahlreicher positiver Erkenntnisse der genannten Projekte sind die in den deutschen Geburtskliniken bisher eingesetzten psychosozialen Screeninginstrumente oft noch zu umfangreich und v. a. in ihrer diagnostischen Genauigkeit nicht zufriedenstellend evaluiert worden. Das primäre Ziel der vorliegenden Auswertung war es daher, einen im klinischen Alltag einfach anzuwendenden perinatalen Screeningbogen mit etablierten Risikoindikatoren in Bezug auf seine diagnostische Genauigkeit zu untersuchen. Zum Vergleich wurde als Referenzstandard ein intensives, standardisiertes Elterninterview zur Bestimmung des Unterstützungsbedarfs im ersten Lebensjahr des Kindes herangezogen.

Methoden

Studiensetting und -teilnehmer

Die Methodik des Projekts Babylotse-Plus Berlin, einer 1‑jährigen Interventionsstudie mit historischer Kontrollgruppe, wurde ausführlich im Rahmen einer Dissertationsschrift beschrieben [20]. Im Folgenden fassen wir die für die vorliegende Arbeit relevanten Methoden, basierend auf der STARD-Checkliste zum Berichten von Studien zur diagnostischen Genauigkeit, zusammen [21].

Eingeschlossen in die vorliegenden Analysen wurden alle Frauen, die zwischen dem 1.1.2013 und 31.8.2013 zur Schwangerenberatung oder auf eine Präpartalstation der Entbindungskliniken der Charité – Universitätsmedizin Berlin kamen. Ausschlusskriterien waren: a) Mutter des Kindes wurde bereits anderweitig sozial betreut (z. B. Sozialdienst, Elternberatung der Neonatologie), b) keine ausreichenden Sprachkenntnisse (das ausführliche 1‑stündige Interview mit Sozialpädagoginnen als Referenzstandard wurde auf Deutsch geführt), c) Verweigerung der Studienteilnahme (s. Abb. 1). Nicht eingeschlossen werden konnten zudem Fälle, bei denen die Daten aus Screeningbogen oder diagnostischem Interview nicht zuordenbar/unvollständig waren oder Eltern aufgrund ambulanter Entbindung oder kurzfristiger Entlassung nicht für ein diagnostisches Interview erreicht wurden.

Abb. 1
figure 1

Studiendesign zur Auswertung der diagnostischen Genauigkeit des Babylotse-Plus-Screeningbogens im Vergleich zu einem standardisierten Elterninterview (als Referenzstandard; aus Fisch [20])

Gründe für eine anderweitig soziale Betreuung (durch den klinikeigenen Sozialdienst) waren schwerwiegende Belastungen, wie z. B. häusliche Gewalt, Substanzabusus, schwere psychiatrische Erkrankung, der Wunsch nach einer Adoption oder anonymen Geburt, bereits bestehende Anbindung an das Jugendamt bzw. eine gesetzliche Betreuung und extreme Unreife oder schwere Erkrankungen des Kindes. Da diese Fälle nicht Ziel des niederschwelligen Screenings waren und auch primär nicht von dem Babylotsen-Team betreut wurden (es daher auch keine Daten aus diagnostischen Interviews gibt), wurden sie nicht in die Analyse einbezogen.

Stichprobe

Im Beobachtungszeitraum wurden 2344 (82,2 %) von 2850 Geburten mit dem Screeningbogen erfasst. Bei 1116 Familien (47,6 %) wurde ein auffälliger Score ≥ 3 ermittelt. Für die Mehrzahl dieser Familien lag jedoch mindestens ein Ausschlussgrund vor, sodass nur 215 Familien in die vorliegenden Analysen eingeschlossen werden konnten (s. Abb. 1). Von den 1228 Familien mit unauffälligem Score (<3) wurden aus Gründen der Ressourcenknappheit 64 zufällig ausgewählt. Mit diesen und den 215 im Screeningbogen auffälligen Familien wurde ein 1‑stündiges, diagnostisches Interview durchgeführt. Für die Stichprobengröße waren vor Durchführung keine festen Zielwerte benannt: Ausschlaggebend waren der Beobachtungszeitraum, Ausschlusskriterien und personelle Ressourcen für die Durchführung.

Screeningbogen

Der Babylotse-Plus-Screeningbogen mit 27 Items wurde bei der Aufnahme der Schwangeren von den Hebammen, pflegerischem oder ärztlichem Personal der Geburtskliniken mit Informationen aus Anamnese und Mutterpass ausgefüllt (s. Abb. 2). Der Zeitaufwand betrug ca. 5 min.

Abb. 2
figure 2

Babylotse-Plus-Screeningbogen zur Erfassung psychosozialer Risiken, der perinatal durch medizinisches Personal ausgefüllt wird

Die einzelnen Risikoindikatoren wurden mit 1–4 Punkten bewertet, der Gesamtsummenscore reichte von 0 (kein Risiko) bis 65 (höchstes Risiko) (Tab. 1). Als „auffälliges“ Ergebnis im Screening wurden, wie im Partnerprojekt der Hamburger Babylotsen, Scorewerte ≥ 3 im Sinne eines psychosozialen Risikos gewertet [17]. So wurde der Tatsache Rechnung getragen, dass das kumulative Auftreten von Risikofaktoren das Gesamtrisiko für eine mögliche Kindeswohlgefährdung erhöht [22, 23]. Die Scorewerte <3 wurden als unauffällig bewertet. Es gab keine fehlenden Scoreangaben.

Tab. 1 Punktevergabe für die einzelnen Items des Babylotse-Plus-Screeningbogens (ein Screeningergebnis mit ≥ 3 wurde als „auffällig“, d. h. positives Testergebnis, definiert; aus Fisch [20])

Entwicklung des Screeningbogens

Die Auswahl der Items des Screeningbogens erfolgte basierend auf dem vorausgegangenen Hamburger Babylotse-Projekt in enger Abstimmung mit Geburtsmedizinern, Sozialpädagogen und Epidemiologen und orientierte sich an bereits bestehenden Screeninginstrumenten, dem aktuellen Forschungsstand sowie pragmatischen Bedürfnissen des klinischen Alltags [16, 2432]. Einige für den Screeningbogen zunächst ausgewählte Items mussten auf Wunsch der Datenschutzbeauftragten verworfen werden. Dazu gehörten den Kindesvater betreffende Risikoindikatoren und das Bildungsniveau.

Bei seiner Entwicklung wurde darauf geachtet, dass der Screeningbogen wichtige Fragen abdeckt, dabei kurz und einfach anwendbar bleibt und dadurch vom Klinikpersonal im Alltag besser angenommen wird. Einige Items wurden bewusst relativ abstrakt benannt, um der Intuition/dem „Bauchgefühl“ erfahrener Mitarbeiter der Geburtsklinik im Umgang mit belasteten Familien Raum zu geben und die Schwelle zum Bejahen von Risikoindikatoren niedrig zu halten. Zudem wurde für einige Items die Antwortmöglichkeit „unsicher“ eingeführt, die bei der Berechnung des Scores wie ein „Ja“ gewertet wurde. In der Pilotphase hat sich in Gesprächen mit dem Klinikpersonal herausgestellt, dass viele Anwendende sich damit schwertaten, z. B. bei Alkoholkonsum in der Schwangerschaft ohne Beweise ein „Ja“ anzukreuzen, um Eltern nicht falsch zu beschuldigen.

Die Wertung im Score ist angelehnt an das Projekt Babylotse Hamburg [17]. Das interdisziplinäre Projektteam in Berlin definierte im Rahmen der Entwicklungsphase den Cut-off-Wert bei 3 und die Punktwerte der einzelnen Items. Dadurch konnte bereits das Vorliegen eines einzelnen, aber sehr relevanten Risikoindikators zu einem auffälligen Score von 3 oder mehr führen (Tab. 1).

Im Februar 2012 wurde der Screeningbogen in einer 10-tägigen Pilotphase testweise angewendet, Probleme und Unklarheiten notiert und das Vorgehen und die Handhabung mit dem Kreißsaalpersonal diskutiert. Von Juni bis Dezember 2012 wurde der überarbeitete Screeningbogen zunächst bei 1333 Familien eingesetzt und das intensive diagnostische Interview durch Babylotsen mit den laut Score belasteten Eltern geführt. Diese wurden bei Bestätigung des Bedarfs anschließend zu Einrichtungen Früher Hilfen weitergeleitet.

In der Entwicklungsphase 2012–2013 wurde der Screeningbogen in Absprache mit den Datenschutzbeauftragten und dem anwendenden Klinikpersonal weiter angepasst. Die Mitarbeiter des Projekts Babylotse-Plus, der Geburtskliniken und der Neonatologie (Ärzte, Hebammen, Sozialdienstmitarbeiter, Pflegepersonal) wurden in die Weiterentwicklung einbezogen und in der Anwendung des Instrumentes geschult.

Intensives standardisiertes Interview (Referenzstandard)

Bei einem auffälligen Score (≥ 3) führten Sozialpädagoginnen, die sogenannten Babylotsinnen, ein ca. 1-stündiges Interview mit 59 standardisierten Fragen mit der Mutter und ggf. ihrem Partner durch. Darin erfolgte die genaue Ermittlung von individuellen Belastungsfaktoren und vorhandenen Ressourcen. Wenn die Babylotsinnen Unterstützungsbedarf erkannten und die Mütter zustimmten, wurde ein gemeinsamer Plan zum Bedarf erstellt und die Überleitung zu passgenauen Einrichtungen für Frühe Hilfen angesprochen. Die Babylotsinnen und geschulten Medizinstudentinnen unter Supervision durch Babylotsinnen führten dieses standardisierte Interview auch mit zufällig ausgewählten Familien mit einem unauffälligen Score (<3) durch. Aufgrund begrenzter Ressourcen war es nicht möglich, dies auf alle Familien mit einem unauffälligen Score auszuweiten [12].

Statistische Methoden

Zur Evaluation der diagnostischen Genauigkeit wurde eine Vierfeldertafel des Screeningbogenergebnisses (≥3 = „auffällig“ vs. <3 = „unauffällig“) und des Interviewergebnisses (Unterstützungsbedarf vs. kein Unterstützungsbedarf) erstellt (Tab. 2).

Tab. 2 Vierfeldertafel: Ergebnisse des Babylotse-Plus-Screeningbogens und des Interviews (Referenzstandard; aus Fisch [20])

Daraus wurden für das dichotome Screeningergebnis „auffällig“ vs. „unauffällig“ folgende Parameter, jeweils mit einem 95 %-Konfidenzintervall, ermittelt:

  • Sensitivität (Anzahl der richtig positiv getesteten Familien/[Anzahl der richtig positiv getesteten + Anzahl der falsch negativ getesteten]),

  • Spezifität (Anzahl der richtig negativ getesteten/[Anzahl der richtig negativ getesteten + Anzahl der falsch positiv getesteten]),

  • Positive Likelihood Ratio (Sensitivität/[1 − Spezifität]),

  • Negative Likelihood Ratio ([1 – Sensitivität]/Spezifität),

  • Die Grenzwertoptimierungskurve (Receiver Operating Characteristic, ROC) mit der „Fläche unter der Kurve“ (Area under the curve, AUC).

Die positive Likelihood Ratio gibt an, wieviel Mal wahrscheinlicher ein positiver Test bei Familien mit Unterstützungsbedarf ist im Vergleich zu Familien ohne Unterstützungsbedarf. Tests mit positiver Likelihood Ratio >3 bis 10 werden dabei als gut eingeschätzt, >10 als hervorragend. Die negative Likelihood Ratio gibt an, wieviel Mal wahrscheinlicher ein negativer Test bei Familien mit Unterstützungsbedarf ist im Vergleich zu Familien ohne Unterstützungsbedarf. Tests mit einer negativen Likelihood Ratio von 0,1 bis <0,3 werden als gut eingeschätzt, mit <0,1 als hervorragend [33].

Da positive und negative prädiktive Werte im Gegensatz zu Sensitivität und Spezifität von der Prävalenz des gemessenen Ereignisses abhängig sind, wurde aufgrund des Studiendesigns mit zahlreichen Ausschlusskriterien, die eine valide Prävalenzschätzung nicht zulassen, auf ihre Berechnung verzichtet. Für die statistische Auswertung wurde das Statistikprogramm SPSS Version 21 genutzt. Fehlende Werte wurden in den Analysen nicht berücksichtigt. Ein Alpha-Level von 0,05 wurde für alle Analysen als statistisch signifikant betrachtet.

Ergebnisse

Beschreibung der Stichprobe

Von den mit dem Screeningbogen im Beobachtungszeitraum erfassten 2344 Familien (Abb. 2) hatten 47,6 % einen Score ≥ 3 und damit ein auffälliges Ergebnis. Für die Mehrzahl dieser Familien lagen jedoch Ausschlussgründe vor, sodass sie nicht in die vorliegenden Auswertungen eingehen konnten (Abb. 1).

Die 215 Familien, die in die Analysen eingeschlossen werden konnten, wiesen im Babylotse-Plus-Screeningbogen Scores von 3–22 auf. Der Mittelwert der Scores betrug 6,1; der Median 5. Die Scorewerte für die 64 unauffälligen Familien reichten von 0–2, dabei lag der Mittelwert bei 0,8 und der Median bei 1 [20]. Familien mit und ohne Unterstützungsbedarf unterschieden sich deutlich in der Mehrzahl der erfassten Faktoren, die in Tab. 3 dargestellt sind.

Tab. 3 Häufigkeit der im Screeningbogen Babylotse-Plus erfassten Risikoindikatoren bei den Familien mit und ohne auffälliges Screeningergebnis. (Aus Fisch [20])

Evaluation des Babylotse-Plus-Screeningbogens

Familien, die im diagnostischen Interview als unterstützungsbedürftig eingestuft wurden, hatten fast alle auch im Screeningbogen einen auffälligen Wert von ≥ 3 (Tab. 2), woraus sich eine hohe Sensitivität (d. h. der Anteil richtig Positiver) des Screeningbogens von fast 99 % ergab [20]. Familien ohne Unterstützungsbedarf hatten jedoch nur zu einem Drittel im Screeningbogen ein unauffälliges Ergebnis (<3), folglich war die Spezifität (d. h. der Anteil richtig Negativer) mit 33 % gering (Tab. 4).

Tab. 4 Übersicht der Testkriterien für den Babylotse-Plus-Screeningbogen im Vergleich zum Referenzstandard, dem ausführlichem Elterninterview. (Aus Fisch [20])

Die positive Likelihood Ratio fiel eher schwach aus [20]. Der Wert von 1,5 bedeutet, dass eine unterstützungsbedürftige Familie nur mit einer 1,5fach höheren Wahrscheinlichkeit ein positives Testergebnis bekommen würde gegenüber einer Familie ohne Unterstützungsbedarf (Tab. 4). Dagegen war ein negatives, also unauffälliges Testergebnis mit einem Score <3 ein sehr zuverlässiger Indikator dafür, dass eine Familie keinen Unterstützungsbedarf hatte. Dies zeigte sich in einer sehr niedrigen und damit exzellenten negativen Likelihood Ratio des Tests. Der Wert von 0,03 bedeutet, dass die Wahrscheinlichkeit einer Familie mit Unterstützungsbedarf, ein unauffälliges Testergebnis zu bekommen, 33-mal geringer ist als die Wahrscheinlichkeit einer Familie ohne Unterstützungsbedarf, ein unauffälliges Testergebnis zu bekommen (Tab. 4; [33]).

In Abb. 3 zeigt die ROC-Kurven für die Screeningbogenscores von 0–22 einen AUC-Wert von 0,76 (95 %-KI: 0,71–0,82), der sich statistisch signifikant von einer AUC-Fläche von 0,5 bei einer Zufallszuweisung unterscheidet (p < 0,001) [20].

Abb. 3
figure 3

ROC-Kurve für den Babylotse-Plus-Screeningbogen als Testinstrument für Unterstützungsbedarf (im Sinne Früher Hilfen) und einem standardisierten 1‑stündigen diagnostischen Elterninterview als Referenzstandard (Screening-Score-Werte von 0 = kein Risiko bis 22 = höchstes Risiko; mit 95 %-Konfidenzintervall als gestrichelte Linien; nach Fisch [20])

Diskussion

Hauptergebnisse

Unsere Auswertungen zeigten, dass der für den Einsatz in der Perinatalzeit entwickelte einfache Babylotse-Plus-Screeningbogen geeignet ist, um Familien mit Unterstützungsbedarf zu erkennen. Ein auffälliger Score im Babylotse-Plus-Screeningbogen ging jedoch nicht zwangsläufig mit einem tatsächlichen Unterstützungsbedarf einher. Viele Familien wurden fälschlicherweise positiv getestet. Ein unauffälliges Screeningergebnis dagegen bedeutete mit sehr großer Wahrscheinlichkeit, dass die Familien keine schweren Belastungen aufwiesen und keine Unterstützung oder Weiterleitung zu Einrichtungen der Frühen Hilfen benötigten.

Cut-off-Wert des Screeningbogens

Der hohe Anteil falsch positiver Testergebnisse lässt sich nicht zuletzt auch auf den bewusst niedrig gewählten Cut-off-Wert zurückführen. Hierfür reichte in einigen Fällen bereits das Vorliegen eines einzigen (relevanten) Risikoindikators aus. Betrachtet man die für andere theoretisch mögliche Scorewerte dargestellte ROC-Kurve, könnte man diese so interpretieren, dass ein Cut-off-Wert von 4 oder 5 zu einem ausgewogeneren Verhältnis von Sensitivität und Spezifität führen würde als der von uns a priori gewählte Wert von 3. Da wir jedoch auf keinen Fall Risikofamilien übersehen wollten und bewusst eine möglichst hohe Sensitivität des Screeningbogens angestrebt haben, führt die nachträgliche Auswertung der ROC-Kurve aus unserer Sicht zu keinem besseren Cut-off-Wert, denn bei 4 oder 5 würden deutliche Reduzierungen des Anteils richtig positiver Getesteter in Kauf genommen werden. Bei dieser speziellen Fragestellung wird eine möglichst hohe Sensitivität wichtiger eingeschätzt als eine hohe Spezifität (Anteil richtig Negativer), wenn diese nur auf Kosten einer geringeren Sensitivität zu erreichen wäre.

Wenn das Risiko fälschlicherweise zu hoch eingeschätzt wird, werden personelle Ressourcen unnötig überstrapaziert. Würde jedoch das Risiko fälschlicherweise zu niedrig eingeschätzt, könnte dies in Bezug auf unerkannte Kindeswohlgefährdung fatale Folgen haben [34]. Eine hohe Sensitivität von Screeninginstrumenten ist anzustreben, damit niemand „durchs Netz fällt“. Somit erscheint dieses Frühwarnsystem zum niederschwelligen und hoffentlich rechtzeitigen Identifizieren von Risikokonstellationen zum Zeitpunkt der Geburt geeignet. In weiteren Untersuchungen des Babylotse-Plus-Projektes soll evaluiert werden, ob das Projekt von den Eltern tatsächlich als niederschwellig und nicht stigmatisierend empfunden wird, da dies Teil der Voraussetzung für die Inkaufnahme hoher falsch positiver Raten ist [36]. Die niedrige Rate an Ablehnung des diagnostischen Interviews von <2 % spricht dafür. Erste Ergebnisse des Kooperationsprojekts Babylotse aus Hamburg deuteten auf eine gute Annahme des Projekts durch die Eltern hin [14, 17]. Eine niedrige Spezifität ist aber auch aus Versorgerperspektive zu vermeiden, da vorhandene Ressourcen (Anzahl und Arbeitsumfang benötigter Babylotsinnen) effizienter eingesetzt werden können.

Vergleich mit anderen Studien

Die Heidelberger Belastungsskala ist ein Screeninginstrument zur Erfassung psychosozialer Risikokonstellationen in Geburtskliniken. Auch sie wird durch medizinisches Personal ausgefüllt. Die Skala umfasst die 4 Bereiche: persönliche Belastung des Kindes, persönliche Belastungen der Eltern bzw. familiäre Belastung, soziale Belastung sowie materielle Belastung. Für diese Bereiche können Punkte zwischen 0 und 100 vergeben werden, ebenso für die daraus ermittelte Gesamtbelastung, nach der sich der Handlungsbedarf richtet: Ab 40 Punkten wird angenommen, dass eine Belastung die vorhandenen Ressourcen überwiegt und eine Weiterleitung an passende Einrichtungen der Frühen Hilfen empfohlen. Die Sensitivität dieses Screeninginstruments lag nur bei 63,6 %, die Spezifität dagegen mit 73,6 % etwas höher [18]. Zur Berechnung wurden die Gesamtbelastungswerte mit den Fällen von Inobhutnahmen im ersten Lebensjahr verglichen, wobei es nur 11 Inobhutnahmen bei 7 Familien gab. Von 284 Familien des Projekts „Keiner fällt durchs Netz“ waren 133 Familien psychosozial belastet [18]. Für die Validierung des Screeninginstrumentes wurden die Daten von Inobhutnahmen hinzugezogen, dadurch sind jedoch nur schwerwiegende Fälle von Kindeswohlgefährdung beachtet worden, was für die Babylotse-Plus-Validierung aufgrund der niederschwelligen und präventiven Zielsetzung nicht geeignet erschien. Auch wenn die Vergleichbarkeit dieser beiden Instrumente erschwert ist, scheint der Babylotse-Plus-Bogen für ein niederschwelliges, systematisches Screening mit seiner hohen Sensitivität besser geeignet zu sein.

Auch im Modellprojekt „Guter Start ins Kinderleben“ der Länder Baden-Württemberg, Bayern, Thüringen und Rheinland-Pfalz zur frühen Förderung elterlicher Erziehungs- und Beziehungskompetenzen sollte nach perinatal ermittelten Risikofaktoren – wie beim Babylotse-Plus-Projekt – ein vertiefendes Gespräch geführt werden [19]. Die Belastung der Eltern wurde dabei ebenfalls vom medizinischen Personal ermittelt und daraus auf das Risiko für eine mögliche Kindeswohlgefährdung geschlossen [19, 36]. Die im eingesetzten Instrument („Anhaltsbogen“) erfassten Risikofaktoren wurden alle auch im Babylotse-Plus-Screeningbogen berücksichtigt. Letzterer war jedoch etwas ausführlicher, aber dennoch ebenfalls in kurzer Zeit ausfüllbar. Auch wenn Angaben zur Sensitivität und Spezifität nach unserer Kenntnis bisher nicht publiziert sind, wurde der „Anhaltsbogen“ mithilfe des Eltern-Belastungs-Screenings zur Kindeswohlgefährdung (EBSK, deutsches Äquivalent zum „Child Abuse Potential Inventory“), [37] evaluiert. Bei der Auswertung von 160 Müttern (rund 21 % der Teilnehmer), für die Angaben aus beiden Instrumenten vorlagen, zeigte sich, dass Fehlen von Risikoindikatoren für ein vertiefendes Gespräch im „Anhaltsbogen“ auch mit einem niedrigeren Stresslevel im ESBK einherging [36].

Die Auswertung der Sensitivität des Babylotse-Plus-Screeningbogens zeigte im Vergleich zu anderen deutschen psychosozialen Screeningverfahren ähnliche oder bessere Ergebnisse bei guter Praktikabilität. Der Babylotse-Plus-Screeningbogen bietet sich damit durchaus als ein Ausschlusstest für Unterstützungsbedarf durch Einrichtungen der Frühen Hilfen an.

Potenzielle Limitationen

Eine mögliche Limitation unserer Studie ist die bisher fehlende Validierung des standardisierten intensiven Elterninterviews. Da es jedoch nicht das Ziel war, eine bestehende Kindeswohlgefährdung aufzudecken, sondern nach Risikoabschätzung einen möglichen Unterstützungsbedarf im ersten Lebensjahr des Kindes frühzeitig zu erkennen, wurde die Expertenmeinung der Sozialpädagoginnen für diesen Zweck als ausreichend valide eingeschätzt und als bestmöglicher Referenzstandard für den Babylotse-Plus-Screeningbogen gewählt.

Inwieweit die teilweise beabsichtigte subjektive Interpretation der Items durch die bewertende Person aufgrund der allgemeinen Formulierungen einen Einfluss auf das Ergebnis hatte, müsste Gegenstand zukünftiger Untersuchungen, z. B. der Interrater-Reliabilität, sein.

Die Bearbeitung des Screeninginstruments durch geschultes Personal sollte stets unter Berücksichtigung der aktuellen Anamnese und weiterer Informationen (z. B. Mutterpass, Patientenakte, Übergabe von Kollegen) erfolgen, auch wenn diese Angaben nicht konsequent standardisiert und für die Bewertenden nicht immer verifizierbar waren. Zusätzlich stand gezielt für die subjektive Einschätzung (die Intuition) der den Bogen ausfüllenden Person ein eigenes Item auf dem Screeningbogen zur Verfügung.

Dass für die vorliegenden Auswertungen viele potenzielle Probanden ausgeschlossen werden mussten, ist eine weitere Limitation. Aufgrund der geplanten Untersuchung der Wirksamkeit der Babylotse-Plus-Intervention (Weiterleitung zu Frühen Hilfen) war insbesondere eine bereits bestehende primäre Betreuung der Familien durch den Sozialdienst ein Ausschlussgrund. Ebenso mussten unzureichende Sprachkenntnisse, die für das intensive Elterninterview zur detaillierten Abklärung von Ressourcen und Unterstützungsbedarf hinderlich gewesen wären, zum Ausschluss in der aktuellen Studie führen. Möglicherweise wären hierbei gerade die von der Sprachbarriere betroffenen Familien als besonders unterstützungsbedürftig aufgefallen. Dolmetscherdienste sind für die nötigste Basisversorgung in den Geburtskliniken der Charité vorhanden, konnten jedoch bei den begrenzten Ressourcen für die zeitlich aufwendigen diagnostischen Elterninterviews der vorliegenden Studie nicht genutzt werden. Daher bleibt unklar, wie eine Berücksichtigung der ausgeschlossenen Familien die Evaluation des Screeningbogens beeinflusst hätte.

Schlussfolgerungen

Mit dem Babylotse-Plus-Screeningbogen gelang es zuverlässig, unterstützungsbedürftige Familien zu identifizieren und ihnen den Zugang zu Einrichtungen Früher Hilfen zu eröffnen. Ob diese Angebote Früher Hilfen tatsächlich von den Eltern angenommen wurden, werden die Auswertungen der Interventionsstudie des Babylotse-Plus-Projekts zeigen. Ein unauffälliges Ergebnis im Babylotse-Plus-Screeningbogen war ein deutlicher Indikator dafür, dass bei diesen Familien die personalintensiven Interviews für die weitere Abschätzung von Unterstützungsbedarf eingespart werden können. Da das Screeninginstrument jedoch auch eine hohe Zahl falsch positiv anzeigte, sollte das intensive Elterninterview weiterhin ergänzend bei allen im Screening auffälligen Familien durchgeführt werden, um die Notwendigkeit eines tatsächlichen Unterstützungsbedarfs abschließend zu klären. So kann gewährleistet werden, dass knappe Ressourcen Früher Hilfen, wie z. B. Familienhebammen, bei den „richtigen“ Familien zum Einsatz kommen. Durch den hohen Anteil falsch Positiver beim Einsatz des aktuellen Screeningbogens müssen also noch personelle Ressourcen für die diagnostischen Elterninterviews bereitgehalten werden. Die Beratungsgespräche der Babylotsinnen setzen an den Ressourcen der Familien an, stärken ihr Selbsthilfe- bzw. Selbstwirksamkeitspotenzial und fördern die Elternverantwortung als eine wichtige Voraussetzung für das Gelingen von Prävention [38]. Um dieser Aufgabe so früh gerecht zu werden, benötigt die Jugendhilfe Kooperationspartner aus dem Gesundheitsbereich.

Der Babylotse-Plus-Screeningbogen könnte durch weitere Studien in anderen Settings noch verbessert werden. Bei gleichbleibend hoher Sensitivität sollte unbedingt versucht werden, die Anzahl der falsch Positiven zu reduzieren und damit die Spezifität des Instruments zu erhöhen. Weiterhin sollte neben der Validierung, z. B. in Bezug auf die Interrater-Reliabilität, die diagnostische Güte des Babylotse-Plus-Screeningbogens in zukünftigen Studien auch unter Einschluss von Familien mit schlechten Deutschkenntnissen, z. B. durch Einsatz von Dolmetschern oder mehrsprachigem Studienpersonal, untersucht werden. So können weitere wichtige Schritte vom reaktiven zum präventiven Kinderschutz aller in Deutschland lebenden Kindern getan werden.