Mit der Einführung standardisierter Einschätzungsinstrumente ist die Hoffnung verbunden, sozialarbeiterische Einschätzungen über Risiken durch verbindliche Verfahren zu verbessern. Dabei gerät leicht aus dem Blick, dass die Anwendung von standardisierten Risikoeinschätzungsverfahren im Organisationshandeln sehr unterschiedliche Funktionen haben und mit dem Potenzial ausgestattet sind, lokale Fallpraxis in spezifischer Weise anzuleiten und zu strukturieren. Was sind mögliche nicht-intendierte Folgen von Standardisierungsprozessen und welche Auswirkungen haben sie auf die praktische Fallarbeit?

Spätestens mit der Einführung des Bundeskinderschutzgesetz haben standardisierte Risikoeinschätzungsinstrumente in Deutschland eine Ausweitung erfahren. Der Beitrag gibt einen Einblick in die disparate Landschaft der in Deutschland verwendeten Einschätzungsinstrumente. Auch wenn risikostatische Entscheidungsinstrumente wie in anderen Ländern im deutschsprachigen Kontext (noch) nicht vorliegen, hat der vermehrte Einsatz standardisierter Einschätzungsinstrumente im Kinderschutz das Potenzial, die lokale Fallpraxis nachhaltig zu beeinflussen. Mit der Einführung standardisierter Einschätzungsinstrumente ist die Hoffnung verbunden, sozialarbeiterische Einschätzungen über Risiken durch verbindliche Verfahren zu objektivieren und zu verbessern. In der einschlägigen Fachdiskussion wird die Einführung standardisierter Einschätzungsverfahren oft als Einfallstor für eine unzulässige Einschränkung professioneller Ermessensspielräume sowie als Treiber einer De-Professionalisierung gedeutet, da diese einzelfallbezogenes, dialogisches Fallverstehen erschwere.

Diese Perspektiven fokussieren insbesondere die Frage nach der Angemessenheit, der Performanz oder der Fehlerquellen verschiedener Diagnoseinstrumente für die Einschätzung von Gefährdungen. Dabei gerät leicht aus dem Blick, dass die Anwendung von standardisierten Risikoeinschätzungsverfahren im Organisationshandeln sehr unterschiedliche Funktionen haben und lokale Fallpraxis in spezifischer Weise anleiten und strukturieren. Der Perspektive einer „Soziologie der Standards“ (Timmermans und Epstein 2010) folgend, gilt es, Standards nicht einfach als inhärent „gut“ oder „schlecht“ zu betrachten, sondern durch sorgfältige empirische Analyse in den Blick zu nehmen, gerade bezogen auf spezifische (und manchmal nicht intendierte) Konsequenzen von Standardisierung. Dieser Perspektive folgend zeigt der Beitrag, dass standardisierte Einschätzungsverfahren das Potenzial haben, lokale Praxis stärker an organisatorische Vorgaben zu koppeln, durch ihre Konstruktionsweise die Sicht auf den Fall zu beeinflussen und meist komplexe Fallverläufe auf vermeintlich deskriptiv eindeutige Kategorien zu reduzieren. Damit ist nicht zuletzt die Gefahr verbunden, dass sich die institutionelle Aufmerksamkeit von ko-produktiven Elementen der Leistungserbringung hin zu einem präventiven Managen von potenziellen Gefährdungsrisiken verschiebt (Dahmen und Kläsener 2019).

Bundeskinderschutzgesetz befördert die Entwicklung standardisierter Einschätzungsinstrumente

Die Einführung des Paragraphen 8a im SGB VIII im Rahmen der Novellierung des SGB VIII unter dem Namen KICK und die Umsetzung des Bundeskinderschutzgesetzes im Jahr 2012 haben auf die Einführung von Einschätzungs- und Dokumentationsinstrumenten wie ein Katalysator gewirkt. Hatten 2004 nur sechs Prozent der Jugendämter ein verbindliches Dokumentationsverfahren, waren es 2008 schon 51 und 2014 ganze 99 % (vgl. Albrecht et al. 2016, S. 111 f.). Auch im Rahmen der sogenannten „Frühen Hilfen“ kommen in knapp der Hälfte (47 %) der durch die Bundesinitiative geförderten Kommunen standardisierte Instrumente zur Einschätzung von Belastungen und Risiken bei Familien mit Säuglingen und Kleinkindern zum Einsatz (Pabst et al. 2017, S. 63). Diese Zahlen weisen auf eine Ausweitung standardisierter Einschätzungs- und Dokumentationsverfahren hin, die jedoch einen sehr unterschiedlichen Standardisierungsgrad aufweisen. Legt man Schrödter et al. (2020) Typologie von Verfahren der Urteilsbildung im Kinderschutz zugrunde, dann muss man zu dem Schluss kommen, dass mechanische risikostatische oder auf Algorithmen basierende Prognoseverfahren für den deutschsprachigen Raum (noch) nicht vorliegen.

Der in der Jugendamtspraxis in unterschiedlichen Variationen verwendete „Stuttgarter/Düsseldorfer Kinderschutzbogen“ oder der für die Verwendung in den Frühen Hilfen entworfene „Anhaltsbogen für ein vertiefendes Gespräch“ bieten bestenfalls auf Metaanalyen verschiedener Studien beruhende „empirisch begründete Orientierungspunkte“ (Kindler et al. 2008, S. 70). Sie sind daher und sind somit dem Typus der „klassifikatorisch diskursiven Urteilsbildung“ (Schrödter et al. 2018) zuzuordnen. Zu einer ähnlichen Einschätzung kommen Metzner und Pawils (2011). Sie unterscheiden zwischen „wissenschaftlich entwickelte(n) Instrumente(n)“ (57 %) und „Eigenentwicklungen ohne entsprechende wissenschaftliche Begleitung“ (43 %) (ebd., S. 258), von 138 Verfahren wiesen nur drei „empirische Prädiktor-Modelle“ auf. Die ethischen und technischen Fragen und Herausforderungen, die mit der Einführung von risikostatistischen/algorithmischen Einschätzungsinstrumenten und der zunehmenden Digitalisierung von sozialarbeiterischen Arbeitsumgebungen einhergehen (Gillingham, in diesem Heft), treffen also in weit geringerem Maße für die bundesrepublikanische Kinder- und Jugendhilfe zu. Nichtsdestotrotz haben auch Kinderschutzbögen, die nicht auf aktuarialistisch-algorithmischen Prognosemodellen beruhen, ein erhebliches Potenzial, die lokale Fallpraxis erheblich zu strukturieren. Zudem werden Kinderschutzbögen in Deutschland selten ausschließlich zur Risikoeinschätzung verwendet, in der Alltagspraxis fungieren sie oft zugleich als Dokumentationsinstrument, als Instrument zur Interventionsplanung und als Instrument zur (rechtlichen- und innerorganisatorischen) Absicherung und Kontrolle. Somit ist Standardisierung keinesfalls ausschließlich Ausdruck der einem bestimmten Einschätzungsbogen zugrundeliegenden (fachlich-dialogischen vs. statistisch-algorithmischen) Wissensbasis, vielmehr verweisen Standardisierungen auf eine Vielzahl von organisatorischen, administrativen und rechtlichen Rationalitäten und Funktionen (Ley und Seelmeyer 2014).

Risikoeinschätzungsinstrumente als Dokumentations‑, Legitimations- und Entscheidungstool

Aussagen zu den praktischen Auswirkungen von Einschätzungs- und Dokumentationsbögen zu treffen ist auch deswegen schwer, weil diese eine sehr große Variationsbreite aufweisen. Der hohe Anteil an „eigenentwickelten Behörden- bzw. Diagnostikbögen“ (Metzner et al. 2019, S. 155) und die geringe Anzahl an Verfahren mit empirischen Prädiktor-Modellen erklärt sich auch dadurch, dass es sich eben nicht um Instrumente handelt, die die alleinige Funktion haben, das Risiko einer Kindeswohlgefährdung einzuschätzen und zu bewerten. Vielmehr schreiben sich auch im Sinne von „verbindlichen Verfahrensstandards“ bestimmte prozedurale und rechtliche Aspekte in diese Bögen ein. So versteht sich etwa der an den Stuttgarter/Düsseldorfer Kinderschutzbogen angelehnte „Berliner Kinderschutzbogen“ als „verbindliche(s) Bewertungs- und Dokumentationsverfahren“ (Berlin), das zugleich als „fachliche Grundlage für die Antragstellung beim Familiengericht“ fungieren soll sowie die „Kommunikation und Koordination unter Fachkräften“ unterstützt. Einschätzungsinstrumente sind als Bestandteil institutioneller Dokumentation immer auch als „Grenzobjekte“ (Lamont et al. 2002) zu verstehen, die zwischen verschiedenen sozialen Welten vermitteln.

Insofern Instrumente oft konkrete Handlungsanweisungen enthalten (etwa bei Vorliegen einer Gefährdung den Vorgesetzten zu informieren), sind sie an der Koordinierung von Arbeitsprozessen beteiligt (siehe auch Büchner 2018). Da sie auch das Ausfüllen eines Einschätzungsbogens durch eine bestimmte Person zuverlässig zurechenbar machen, sind sie auch Medium der Kontrolle, Legitimation und rechtlicher Absicherung. Als „institutionalisierte Spuren“ (Wolff 2008) können sie für die weitere Fallarbeit und Hilfeplanung jederzeit herangezogen werden und sind somit nicht unwesentlich an der weiteren Organisation von Hilfeprozessen beteiligt. Nicht zuletzt entscheidet auch schon die inhaltliche und formale Gestaltung eines Einschätzungsformulars wesentlich darüber, was in welcher Ausführlichkeit dokumentiert und gewichtet werden soll (und im Umkehrschluss – was aus Sicht des Erstellers des Bogens für die weitere Prozessierung eines Falls als weniger wichtig betrachtet wird). Auch unterscheiden sich Einschätzungsinstrumente ganz erheblich nach ihrem Standardisierungsgrad: Sie reichen von unstrukturierten Beobachtungskategorien mit freien Textfeldern über quantifizierende Ampel- und Ratingskalen hin zu dichotomen Ja‑/Nein-Aussagen. Sie unterscheiden sich des Weiteren nach ihrem Zweck (reiner Dokumentationszwecke bis hin zu einer standardisiert numerischen Auszählung eines Gefährdungsrisikos) ihrer Länge (7 bis 50 Items) (vgl. Metzner und Pawils 2011) sowie ihrer Einbindung in organisatorische Handlungsabläufe (also bezüglich der Frage, wann und in welcher Verbindlichkeit ein solcher Einschätzungsbogen auszufüllen ist und welche Anschlusshandlungen der Einschätzungsbogen vorschlägt).

Zur Rolle von Dokumenten für die soziale Organisation von Hilfeprozessen

Somit spricht einiges dafür, Instrumente nicht alleine daraufhin zu befragen, inwiefern sie in der Lage sind, möglichst valide Einschätzungen zu vorliegenden oder bevorstehenden Gefährdungen abzugeben, sondern ihre Rolle für die „Soziale Organisation von Hilfeprozessen“ (Nadai 2015, S. 242) in den Blick zu nehmen. Einschätzungsinstrumente stellen Technologien dar, deren Auswirkungen nicht alleine durch ihren Inhalt (content) ausreichend erfasst werden können, vielmehr müssen diese in ihrer Einbettung in konkrete Handlungspraxis (context) betrachtet werden (s. etwa Høybe-Mortensen 2015). Eine solche Perspektive vertritt etwa der Ansatz der Institutional Ethnography (Smith 2005), der Texten eine Scharnierfunktion zwischen situierter Fallarbeit und extralokaler sozialer Ordnung zuspricht. Texte vermitteln, regulieren und autorisieren das lokale Handeln von Akteuren und sind daran beteiligt, Sachverhalte „institutionally actionable“ (Smith 2005) zu machen, d. h. sie auf eine Art und Weise zu beschreiben, in welcher sie dem weiteren Prozessieren der Organisation zugeführt werden können. Somit sind in Einschätzungsbögen auch immer Handlungsskripte (Akrich und Latour 1992) eingeschrieben, etwa im Sinne von intendierten Arten, das Dokument zu nutzen, oder durch die Auswahl und Darstellung von Informationskategorien, welche immer auch eine spezifische „Bildgebung“ (Büchner 2018) des Falles implizieren.

Die Frage, ob und auf welche Weise Standardisierungen den Ermessenspielraum von Fachkräften beeinflussen, lässt sich somit ohne eine Analyse von deren Anwendung nicht abschließend beantworten (s. dazu Ackermann in diesem Schwerpunkt). Potenzielle Effekte auf die lokale Fallpraxis lassen sich aber schon in der Analyse der inhaltlichen und formalen Gestaltung konkreter Einschätzungsinstrumente abschätzen. So unterscheiden sich die in den Einschätzungsbögen abgefragten Items erheblich in ihrem Standardisierungsgrad und lassen somit einen unterschiedlichen Grad an Interpretationsspielraum und einen Rückgriff auf implizites Fallwissen zu. Während etwa die Frage: „Mehrere fehlende U‑Untersuchungen: Ja/Nein“ (Anhaltsbogen für ein vertiefendes Gespräch des Modellprojekts „Guter Start ins Kinderleben“; für eine vertiefende Analyse s. Kelle 2020) durch fallkundige Fachkräfte relativ eindeutig beantwortet werden kann, ist die Frage nach der „Betreuung des Kindes: Skala von +2 bis −2 mit Feld für Beschreibung“ (ein Beispiel aus dem Stuttgarter Kinderschutzbogen) oder des Items „unzureichende willkürliche Grenzsetzungen: ja/Nein“ (Gefährdungseinschätzungsbogen des Kreises Paderborn) nicht ohne Rekurs auf vertiefte Fallkenntnis und im Dokument nicht weiter bestimmte normative Vorstellungen, etwa bezüglich „angemessener“ Grenzsetzungen eindeutig zu bestimmen. Das Ausfüllen solcher Items scheint also nicht ohne das subjektiv-erfahrungsgesättigte implizite Wissen möglich (s. dazu auch Bastian 2019; Ackermann 2017), welches von den Vertreter_Innen risikostatistischer Ansätze als fehleranfällig und wenig valide gegeißelt wird. Indem die beschriebenen Items binär (Ja/Nein) oder numerisch codiert sind, verlangen sie von Nutzerinnen eine eindeutige Einschätzung, die vermeintliche Objektivität suggeriert. Durch das Ausfüllen des Bogens findet eine Transformation von beobachteten Qualitäten (etwa das Verhalten der Kindesmutter in einer bestimmten Situation) in eine gemeinsame Metrik statt, welche dann (bei einigen Instrumenten durch einfaches Addieren) in der Summe einen Gefährdungsscore ergeben. Durch diesen Prozess der „Kommensurierung“ (Espeland und Stevens 1998) wird eine Fülle von Informationen in numerische Werte transformiert welche Objektivität beanspruchen, leicht für Fallenscheidungen mobilisiert und in andere Handlungskontexte transportiert werden können (Schulz-Schaeffer 2008, S. 132).

Eine solche numerische Darstellung von Fällen führt aber auch dazu, dass Informationen, die etwa in klassischen narrativen Falldarstellungen enthalten sind (etwa der chronologische Ablauf von Ereignissen, die Vermischung von Wahrnehmungen und Einschätzungen, die Darstellung unterschiedlicher Sichtweisen) ausgeblendet werden (White et al. 2009). So weisen etwa Studien zur Digitalisierung von Fallakten im medizinischen Bereich (Heath und Luff 2000) auf potenzielle Konflikte zwischen den spezifischen deskriptiven Anforderungen von digitalen Fallakten und den alltagspraktischen Arbeitsanforderungen hin. Digitale Fallakten ermöglichten zwar durch ihre Ausführlichkeit und Standardisierung eine stärkere Nachvollziehbarkeit und bürokratische Kontrolle, waren jedoch für das durch Aufrechterhalten von Ambivalenz und Unsicherheit gekennzeichnete Treffen von medizinischen Entscheidungen nur bedingt zu gebrauchen. Auf die Soziale Arbeit bezogen könnte dieser Befund den vielfach berichteten „kreativen“ Umgang mit standardisierten Risikoeinschätzungsbögen erklären. Studien zur Verwendung von standardisierten Einschätzungsinstrumenten beschreiben, dass Anwender_Innen ein „eher ‚lässiges‘, selektives Verhalten an den Tag zu legen, indem sie etwa als ‚überflüssig‘ wahrgenommene Fragen ausblenden oder sogar komplett auf den Einsatz verzichten“ (Bode und Tuba 2014, S. 297, siehe auch Ackermann 2017 und in diesem Heft). Dies als defizitäres, nachlässiges Dokumentationsverhalten zu beschreiben würde jedoch der komplexen Alltagspraxis Sozialer Arbeit nicht gerecht werden. Vielmehr ist anzunehmen, dass es „gute“ organisatorische Gründe für „schlechte (Klinik)Aufzeichnungen“ (Garfinkel 1967) gibt.

Weitere potenzielle Folgen von Standardisierungsprozessen

Ausgefüllte Einschätzungsbögen sind somit nicht einfach eine Form der Darstellung von Wirklichkeit, vielmehr bringt die Konstruktionsweise eines Formulars eine institutionelle Wirklichkeit erst hervor. Einschätzungsbögen werden als institutionalisierte Skripte wirksam, welche institutionell relevante Informationen ein- und ausblenden sowie dadurch organisieren und sortieren, dass sie den Blick der Professionellen für bestimmte Themen und Informationskategorien schärfen (Berrick et al. 2018, S. 41). Dies wird in der Jugendamtsstudie von Büchner (2018) eindrucksvoll am Beispiel der Einschätzung von „Mitwirkungsbereitschaft“ (ebd., S. 256) exemplifiziert. Wird etwa in standardisierten Erhebungsinstrumenten verlangt, die MitwirkungsbereitschaftFootnote 1 der Eltern schon bei Hilfebeginn zu klassifizieren, so wird „Mitwirkungsbereitschaft als ko-produktive professionelle Herstellungsleistung“ (ebd.) als organisatorisch handlungsrelevante Problematik negiert und unsichtbar gemacht. An diesem Beispiel wird die Ambivalenz von Standardisierung deutlich – diese verspricht zwar Eindeutigkeit und Vergleichbarkeit, blendet damit aber notgedrungen auch Informationen aus. In den Worten von Bowker und Star: „Each standard and each category valorizes some point of view and silences another“ (Bowker und Star 2000, S. 5). Durch die Fokussierung auf Mitwirkungsbereitschaft als zentrales Element der Gefährdungseinschätzung wird diese nicht als eine erst prozessual herzustellende, schwer zu vereindeutigende Kategorie gedacht, sondern als eine im Rahmen von Dokumentationssystemen binär zu treffende Entscheidung. Espeland und Sauder beschreiben diesen Effekt von Standardisierung als „selective accountability“ (2016, S. 7): standardisierte Einschätzungsbögen und Dokumentationssysteme ziehen Personen und Organisationen für bestimmte Dimensionen zur Rechenschaft, während sie andere Aspekte verschleiern. Somit besteht die Tendenz, interaktiv-aushandelnde Arbeitsanteile, die gemeinhin als das professionelle Kerngeschäft der Sozialen Arbeit betrachtet werden, einer Orientierung an der möglichst schnellen Abklärung von Gefährdungen unter- bzw. nachzuordnen (s. auch Dahmen und Kläsener 2019). Dies legen auch Befunde eines Transferprojekts im Kinderschutzbereich nahe, in welchem konstatiert wird, dass „[e]videnzbasierten respektive standardisierten Modellen der Fallbearbeitung und -einschätzung (…) auf Basis einer auch mitunter wissenschaftlich geschürten Hoffnung auf vermeintliche Messbarkeit und Objektivierbarkeit von ‚Kindeswohlgefährdungen‘ Vorrang eingeräumt“ (Marks et al. 2018, S. 12) wird.

Was verändert sich durch Digitalisierungsprozesse?

Auch wenn, wie zu Beginn beschrieben, die Entwicklung risikostatistischer, algorithmisierter Einschätzungsinstrumente im Vergleich zu anderen Ländern in Deutschland noch in den Kinderschuhen steckt, spielen Digitalisierungsprozesse auch im deutschen Kinderschutzsystem insbesondere aufgrund des vermehrten Einsatzes von Fallsoftware eine wichtige Rolle. So werden Kinderschutzbögen immer weniger in Papierform ausgefüllt, sie sind vermehrt als bildschirmgebundene Eingabemasken in Fallsoftware integriert (s. auch den Beitrag von Schroth in diesem Schwrpunkt). So bietet etwa die Jugendamtssoftware JUS-IT neben einer Gesamtübersicht über alle Fallaspekte die Möglichkeit der automatisierten Weiterleitung von Polizeimeldungen, das automatische Anlegen einer Kinderschutzakte, und sie informiert den Vorgesetzten, wenn ein Kinderschutzfall nicht innerhalb von 24 h bearbeitet wird (IBM 2020). So ist davon auszugehen, dass die oben beschriebenen Spannungsfelder sich durch digitalisierte Dokumentationsformen potenziell amplifizieren. Ley und Seelmeyer (2014) beschreiben etwa, dass digitale Fallakten (durch Pflichtfelder, vorgegebene Kategorien, automatische Vollständigkeitsprüfungen oder begrenzten Freitext) mit einen stärkeren „Zwang zur Exaktheit“ (ebd. S. 54) einhergehen und somit weniger Spielraum für das Aufrechterhalten fallspezifischer Ambivalenzen und des „kreativen Ausfüllens“ beinhalten. Zudem führt das digitale Trägermedium zu einer „ambivalenten Transparenz“ (Devlieghere und Roose 2019): In dem Maße, in welchem sich die potenzielle Leserschaft digitaler Fallakten erhöht, erhöht sich auch die Möglichkeit, alltägliche Arbeit nach ökonomischen und/oder rein administrativen Gesichtspunkten zu steuern, etwa wenn nach einer (elektronisch) dokumentierten Diagnose bestimmte Maßnahmen vorgegeben oder vorgeschlagen werden. Ganz in diesem Sinne beschreiben Michael Böwer und Stephan Wolff (2011) die Einführung neuer Standards im Rahmen der Kinderschutzdebatte als Versuch verstärkter Kontrolle, der einseitig auf engere Kopplung hinauslaufe (Böwer und Wolff 2011, S. 146), ein Prozess, der durch die Einführung digitaler Falldokumentation sicherlich verstärkt wird. Nicht zuletzt ist das Vorliegen von Falldaten in digitaler Form Bedingung für deren weitere Verarbeitung und die potenzielle Entwicklung statistischer und algorithmischer Prognoseinstrumente, wie sie im Beitrag von Gillingham beschrieben werden.

Vor dem Hintergrund dieser Ausführungen sind für die weitere Auseinandersetzung mit (digital und analog) verfassten Instrumenten und deren möglichen Konsequenzen folgende Aspekte zu beachten. Wie der Beitrag dargelegt hat, sollte Risikoeinschätzung nicht als durch die einzelne Fachkraft durchgeführte binäre Fallentscheidung, sondern als sozial-situierte Praxis verstanden werden, welche in einem durch vielfältige menschliche und materielle Akteure (Bastian 2019) bevölkerten Kontext stattfindet. Letztlich handelt es sich bei Risikoeinschätzungsinstrumenten um Technologien, welche erst durch ihre Nutzung eine Wirkung entfalten. Somit sind auch die Aussagen dieses Beitrages insofern begrenzt, da sich nicht von den inhärenten Merkmalen der Instrumente und ihrer intendierten Nutzung auf mögliche Effekte schließen lässt. Somit sind – und das haben die unterschiedlichen referierten Studien zur Verwendung von Instrumenten gezeigt – die Effekte von Standardisierungs- und Digitalisierungsprozessen nicht damit hinreichend beschrieben, dass Sie professionelle Ermessenspielräume unzulässig einschränken. Anstelle der Frage, ob und in welchem Ausmaß sie Praxis beeinflussen, sollte zukünftige Forschung ihr Augenmerk darauf richten, wo, wann und in welcher Weise sie in verschiedenen Kontexten Sozialer Arbeit Praxis konstituieren.