FormalPara Zusammenfassung

Die gesetzliche Qualitätssicherung in der vollstationären Langzeitpflege hat sich seit Einführung der Pflegeversicherung erheblich gewandelt. Seit 2019 ist ein neues Qualitätssicherungssystem in Kraft, das externe und interne Qualitätssicherung miteinander verknüpfen soll. Die Ergebnisse der externen Prüfungen durch die Prüfdienste sowie die auf Eigenerhebung der Einrichtungen basierenden Indikatoren zu pflegerischen Versorgungszuständen gehen in die öffentliche Berichterstattung ein. Dies ist grundsätzlich als sinnvolle Weiterentwicklung des Systems zu werten mit dem Ziel, Transparenz für die Verbraucherinnen und Verbraucher zu schaffen und relevantes Wissen in das interne Qualitätsmanagement rückzukoppeln. Die Antwort auf die Frage, wie gut dieses Ziel mit dem neuen System erreicht wird, steht bisher aus. Ermöglicht die neue Qualitätssicherung in der stationären Langzeitpflege eine zuverlässige Bewertung der Einrichtungen? Befähigt sie die Pflegebedürftigen und ihre Angehörigen, wie gesetzlich vorgegeben Pflegeheime auf Basis für sie verständlicher prüf- und indikatorbasierter Kennzahlen für ihre Zwecke zu vergleichen? Evaluation und Weiterentwicklung des Systems sind geboten und die institutionelle Verankerung der Evaluations- und Weiterentwicklungsprozesse ist zu diskutieren.

Statutory quality assurance in inpatient long-term care in Germany has changed considerably since the introduction of long-term care insurance. A new quality assurance system has been in force since 2019, which aims to link external and internal quality assurance. The results of the external audits by the review boards as well as the indicators on nursing care conditions based on the facilities’ own surveys are included in public reporting. In principle, this can be regarded as a sensible advancement of the system with the aim of increasing transparency for the users and relevant knowledge for feedback into the internal quality management. The answer as to whether the new system succeeds in achieving this goal has yet to be found. Does the new quality assurance in inpatient long-term care facilitate reliable evaluation of facilities? Does it enable people in need of care and their relatives to compare nursing homes for their own purposes, as required by law, on the basis of comprehensible audit and indicator-based data? Evaluation and further development of the system are urgently needed and an institutional anchoring of the evaluation and further development processes needs to be discussed.

1 Einführung

Die gesetzliche Qualitätssicherung in der Langzeitpflege hat sich seit Einführung der Pflegeversicherung vor nunmehr knapp 30 Jahren grundlegend gewandelt. Die Entwicklungen sind durch zwei Wendepunkte gekennzeichnet: durch die Einführung des Pflege-TÜV mit dem Pflegeweiterentwicklungsgesetz (PfWG) aus dem Jahr 2008 und die Verabschiedung der heute gültigen Verfahren im Jahr 2019. Der Beitrag liefert einen historischen Abriss der gesetzlichen Qualitätssicherung in der vollstationären Langzeitpflege in Deutschland und gibt davon ausgehend einen Überblick über die Ausgestaltung des neuen Systems seit 2019. Am Beispiel der Bewertungssystematik, d. h. des aktuellen Verfahrens zur Bewertung der Pflegeeinrichtungen auf Basis von prüf- und indikatorbasierten Informationen, diskutieren die Autorinnen die Herausforderungen und offenen Fragen für eine zielkonforme Wirkweise der Qualitätsmessung und -berichterstattung. Der Beitrag schließt mit einem Fazit zu Evaluations- und Weiterentwicklungsprozessen und zur Bedeutung einer möglichen institutionellen Verankerung der wissenschaftlichen Fundierung dieser Verfahren.

2 Historischer Abriss der gesetzlichen Qualitätssicherung

2.1 Vom Pflege-Qualitätssicherungsgesetz zum Pflege-TÜV

Mit Einführung der Pflegeversicherung wurde erstmals die gesetzliche Qualitätssicherung in der Pflege expliziert. Dies hing zum einen damit zusammen, dass Pflege nun erstmals als eigenständige Leistung sozialrechtlich normiert war und zum anderen, dass der Gesetzgeber explizit darauf zielte, durch einen relativ freien Zutritt in den Pflegemarkt die Pflegeinfrastruktur auszubauen (Büscher et al. 2018). Das PflegeVG verpflichtete die Selbstverwaltung erstmals, auf Bundesebene Grundsätze und Maßstäbe für die Qualität und die Qualitätssicherung der ambulanten und stationären Pflege zu formulieren. Hinzu kam die Verpflichtung der Einrichtungen, sich an Maßnahmen der Qualitätssicherung zu beteiligen. Ebenso mussten die Einrichtungen auf Verlangen der Kassen oder des Medizinisches Dienstes Prüfungen der Qualität ermöglichen (§ 89 i. d. V. PflegeVG).

Mediale wie fachpolitische Berichte über gravierende Pflegemängel (Gerste et al. 2004), aber auch eine durch die Pflegeversicherung gestärkte Verbrauchersouveränität – so die Einschätzung des Gesetzgebers (BT-Drs. 14/5395, S. 17) – machten eine weitergehende Regulierung der Qualitätssicherung notwendig. Der gewählte Ansatz folgte der Philosophie: Qualität kann nicht in die Heime hineingeprüft werden, sondern muss auf der Eigenverantwortung der Träger fußen (BT-Drs. 14/5395, S. 2). So wurde 2002 mit dem Pflege-Qualitätssicherungsgesetz (PQsG) das „Elfte Kapitel Qualitätssicherung, Sonstige Regelungen zum Schutz der Pflegebedürftigen“ in die Pflegeversicherung eingeführt. Die zentralen Inhalte umfassten die Verpflichtung der Pflegeeinrichtungen zum Aufbau eines internen Qualitätsmanagements und zur regelmäßigen Übermittlung von „Leistungs- und Qualitätsnachweisen“ (LQN) an die Pflegekassen (§ 113 SGB XI i. d. F. vom PQsG). Die LQN – abgenommen durch zugelassene Prüfstellen – sollten ab 2004 Voraussetzung für Vergütungsvereinbarungen sein und hätten zudem die damals noch im dreijährigen Turnus angesetzten Vor-Ort-Prüfungen ablösen können. Die hierfür notwendige Pflege-Prüfverordnung lehnte der Bundesrat jedoch im Jahr 2002 ab (Gerste et al. 2004). Der Ansatz, den Leistungserbringern durch den Nachweis von im Sinne der LQN zertifizierten Qualitätssiegeln Handlungsspielräume bei der Ausgestaltung des Qualitätsmanagements- und -sicherungsverfahrens zu geben, konnte sich folglich nicht durchsetzen.

Das Pflegeweiterentwicklungsgesetz (PfWG; Abb. 4.1) revidierte die Pflicht zur Vorlage von Leistungs- und Qualitätsnachweisen bzw. integrierte deren Inhalte teilweise in die Pflegesatzvereinbarung nach § 84 SGB XI. Ferner wurden die Prüfverfahren durch den Medizinischen Dienst und den Prüfdienst der PKV deutlich verschärft: Waren bis ins Jahr 2006 lediglich 80 % der Pflegeheime geprüft worden – bei einer jährlichen Prüffrequenz von rund 1.000 Einrichtungen – sollten ab 2011 alle Pflegeheime einmal pro Jahr eine Begehung erhalten (Rothgang und Preuss 2009, S. 20). Hinzu kam die verpflichtende Bereitstellung und Veröffentlichung der Qualitätsberichte für die Pflegebedürftigen und ihre Angehörigen in „verständlicher, übersichtlicher und vergleichbarer“ Form (§ 115 (1a) SGB XI). Die Landesverbände der Pflegekassen veröffentlichten diese sogenannten „Pflege-Transparenzberichte“ je Einrichtung frei zugänglich im Internet über Portale wie Pflegenavigator, Pflegekompass und Pflegelotsen.

Abb. 4.1
figure 1

Historischer Abriss der gesetzlichen Qualitätssicherungsverfahren in der vollstationären Pflege

Die Pflege-Transparenzberichte standen gleichwohl von Anbeginn in der Kritik. Die Kritik reichte von einer fehlenden wissenschaftlichen Fundierung der „Transparenzkriterien“ über eine fragwürdige Validität, Reliabilität und Objektivität der Instrumente zur Bestimmung der Pflegequalität bis hin zu ganz grundsätzlichen methodischen Problemen der Stichprobenbildung, der Bewertungssystematik und der fehlenden Einbeziehung von Risikofaktoren (Dressel et al. 2011; Hasseler und Wolf-Ostermann 2010; VDAB und ABVP 2011). Im Ergebnis diskriminiert der Pflege-TÜV kaum zwischen den Einrichtungen. Mit anderen Worten: Dem Verfahren zufolge existierten in deutschen Pflegeheimen kaum oder gar keine Qualitätsdefizite; ein Großteil der Einrichtungen wurden „Einser-Schüler“ (Rothgang 2018).

2.2 Vom Pflege-TÜV zu den Indikatoren

Als Reaktion auf die anhaltende Kritik am Pflege-TÜV einerseits und angesichts der (medial) verstärkt ins öffentliche Bewusstsein gerückten Versorgungsdefizite im Pflegeheim andererseits folgte mit dem 2012 in Kraft getretenen Pflegeneuausrichtungsgesetz (PNG) schließlich der Schritt weg vom Pflege-TÜV (Abb. 4.1). Bereits von 2008 bis 2011 war in einem vom Bundesministerium für Familie, Senioren, Frauen und Jugend (BMFSFJ) und vom Bundesministerium für Gesundheit (BMG) geförderten Projekt die „Entwicklung und Erprobung von Instrumenten zur Beurteilung der Ergebnisqualität in der stationären Altenhilfe“ durch das Institut für Pflegewissenschaft an der Universität Bielefeld (IPW) und das Institut für Sozialforschung und Gesellschaftspolitik GmbH (ISG) vorangetrieben worden (Wingenfeld et al. 2011). Aufsetzend hierauf wurde mit dem PNG der § 113 SGB XI neu gefasst. Die Vertragsparteien sollten fortan in den Maßstäben und Grundsätzen (MuG) neben Anforderungen an das Prüfverfahren auch solche an ein „indikatorengestütztes Verfahren zur vergleichenden Messung und Darstellung von Ergebnisqualität im stationären Bereich“ formulieren. Gestützt auf Eigenerhebungen der Pflegeeinrichtungen sollten fortan Qualitätsindikatoren die weiterhin bestehenden externen Prüfungen ergänzen (§ 113 Abs. 1 Nr. 4 SGB XI).

Erst das Pflegestärkungsgesetz II mit Gültigkeit ab 2016 schaltete die Vorgaben durch Fristsetzung letztlich verbindlich „scharf“ (Abb. 4.1). Wesentliche Neuerung war zudem die Neustrukturierung des institutionellen Rahmens. Einerseits wurde die „Schiedsstelle Qualitätssicherung“ zum „Qualitätsausschuss Pflege“ umgestaltet. In diesem sind die Kosten- und die Leistungsträger zu gleichen Teilen vertreten und er kann durch eine unparteiische Person erweitert werden. Die Prüfdienste (Medizinischer Dienst und Prüfdienst der PKV) und die Betroffenenverbände können zudem beratend intervenieren. Man spricht seit der Neustrukturierung der Pflege-Selbstverwaltung nun auch vom „kleinen G-BA“. Wesentliche Neuerung des PSG II bestand jedoch in der Spezifizierung, dass die neuen Instrumente und Verfahren wissenschaftlich fundiert zu entwickeln und hierfür Institute zu beauftragen sind. Eine neue unabhängige qualifizierte Geschäftsstelle des Qualitätsausschusses mit Bestand für zunächst fünf Jahre soll die wissenschaftlichen Aufträge an Dritte koordinieren, den Qualitätsausschuss und seine Mitglieder fachwissenschaftlich beraten und die wissenschaftlichen Arbeitsergebnisse für die Entscheidungen im Qualitätsausschuss aufbereiten (§ 113c Abs. 6 SGB XI).

Den gesetzlichen Vorgaben zur Stärkung der Wissenschaftlichkeit bei der Verfahrensentwicklung war man bereits vorab gefolgt. Von 2015 bis 2017 pilotierte die Universität Bremen in Kooperation mit der Ostfalia Hochschule für Angewandte Wissenschaften die 15 Indikatoren des 2011er-Gutachtens von Wingenfeld et al. mit Blick auf die Datenvalidität, Reliabilität des Erhebungsinstrumentariums sowie Praktikabilität im Regelbetrieb im Projekt „Modellhafte Pilotierung von Indikatoren in der stationären Pflege (MoPIP)“ (UBC 2017). Im März 2017 erhielten dann das Institut für Pflegewissenschaft (IPW) und das aQua-Institut den Auftrag, die Instrumentarien und Prozesse der Prüfungen weiterzuentwickeln und mit der indikatorbasierten Messung der Ergebnisqualität zu einem Gesamtverfahren zu integrieren (Wingenfeld et al. 2018).

Im März 2019 nahm der Qualitätsausschuss das zentrale Gutachten für die „Entwicklung der Instrumente und Verfahren für Qualitätsprüfungen nach §§ 114 ff. SGB XI und die Qualitätsdarstellung nach § 115 Abs. 1a SGB XI in der stationären Pflege“ ab und stellte damit die Weichen für die zukünftige Systemgestaltung (Wingenfeld et al. 2018; Abb. 4.1). Ein weiterer Meilenstein war die Errichtung einer neuen Datenstelle (DAS) beim aQua-Institut im September 2019. Die Qualitätsprüfungen sollten bereits am 1. November 2019 auf die neue Systematik umgestellt werden. Ab Oktober 2019 waren Testerhebungen der Pflegeheime zu den neuen Indikatoren geplant, die ersten Veröffentlichungen von Indikatorergebnissen sollten ab Juli 2020 folgen. Sowohl die Covid-19-Pandemie und die hiermit einhergehenden Hygieneanforderungen als auch die Belastungen der Pflegeheime zogen eine Lockerung der jährlichen Prüfpflicht für den Zeitraum vom 1. Oktober 2020 bis zum 31. Dezember 2021 durch das EpiLage-Fortgeltungsgesetz nach sich. Jede zugelassene Pflegeeinrichtung war damit möglichst einmal zu prüfen, wenn die pandemische Lage es zulässt (§ 114 (2a) SGB XI). Der Start der regelhaften Erhebung der indikatorgestützten Daten durch die Einrichtungen verschob sich auf den 1. Januar 2022. Aufsetzend auf den nun erstmals vorliegenden prüf- und indikatorgestützten Ergebnissen wurde nach § 114c SGB XI im April 2023 ferner definiert, ab wann eine Regelprüfung bei Vorliegen eines hohen Qualitätsniveaus lediglich alle zwei Jahre erfolgen muss (PruP-RiLi).

3 Ausgestaltung der aktuellen Qualitätssicherung in der stationären Langzeitpflege

3.1 Qualitätskennzahlen und Erhebungsverfahren

Mit Umsetzung des neuen Regelwerks stehen den Betroffenen und ihren Angehörigen potenziell die folgenden Arten von Informationen zur Verfügung: die Ergebnisse der Vor-Ort-Prüfungen (durchgeführt durch den Medizinischen Dienst oder den Prüfdienst der PKV) sowie die auf Eigendokumentation der Einrichtungen fußenden Indikatoren. Die Angaben der Einrichtungen u. a. zu Baulichkeiten, Angeboten und vorgehaltenem Personal als dritte Informationsgruppe sind nicht gesetzlich verpflichtend und werden im Folgenden nicht behandelt.

Die Prüfung erfasst die in Tab. 4.1 aufgeführten bewohnerbezogenen Qualitätsaspekte aus den Bereichen „Unterstützung bei der Mobilität und Selbstversorgung“ (1), „Unterstützung bei der Bewältigung von krankheits- und therapiebedingten Anforderungen“ (2), „Unterstützung bei der Gestaltung des Alltagslebens und der sozialen Kontakte“ (3) und „Unterstützung in besonderen Bedarfs- und Versorgungssituationen“ (4). Ferner sind struktur- bzw. prozessbezogene Aspekte der Einrichtung Bestandteil der Erhebung (5, 6). In die öffentliche Berichterstattung gehen Informationen aus den Bereichen 5 und 6 – ausgenommen jene zur Begleitung von sterbenden Bewohnerinnen und Bewohnern – jedoch nicht ein.

Tab. 4.1 Übersicht zu den Inhalten der Prüfungen (durch Medizinischen Dienst und Prüfdienst der PKV) und Indikatoren

Die Qualitätsindikatoren sind in Tab. 4.1 den inhaltsverwandten bzw. -ähnlichen Bereichen aus den Qualitätsprüfungen zugeordnet. Fünf der zehn Indikatoren liegen stratifiziert vor, d. h. sie messen den Indikatoraspekt für zwei Risikogruppen. Stratifizierungsmerkmal ist hierbei bei vier Indikatoren das Vorliegen einer erheblichen/schweren geistigen Beeinträchtigung und beim „Dekubitus-Indikator“ das Bestehen eines hohen Dekubitus-Risikos.

Die bewohnerbezogenen Ergebnisse der Prüfungen vor Ort basieren auf der Inaugenscheinnahme von neun nach einem vorgegebenen Verfahren zufällig ausgewählten Bewohnerinnen und Bewohnern (QPR vollstationär, S. 14 f). Die Indikatorergebnisse basieren auf Eigenerhebungen der Pflegeinrichtungen. Zweimal jährlich sind anhand eines vorgegebenen Erhebungsbogens Informationen über alle Bewohner zu erfassen und an die Datenstelle des Qualitätsausschusses zu übermitteln (MuG, Anlage 3 und Anlage 4). Die Indikatoren fußen folglich auf einer Vollerhebung, wenngleich wenige Ausschlussregeln definiert sind. Beispielsweise werden allgemein Personen kurz nach Einzug, solche in der Sterbephase oder z. B. bei spezifischen Qualitätsbereichen solche in einem komatösen Zustand nicht einbezogen (MuG, Anlage 3). Die Datenauswertungsstelle führt nach einem abgestimmten Verfahren statistische Plausibilitätskontrollen durch (MuG, Anlage 4; sowie auch Wingenfeld et al. 2022).

3.2 Bewertungskonzept der Vor-Ort-Prüfung und Indikatoren

Nicht nur die Verfahren der Datengewinnung, sondern auch die Bewertungskonzepte unterscheiden sich zwischen prüf- und indikatorbezogenen Verfahren: Bei den Prüfungen wird zuerst für jeden Qualitätsaspekt und für jeden Bewohner festgestellt, ob „keine Auffälligkeiten oder Defizite“ (A), „Auffälligkeiten, die keine Risiken oder negativen Folgen erwarten lassen“ (B), „ein Defizit mit Risiko negativer Folgen“ (C) oder „ein Defizit mit eingetretenen negativen Folgen“ (D) vorliegt. Mittels der Häufigkeit von C- (Risiko) und D-Wertungen (negative Folgen) wird dann eines der folgenden vier Qualitätsniveaus zugewiesen: „keine oder geringe“, „moderate“, „erhebliche“ oder „schwerwiegende Qualitätsdefizite“. Da nicht alle Qualitätsaspekte für alle neun in die Prüfung eingeschlossenen Bewohner prüfbar sind, z. B. solche, die sich auf Personen mit kognitiven Einschränkungen beziehen, ist die Bewertungssystematik ferner nach der Anzahl der vorliegenden Bewertungen differenziert.

Die indikatorgestützte Bewertung der einzelnen Pflegeeinrichtungen hingegen geschieht mithilfe von Referenzwerten auf einer fünfstufigen Skala: Eine Einrichtung weist hiermit entweder eine Ergebnisqualität „weit über dem Durchschnitt“, „leicht über dem Durchschnitt“, „nahe dem Durchschnitt“, „leicht unter dem Durchschnitt“ oder „weit unter dem Durchschnitt“ auf. Es soll sich hierbei um eine relationale Bewertung mittels Verteilungskurven des Qualitätsergebnisse handeln (QDVS – Qualitätsdarstellungsvereinbarung nach § 115 Abs. 1 Satz 2 ff. SGB XI, Anlage 2). Je Indikator sind folglich die Einrichtungen nach ihren Werten geordnet und diese Reihung in fünf gleich große Gruppen, die sogenannten Quintile, unterteilt. Jede Qualitätsstufe der fünfstufigen Skala umfasst folglich ein Fünftel der Pflegeeinrichtungen.

Die Landesverbände der Pflegekassen sind verpflichtet, die Daten zu den von Pflegeeinrichtungen erbrachten Leistungen und deren Qualität (d. h. sowohl die Ergebnisse der Prüfung als auch die Indikatorergebnisse) für die Pflegebedürftigen und ihre Angehörigen „verständlich, übersichtlich und vergleichbar“ im Internet zu veröffentlichen (§ 115 Abs. 1a SGB XI). Auf eine weitergehende Aggregation bzw. Zusammenfassung der Einzelinformationen verzichtet das neue Verfahren.

4 Herausforderungen und offene Fragen – Fokus Bewertungskonzept

Mit Implementierung des neuen Systems steht nun die Frage im Raum, wie gut es gelingt, die Transparenz für die Verbraucherinnen und Verbraucher zu verbessern und relevantes Wissen für Rückkopplungen in das interne Qualitätsmanagement zu ermöglichen. Eine Strukturierung der Bewertung von Qualitätsmessverfahren bietet die Differenzierung nach Qualitätsziel, Messverfahren und Bewertungskonzept (siehe Abb. 4.2, IQTIG 2022). Fragen nach dem Qualitätsziel umfassen die Relevanz der für die Prüfung ausgewählten Inhalte sowohl aus fachlicher Sicht als auch aus Sicht der Patientinnen und Patienten. Ebenso zentral ist die Frage, ob das Gemessene auch durch die Leistungserbringer, deren Qualität man misst, beeinflusst werden kann. Die Güte des Messverfahrens bestimmt sich aus der Datenqualität, aber auch daraus, wie zuverlässig das Verfahren bei einer Messreihe (z. B. auch durch unterschiedliche Personen) immer annähernd das Gleiche misst; die Validität, ob es auch das misst, was es messen soll. Die Eignung des Bewertungskonzepts kann diskutiert werden mit Blick auf Referenzbereiche, die Klassifikationsgüte (sprich, den Umgang mit statistischer Unsicherheit) und die Risikoadjustierung (sprich, den Umgang mit personenbezogenen Risiken, die das Ergebnis nicht beeinflussen sollen; siehe auch IQTIG 2022, S. 119 ff). Nicht alle Eignungskriterien sollen und können im Folgenden diskutiert werden. Aufgegriffen werden an dieser Stelle exemplarisch Fragestellungen zum Bewertungskonzept.

Abb. 4.2
figure 2

Eignungskriterien für Qualitätsmessungen. (Quelle: Eigene Darstellung nach IQTIG 2022, S. 120)

4.1 Bewertungskonzept der geprüften 15 Qualitätsaspekte

Zwei Arten von Referenzenbereichen werden grundsätzlich unterschieden: sogenannte kriteriumsbezogene (feste) Referenzbereiche und verteilungsbezogene Referenzbereiche. Kriteriumsbezogene Referenzbereiche orientieren sich an Aussagen darüber, was erreichbar ist (IQTIG 2022, S. 142 f), also an normativen Setzungen durch entsprechende Gremien. Die für die Prüfungen gewählten Referenzbereiche, d. h. die aktuell gültige gewählte fallzahlabhängige „Wenn-dann-Regel“, die Einrichtungen je nach der Häufigkeit von C- oder D-Wertungen einem Qualitätsniveau zuordnet, ist eine kriteriumsbezogene, also normative Setzung des Qualitätsausschuss Pflege. Bei der Festlegung solch fester Referenzbereiche sind fachliche Gründe und normative Setzungen zu differenzieren und zu explizieren. Die fachlichen Gründe, die den Referenzbereich eingrenzen, sind eine Aussage darüber, was aus fachlicher Sicht – literatur- oder expertenbasiert – als erreichbar angesehen wird. Zur fachlichen Bewertung des Erreichbaren gehört auch, die Angemessenheit der fachlichen Annahme empirisch zu überprüfen; beispielsweise, ob das Qualitätsniveau „Keine Auffälligkeiten oder Defizite“ überhaupt von den Leistungserbringern erreicht werden kann (IQTIG 2022, S. 144 ff). Die normative Setzung erfolgt schlussendlich im Sinne eines iterativen Prozesses unter Einbezug der fachlichen Bewertung. Sie stellt dar, was gefordert wird (IQTIG 2022, S. 144 ff). Zwar finden sich Ausführungen zur Bewertungssystematik bei Wingenfeld et al. (2018). Details und Fundierung der fachlichen Ableitung des Erreichbaren wären für die Beurteilung der Güte des Systems wünschenswert – vor allem da keine lineare Bewertung, sondern eine recht komplexe fallzahlabhängige Wenn-dann-Regel das Geforderte ausdrückt. Vor allem empirische Analysen zum Erreichbaren wären notwendig, um die Güte der gewählten Referenzbereiche nachvollziehbar zu machen.

Ein weiterer Aspekt, der die Güte des Bewertungskonzepts beschreibt (siehe Abb. 4.2) ist, inwiefern dieses unterscheidet (klassifiziert), obwohl der gemessene Indikatorwert nur eine Schätzung darstellt (IQTIG 2022, S. 134). Eine Schätzung deshalb, da bei Zufallsstichproben von neun Bewohnerinnen und Bewohnern ein Ergebnis – wie z. B. zwei C-Wertungen beim Qualitätsaspekt Mobilität – ein Zufallsbefund sein kann und ganz anders aussehen könnte, wenn andere Bewohner zufällig ausgewählt worden wären. Je kleiner die Stichprobe, umso größer die statistische Unsicherheit. Über Signifikanzniveaus, mit denen sichtbar wird, ab wann eine statistisch signifikante Abweichung vom Referenzbereich besteht, lässt sich die Unsicherheit darstellen (siehe auch hierzu IQTIG 2022, u. a. S. 134). Auch Wingenfeld et al. (2018) weisen im Abschlussbericht darauf hin: „Aus Prüfergebnissen mit den Mitteln der Statistik eine Kennzahl (einen Prozentwert) abzuleiten und mit der Kennzahl anderer Einrichtungen zu vergleichen, ist aufgrund der kleinen Stichprobengröße ausgeschlossen. Der sog. Vertrauensbereich ist bei so geringen Stichprobengrößen extrem breit, so dass signifikante Unterschiede nur in Extremfällen feststellbar wären, also statistische Sicherheit gar nicht gegeben sein kann“ (S. 85). Die Gutachter ziehen hieraus den Schluss: „Das bedeutet für die Bewertungssystematik, dass sie nicht mit statistischen Ableitungen, sondern mit anderen, nachvollziehbaren, vor allem aber konsentierten Begründungen und Definitionen operieren muss. Die Feststellung von Qualitätsdefiziten bei externen Prüfungen ist keine Kennzahlberechnung, sondern eine regelgeleitete Beurteilung durch einen Sachverständigen, der die von ihm festgestellten Sachverhalte ohne Bezugnahme auf statistische Größen beurteilen muss.“ (S. 85) Wenn die einzelnen Bewertungen der Qualitätsaspekte jedoch keine Kennzahlen, sondern qualitative Analysemethoden darstellen, dann wäre es folgerichtig, die Ergebnisse nicht als differenzierende, standardisierte Bewertung für den Vergleich von Einrichtungen aufzubereiten, sondern stattdessen andere Formen der Aufbereitung – qualitativ beschreibender Art – zu diskutieren (siehe hierzu IQTIG 2022, S. 49 ff). Mit Blick auf den Stellenwert der Bewertungssystematik ist es folgerichtig, dass der Gesetzgeber eine Berichterstattung und Evaluation der Bewertungssystematik gesetzlich verankert hat. Vorgesehen war hiernach eine Evaluation der in der Qualitätsdarstellungsvereinbarung festgelegten Bewertungssystematik durch unabhängige Dritte und eine Berichtslegung des Spitzenverbandes Bund der Pflegekassen bis zum 31. März 2023 (§ 114c (3) SGB XI). Zum Zeitpunkt der Drucklegung dieses Beitrags waren die Ergebnisse der Evaluation nicht öffentlich zugänglich.

4.2 Bewertungskonzept der erhobenen Indikatoren

Die Referenzbereiche der indikatorgestützten Bewertung sind verteilungsabhängig, d. h. mit Hilfe von empirischen Referenzwerten definiert. Aufgesetzt wird aktuell jedoch auf Schwellenwerten, die im Rahmen von vorangegangenen Modellprojekten und damit auf einer Grundgesamtheit an freiwillig teilnehmenden Einrichtungen geeicht wurden. Diese Schwellenwerte wurden für den Einstieg in das System als vorläufige Lösung vorgeschlagen, denn erst nach einer gewissen Zeit können rechnerische Schwellenwerte auf Basis aller Einrichtungen Deutschlands vorliegen. Dass diese den Modellprojekten entnommenen Schwellenwerte bundesweit für alle teilnehmenden Pflegeheime „passen“, wurde im o. g. Abschlussbericht als wahrscheinlich angenommen (Wingenfeld et al. 2018, S. 42). In der QDVS selbst wird die Vorläufigkeit dieser Schwellenwerte betont und festgehalten, dass die „Referenz- und Schwellenwerte (..) angepasst (werden), sobald eine ausreichende Grundlage valider Daten aus der Umsetzung des neuen Systems vorliegt. Die Vertragsparteien überprüfen die Referenzwerte sowie die daraus abgeleiteten Schwellenwerte in regelmäßigen Abständen und passen diese ggf. an.“

Seit dem 01.01.2022 sollen für alle Einrichtungen Indikatoren veröffentlicht werden. Damit müsste eine ausreichende Datengrundlage vorliegen, neue Referenzwerte (z. B. durch die DAS) zu ermitteln. Eine Anpassung der Schwellenwerte ist also möglich. Für zuverlässige Aussagen ist es wichtig, dass wirklich annäherungsweise ein Fünftel (d. h. 20 %) der Einrichtungen so eingestuft werden, dass sie „weit über dem Durchschnitt“ etc. liegen. Lägen z. B. 60 % und mehr oder sogar 90 % und mehr der Heime auf dieser Qualitätsstufe, wären damit verzerrte Qualitätsaussagen verbunden. Die Bewertung wäre nicht – wie nach der QDVS intendiert – relational in Bezug auf alle Pflegeheime Deutschlands, sondern bezogen auf die damals an den Modellprojekten teilnehmenden Einrichtungen. Die Überprüfung der Schwellenwerte ist insofern dringend geboten, um belastbare Qualitätsaussagen formulieren zu können. Ferner muss auch ein Verfahren entwickelt und vereinbart werden, wie die Schwellenwerte regelhaft überprüft und angepasst werden.

Ein weiterer Aspekt mit Blick auf eine zuverlässige Bewertung der Heime ist die Frage, ob nicht durch die Leistungserbringer beeinflussbare Risikofaktoren aus den Ergebnissen herausgerechnet werden (siehe Abb. 4.2). Den Empfehlungen des Gutachtens folgend, hat der Qualitätsausschuss Pflege für das neue Prüfsystem bei fünf Indikatoren die Methode der Stratifizierung gewählt, d. h. eine eindimensionale Differenzierung der Indikatoren mit und ohne hohes Risiko für das Ereignis in zwei Gruppen bzw. Strata (Wingenfeld et al. 2018). Gängig ist im Kontext von Ergebnisindikatoren auch der Einsatz von Regressionsansätzen, da sie die Betrachtung von mehreren Einflussfaktoren bei der Adjustierung der Ergebnisse ermöglichen und damit der multifaktoriellen Bedingung von Indikatorereignissen und damit letztlich von Qualität Rechnung tragen können (IQTIG 2022). Zu evaluieren ist – vor allem auch mit Blick auf die z. T. geringe Größe der Heime und damit die Fallzahl je bewerteter Einrichtung –, inwiefern die Stratifizierung das bestehende Fallzahl-Problem verschärft oder eine adäquate Lösung darstellt. Wingenfeld et al. (2022) weisen in einer Stellungnahme zum Thema „Statistische Plausibilitätskontrolle“ darauf hin, dass bei Einrichtungen mit unter 15 Plätzen nach der Risikogruppenbildung oft nur einzelne Indikatoren berechnet werden könnten, weil die erforderliche Mindestfallzahl zum Teil nicht erreicht werde (S. 99).

4.3 Verständlichkeit der parallelen Bewertungskonzepte

Die Ergebnisse stehen seit 2022 für die Verbraucherinnen und Verbraucher bereit. Eine zentrale Forschungsfrage ist, wie das Zusammenspiel der Ergebnisse von Vor-Ort-Prüfungen und Indikatoren von den Verbrauchern wahrgenommen werden. Wird deutlich, dass die Informationen zu den Indikatoren auf Eigenerhebungen der Pflegeheime fußen, die zu den Qualitätsaspekten hingegen auf Begehungen vor Ort? Erfassen die Verbraucher, dass die Indikatoren zu einer vergleichenden Bewertung genutzt werden können? Ist demgegenüber den Nutzerinnen und Nutzern verständlich, dass die Prüfergebnisse aufgrund der fehlenden Risikoadjustierung sowie aufgrund der stichprobenbezogenen Zufallsschwankungen nur eingeschränkt für Vergleiche von Einrichtungen herangezogen werden sollten? Ferner ist zu erheben, wie die Nutzer bei ähnlichen Qualitätsthemen (zum Beispiel „Anwendung von Gurten zur Fixierung von Bewohnern beziehungsweise Bewohnerinnen“ und „Anwendung freiheitsentziehender Maßnahmen“ oder „Aktualität der Schmerzeinschätzung“ und „Schmerzmanagement“) mit ggf. divergierenden Ergebnissen zwischen Qualitätsaspekten und Indikatoren umgehen – abgesehen davon, dass derartiges natürlich auch messtheoretische Fragen mit Blick auf die Reliabilität der Instrumente aufwirft. Hinsichtlich der Fülle der nun für die Verbraucher bereitgestellten Einzelinformationen (15 Indikatoren + 15 Qualitätsaspekte) ist die Frage zu ergänzen, wie sie diese verdichten oder priorisieren, wenn sie eine Rangfolge von Heimen aufstellen wollen. Ist es für die Verbraucher möglich, Einrichtungen ohne eine oder mehrere zusammenfassende Bewertungen je Einrichtung zu vergleichen bzw. „vorzusortieren“? Der Verzicht auf einen Composite Measure mag der Tatsache geschuldet sein, dass die aggregierte Bewertung des alten Pflege-TÜVs einer seiner zentralen Kritikpunkte war. Natürlich bergen Zusammenfassungen von Qualitätsergebnissen methodische Fallstricke (siehe hierzu u. a. Goddard und Jacobs 2010; Friebel und Steventon 2019). Ebenso wenig sind sie in der Lage, individuelle Verbraucherpräferenzen für bestimmte Qualitätsaspekte bzw. Darstellungsformen zu berücksichtigen. Studien zeigen jedoch, dass Zusammenfassungen die Komplexität aus Nutzersicht reduzieren und Wahlentscheidungen unterstützen (Kumpunen et al. 2014).

5 Fazit

Sowohl das Verständnis als auch die Sicherstellung von Qualität in der Langzeitpflege haben sich seit Einführung der gesetzlichen Pflegeversicherung kontinuierlich weiterentwickelt. Jedes System, so neu es noch scheint, hat seine Wurzeln und so wirft der Beitrag zunächst einen Blick auf den Weg des gesetzlichen QS-Verfahrens im Bereich der vollstationären Langzeitpflege von Beginn der Pflegeversicherung bis zur Ablösung des viel kritisierten Pflege-TÜV. Das novellierte System ist nun ein weiterer Schritt und beinhaltet wichtige Weiterentwicklungen, allen voran die Entscheidung für auf einrichtungsbezogenen Vollerhebungen basierenden Indikatoren und die Verknüpfung von interner und externer Qualitätssicherung. Die Qualitätsergebnisse sollen schließlich für die interne Qualitätsentwicklung und ebenso für die Verbraucherinnen und Verbraucher relevant und verständlich sein. Hinter diesem Anspruch verbergen sich komplexe Anforderungen an die Ausgestaltung und Umsetzung. Der Beitrag akzentuiert hier einige der Herausforderungen, die das neue System noch zu stemmen hat, und formuliert Fragen mit Blick auf die Güte der Messverfahren auf der einen Seite und die Verständlichkeit der Ergebnisse für die Verbraucher auf der anderen Seite – elementare Fragen der Systempflege also, die sich aus der Anwendung der neuen Verfahren ergeben und Anpassungsbedarf erzeugen. Folgerichtig ist aus Sicht der Autorinnen insofern, dass der Gesetzgeber eine wissenschaftliche Evaluierung zur Umsetzung der entwickelten Verfahren zur Qualitätsmessung und Qualitätsdarstellung nach § 113b Abs. 4 Satz 2 SGB XI vorgesehen hat.

Der Bedarf zur Weiterentwicklung der Instrumente, Verfahren und Bewertungen ist hierbei noch nicht angesprochen. Schlussendlich muss ein novelliertes System auch zukunftsfähig bleiben: Zu diskutieren wäre das Einrichten eines Themenfindungs- und Priorisierungsverfahrens analog zum Verfahren bei der Qualitätssicherung der Krankenhäuser (siehe Beschluss des GBA zum TuP-Verfahren), um neue relevante Themen in die Qualitätssicherung aufnehmen zu können. Ferner wurde hier ausschließlich der Rahmen der vollstationären Pflege aufgezeigt. Für die ambulante Pflege wurde ebenfalls ein neues System geschaffen, für das die Pilotierung bereits Anpassungsbedarf aufzeigt (siehe Nolting et al., Kap. 5 im gleichen Band); das Thema Qualitätssicherung in neuen Wohnformen (siehe Kremer-Preiß und Wolf-Ostermann, Kap. 10 im gleichen Band) steht ebenso aus. Ungeklärt ist ferner die Frage nach einem Ausbau um Aspekte der Lebensqualität (Hasseler et al. 2016), d. h. um Patientenbefragungen (siehe hierzu auch Strotbek und Tucman, Kap. 7 im gleichen Band), oder auch die Frage nach der Einbindung von Sozialdaten, d. h. Abrechnungsdaten der gesetzlichen Kranken- und Pflegeversicherung zum Zweck der Qualitätssicherung (siehe Behrendt et al., Kap. 1 im gleichen Band). Experten aus dem Kontext Qualitätssicherung sehen zudem „die Notwendigkeit, den Einsatz von einzelnen Qualitätsindikatoren und insbesondere auch von Indikatoren-Sets in ein Rahmenkonzept einzubetten, auf dessen Grundlage die weitere Entwicklung geplant und später auch evaluiert werden kann. Die spätere Evaluation erscheint von besonderer Bedeutung, da international Ergebnisse aus einem breiten Einsatz von Qualitätsinformationen bekannt sind, die teilweise einen positiven Einfluss im Sinne einer Qualitätsverbesserung nicht belegen konnten.“ (Döbler et al. 2019, S. 1)

In der Gesamtschau hat sich die wissenschaftliche Begleitung des Qualitätsausschusses seit den gesetzlichen Anpassungen des PSG II (2016) deutlich verbessert. Eine institutionelle Verstetigung analog dem IQTIG bzw. die befristete Vergabe der Entwicklung und Durchführung der Verfahren an ein Institut (analog BQS- oder aQua-Institut) wird bisher jedoch nicht diskutiert. Die Datenauswertungsstelle am aQua-Institut ist zwar mit der Berechnung der indikatorengestützten Ergebnisse (bis 2024) beauftragt. Diese Arbeiten umfassen jedoch allein die technische Auswertung der Daten nach dem beschlossenen Verfahren; eine fachliche und wissenschaftliche Begleitung der Aufgaben des Qualitätsausschusses ist hier nicht vorgesehen. Stattdessen soll er seinen Aufgaben mithilfe ausgeschriebener wissenschaftlicher Gutachten und unterstützt durch eine „unabhängige qualifizierte Geschäftsstelle“ (§ 113b Abs. 4 und 6 SGB XI) nachkommen. Durch die Entfristung dieser Geschäftsstelle im Jahr 2020 erkannte der Gesetzgeber zumindest an, dass es sich „bei vielen Fragen der Qualitätssicherung und -entwicklung um kontinuierlich zu bearbeitende Daueraufgaben“ handelt (BT-Drs. 19/18112, S. 37). Dennoch ist die Frage zu stellen, ob eine Kontinuität über die Vergabe von Einzelaufträgen zielführend ist und ob nicht mindestens die methodischen Prinzipien und Prozessabläufe durch den Qualitätsausschuss ausformuliert werden müssten, um einen Rahmen zu setzen. Welchen Stellenwert eine transparente Darlegung der getroffenen Entscheidungen hat, ist durch das Pflegeunterstützungs- und -entlastungsgesetz (PUEG) verdeutlicht. Fortan sind die beschlussfassenden Sitzungen des Qualitätsausschusses – mit Verweis auf die für den Gemeinsamen Bundesausschuss geltenden Transparenzregelungen – öffentlich (Live-Video-Übertragung; § 113b Abs. 3a SGB XI). Auch die Komplexität der im Qualitätsausschuss beratenen Themen ist im Rahmen des PUEG anerkannt und für die Betroffenenverbände wurde zur Wahrnehmung ihrer Interessen eine Referentenstelle beim Qualitätsausschuss eingerichtet (§ 113b Abs. 6 SGB XI).

Kurz und knapp: Die Qualitätssicherung in der Langzeitpflege ist kein Selbstläufer – die Verfahren sind anspruchsvoll, die Herausforderungen nicht zu unterschätzen. Mit Blick auf die anstehenden Aufgaben bei der Systempflege und Weiterentwicklung möchten die Autorinnen eine Verstetigung der wissenschaftlichen Begleitstrukturen – d. h. konkret die Vergabe der Aufträge an ein wissenschaftliches Institut oder die Errichtung eines solchen Instituts des Qualitätsausschusses – in die Diskussion einbringen. Die Qualitätssicherung wurde mit den neuen Verfahren auf einen guten Weg gebracht. Viel ist erreicht worden, Qualitätssicherung ist jedoch kein Selbstzweck: Die Vulnerabilität der i. d. R. hochbetagten, multimorbiden und kognitiv eingeschränkten Pflegebedürftigen, deren Versorgung hier im Mittelpunkt steht, verlangt nach dem Bestmöglichen.