FormalPara Zusammenfassung

Der vorliegende Beitrag gibt einen Einblick in den aktuellen Stand der Forschung zum Zusammenhang zwischen der Pflegepersonalausstattung und Patientenergebnissen. Dabei sollen sowohl die internationale Forschung synthetisiert als auch empirische Evidenz aus deutschen Krankenhäusern geliefert werden. Letztere wurde im Innovationsfonds-Projekt „PPE: Pflegesensitive patient:innenbezogene Ergebnisindikatoren“ generiert. Die Pflegepersonalausstattung umfasst dabei zwei Aspekte: zum einen das Patienten-Pflegepersonal-Verhältnis, sprich wie viele Patientinnen und Patienten eine Pflegekraft durchschnittlich zu versorgen hat. Zum zweiten geht es um den Qualifikationsmix, also die Frage, wie das Verhältnis von Pflegekräften mit dreijähriger Ausbildung zu kürzer ausgebildeten Pflegekräften ist. Die untersuchten Patientenergebnisse umfassten Letalität, Wiederaufnahmen ins Krankenhaus, Druckgeschwüre, Lungenversagen, Pneumonie und Sepsis (auf Basis von Abrechnungsdaten der TK-Krankenkasse) sowie die von Patientinnen und Patienten erlebte Pflegequalität im Krankenhaus, wofür eine umfangreiche Befragung von TK-Versicherten durchgeführt wurde. Es wurden signifikante Zusammenhänge zwischen der Pflegepersonalausstattung und Patientenergebnissen festgestellt, wobei die Anzahl signifikanter Ergebnisse substanziell von der betrachteten Fachabteilung und dem Patienten-Outcome abhing. Unter den klinisch beobachtbaren Patientenergebnissen zeigte sich die stärkste empirische Evidenz für die Pflegesensitivität von Pneumonie und Lungenversagen, wohingegen die Evidenz für globalere Outcomes wie Letalität und Wiederaufnahmen schwächer war. Für alle drei untersuchten Dimensionen von der von Patientinnen und Patienten erlebten Pflegequalität zeigte sich ein signifikanter Zusammenhang sowohl mit der Pflegepersonalausstattung als auch mit dem Qualifikationsmix. Die Ergebnisse wurden zu verschiedenen Zeitpunkten mit Fachleuten aus der Praxis, unter anderem des Verbandes der Universitätsklinika Deutschlands (VUD), diskutiert.

The paper provides an insight into the current state of research on the relationship between nurse staffing and patient outcomes. The aim is to synthesise international research as well as empirical evidence from German hospitals. The latter was generated in the research project “PPE: Nursing″​=sensitive patient outcomes”. Nurse staffing comprises two aspects: firstly, the patient-to-nurse ratio, i.e. how many patients a nurse has to care for on average. The second aspect is the skill mix, i.e. the ratio of nurses with three years of training to nurses with less training. The patient outcomes examined included mortality, hospital readmissions, pressure ulcers, lung failure, pneumonia and sepsis (based on billing data of the TK health insurance fund), as well as the quality of care experienced by patients in the hospital, for which an extensive survey of TK insurees was conducted. Significant correlations were found between nurse staffing and patient outcomes, whereby the number of significant outcomes depended substantially on the hospital unit under consideration and the patient outcome. Among the clinically observable patient outcomes, the strongest empirical nursing sensitivity was found for pneumonia and respiratory failure, whereas the evidence was weaker for more global outcomes such as mortality and readmissions. For all three dimensions of quality of care experienced by patients, there was a significant association with both nurse staffing and skill mix. The results were discussed at various times with experts from the field, including from the German Association of University Clinics (VUD).

1 Hintergrund/Einleitung

Pflegekräfte sind für die Erbringung des größten Teils der Versorgung von Patientinnen und Patienten in Krankenhäusern verantwortlich und tragen daher wesentlich zur Qualität der Krankenhausversorgung bei (Stalpers et al. 2015). Reformen in der Krankenhausfinanzierung wie die seit den 1980er Jahren in vielen europäischen Ländern und darüber hinaus eingeführten prospektiven Vergütungssysteme haben den finanziellen Druck auf Krankenhäuser allgemein erhöht und sowohl zu Initiativen zur Steigerung der Krankenhauseffizienz als auch zu einer restriktiveren Personalpolitik geführt (Heimeshoff et al. 2014). In den letzten Jahren wurden in einer Reihe von Ländern Bedenken über unzureichende Personalquoten und ihre potenziell nachteiligen Auswirkungen auf die Versorgungsqualität geäußert, was zu Mindestpersonalvorschriften in Kalifornien in den USA, in Victoria in Australien und seit Anfang 2019 auch in Deutschland geführt hat (Donaldson und Shapiro 2010; Griffiths et al. 2019). Um die Bedeutung einer angemessenen Personalausstattung zu untersuchen und darauf aufbauend Personalregelungen adäquat gestalten und bewerten zu können, ist es entscheidend, den Zusammenhang zwischen der Pflegepersonalausstattung und pflegesensitiven, patientenbezogenen Ergebnisindikatoren, auch bekannt als nursing sensitive patient outcomes (NSPOs), empirisch zu analysieren.

Der vorliegende Beitrag gibt einen Einblick in den aktuellen Stand der Forschung zum Zusammenhang zwischen der Pflegepersonalausstattung und Patientenergebnissen. Dabei sollen sowohl die internationale Forschung synthetisiert als auch empirische Evidenz aus deutschen Krankenhäusern geliefert werden. Letztere wurde im Innovationsfonds-Projekt „PPE: Pflegesensitive patient:innenbezogene Ergebnisindikatoren“ generiert. Die Pflegepersonalausstattung umfasst dabei zwei Aspekte: zum einen das Patienten-Pflegepersonal-Verhältnis, sprich wie viele Patientinnen und Patienten eine Pflegekraft durchschnittlich zu versorgen hat. Zum zweiten geht es um den Qualifikationsmix, also die Frage, wie das Verhältnis von Pflegekräften mit dreijähriger Ausbildung zu kürzer ausgebildeten Pflegekräften ist. Die untersuchten Patientenergebnisse umfassten Letalität, Wiederaufnahmen ins Krankenhaus, Druckgeschwüre, Lungenversagen, Pneumonie und Sepsis sowie die von Patientinnen und Patienten erlebte Pflegequalität im Krankenhaus.

2 Stand der Forschung

2002 lieferten Needleman et al. und Aiken et al. Meilensteine zur Untersuchung des Zusammenhangs zwischen der Pflegepersonalausstattung in Krankenhäusern und Patientenergebnissen. So haben Needleman et al. (2002) administrative Daten 799 amerikanischer Krankenhäuser hinsichtlich der Beziehung zwischen der Pflegepersonalausstattung (Gesamtanzahl erbrachter Pflegestunden voll ausgebildeter Pflegekräfte pro Patiententag) sowie dem Qualifikationsmix (Anteil der durch voll ausgebildete Pflegekräfte erbrachten Pflegestunden an der Gesamtzahl an Pflegestunden) und potenzieller NSPOs untersucht. Sowohl für die Pflegepersonalausstattung als auch für den Qualifikationsmix konnten Zusammenhänge mit den Indikatoren Verweildauer, Harnwegsinfektionen und innere Blutungen identifiziert werden. Andere medizinische Komplikationen wie Versäumnis der Rettung (d. h. das zum Tod führende Versäumnis, (drohende) Komplikationen rechtzeitig zu erkennen und wirksam darauf zu reagieren) und Pneumonie waren nur mit dem Qualifikationsmix assoziiert. Für keinen der beiden Personalindikatoren konnte ein Zusammenhang mit Letalität während des Krankenhausaufenthalts festgestellt werden. Aiken et al. (2002) kombinierten administrative Daten von 168 Allgemeinkrankenhäusern in Pennsylvania mit Befragungsdaten von 10.184 Pflegekräften und 232.342 OP-Patientinnen und -Patienten und stellten einen Zusammenhang zwischen Patienten-Pflegepersonal-Verhältnis und der Patientenletalität fest. Demnach stand jeder zusätzliche Patient pro Pflegekraft mit einer um 7 % höheren Sterblichkeitswahrscheinlichkeit 30 Tage nach Einweisung sowie einer um 7 % höheren Wahrscheinlichkeit der Versäumnis der Rettung im Zusammenhang. Seit der Veröffentlichung dieser bahnbrechenden Studien wurde der Zusammenhang zwischen dem Personalstand von Pflegekräften und einem breiten Spektrum von NSPOs in vielen weiteren Studien untersucht. Neben dem Patienten-Pflegekraft-Verhältnis als dem am häufigsten untersuchten Merkmal der Pflegepersonalausstattung analysierten Forschende weitere Indikatoren wie den Qualifikationsmix oder die Personaleinsatzflexibilität (d. h. den Anteil der Teilzeitkräfte) und ihre Zusammenhänge mit patientenbezogenen Ergebnisindikatoren. Oppel und Young (2018) fanden z. B. anhand von Daten amerikanischer Krankenhäuser, dass ein (unerwarteter) positiver Zusammenhang zwischen einem hohen Anteil von Teilzeitkräften in der Belegschaft und der Patientenerfahrung besteht. Ein angelehnter Forschungsstrang befasst sich mit dem Einsatz von Zeitarbeitspflegekräften. Sowohl bezogen auf die Anzahl temporärer Pflegekräfte als auch auf deren Anteil am gesamten Pflegepersonal fanden Studien gemischte Zusammenhänge etwa mit Letalität, Medikationsfehlern, Sturzraten und Patientenzufriedenheit (z. B. Aiken et al. 2007; Dall’Ora et al. 2020).

Die vielzitierte systematische Literaturübersicht von Kane et al. (2007) fasste 28 Studien zusammen mit dem Ziel, Evidenz zum Zusammenhang zwischen dem Personalstand ausgebildeter Pflegekräfte und patientenbezogenen Ergebnisindikatoren in Akutkrankenhäusern zu synthetisieren. Der Review zeigt, dass der positive Zusammenhang zwischen einem erhöhten Pflegepersonalstand und einer geringeren Wahrscheinlichkeit für krankenhausbezogene Sterblichkeit und anderen unerwünschten Ereignissen (z. B. Versäumnis der Rettung, ungeplante Extubation und Herzinfarkt) über Studien verschiedener Designs hinweg erkennbar ist. Für andere untersuchte Ereignisse wie Stürze, Dekubitus und Harnwegsinfektionen erwiesen sich die Zusammenhänge mit dem Patienten-Pflegekraft-Verhältnis allerdings als weniger konsistent. Einen eindeutigen Hinweis auf Kausalität konnte der Review nicht feststellen (Kane et al. 2007). Im Anschluss wurden mehrere weitere Literaturübersichten zu diesem Thema veröffentlicht.

Ein erster Umbrella Review hat Literaturübersichten zu diesem Zusammenhang synthetisiert und eine hohe Variabilität der Methoden und Messansätze sowie Widersprüchlichkeiten in den Ergebnissen der Primärstudien festgestellt (Brennan et al. 2013). Dieses Problem kann zumindest teilweise auf das Fehlen einer einheitlichen Definition der Pflegepersonalausstattung (siehe Qualifikationsmix, Patienten-Pflegepersonal-Verhältnis etc.) und Patientenergebnissen und daraus folgenden begrifflichen und methodischen Unterschieden zurückgeführt werden. Ein weiterer Faktor ist die Heterogenität in Bezug auf die Datengrundlagen, die das methodische Vorgehen erheblich beeinflussen können. Der acht Jahre später erschienene Umbrella Review von Blume et al. (2021) umfasst 15 bisher veröffentlichte Literaturübersichten, aus denen eine Liste von 22 bereits untersuchten NSPOs abgeleitet wurde. Der Umbrella Review gibt einen Überblick darüber, welche NSPOs bisher wie oft untersucht wurden (Evidenzquantität) und als wie stark die empirische Evidenz für den Zusammenhang mit der Pflegepersonalausstattung auf Basis der Anzahl der Studien und deren Ergebnissen jeweils eingestuft werden kann (Evidenzstärke). Zusätzlich liefern Interviews mit Expertinnen und Experten weitere NSPOs, die in der bestehenden Literatur noch nicht erwähnt wurden. Für vier der 22 in der Literatur diskutierten NSPOs wurde die Evidenzstärke als hoch eingeordnet, für fünf als moderat und für 13 NSPOs als gering.

Table 5.1 gibt einen Überblick über die Quantität und Stärke der Evidenz, wie sie im Umbrella Review von Blume et al. (2021) ermittelt wurden. Zusätzlich wurde eine Spalte zur Pflegesensitivität, d. h. zur vermuteten Effektstärke des Kausalzusammenhangs von Pflegepersonalausstattung und der Prävalenz verschiedener Ereignisse, ergänzt. Die Tabelle zeigt, dass die im Umbrella Review identifizierte Evidenzquantität und -stärke und die anzunehmende Pflegesensitivität der Patientenergebnisse nicht miteinander gleichzusetzen sind. Beispielsweise liegt für die Outcomes Letalität, tiefe Venenthrombose und Sepsis jeweils Evidenz in hoher Quantität vor, während die Evidenzstärke und die vermutete Pflegesensitivität lediglich als gering bis moderat eingestuft werden. Dies impliziert, dass Datenverfügbarkeit und Pfadabhängigkeit eine wichtige Rolle bei der Auswahl bisher untersuchter NSPOs gespielt haben könnten – bei den genannten Outcomes handelt es sich beispielsweise um Indikatoren, die aus Routinedaten abgeleitet werden können. Zwar ist ein geringe bis moderate Pflegesensitivität jeweils plausibel, jedoch sind die Outcomes grundsätzlich als multi-kausal einzuordnen, d. h. es ist davon auszugehen, dass sie auch oder primär von Risikofaktoren der Patientinnen und Patienten und Faktoren im Verantwortungsbereich des ärztlichen Personals beeinflusst werden.

Tab. 5.1 Überblick über die Quantität und Stärke der Evidenz sowie die vermutete Pflegesensitivität zu verschiedenen Ergebnisindikatoren

Weiterhin könnten Diskrepanzen zwischen Evidenzquantität und -stärke und der vermuteten Pflegesensitivität auch dadurch zustande kommen, dass die Identifikation des Zusammenhangs zwischen Pflegepersonalausstattung und NSPOs einigen Endogenitätsproblemen unterliegt. Bspw. sind einige patienten-, krankenhaus- und personalbezogene Faktoren denkbar, die den Zusammenhang zwischen der Personalausstattung und Patientenoutcomes beeinflussen und nur z. T. empirisch kontrollierbar sind (z. B. der durchschnittliche Schweregrad der Diagnosen, das Technologieniveau des Krankenhauses oder die Anteile verschiedener beruflicher Qualifikationsniveaus). Zusätzlich können teilweise entgegengesetzte Effekte vorliegen, die die Identifikation des wahren Zusammenhangs zwischen Pflegepersonalausstattung und NSPOs erschweren. So kann bspw. davon ausgegangen werden, dass sich eine bessere Personalausstattung negativ auf die Wahrscheinlichkeit auswirkt, dass Patientinnen und Patienten Dekubiti (Druckgeschwüre) entwickeln, da die wirksame präventive (aber zeitaufwendige) Maßnahme des regelmäßigen Lagerns immobiler Personen im Verantwortungsbereich der Pflegekräfte liegt; jedoch besteht auch Übereinstimmung darüber, dass die Erkennungsraten höher sind, wenn mehr Pflegekräfte zur Versorgung der Patienten zur Verfügung stehen (Cho et al. 2003; Dietermann et al. 2021; Shekelle 2013; Shuldham et al. 2009). Um Limitationen bisheriger Evidenz durch Pfadabhängigkeit und/oder Herausforderungen bei der empirischen Identifikation des Zusammenhangs zwischen Pflegepersonalausstattung und NSPOs zu adressieren, ist weitere empirische Forschung nötig. Forschungsbedarf besteht insbesondere für NSPOs, deren Pflegesensitivität als moderat oder sogar hoch angenommen werden kann, für die bisher jedoch keine oder wenige empirische Ergebnisse vorliegen (z. B. fehlende Entlassungsvorbereitung oder Infektion des vaskulären Zugangs) oder für die Diskrepanzen zwischen vermuteter Pflegesensitivität und bisheriger Evidenzstärke potenziell durch verbesserte empirische Methoden adressiert werden könnten (z. B. Druckgeschwüre).

Bislang gibt es nur wenige Studien, die diesen Zusammenhang in Deutschland untersucht haben. Im Rahmen einer europaweiten Studie (RN4CAST) analysierten Aiken et al. (2012; 2013; 2017) Daten aus 49 ausgewählten deutschen Krankenhäusern und von 1.508 Pflegekräften in deutschen Krankenhäusern. Innerhalb von Europa wurden Schwankungen in der Pflegepersonalausstattung verzeichnet. In Deutschland lag das durchschnittliche Patienten-Pflege-Verhältnis bei 9,9, der durchschnittliche Qualifikationsmix (Anteil vollausgebildeter Pflegekräfte) bei 82 %. Auch wenn der Qualifikationsmix in Deutschland damit vergleichsweise hoch ist, gaben 30 % der Pflegekräfte die Pflegequalität als eher schlecht an. Pflegekräfte berichteten außerdem, dass pflegeassoziierte Infektionen mehrmals im Monat auftraten (Aiken et al. 2013). In allen europäischen Ländern wurde ein Zusammenhang zwischen verbesserter Pflegepersonalausstattung und Pflegeergebnissen (u. a. Patientensicherheit und Versorgungsqualität) sowie Patientenergebnissen (u. a. allgemeine Zufriedenheit mit der Pflege und Bereitschaft, das Krankenhaus weiterzuempfehlen) festgestellt (Aiken et al. 2012). Ein höherer Qualifikationsmix war verbunden mit einer geringeren Wahrscheinlichkeit für Letalität, der Meldung schlechter Qualität und anderer negativer Patientenereignisse wie Dekubitus und Stürze (Aiken et al. 2017). Eine Studie von Milstein und Schreyögg (2020) analysierte 26,5 Mio. Fälle in allen deutschen Krankenhäusern auf Basis von Krankenhausabrechnungsdaten hinsichtlich der Pflegepersonalausstattung (Verhältniszahl) und ihrer Auswirkung auf elf pflegesensitive patientenbezogene Ergebnisindikatoren (z. B. Dekubitus, Harnwegsinfektionen, Pneumonie, tiefe Venenthrombose). Insgesamt bestand in 15 Fachabteilungstypen für mindestens einen Ergebnisindikator ein signifikanter Zusammenhang mit der Pflegepersonalausstattung. Damit können 15 Fachabteilungen als pflegesensitiv bezeichnet werden. Zudem fand die Studie heraus, dass der Zusammenhang zwischen Pflegepersonalausstattung und Ergebnisindikatoren stark zwischen Fachabteilungstypen schwankte. Z. B. waren in der Fachabteilung für Innere Medizin zehn von elf Ergebnisindikatoren signifikant mit der Pflegepersonalausstattung assoziiert, während in der Gefäßchirurgie nur zwei von elf Ergebnisindikatoren signifikant korrelierten (Milstein und Schreyögg 2020).

3 Methode

Zur empirischen Untersuchung des Zusammenhangs zwischen Pflegepersonalausstattung und Patientenergebnissen in deutschen Krankenhausfachabteilungen wurden verschiedene Datenquellen genutzt, die im Folgenden beschrieben werden.

3.1 Datengrundlage der Sekundär- und Primärdatenanalysen

3.1.1 Abrechnungsdaten der Techniker-Krankenkasse

Die von der Techniker-Krankenkasse zur Verfügung gestellten Abrechnungsdaten enthielten detaillierte Informationen über Krankheitsverläufe auf Patientenlevel, was den Autorinnen und Autoren erlaubte, sowohl pflegesensitive patientenbezogene Ergebnisindikatoren abzuleiten, die während des Krankenhausaufenthalts auftreten, als auch solche, die erst nach der Entlassung auftreten. Es wurden komplette stationäre Aufenthalte aus den Abrechnungsdaten extrahiert, die zwischen 2014 und 2018 über das deutsche DRG-System abgerechnet wurden. Die Abrechnungsdaten (nach §§ 295, 301, 300, 33 SGB V) wurden im Hinblick auf die Prävalenz der aus Blume et al. (2021) abgeleiteten pflegesensitiven patientenbezogenen Ergebnisindikatoren (während Krankenhausaufenthalten sowie poststationär, d. h. bis zu 30 Tage nach Krankenhausaufenthalt; siehe Abschn. „Abhängige Variablen“) für die Jahre 2014 bis 2018 aufbereitet. Aus den Abrechnungsdaten wurden stationäre Krankenhausfälle von Patientinnen und Patienten ausgeschlossen, die aus pädiatrischen, psychiatrischen oder Intensivstationen entlassen wurden, da viele pflegesensitive patientenbezogene Ergebnisindikatoren für diese Fachabteilungen nicht anwendbar sind oder nicht dafür validiert worden sind. Weiterhin wurden alle Fachabteilungstypen exkludiert, bei denen die Prävalenzrate für jeden der pflegesensitiven patientenbezogenen Ergebnisindikatoren unter einem Prozent lag, sowie Fachabteilungstypen, die in weniger als 25 Krankenhäusern vorkamen. Darüber hinaus wurden stationäre Krankenhausfälle von Patientinnen und Patienten entfernt, die in den jeweils 90 Tagen vor und nach dem Krankenhausaufenthalt nicht kontinuierlich versichert waren. Nach Anwendung der Ausschlusskriterien ergab sich auf Basis der Abrechnungsdaten eine Stichprobe von 4.589.147 Krankenhausfällen in 1.358 Krankenhäusern und 15 verschiedenen Fachabteilungstypen.

3.1.2 Daten aus den verpflichtenden jährlichen Qualitätsberichten deutscher Krankenhäuser

Daten aus den verpflichtenden jährlichen Qualitätsberichten deutscher Krankenhäuser lieferten allgemeine Krankenhausinformationen auf Fachabteilungsebene, wie z. B. die Anzahl der stationären Fälle und die Personalausstattung. In der Studie wurden darauf basierend die Pflegepersonalausstattungen für die Jahre 2013 bis (sukzessive) 2018 auf Fachabteilungsebene berechnet. Zudem wurden basierend auf den Qualitätsberichtsdaten Informationen zur Kalkulation von Case-Mix-adjustierten Fallzahlen pro Krankenhaus und Fachabteilung abgeleitet. Krankenhäuser, deren Berichterstattung Inkonsistenzen aufwies, wurden aus den Daten entfernt.

Nach Anwendung der Ausschlusskriterien wurden die stationären Krankenhausfälle jeweils mit den Informationen aus den Qualitätsberichten der Krankenhäuser aus dem Vorjahr zusammengefügt. Dafür wurde eine Variablenkombination aus der IK-Kennung und dem Fachgebietsschlüssel nach § 301 SGB V genutzt. Bei Krankenhäusern, die über mehrere Standorte verfügen, jedoch nur eine IK-Kennung besitzen, wurde individuell auf Basis der Krankenhausgröße und der geographischen Distanz entschieden, ob es sinnvoll ist, die Standorte zu einer Krankenhausgruppe zusammenzufügen. Dadurch ergab sich eine Stichprobe von 3.574.776 stationären Krankenhausfällen in 1.174 Krankenhäusern. Details zum Prozess der Stichprobenselektion sind in Dietermann et al. (2021) dargestellt.

3.1.3 Primärdaten aus der Patientenbefragung

Für die kombinierten Primär- und Sekundärdatenanalysen wurden die oben genannten beiden Datenquellen um die Primärdaten aus der Patientenbefragung ergänzt. Zu dem Zweck wurden 2019 insgesamt 212.554 Versicherte der Techniker Krankenkasse angeschrieben und zur Beteiligung an der Online-Befragung zur erlebten Qualität der Pflege im Krankenhaus aufgefordert. Die Zielpopulation der Befragung waren Versicherte mit einem stationären Krankenhausaufenthalt und analogen Ein- und Ausschlusskriterien der Sekundärdatenstichprobe. Details sind in Winter et al. (2021) und Blume et al. (2022) beschrieben. Final stand also eine Stichprobe von 30.174 Versicherten zur Auswertung bereit, was einer Teilnahmequote von 14,2 % entspricht.

Zur Erstellung eines kombinierten Datensatzes wurde der Primärdatensatz anhand einer pseudonymisierten Patienten-ID mit zuvor ausgewählten Abrechnungsdaten kombiniert (z. B. Aufnahme- und Entlass-Datum, Diagnosen während des Krankenhausaufenthalts, Krankenhaus-IK, Fachgebietsschlüssel nach § 301 SGB V). In einem weiteren Schritt wurde dieser kombinierte Datensatz mit Qualitätsberichtsdaten (§ 136b SGB V) aus dem Jahr 2017 zusammengeführt. Die Zusammenführung erfolgte anhand einer Variablenkombination aus der IK-Kennung des Krankenhauses, in das die Patientin oder der Patient eingewiesen war, sowie des Fachgebietsschlüssels nach § 301 SGB V.

Dadurch stand ein kombinierter Datensatz zur Verfügung, der initial 30.174 Versicherte umfasste. Davon wurden zunächst Ausreißer für die Pflegeverhältniszahlen und den Qualifikationsmix (s. u.) ausgeschlossen (Exklusion von 480 + 676 Fällen). Weiterhin wurden 749 Beobachtungen mit fehlenden Werten für den PCCL-Index (s. u.) sowie 133 Beobachtungen aus Fachabteilungen, die weniger als 150 Beobachtungen für die Verweildauer enthielten, entfernt. So ergab sich eine endgültige Stichprobe von 28.136 Patientinnen und Patienten im Alter von 18 bis 97 Jahren (Durchschnitt: 61,12 Jahre), die aus 3.458 verschiedenen Krankenhausfachabteilungen in 1.017 Krankenhäusern entlassen worden waren.

3.2 Beschreibung und Repräsentativität der finalen Stichprobe nach Fachabteilungen

Table 5.2 gibt einen Überblick über die Stichproben, die den Datenanalysen zugrunde liegen. Insgesamt umfasst die Datenbasis mehr als drei Millionen Fälle, die in über 900 verschiedenen Krankenhäusern behandelt wurden. Die proportional größten Fachabteilungen Innere Medizin und Allgemeine Chirurgie sind sowohl in den Sekundärdatenanalysen als auch in den Primärdatenanalysen am meisten vertreten.

Tab. 5.2 Überblick über die Stichproben und Pflegepersonalausstattungsmerkmale

Zur Überprüfung der Repräsentativität wurden bei den Sekundärdaten alle stationären Fälle volljähriger Personen in Deutschland mit den volljährigen TK-Versicherten, die im Jahr 2019 einen Krankenhausaufenthalt hatten, verglichen.

Bei den Primärdaten wurden die Teilnehmenden mit drei Gruppen verglichen: der Gruppe aller stationären Fälle volljähriger Personen in Deutschland, der Gruppe der volljährigen TK-Versicherten, die 2019 einen Krankenhausaufenthalt hatten, und der Studienpopulation (d. h. allen Angeschriebenen zur Untersuchung eines Non-Response-Bias). Es zeigen sich insgesamt nur geringe Abweichungen zwischen den Gruppen (vgl. Winter et al. 2022), sodass von ausreichender Repräsentativität ausgegangen werden kann.

3.3 Variablen

3.3.1 Unabhängige Variablen

Pflegeverhältniszahlen:

Diese geben an, wie viele Patientinnen und Patienten eine Krankenpflegekraft bei einer durchschnittlichen Schicht zu versorgen hat. Entsprechend den Empfehlungen des Statistischen Bundesamts wurde die Pflegepersonalausstattung berechnet als Verhältnis der Anzahl an Patientinnen und Patienten zu Pflegekräften pro Jahr und Fachabteilung (patient-to-nurse (PTN) ratio). Details sind in Dietermann et al. (2021) beschrieben. Nach Berechnung der Pflegepersonalausstattung pro Krankenhausstation und Jahr wurden Ausreißer entfernt, d. h. Fälle mit Pflegeverhältniszahlen kleiner als eins und größer als 15. Dadurch reduzierte sich die Stichprobengröße auf 3.159.136 stationäre Fälle in 907 deutschen Krankenhäusern.

Bei den kombinierten Primär- und Sekundärdatenanalysen wurden nur Krankenhausabteilungen ausgeschlossen, die 150 oder weniger stationäre Fälle aufwiesen (statt die Grenze wie bei den Sekundärdatenanalysen auf 500 stationäre Fälle zu setzen) sowie Fachabteilungen mit Pflegeverhältniszahlen kleiner als eins und größer als 20 (in Sekundärdatenanalysen 15). Die Entscheidung begründet sich dadurch, dass anhand der strengeren Ausschlusskriterien zu viele Beobachtungen des für dieses Teilprojekt verwendeten kombinierten Datensatzes verloren gegangen wären. Im Rahmen einer Sensitivitätsanalyse wurden die Ergebnisse nach Anwendung beider Grenzwerte verglichen. Diese zeigten sich robust.

Qualifikationsmix:

Als weiteres Maß der Pflegepersonalausstattung wurde in den kombinierten Primär- und Sekundärdatenanalysen der Qualifikationsmix einer jeden Krankenhausabteilung betrachtet (vgl. Winter et al. 2021). Dafür wurde der Anteil an Gesundheits- und Krankenpflegehilfskräften an der Gesamtanzahl der Pflegekräfte (gemessen in Vollzeit-Äquivalenten) berechnet. Ausreißer wurden exkludiert, d. h. Krankenhausabteilungen mit Qualifikationsmixen von über 25 %.

3.3.2 Abhängige Variablen/Zielgrößen

Objektive Ergebnisindikatoren:

Sieben patientenbezogene objektive Ergebnisindikatoren wurden zur Beantwortung der Forschungsfrage betrachtet: Letalität, Lungenversagen, Druckgeschwüre, Pneumonie, Sepsis sowie 30- und 7-Tage-Wiedereinweisung. Die Auswahl erfolgte auf Basis der Empfehlungen des National Voluntary Consensus Standards for Nursing-Sensitive Care und der Ergebnisse des Umbrella Reviews (Blume et al. 2021).

Qualität der Pflege:

Im Rahmen des Innovationsfondsprojekt „PPE“ wurde ein Instrument zur Messung der von Patientinnen und Patienten erlebten Pflegequalität in deutschen Akutkrankenhäusern (Patients’ Experience of Nursing Quality in Acute Hospitals (PENQuAH)) entwickelt. Auf Basis einer systematischen Literaturrecherche und Experteninterviews wurde zunächst ein umfassender Fragebogen entwickelt, der insgesamt 32 Items umfasste. Im Rahmen der Validierung wurden die Dimensionalität des Instruments untersucht und Items ausgeschlossen, die keiner der identifizierten Dimensionen von Pflegequalität zugeordnet werden konnten. Im Ergebnis wurde ein Instrument vorgeschlagen, das aus insgesamt 22 Items besteht, deren Varianz sich durch zwei Dimensionen abbilden lässt (Blume et al. 2022):

  • Qualität der direkten Krankenpflegeaktivitäten und

  • Qualität der durch Pflegepersonen erfolgten Anleitung

Zusätzlich wurden zwei Items zur Messung der auf den Pflegeerfahrungen basierenden Loyalität der Patienten verwendet, um eine zusätzliche Dimension abzubilden, die sich indirekt aus der erlebten Pflegequalität im Krankenhaus ergibt.

Die drei Dimensionen wurden berechnet, indem jeweils das arithmetische Mittel über alle der Dimension zugrunde liegenden Items ermittelt wurde. Die Items sind in Blume et al. (2022), Winter et al. (2021) und Winter et al. (2022) spezifiziert.

3.3.3 Kontrollvariablen

In beiden Analysen werden verschiedene patientenbezogene und krankenhaus(fachabteilungs)spezifische Kontrollvariablen berücksichtigt und teilweise als Differenzierungsmerkmale für Subgruppenanalysen verwendet. Um strukturelle Unterschiede der Fallschwere stationärer Fälle über die Krankenhäuser hinweg zu adressieren, wurden das Elixhauser-Komorbiditätsmaß (Elixhauser Comorbidity Measure, ECM) und das sog. Patient Clinical Complexity Level (PCCL) verwendet. Zusätzlich wurden Alter und Geschlecht der Patientinnen und Patienten als Kontrollvariablen integriert. Das Verhältnis von Patientinnen und Patienten zu ärztlichem Personal (patient-to-physician (PTP) ratio), der Pflegepersonalqualifikationsmix (soweit nicht schon in den Hauptanalysen enthalten), die Krankenhausgröße und die Ländlichkeit der Gegend sind weitere Kontrollvariablen.

3.4 Statistisches Modell

Für die Sekundärdatenanalysen wurden Regressionsmodelle unter Berücksichtigung der Gruppierungsstruktur der Daten (d. h. Patientinnen und Patienten, die in Fachabteilungstypen gruppiert sind) geschätzt. Teilweise wurden auch nichtlineare Effekte und Interaktionseffekte untersucht. Um die Robustheit der Ergebnisse zu testen, wurden umfangreiche Sensitivitäts- und Subgruppenanalysen durchgeführt. Ein Fokus lag hier insbesondere auf der Vermeidung von Verzerrungen durch strukturelle Unterschiede der Fallschwere über Krankenhäuser hinweg.

Um für Einflussfaktoren zu kontrollieren, die über die Zeit hinweg konstant sind, und die empirische Aussagekraft somit zu erhöhen, wurden Veränderungen in der Pflegepersonalausstattung und Veränderungen in der Qualität der Versorgung über die Zeit hinweg analysiert (deskriptiv und durch Längsschnittanalysen des Zusammenhangs). Details zu den statistischen Modellen können den beiden Studien entnommen werden (Dietermann et al. 2021; Winter et al. 2021).

4 Ergebnisse: Abteilungsspezifische und abteilungsübergreifende Zusammenhänge zwischen der Pflegeintensität und pflegesensitiven Ergebnisindikatoren in deutschen Krankenhäusern

4.1 Deskriptive Ergebnisse

Fig. 5.1 gibt einen Überblick über die deskriptiven Statistiken. In den Prävalenzen adverser Ereignisse zeigen sich Variationen innerhalb und zwischen den verschiedenen Fachabteilungstypen.

Abb. 5.1
figure 1

Fachabteilungsspezifische Prävalenzen in objektiven Ergebnisindikatoren. Anmerkungen: Gestrichelte Linien stellen durchschnittliche Prävalenzen dar. Inzidenzraten wurden in zwei Fällen (30-Tage-Wiedereinweisungsrate in der Hämatologie (34,1) und Lungenversagen in der Herzchirurgie (20)) aus Darstellungszwecken bei 15 gekürzt

Gleiches gilt für die Variation der Qualitätsbewertungsdimensionen (Fig. 5.2). Um zu ermitteln, in welchen Fachabteilungstypen die durchschnittliche Qualitätsbewertung signifikant vom Durchschnitt der anderen Abteilungen abweicht, wurden zusätzliche Regressionen mit einem Dummy für den jeweiligen Fachabteilungstyp berechnet (vgl. Winter et al. 2022). In vier Fachabteilungen zeigten sich signifikante negative Abweichungen für alle drei Dimensionen der Pflegequalität in konsistenter Reihenfolge: Die schlechtesten Werte weist die Geriatrie auf, gefolgt von der Gastroenterologie, der Inneren Medizin und – mit den geringsten (signifikanten) Abweichungen – der Neurologie. Zwei signifikant unterdurchschnittliche Werte existieren in der Zahn- und Kieferheilkunde und der Unfallchirurgie (jeweils signifikant unterdurchschnittliche Bewertung der allgemeinen Pflege sowie der Loyalität), und jeweils eine signifikant unterdurchschnittliche Bewertung der wahrgenommenen Qualität der durch Pflegepersonen erfolgten Anleitung liegen für die Kardiologie, Rheumatologie und Neurochirurgie vor.

Abb. 5.2
figure 2

Fachabteilungsspezifische Bewertung der Qualität der Pflege aus der Patientenbefragung. Anmerkung: Alle Qualitätsbewertungen sind von 1 (sehr schlecht) bis 5 (sehr gut) skaliert

4.2 Regressionsergebnisse

4.2.1 Ergebnisse der Sekundärdatenanalysen

Table 5.3 fasst die Ergebnisse aus den Regressionsanalysen zusammen und spezifiziert, in welchen Fachabteilungen welche objektive Ergebnisindikatoren als pflegesensitiv identifiziert wurden, d. h. signifikant mit der Pflegepersonalausstattung zusammenhängen. Insgesamt ergeben sich 32 signifikante Zusammenhänge in die erwartete Richtung sowie fünf Zusammenhänge in die unerwartete Richtung (d. h. dort korreliert eine bessere Pflegepersonalausstattung mit einer höheren Prävalenzrate eines adversen Ergebnisses). Die detaillierten Ergebnisse sind in Dietermann et al. (2021) und Winter et al. (2022) veröffentlicht.

Tab. 5.3 Zusammenfassende Darstellung der Analyseergebnisse

In jedem Fachabteilungstyp liegt ein signifikanter Zusammenhang in der erwarteten Richtung für mindestens einen Ergebnisindikator vor. Drei Fachabteilungstypen (Kardiologie, Hämatologie und Pneumologie) sind mit signifikanten Zusammenhängen in der erwarteten Richtung für jeweils vier der Ergebnisindikatoren am pflegesensitivsten. In acht Fachabteilungstypen (Innere Medizin, Allgemeine Chirurgie, Unfallchirurgie, Neurochirurgie, Gefäßchirurgie, Herzchirurgie, Dermatologie und Zahnmedizin) wurden signifikante Ergebnisse in der erwarteten Richtung für zwei der Ergebnisindikatoren gefunden. Während Unterschiede in der Anzahl der signifikanten Assoziationen zwischen medizinischen und chirurgischen Fachabteilungstypen beobachtet wurden (Durchschnittswerte von 2,6 bzw. 1,6), scheint diese grobe Unterscheidung die Variation zwischen den Fachabteilungstypen nur teilweise zu erklären (Standardabweichungen von 1,3 und 0,5).

Zusätzlich wurden Unterschiede im Grad der Pflegesensitivität zwischen den Ergebnisindikatoren beobachtet. Pneumonie ist in 14 Fachabteilungstypen signifikant mit der Pflegepersonalausstattung assoziiert, gefolgt von Atemversagen (zehn Fachabteilungstypen); Dekubitus und 30-Tage-Wiedereinweisungen (je drei Fachabteilungstypen); Sterblichkeit und Sepsis (je ein Fachabteilungstyp); und 7-Tage-Wiedereinweisungen (in keinem Fachabteilungstyp). Bei Lungenversagen scheint der Effekt darüber hinaus nicht-linear zu sein, d. h. der marginale Effekt der PTN-Ratio nimmt mit zunehmender Anzahl Patientinnen und Patienten pro Pflegekraft ab.

Ebenso wie frühere Studien findet diese Studie eine höhere Anzahl signifikanter Assoziationen für medizinische Fachabteilungstypen im Vergleich zu chirurgischen Fachabteilungstypen. Außerdem wurde ein etwas höherer Anteil signifikanter Effekte bei Patienten mit geringer und mittlerer Fallkomplexität beobachtet als bei Patienten mit hoher Komplexität.

Die Ergebnisse der Sensitivitätsanalysen stützen die Hauptergebnisse. Bei Schätzung des statistischen Modells unter Einbezug anderer Risikoadjustierungen bleiben die Ergebnisse weitgehend stabil. Auch Interaktionseffekte zwischen Pflegepersonalausstattung und Fallschwere verändern die Hauptergebnisse nicht. Genauso führt der Einbezug der ärztlichen Stunden pro Patiententag und des Verhältnisses von Assistenz- zu examinierten Pflegekräften als Kontrollvariablen nicht zu signifikanten Veränderungen der Regressionsergebnisse.

Die deskriptiven Statistiken zur Pflegepersonalausstattung und der Qualität der Versorgung (d. h. Prävalenzen der Patientenergebnisse) über die verschiedenen Jahre zeigten, dass sich im Zeitverlauf keine substantiellen Veränderungen ergeben haben. Da die Variation innerhalb einzelner Krankenhausfachabteilungen über die verschiedenen Jahre so gering war, konvergierte keines der Längsschnittmodelle. Dies deutet darauf hin, dass weder die Pflegepersonalausstattung noch die Ergebnisindikatoren über die Zeit großen Schwankungen unterliegen, sondern dass der Großteil der Variation zwischen Krankenhäusern und Fachabteilungstypen liegt.

4.2.2 Ergebnisse der kombinierten Primär- und Sekundärdatenanalysen

Die Regressionsanalysen zeigen, dass die Bewertungen aller drei Dimensionen der von Patientinnen und Patienten wahrgenommenen Qualität der Pflege signifikant niedriger waren, wenn (a) der Personalbestand des Krankenpflegepersonals niedriger war (mit abnehmenden marginalen Effekten) und (b) der Anteil der Pflegehilfskräfte in einer Krankenhausabteilung höher war (für die detaillierten Ergebnisse vgl. Winter et al. (2021) und Winter et al. (2022)). Die Subgruppenanalysen geben Hinweise darauf, dass die Effekte über verschiedene Gruppen unterschiedlich ausfallen. So war der Zusammenhang zwischen der Pflegepersonalausstattung und der Qualität der Krankenpflege bei Patientinnen und Patienten, die weniger klinisch komplexe Diagnosen hatten, in kleinere Krankenhäuser oder in medizinische Fachabteilungen eingeliefert wurden, ausgeprägter (vgl. Winter et al. 2021).

Deskriptive Analysen der Patientenzufriedenheit basierend auf den Daten der Weissen Liste deuten darauf hin, dass auch hier die Variation innerhalb von Krankenhausfachabteilungen über die Jahre eher gering war. Aufgrund Corona-bedingter Beschränkungen des Datenzugangs konnten die Längsschnittanalysen nicht durchgeführt werden; mit großer Wahrscheinlichkeit wären aufgrund der geringen Variation keine sinnvollen Ergebnisse erreicht worden.

4.2.3 Vergleich der Ergebnisse von Studien zu Pflegepersonalausstattung und patientenbezogenen Ergebnisindikatoren in Deutschland

In Table 5.4 werden die Ergebnisse der vier Studien verglichen, die vollständig oder teilweise auf Daten aus deutschen Krankenhäusern beruhen. Im Vergleich zur etwas älteren Studie mit vergleichsweise kleiner deutschen Teilstichprobe von Aiken et al. (2012; 2013; 2017) sind die Pflegeverhältniszahlen in den neueren Studien niedriger, was auf Veränderungen über die Zeit oder einen Selektionsbias der RN4CAST-Studie zurückzuführen sein könnte. Die Unterschiede zwischen Milstein und Schreyögg (2020), Dietermann et al. (2021) und Winter et al. (2021) sind eher geringfügig. Insgesamt finden alle Studien signifikante Effekte, die dafür sprechen, dass eine bessere Pflegepersonalausstattung zu weniger unerwünschten Patientenergebnissen führt. In den beiden Studien, welche die Zusammenhänge differenziert nach Fachabteilungstypen schätzen (Milstein und Schreyögg 2020, Dietermann et al. 2021), sind aus allen möglichen Ergebnisindikator-Fachabteilungstyp-Kombinationen ca. 30 % signifikant; dabei gibt es zwischen den Studien allerdings Unterschiede hinsichtlich der Ergebnisindikatoren und der Fachabteilungstypen, die am häufigsten signifikante Zusammenhänge aufweisen. Interessant ist zudem, dass der Zusammenhang zwischen der Pflegepersonalausstattung und der von Patientinnen und Patienten wahrgenommen Qualität der Pflege fachabteilungstypübergreifend gleich ist.

Tab. 5.4 Vergleich mit anderen Studien zu Pflegepersonalausstattung und patientenbezogenen Ergebnisindikatoren in Deutschland

5 Diskussion und Ausblick

Die Ergebnisse der Analysen liefern weitere Hinweise dafür, dass ein Zusammenhang zwischen der Pflegepersonalausstattung und patientenbezogenen Ergebnisindikatoren besteht. Insbesondere zeigen die Autorinnen und Autoren für Deutschland auf, dass dieser Zusammenhang je nach Fachabteilungstyp unterschiedlich ist. Auf Basis dieser Ergebnisse in Verbindung mit den aktuellen Schwellenwerten für Pflegekraftverhältniszahlen und Qualifikationen von Pflegekräften lassen sich wichtige Implikationen für die weitere Gestaltung der Pflegepersonaluntergrenzen ableiten.

Zunächst sollte die Einführung von Pflegepersonaluntergrenzen für die Fachabteilungstypen Hämatologie, Gastroenterologie und Pneumologie geprüft werden. In diesen existieren bislang keine Pflegepersonaluntergrenzen, sie haben sich in dem Projekt jedoch als besonders pflegesensitiv herausgestellt bzw. weisen eine unterdurchschnittliche wahrgenommene Pflegequalität auf. Die im Projekt ermittelten Schwellenwerte (vgl. Winter et al. 2022) können unter Berücksichtigung der Datenlimitationen als Ansatzpunkt dienen.

Darüber hinaus zeigt das Projekt, dass die Abteilungen Innere Medizin und Kardiologie sich sowohl in ihrer Pflegesensitivität als auch in ihren Schwellenwerten deutlich unterscheiden. Da die Kardiologie besonders pflegesensitiv scheint und grundsätzlich niedrigere Pflegeverhältniszahlen als die Innere Medizin aufweist, sollte geprüft werden, ob die bislang gemeinsam ausgegebene Pflegepersonaluntergrenze separiert und für die Kardiologie weiter verschärft werden sollte.

Bezogen auf den Anteil an Pflegehilfskräften ist analog zu den Pflegepersonaluntergrenzen eine Prüfung von Obergrenzen in den Fachabteilungen Hämatologie, Gastroenterologie und Pneumologie angeraten. Zusätzlich sollte die Fachabteilung Geriatrie verstärkt Beachtung finden, da sich hier eine unterdurchschnittliche Qualitätsbewertung bei gleichzeitig vergleichsweise hohem Anteil an Pflegehilfskräften zeigt.

Ein weiteres zentrales Ergebnis der Analysen ist, dass der Zusammenhang zwischen der Pflegepersonalausstattung und den patientenbezogenen Ergebnisindikatoren auch von der Fallschwere abhängt. Dementsprechend ist eine wichtige Implikation, dass geprüft werden sollte, inwieweit die Berücksichtigung der durchschnittlichen abteilungsbezogenen Fallschwere bei der Festlegung der Pflegepersonaluntergrenzen – z. B. durch die Festlegung von Clustern nach Fallschwere – sinnvoll und operationalisierbar ist. So könnten beispielsweise für Universitätskliniken andere Schwellwerte definiert werden als für Krankenhäuser der Grundversorgung.

Die Projektergebnisse weisen im Vergleich zu bisherigen Studien eine Reihe von Fortschritten auf. Erstens liefert der umfangreiche Umbrella Review wichtige Erkenntnisse über relevante pflegesensitive patientenbezogene Ergebnisindikatoren, die für weitere Forschung zum Zusammenhang der Pflegepersonalausstattung mit pflegesensitiven patientenbezogenen Ergebnisindikatoren als Orientierungshilfe für die Auswahl von Ergebnisindikatoren dienen können. Table 5.1 gibt wertvolle Hinweise zur Differenzierung zwischen Quantität und Stärke bisheriger Evidenz und der vermuteten Pflegesensitivität. Zweitens wurden für die empirischen Analysen Krankenkassendaten verwendet, die über den Krankenhausaufenthalt hinausgehen und zeigen, dass pflegesensitive patientenbezogene Ergebnisindikatoren nach Entlassung in drei Krankenhausfachabteilungen (Kardiologie, Allgemeinchirurgie und Unfallchirurgie) relevante Informationen zu einem vorangegangenen Krankenhausaufenthalt enthalten. Drittens werden Mehrebenenmodelle verwendet, die Variationen innerhalb und zwischen verschiedenen Fachabteilungstypen berücksichtigen. Viertens ist dies international eine der ersten Analysen, die den Zusammenhang zwischen Pflegepersonalausstattung und (auf Basis einer umfassend validierten Skala) der von Patientinnen und Patienten wahrgenommenen Qualität der Pflege ermittelt.

Trotz der Erkenntnisfortschritte weisen die vorliegenden Analysen Limitation auf, die bei der Interpretation Berücksichtigung finden sollten. Erstens verwenden die Autorinnen und Autoren aufgrund der eingeschränkten Datenverfügbarkeit die durchschnittliche Pflegeverhältniszahl für jede Krankenhausabteilung pro Jahr. Daher können potenzielle Schwankungen beim Personaleinsatz oder der Belastung, z. B. innerhalb eines Tages, nicht kontrolliert werden. Das führt potenziell zu einem Messfehler. Eine Differenzierung der Pflegepersonalausstattung nach Schichten (d. h. z. B. Früh-, Spät- oder Nachtdienst) wäre empirisch grundsätzlich interessant – bisher sind die entsprechenden Daten jedoch nicht für Forschungszwecke freigegeben. Zudem wird es kaum möglich sein, die Patientenergebnisse (z. B. Dekubitus) einer bestimmten Schicht zuzuordnen. Dies könnte höchstens beispielsweise bei Versterben der Patientin/des Patienten über den Zeitstempel erfolgen. Daher wird eine Differenzierung nach Schichten für die Schätzungen kaum einen Mehrwert erbringen. Anders ist dies bei einer intertemporalen Differenzierung zu bewerten. Eine Verfügbarkeit der Pflegepersonalausstattung auf Wochen- oder besser auf Tagesbasis könnte wertvoll sein, da man diese somit den Zeitstempeln der Fälle zuordnen könnte. Wie bereits beschrieben, ergibt sich der Vorteil daraus nur, wenn die Selbstangaben der Krankenhäuser nicht zu viele Messfehler aufweisen. Insgesamt ist es daher unklar, ob eine verbesserte Datenbasis zu präziseren Schätzungen führen würde.

Weiterhin schränken mögliche Endogenitätsprobleme die Aussagekraft der Ergebnisse in Bezug auf einen kausalen Effekt der Pflegepersonalausstattung auf NSPOs ein. Bspw. sind einige patienten-, krankenhaus- und personalbezogene Faktoren denkbar, die den Zusammenhang zwischen der Personalausstattung und Patientenoutcomes beeinflussen und nur z. T. empirisch kontrollierbar sind (z. B. der durchschnittliche Schweregrad der Diagnosen, das Technologieniveau des Krankenhauses, die Qualität der interprofessionellen Zusammenarbeit oder die Anteile verschiedener beruflicher Qualifikationsniveaus). Zusätzlich können teilweise entgegengesetzte Effekte vorliegen, da eine höhere Personalausstattung zwar die Wahrscheinlichkeit von Komplikationen verringern, aber die Erkennungs- und Dokumentationsraten von Komplikationen erhöhen könnte. Durch die Berücksichtigung der verschiedenen Ebenen und Berechnung von Längsschnittregressionsmodellen wurde die Endogenitätsproblematik teilweise adressiert. Allerdings führten letztere im Vergleich zu den Querschnittsmodellen zu keiner Verbesserung des Modellfits. Dies ist auf die Beschaffenheit der Daten zurückzuführen, da sich die durchschnittliche Pflegepersonalausstattung sowie die Qualität der Versorgung über den Betrachtungszeitraum nicht substantiell verändert haben. Zusätzliche Längsschnittanalysen können zukünftig sinnvoll sein, sofern Daten verfügbar sind, die die Personalausstattung nach Tagen und Wochen differenzieren.

Eine weitere Limitation der Analyse ist die Risikoadjustierung. Die Mehrzahl der Modelle legt nahe, dass die Risikoadjustierung über PCCL sowie die weiteren verwendeten Risikoadjustierungen gut funktionieren. Allerdings ist in weiterführenden Analysen zu sehen, dass die Risikoadjustierung für Krankenhausabteilungen mit einem hohen Anteil hochkomplexer Fälle an ihre Grenzen stößt. Dies könnte erklären, warum es in diesen Abteilungen einen überproportionalen Anteil an signifikanten Effekten in die unerwartete Richtung gibt, d. h. Abteilungen, in denen ein niedrigeres Patienten-Pflegekraft-Verhältnis mit einer höheren Prävalenz unerwünschter Ereignisse korreliert. Daher erscheint es sinnvoll, bei künftigen Analysen Fachabteilungen mit hochkomplexen Fällen in den Fokus zu nehmen und zu beobachten, ob dort eine verbesserte Risikoadjustierung zu anderen Ergebnissen führt.

Im Unterschied zu den USA existieren in Deutschland bisher nur wenige Arbeiten zum Zusammenhang zwischen der Pflegepersonalausstattung und pflegesensitiven Outcomes. Politisch gesehen erscheint es jedoch wichtig, diesen Zusammenhang in weiteren Analysen zu beleuchten, u. a. weil die internationale Vergleichbarkeit von Studienergebnissen z. B. durch unterschiedliche Differenzierungen beruflicher Qualifikationsniveaus in der Krankenpflege eingeschränkt ist. Einen wichtigen Beitrag für die Forschung zu diesem Zusammenhang im deutschen Kontext würde die Freigabe der durch die Krankenhäuser an das InEK übermittelten unterjährigen Personalbesetzungen auf Fachabteilungsebene leisten. Es wäre zudem wünschenswert, dass diese unterjährigen Daten zu Personalbesetzungen mit Daten zur Qualifikation von Pflegekräften angereichert werden, die über die übliche Differenzierung von Pflegefachkräften und Pflegehilfskräften hinausgeht. Wenn die genannten Informationen im Forschungsdatenzentrum Gesundheit mit Krankenkassendaten verbunden werden könnten, würde dies eine wichtige Grundlage für künftige Forschungsarbeiten zum Zusammengang zwischen Pflegepersonalausstattung und pflegesensitiven Outcomes darstellen und weitere Erkenntnisfortschritte auf diesem Gebiet ermöglichen. Insbesondere sollte in den nächsten Jahren die Wirkung von Personalpflegeuntergrenzen auf pflegesensitive Outcomes anhand von Routinedaten untersucht werden. Da sie während der SARS-CoV-2-Pandemie überwiegend ausgesetzt waren, wird es einige Jahre dauern, bis ihre Wirkung sinnvoll über mehrere Fachabteilungen hinweg untersucht werden kann.