Einführung

Krankenhäuser sind laut §135a SGB V zur einrichtungsinternen und -übergreifenden Qualitätssicherung verpflichtet. Qualitätsindikatoren werden eingesetzt, um Teilaspekte der medizinischen Versorgung zu messen, darzustellen und zu bewerten. Sie dienen im medizinischen Qualitätsmanagement als Steuerungsinstrumente für Strukturen, Prozesse und Ergebnisse der Versorgung [2, 28]. Kennzahlen sind wichtig zum erfolgreichen Betrieb einer Notaufnahme. Im Gegensatz zu Qualitätsindikatoren verbessert ihre Anwendung jedoch nicht zwingend die Patientenversorgung [28].

Das Institut für Qualitätssicherung und Transparenz im Gesundheitswesen (IQTIG) wird vom Gemeinsamen Bundesausschuss (G-BA) zur Entwicklung von Qualitätsindikatoren beauftragt (§137a SGB V). Für den großen Bereich der Notfallmedizin ist dies bisher noch nicht umgesetzt. Vermutlich deshalb werden in deutschen Notaufnahmen, je nach lokalen Gegebenheiten und Möglichkeiten, die verschiedensten Qualitätsindikatoren und Kennzahlen zur Analyse der eigenen Leistungen verwendet. Diese reichen von einfachen deskriptiven Fallzahldarstellungen bis hin zu detaillierten Untersuchungen bezüglich einzelner Tracerdiagnosen [1, 28].

Demgegenüber existieren im internationalen Umfeld diverse Vorschläge und teilweise verbindliche Vorgaben zum Einsatz von speziellen Qualitätsindikatoren. In einer Vorarbeit wurden von Hörster et al. in einer systematischen Literaturrecherche 170 international publizierte Indikatoren für die klinische Akut- und Notfallmedizin identifiziert [19]. Für diese 170 Qualitätsindikatoren waren jedoch überwiegend keine Gütekriterien der Indikatoren publiziert, sodass vor der Einführung in Deutschland eine Gütebewertung notwendig wurde.

Zur Bewertung von Indikatoren existieren mehrere Methoden [14, 27]: Vom Institut für Qualität und Patientensicherheit (BQS-Institut) wurde mit QUALIFY ein durchgängig operationalisiertes Instrument zur Bewertung von Qualitätsindikatoren entwickelt, dessen Kriterien in Tab. 1 dargestellt sind.

Tab. 1 Zusammenfassung der zu bewertenden Kernaussagen von Qualitätsindikatoren in der QUALIFY-Methode. (Nach Reiter et al. [27])

Zielsetzung

  1. 1.

    Primäres Ziel der Arbeit war es, die erste Anwendung des QUALIFY-Bewertungsinstruments bei der Bewertung von Indikatoren für die (zentrale) Notaufnahme zu analysieren und dabei Stärken und Limitationen des Verfahrens im Vergleich zu einer offenen Diskussion herauszuarbeiten.

  2. 2.

    Sekundäres Ziel war die Publikation eines Ergebnisprotokolls mit den inhaltlichen Ergebnissen dieses Bewertungsprozesses als Indikatorregister.

Material und Methodik

Auswahl der Indikatoren

Grundlage der Auswahl bildete eine systematische Literaturrecherche von Hörster et al. [19]. Die dort identifizierten 170 Indikatoren wurden zunächst in einem Indikatorregister erfasst und verschiedenen Prozessen der Notaufnahme zugeordnet. Erweitert wurde das Indikatorregister um 3 weitere Kennzahlen aufgrund von Expertenvorschlägen. Jeweils mindestens ein Qualitätsindikator pro Prozess wurde für die weitere Betrachtung exemplarisch ausgewählt. Der Bereich „Pädiatrische Patientenversorgung“ mit 5 möglichen Kennzahlen wurde ausgeschlossen.

Bewertungsmethoden der Indikatoren

Die Indikatoren wurden im Rahmen eines mehrstufigen Prozesses durch ein Expertengremium beurteilt. Zur Anwendung kamen hierbei

  • QUALIFY: anonymes, standardisiertes Bewertungsinstrument für Qualitätsindikatoren von Reiter et al. ([27]; Zusammenfassung s. Tab. 1),

  • DISKUSSION: offene Gruppendiskussion im Anschluss an QUALIFY.

Aufstellung der Arbeitsgruppe

Die Suche nach Teilnehmern wurde auf Fachkongressen und gegenüber dem Präsidium der DGINA (Deutsche Gesellschaft Interdisziplinäre Notfall- und Akutmedizin e. V.) und der DIVI (Deutsche Interdisziplinäre Vereinigung für Intensiv und Notfallmedizin) in den Jahren 2014/2015 kommuniziert. Ziel war es, mindestens einen Teilnehmer mit Expertise in den Bereichen Anästhesie, Chirurgie, Innere Medizin und Neurologie zu gewinnen, die gleichzeitig langjährige Erfahrung in Notaufnahmen gesammelt haben. Weiterhin sollten Experten aus dem nichtärztlichen Bereich (Pflege) sowie Vertreter der Patientensicht, Biometriker und Epidemiologen in den Prozess involviert werden (s. ESM 1).

Ablauf des Bewertungsprozesses

Jeder Teilnehmer wurde über den Ablauf informiert und erhielt rechtzeitig die notwendigen Unterlagen. Soweit möglich, wurde die Korrespondenz via E‑Mail-Dokumentenverteiler durchgeführt. In Abb. 1 wird der Ablauf beschrieben.

Abb. 1
figure 1

Ablauf des Bewertungsprozesses (QI Qualitätsindikator)

Ablauf und Auswertung QUALIFY

Vor dem Arbeitsgruppentreffen QUALIFY erfolgte zunächst eine Schulung. Im Anschluss wurden für jeden der 35 Qualitätsindikatoren jeweils alle QUALIFY-Kategorien direkt nacheinander bewertet. Diese Bewertung erfolgte durch die einzelnen Mitglieder des Expertenpanels aufgrund ihrer jeweils eigenen Erfahrung (Expertenmeinung) auf einem anonymisierten Fragebogen mittels vierstufiger Likert-Skala [27]:

  • 1 = „trifft nicht zu“,

  • 2 = „trifft eher nicht zu“,

  • 3 = „trifft eher zu“,

  • 4 = „trifft zu“,

  • Leerwert = „Enthaltung“.

Im Rahmen der Auswertung erfolgte zunächst eine Vollständigkeitsüberprüfung der Antworten. Lagen keine Enthaltungen vor, erfolgte eine Klassifizierung der einzelnen QUALIFY-Kriterien eines Qualitätsindikators hinsichtlich

  • ZiK: „Zustimmung im Konsens“ (alle Bewertungen „trifft zu“ oder „trifft eher zu“),

  • BiK: „Bedenken im Konsens“ (alle Bewertungen „trifft nicht zu“ oder „trifft eher nicht zu“).

Danach wurden die Mittelwerte der Einzelantworten der QUALIFY-Kriterien berechnet. Da es sich bei der vierstufigen Likert-Skala um ordinal skalierte Werte handelt, dient die Angabe des auf eine Dezimalstelle gerundeten Mittelwerts lediglich zur Verdeutlichung geringer Unterschiede in der Bewertung. Ergänzend zu den Auswertungsvorschriften von Reiter et al. [2, 27] erfolgte zusammenfassend eine qualitative Globalbewertung des Indikators in Gänze anhand seiner individuell ermittelten Stärken und Schwächen:

  • 1 = STÄRKEN ÜBERWIEGEN,

  • 2 = STÄRKEN MIT PUNKTUELLEN SCHWÄCHEN,

  • 3 = SCHWÄCHEN MIT PUNKTUELLEN STÄRKEN,

  • 4 = SCHWÄCHEN ÜBERWIEGEN.

Ablauf und Auswertung DISKUSSION

Alle Mitglieder der Arbeitsgruppe kommentierten die Qualitätsindikatoren in einem E‑Mail-Verfahren. Parallel wurden die Kommentare an die Arbeitsgruppe zurückgespiegelt. Auf dem anschließenden Präsenztreffen wurde eine offene Diskussion mit der Möglichkeit, Änderungsvorschläge einzubringen, geführt. Zum Ende der Diskussion jedes einzelnen Qualitätsindikators wurde ein qualitatives Statement der Gruppe konsentiert:

  • 1 = PRÄZISIERUNG (P.): Stärken überwiegen nach Festlegung eindeutiger Definitionen für die zu bewertenden Merkmale des Indikators.

  • 2 = MODIFIKATION (M.): Stärken überwiegen nach inhaltlicher Modifikation und Definition des ursprünglichen Indikators.

  • 3 = BEDENKEN (B.): Schwächen überwiegen, sodass Bedenken bei der Verwendung des Indikators in einer Notaufnahme als Qualitätsindikator bestehen. Es kann kein Konsens für eine Modifikation gefunden werden, sodass der Indikator nicht weiter operationalisiert wird.

Methodenvergleich

Die Ergebnisse der abschließenden Bewertung durch QUALIFY und DISKUSSION wurden einer Gegenüberstellung mittels Kreuztabelle unterzogen. Im Sinne einer Paralleltest-Reliabilität wurden diese Ergebnisse zur Bestimmung der internen Konsistenz mittels Cronbachs α [9, 41] verglichen. Grafiken, Tabellen und statistische Auswertung wurden mit Microsoft Office 2016 für OS X (Microsoft Corp., Redmond, WA, USA) sowie IBM SPSS Statistics Version 23 (IBM Corp., Armonk, NY, USA) erstellt.

Ergebnisdarstellung

Im Rahmen des Methodenvergleichs wurden Inhalte und Ergebnisse der Bewertung der Indikatoren bezüglich ihrer möglichen Eignung als Qualitätsindikator für die (zentrale) Notaufnahme im Sinne eines Ergebnisprotokolls sowie der Publikation eines Indikatorregisters vorgenommen.

Ergebnisse

Ein Mitglied der Arbeitsgruppe konnte nicht am anonymen QUALIFY-Prozess teilnehmen, ein anderes Mitglied war am Termin der offenen DISKUSSION verhindert. Alle Mitglieder beteiligten sich an der Kommentarsammlung via E‑Mail sowie an der abschließenden Ergebniszusammenfassung.

Vergleich der Bewertungsmethoden

Ergebnisse QUALIFY

Die Einführung in die QUALIFY-Methode benötigte 1 Stunde. Im Rahmen der 6‑stündigen Bewertung konnte die QUALIFY-Kategorie „Wissenschaftlichkeit“ (Tab. 1) wegen fehlender Datengrundlage bis auf die Kategorie W2 („Klarheit der Definition“) nicht bewertet werden. Insgesamt enthielten sich die 13 anwesenden Rater in 282 von 5915 möglichen Bewertungen (5 %). Von diesen Enthaltungen entfielen 123 auf das QUALIFY-Kriterium „P5: Erhebungsaufwand“. Die Enthaltungen auf die restlichen Kriterien verteilten sich gleichmäßig (s. ESM 2). Fehlerhafte/ungültige Bewertungen wurden nicht abgegeben.

Die Arbeitsgruppe erzielte bei der Bewertung der 35 Qualitätsindikatoren in 120 von 455 bewerteten Einzelkriterien (je 13 QUALIFY-Kriterien bei 35 Indikatoren) primär einen Konsens im Sinne einer Zustimmung/Stärke (ZiK). Zusätzlich wurde zweimal Konsens im Sinne einer Schwäche (BiK) festgestellt. Im Mittel wurde bei 3,5 von 13 QUALIFY-Kategorien (Spannweite 0–11) im ersten Durchgang ein Konsens erreicht. Mit 11-mal Konsens (ZiK) stach der Indikator (ID_149: „Zeitdauer von Erstkontakt bis Durchführung CCT bei Patienten die ein CCT erhalten haben“) hervor. Alle QUALIFY-Kategorien wurden weiterhin über die Angabe des Mittelwerts der Rater-Angaben ausgewertet. Die einzelnen QUALIFY-Kriterien unterschieden sich sowohl im Mittelwert als auch in der Häufigkeit eines primären Konsenses (Abb. 2). In Tab. 2 sind die Ergebnisse der anonymen QUALIFY-Bewertung zusammengefasst. Die zusätzlich durchgeführte qualitative Globalbewertung der Indikatoren bezüglich ihrer Eignung als Qualitätsindikatoren ergab in:

  • 34 % (12/35) STÄRKEN ÜBERWIEGEN (St. ü.),

  • 26 % (9/35) STÄRKEN MIT PUNKTUELLEN SCHWÄCHEN (St. m. p. Schw.),

  • 29 % (10/35) SCHWÄCHEN MIT PUNKTUELLEN STÄRKEN (Schw. m. p. St.),

  • 11 % (4/35): SCHWÄCHEN ÜBERWIEGEN (Schw. ü.).

Der vollständige Inhalt der Tabelle 2, inklusive aller Bewertungen aus dem QUALIFY Prozesses sowie den Ergebnissen der offenen DISKUSSION sind in ESM 3 wiedergegeben.

Abb. 2
figure 2

Durchschnittliche Bewertung der 13 untersuchten QUALIFY-Kriterien ([27]; (Tab. 1). Balkendiagramm der prozentualen Häufigkeit, wie oft ein primärer Konsens bezüglich einer Stärke (ZiK) bzw. Schwäche (BiK) erzielt wurde (rechte Abszisse). Weiterhin wird der Mittelwert ♦ des betrachteten QUALIFY-Kriteriums für alle 35 Qualitätsindikatoren angegeben (linke Abszisse: 1 = trifft nicht zu; 2 = trifft überwiegend nicht zu; 3 = trifft überwiegend zu; 4 = trifft vollständig zu)

Tab. 2 Zusammenfassung der Ergebnisse aus QUALIFY und der offenen DISKUSSION. Angegeben ist der Prozess, dem der Indikator in der Versorgung zugeordnet wurde, sowie seine ursprüngliche ins Deutsche übersetzte Formulierung. Eine vollständige Darstellung ist online zu finden

Ergebnisse der offenen DISKUSSION

Vom 18.11.2015 bis 13.3.2016 wurden 424 Kommentare und Anmerkungen zu den Indikatoren eingereicht (Mittelwert MW = 12,1 Anmerkungen pro Qualitätsindikator/Spannweite = 4–28). Diese wurden gesammelt und an die Arbeitsgruppe zurück gespiegelt. Im 8‑stündigen Arbeitstreffen DISKUSSION wurden alle Qualitätsindikatoren erneut ergebnisoffen diskutiert. Hierbei wurden

  • 46 % (16/35) der Indikatoren bezüglich Definitionen der Merkmale präzisiert und eine Empfehlung zur Anwendung als Qualitätsindikator ausgesprochen (PRÄZISIERUNG),

  • 20 % (7/35) der Indikatoren nach inhaltlicher Modifikation eine Empfehlung zur Anwendung als Qualitätsindikator ausgesprochen (MODIFIKATION),

  • 34 % (12/35) der Indikatoren wegen Schwächen für die allgemeine Anwendung als Qualitätsindikator nicht weiter operationalisiert (BEDENKEN).

Zusätzlich wurden Definitionen zur einheitlichen Verwendung der Qualitätsindikatoren erarbeitet. Sie sind zusammen mit dem vollständigen Indikatorregister als elektronisches Supplement 2 verfügbar.

Zusammenfassung des Methodenvergleichs

Von den 35 ausgewählten Indikatoren hat die Arbeitsgruppe 21 im QUALIFY-Prozess überwiegend mit Zustimmung bewertet (STÄRKEN ÜBERWIEGEN oder STÄRKEN MIT PUNKTUELLEN SCHWÄCHEN). 23 Indikatoren wurden in der DISKUSSION mit PRÄZISIERUNG oder MODIFIKATION bewertet. Hier sah die Arbeitsgruppe nach der Überarbeitung ein hohes Potenzial zur Anwendung in deutschen Notaufnahmen. Eine Aufschlüsselung der Schnittmenge beider Verfahren ist in Tab. 3 dargestellt: Die fett hinterlegten Bereiche zeigen kongruente Ergebnisse beider Verfahren mit der Aussprache der Empfehlung, den Indikator anzuwenden (20/35). In fett-kursiv hinterlegten Bereichen ergab sowohl die Bewertung nach QUALIFY mehrheitlich Schwächen und auch die DISKUSSION sah keine Möglichkeit, die Kennzahl generell für deutsche Notaufnahmen als Qualitätsindikator zu empfehlen (11/35). Unklar ist der Status in den kursiv hinterlegten Feldern der Matrix mit insgesamt 4 Kennzahlen. Kongruente Ergebnisse im positiven Sinn wie auch im Sinne einer Feststellung relevanter Schwächen hatten die beiden Methoden bei 89 % (31/35) der Qualitätsindikatoren (Cronbachs α = 0,865).

Tab. 3 Vergleich der Endbewertung des anonymen QUALIFY-Prozesses mit der offenen DISKUSSION

Ergebnisprotokoll der Indikatorbewertung

Sekundäres Ziel der Arbeit war die Publikation der Inhalte der fachlichen Beurteilung der untersuchten Indikatoren bezüglich ihrer Eignung als Qualitätsindikator für die (zentrale) Notaufnahme. In Tab. 2 ist dies im Sinne eines Ergebnisprotokolls sowohl für QUALIFY als auch für die offene DISKUSSION zusammengefasst. In Abb. 3a–c wird beispielhaft je ein Indikator aus dem ebenfalls erarbeiteten Indikatorregister gezeigt. Das vollständige Indikatorregister ist aufgrund seines Umfangs separat als ESM 2 zu diesem Beitrag publiziert.

Abb. 3
figure 3

a Indikator mit übereinstimmend festgestellten Stärken aus dem QUALIFY-Prozess sowie der offenen DISKUSSION (QUALIFY-Kriterien s. Tab. 1). b Indikator mit übereinstimmend festgestellten Schwächen aus dem QUALIFY-Prozess sowie der offenen DISKUSSION (QUALIFY-Kriterien s. Tab. 1). c Beispiel eines Indikators mit diametraler Bewertung der Stärken und Schwächen im QUALIFY-Prozess und der offenen DISKUSSION (GPCL German Presenting Complaint List; deutsche Übersetzung der CEDIS-PCL [4, 6, 16]; QUALIFY-Kriterien s. Tab. 1). BiK Bedenken im Konsens, MW Mittelwert, ZiK Zustimmung im Konsens im Rahmen des QUALIFY Prozess

Diskussion

Die vorgelegte Arbeit vergleicht erstmals zwei unterschiedliche Methoden zur Beurteilung von Qualitätsindikatoren für die Notaufnahme bezüglich ihrer jeweiligen Stärken, Limitationen sowie der Übereinstimmung ihrer Resultate. Eine besondere Stärke der Studie besteht in der interdisziplinären und -professionellen Zusammensetzung der Arbeitsgruppe.

Ergebnisse des Bewertungsprozesses

Die Basis der Bewertung bildet eine Auswahl von 35 Indikatoren. Ein möglicher Publikationsbias bei der Erstellung des zugrunde liegenden Indikatorregisters, wie er u. a. durch fehlende Publikation bei Studien mit negativem Ausgang vorkommt (z. B. die Nullhypothese stützend), ist auch hier anzunehmen [11, 19, 43]. Für die Interpretation dieser Auswertung ist das weder für die primäre Fragestellung (Methodenvergleich) noch für das sekundäre Studienziel (Ergebnisse der Indikatorbewertung) relevant, da nur eine exemplarische Auswahl bewertet wurde.

Da es sich um bereits publizierte Qualitätsindikatoren handelt, ist es bemerkenswert, dass die Arbeitsgruppe lediglich 20 von 35 Qualitätsindikatoren mit Zustimmung bewertete und bei 11 der 35 Indikatoren für die Anwendung in deutschen Notaufnahmen überwiegende Schwächen bzw. Bedenken sah.

Die Maßgaben von Reiter et al./BQS [27] und dem Ärztlichen Zentrum für Qualität in der Medizin (ÄZQ) [2], wie die Einschätzungen der Rater zu interpretieren sind, führten dazu, dass lediglich bei 27 % der QUALIFY-Bewertungen ein primärer Konsens entstanden ist (Abb. 2). Dies könnte durch die mit 14 Teilnehmern große Expertenrunde erklärt werden. Die ungleiche Verteilung sowohl von primärem Konsens (ZiK) als auch der danach berechneten Mittelwerte sehen wir ebenfalls als Folge der verschiedenen fachlichen Hintergründe der Gruppenmitglieder. Trotzdem sieht die Arbeitsgruppe es nicht als sinnvoll an, eine umfassende Bewertung von Qualitätsindikatoren für deutsche Notaufnahmen mit weniger Vertretern durchzuführen. Gerade für die zweite Methode, die offene Diskussion, wird die Größe und Zusammensetzung der Expertenrunde als Stärke empfunden.

Vergleich der Bewertungsmethoden

Vergleicht man die beiden Bewertungsmethoden mit der Zielsetzung, geeignete Qualitätsindikatoren für die Notaufnahmen zu identifizieren, kann festgestellt werden, dass mit Hilfe der QUALIFY-Methode nahezu alle Indikatoren identifiziert wurden, die im Rahmen der DISKUSSION positiv bewertet wurden (Tab. 3). Allerdings wurden während der offenen DISKUSSION drei Indikatoren, die im QUALIFY mit SCHWÄCHEN MIT PUNKTUELLEN STÄRKEN bzw. SCHWÄCHEN ÜBERWIEGEN bewertet wurden, inhaltlich modifiziert bzw. präzisiert, um damit eine anwendbare Empfehlung zu erhalten.

Eine gegenseitige Beeinflussung der Meinungsbildung konnte durch die anonyme Bewertung im QUALIFY ausgeschlossen werden. Innerhalb einer überschaubaren Zeit wurden ähnlich viele geeignete Qualitätsindikatoren ermittelt (21/35). Demgegenüber wurden 23 Qualitätsindikatoren in einem zeitlich längeren Prozess durch die E‑Mail-Debatte und der anschließend geführten offenen Diskussion als generell anwendbar identifiziert. Im Gegensatz zur strukturierten QUALIFY-Methode wurden im Rahmen der offenen DISKUSSION jedoch zusätzlich die publizierten und oft nicht eindeutig definierten Qualitätsindikatoren in 16 Fällen bezüglich Ein-/Ausschlusskriterien, Berechnung von Zeitfenstern etc. präzisiert. In 7 Fällen wurden die Indikatoren zusätzlich inhaltlich modifiziert (Tab. 2 und ESM 2).

Übertragbarkeit

Wesentlich für die Übertragbarkeit der Ergebnisse ist die Schulung aller Teilnehmer im QUALIFY-Prozess. Es wird angenommen, dass die gewählte Zusammensetzung der Arbeitsgruppe einerseits ausreichend interdisziplinär und interprofessionell und andererseits noch nicht zu groß war. Lediglich das Fehlen von Gesundheitsökonomen wurde kritisiert. Da andere Gruppenzusammensetzungen zu anderen Interpretationen und Bewertungen führen könnten, halten es die Autoren für wichtig, zu jedem bewerteten Indikator auch die Zusammensetzung der Arbeitsgruppe und Maßzahlen der Bewertung (z. B. Verteilung von primär erreichtem Konsens/Mittelwerten/Stimmenthaltungen) anzugeben.

Limitationen

Die vorliegende Studie vergleicht Vor- und Nachteile der offenen Diskussion mit einer standardisierten Bewertung von Qualitätsindikatoren für die Notaufnahme. Hierbei wird ausschließlich die von Reiter et al. publizierte QUALIFY-Methode in einer erweiterten und modifizierten Form verwendet; andere Methoden wurden nicht betrachtet [5, 8, 14]. Auch ist zu vermuten, dass eine andere Zusammensetzung der Expertengruppe zu anderen Ergebnissen bei beiden Methoden führen könnte.

Einschränkend muss auch betont werden, dass die QUALIFY-Methode ursprünglich keine abschließende Bewertung des Qualitätsindikators per se vorsah. Ziel von QUALIFY war vielmehr, Stärken und Schwächen in mehreren Kriterien der drei Kategorien Relevanz (R1–R3), Wissenschaftlichkeit (W1–W8) und Praktikabilität (P1–P9) zu ermitteln. So ist die Bewertung des Qualitätsindikators im Ganzen im Rahmen dieser Arbeit lediglich als Hinweis für eine gute Anwendbarkeit zu verstehen. Hierbei handelt es sich um eine Modifikation des ursprünglichen QUALIFY-Verfahrens.

Gerade die Interpretation der QUALIFY-Bewertungen erfordert große Umsicht: Unklar bleibt, ob ein primärer Konsens (ZiK/BiK) stärker zu bewerten ist als die sekundär berechneten Mittelwerte. So erlangte der Indikator „Behandlung Schwerstverletzter im Schockraum“ (ID_102) trotz übereinstimmend positiver Bewertung seiner Stärken in nahezu allen QUALIFY-Kriterien in keinem Bereich einen primären Konsens. Andererseits kann es passieren, dass selbst ein sehr hoher Wert der Einzelbeurteilung (z. B. alle abgegebenen Bewertungen „trifft zu“) nicht mit „primärem Konsens (ZiK)“ bewertet wird, falls nur ein Rater (Teilnehmer) kein Votum abgibt (z. B. Kriterium P8 bei „Massentransfusionsprotokoll verfügbar“ [ID_040] oder „Thromboseprophylaxe bei Traumapatienten“ [ID_020]), ein Umstand, der bei 31 der 455 Bewertungen zum Tragen kam. Weiterhin fehlt eine quantitative Bewertungsvorschrift, ab wann eine Kennzahl als Qualitätsindikator geeignet ist. Die globalen Bewertungen der vorliegenden Zusammenfassungen (Tab. 2 und 3 und ESM 2) sind daher als qualitative Schlussfolgerungen im Sinne eines Best-Practice-Ansatzes zu verstehen.

Abschließend muss bezüglich der Interpretation beider Methoden festgestellt werden, dass es gute Gründe geben kann, dass Indikatoren wie beispielsweise „Anteil weiterverlegter Patienten“ (ID_025), welche in beiden Methoden mehrheitlich mit Schwächen bezüglich der Anwendung als Qualitätsindikator bewertet wurden, in der individuellen Klinik durchaus sinnvoll als Kennzahlen angewendet werden können. Ein kritisches Votum schließt die Verwendung in keinem Fall aus.

Dies gilt v. a., da bisher zu keinem Qualitätsindikator wesentliche wissenschaftliche Aspekte aufgrund fehlender nationaler Datengrundlage vorliegen. Sobald diese Echtdaten vorhanden sind, muss eine erneute Bewertung, insbesondere der Messeigenschaften der Indikatoren sowie der Praktikabilität erfolgen. Bis dahin ist das vorgestellte Indikatorregister (ESM 2) als vorläufig anzusehen.

In dieselbe Richtung zielt der Aspekt, dass die hier betrachteten 35 Indikatoren keinen umfassenden Blick auf die Qualität einer (zentralen) Notaufnahme an sich erlauben. Die aus einer systematischen Literaturrecherche gezogene Auswahl von 35 Indikatoren beleuchtet zwar viele Prozesse (Tab. 2) einer Notaufnahme punktuell, jedoch bleiben weiterhin „blinde Flecken“, die es zu schließen gilt [2].

Ausblick

Wie in den Limitationen erläutert, müssen Qualitätsindikatoren kontinuierlich weiterentwickelt und an den aktuellen Stand der medizinischen Versorgung angepasst werden [1]. Zur kontinuierlichen Entwicklung des Notaufnahme-Indikatorregisters schlagen die Autoren die Fortführung der begonnenen Arbeit vor. Als mögliche Quellen dienen:

  • weitere international bereits erfolgreich angewendete Qualitätsindikatoren [19],

  • national angewendete Qualitätsindikatoren aus anderen Bereichen der medizinischen Versorgung (z. B. Qualitätsindikatoren-Thesaurus des GKV-Spitzenverbandes, QUINTH) [34],

  • evidenzbasierte Leitlinien [25, 32] sowie

  • v. a. interdisziplinär/-professionell neu entwickelte und an die Besonderheiten nationaler Notaufnahmen angepasste Qualitätsindikatoren [22].

Bezüglich der Identifikation potenzieller Kandidaten muss diskutiert werden, ob zukünftig ein sequenzielles Vorgehen vorteilhaft wäre: zunächst Durchführung eines standardisierten Screenings möglicher Indikatoren (z. B. mittels QUALIFY), um dann in einem zweiten Schritt die erfolgversprechenden Kennzahlen mittels offener DISKUSSION weiter zu operationalisieren. Allerdings muss bedacht werden, dass bei diesem Vorgehen 9 % (3/35) der Indikatoren aus unserer Studie übersehen worden wären.

Kliniken werden weiterhin aufgefordert, diejenigen Indikatoren mit Priorität in der Praxis zu erproben, die sowohl in der Bewertung nach QUALIFY als auch in der offenen DISKUSSION positiv bewertet wurden (Tab. 2 und ESM 2). Spezielles Augenmerk sollte dabei auf ihre Wissenschaftlichkeit gelegt werden. Hierzu gehören u. a. die Festlegung von Referenzbereichen, Risikoadjustierungen sowie eine geeignete Ergebnisdarstellung [5, 33]. Zur Verstetigung dieser Vorhaben strebt die Arbeitsgruppe eine internationale Erweiterung um Mitglieder aus Österreichischen und Schweizer Notaufnahmen an.

Fazit

Anhand einer Auswahl international publizierter Qualitätsindikatoren für die Notaufnahme wurden zwei Bewertungsmethoden miteinander verglichen. Die standardisierte, anonyme Bewertung nach QUALIFY erlaubt die schnelle Identifikation der Stärken und Schwächen potenzieller Qualitätsindikatoren. Die offene DISKUSSION ist weniger strukturiert, schlechter reproduzierbar und zeitaufwändiger. Letztendlich ist sie aber zielführender, da sie nicht nur potenzielle Qualitätsindikatoren identifiziert, sondern als Ergebnis ausformulierte, eindeutig definierte und operationalisierbare Indikatoren liefert. Dabei haben beide Methoden mit 89 % einen hohen Grad an Übereinstimmung. Zukünftige Arbeitsgruppen sollten sich überlegen, potenzielle Indikatoren zunächst mit einem standardisierten Verfahren (z. B. QUALIFY) zu screenen, um dann positiv bewertete mittels ausführlicher Diskussion zu präzisieren. Alle im Rahmen dieses Methodenvergleichs erarbeiteten Qualitätsindikatoren stehen über ein Indikatorregister mit Beschreibung ihrer spezifischen Stärken, aber auch ihrer Schwächen zur Verfügung. Vor der Implementierung der hier bewerteten Qualitätsindikatoren in verpflichtenden Qualitätssicherungsprogrammen steht ihre wissenschaftliche Evaluation anhand von Daten deutscher Notaufnahmen aus.