Massenanfälle von Verletzten (MANV) sind geprägt von einem Missverhältnis zwischen Anzahl der Patienten und den verfügbaren Ressourcen. Um diejenigen Patienten zeitig zu erkennen, die eine Behandlung am dringendsten benötigen, existieren diverse Vorsichtungsalgorithmen. Aktuelle Studien zeigen, dass diese Algorithmen noch Mängel in der Genauigkeit der Detektion von Patienten mit Sichtungskategorie I (SK I, rot) haben [8, 12]. Ziel dieser Arbeit ist es, den Einfluss der Reihenfolge der einzelnen Schritte innerhalb der Algorithmen auf die Detektion der Patienten der SK I (rot) zu untersuchen.

Einführung

Großschadenslagen wie Großbrände, Busunfälle oder CBRN-Lagen stellen die betreffenden Behörden und Organisationen mit Sicherheitsaufgaben (BOS) regelmäßig vor organisatorische Herausforderungen. Kommt es dabei zu einem MANV, können individualmedizinische Prinzipien aufgrund des Ressourcenmangels nicht mehr angewendet werden. Das Ziel besteht dann darin, möglichst vielen Patienten das Überleben zu sichern [10]. Die Vorsichtung stellt hierbei einen entscheidenden Prozess dar. Die Patienten werden dabei frühzeitig durch nichtärztliches Personal in die Sichtungskategorien (SK) I–III kategorisiert. Das Kriterium für die Sichtungskategorie I (SK I, rot) ist dabei, dass die Erkrankung oder das Verletzungsmuster für den Patienten eine konkrete Lebensbedrohung darstellt [2]. Diese Patienten müssen zügig einer geeigneten Klinik zugeführt werden, um dort die überlebenssichernde Therapie zu erhalten. Die Vorsichtung ist dabei von einer sehr hohen emotionalen Belastung für die Einsatzkräfte geprägt, da innerhalb von kurzer Zeit eine genaue Beurteilung des Zustands des Patienten erfolgen muss, vor dem Hintergrund, dass nicht genügend Ressourcen existieren. Eine falsche Kategorisierung führt jedoch zu einer Unter- oder Übertriage, je nachdem ob eine zu niedrige oder zu hohe SK vergeben wurde. Beides hat einen direkten Einfluss auf die Mortalität der Patienten [7]. Als Hilfestellung wurden diverse Vorsichtungsalgorithmen entwickelt, die einen strikten Leitfaden für die Kategorisierung darstellen [13]. Diese Algorithmen sind jedoch noch nicht ausreichend hinsichtlich ihrer diagnostischen Güte für Patienten der SK I (rot) evaluiert und sind daher Bestandteil aktueller Forschung. Wir konnten bereits in vorherigen Arbeiten zeigen, dass es zum Teil erhebliche Qualitätsunterschiede zwischen den Algorithmen gibt [8, 11]. Auffällig war dabei, dass insbesondere solche Algorithmen, welche die Gehfähigkeit als Erstes abfragen, eine hohe Spezifität aufwiesen. Basierend auf dieser Beobachtung war das Ziel dieser Arbeit, den Einfluss der Reihenfolge der Abfragen innerhalb von Vorsichtungsalgorithmen auf die diagnostische Präzision hinsichtlich der SK-I(rot)-Patienten zu evaluieren. In Abb. 1 sind exemplarisch die drei Algorithmen ASAV, mSTaRT und PRIOR dargestellt, welche wir in der vorliegenden Arbeit untersuchten.

Abb. 1
figure 1

Darstellung der Vorsichtungsalgorithmen ASAV, mSTaRT und PRIOR. Bei mSTaRT wurde in unserer Arbeit auf die letzte Abfrage „Inhalationstrauma mit Stridor“ verzichtet, da kein Patient unserer Datenbank dieses Krankheitsbild aufwies. Darstellung nach [13] in leicht modifizierter Form

Methodik

Für diese Studie wurde eine Datenbank von 500 Einsätzen der DRF-Luftrettungsstation Dresden verwendet [8, 11]. Die Genehmigung zur Auswertung der anonymisierten Daten durch die Ethikkommission des Universitätsklinikums Dresden (EK DD 270 06 2015) lag vor. Acht dieser Patienten waren bei Ankunft des Rettungshubschraubers bereits verstorben. Diese wurden aus den weiteren Analysen ausgeschlossen. Übrig blieben 492 Patienten, die durch eine Gruppe von Notärzten anhand der Einsatzprotokolle unabhängig von Algorithmen gesichtet wurden. Die daraus resultierende Sichtungskategorie (SK) verwendeten wir als Referenz. Anschließend wurden die Patienten- und Einsatzdaten in eine Excel-Datenbank (Microsoft Office 365) übertragen und die Vorsichtungsalgorithmen PRIOR [1], ASAV [3] und mSTaRT [13] in Excel-Befehle übersetzt. Dadurch konnten wir für jeden Patienten automatisch eine SK in Abhängigkeit von der Reihenfolge der Items berechnen. Die Excel-Befehle wurden entsprechend der realen Verwendung so konfiguriert, dass bei Zutreffen einer Abfrage die Vorsichtung abgebrochen und die entsprechende Kategorie vergeben wurde. Die Variation der einzelnen Abfragen/Items innerhalb der Vorsichtungsalgorithmen erfolgte anhand eines Rotationsprinzips, um die innere Logik der Algorithmen so weit wie möglich zu erhalten (Abb. 2). Innerhalb des Vorsichtungsalgorithmus mSTaRT ist an die Abfrage der Gehfähigkeit eine zweite Vorsichtungsrunde geknüpft mit Kriterien für die SK I (rot) [13]. Diese Verknüpfung wurde bei der Rotation der Items beibehalten. Nach Erstellung aller Algorithmusvarianten wurden die Originalalgorithmen und alle Variationen miteinander abgeglichen, um eine zufällige Erzeugung von identischen Vorsichtungsalgorithmen auszuschließen.

Abb. 2
figure 2

Variation der Reihenfolge der Items, beispielhaft dargestellt anhand des Vorsichtungsalgorithmus ASAV. Dargestellt sind die Originalversion sowie die ersten beiden von insgesamt 5 Variationen (ASAV_V2 und ASAV_V3). Die Reihenfolge wird anhand eines Rotationsprinzips verändert

Die errechneten SK wurden anschließend in Microsoft Excel mithilfe von Pivot-Tabellen ausgewertet. Hierbei wurden die statistischen Parameter Sensitivität, Spezifität, Youden-Index J sowie daraus abgeleitet die Unter- und Übertriage berechnet (Abb. 3). Der Youden-Index führt die beiden Parameter Sensitivität und Spezifität gleichrangig zu einem Parameter zusammen, indem diese addiert und anschließend mit dem Wert 1 subtrahiert werden [6].

Abb. 3
figure 3

Statistische Auswertung der Vorsichtungsalgorithmen mit Fokus auf die Patienten der Sichtungskategorie I

Die genauen Variationen der Vorsichtungsalgorithmen sind im Online-Supplement einsehbar.

Ergebnisse

mSTaRT

Für die internistischen SK-I(rot)-Patienten lag die Sensitivität konstant bei 68 %, die Spezifität bei 77 % und der Youden-Index bei 0,45. Die Untertriage lag konstant bei 32 % und die Übertriage bei 23 %.

Für die chirurgischen Patienten ergab sich eine Sensitivität von 84 %, Spezifität von 89 % und ein Youden-Index von 0,73. Die Untertriage lag bei 16 % und die Übertriage bei 11 %.

Für alle SK-I(rot)-Patienten zusammen erreichte mSTaRT eine Sensitivität von 74 %, eine Spezifität von 81 % und einen Youden-Index von 0,55. Die Untertriage lag bei 26 % und die Übertriage bei 19 %. Der Vorsichtungsalgorithmus mSTaRT erzielte damit sowohl für alle SK-I(rot)-Patienten kombiniert als auch für die Subgruppen internistisch/chirurgisch die geringste Sensitivität und höchste Untertriage aller Algorithmen in diesem Projekt. Allerdings war der Algorithmus der stabilste in dem Sinne, dass eine Rotation der Items innerhalb des Algorithmus keinerlei Auswirkungen hatte.

ASAV

Hinsichtlich der internistischen SK-I(rot)-Patienten lag die Sensitivität zwischen 71 und 84 %, wobei die Varianten 5 und 6 am meisten profitierten. Dem entgegen nahm die Spezifität von 78 % (Originalfassung) auf 57 % (Varianten 5 und 6) ab. Dennoch erreichte der Algorithmus in der Originalvariante die höchste Spezifität im Projekt für internistische SK-I(rot)-Patienten. Insgesamt überwog jedoch die Abnahme der Spezifität, wodurch der Youden-Index von 0,48 (höchster Wert aller Algorithmen für internistische Patienten) auf 0,41 abnahm. Dies spiegelte sich auch hinsichtlich der Unter- und Übertriage (Abb. 4) wider. Die Untertriage nahm zwar von 29 % (OV) auf 16 % (V5 und V6) ab, jedoch stieg die Übertriage umso stärker von 22 % auf 43 % an.

Abb. 4
figure 4

Unter- (a) und Übertriage (b) bezogen auf die Patienten der Sichtungskategorie I. Dargestellt sind die Originalvariante (OV) und die Versionen V2 bis V6 der Vorsichtungsalgorithmen ASAV und PRIOR. mSTaRT zeigte eine konstante Untertriage von 32 % und Übertriage von 23 % bezogen auf alle Patienten und ist hier nicht dargestellt

Für chirurgische SK-I(rot)-Patienten stieg die Sensitivität von initial 95 % (OV) auf 100 % (V3–V6) an. Dies stellt gleichzeitig die höchste Sensitivität im gesamten Projekt dar. Die Spezifität nahm von 90 % (OV) konstant auf 83 % (V5 und V6) ab. Dennoch erzielte kein anderer Algorithmus eine Spezifität von 90 % oder höher. Der Youden-Index lag zwischen 0,83 und 0,89 mit dem Maximum für die Variante 3 von ASAV. Dies war gleichzeitig der höchste Wert im gesamten Projekt. Die Untertriage nahm von 5 % (OV) auf 0 % (V3–V6) ab. Die Übertriage nahm von 10 % (OV) konstant auf 17 % (V5 und V6) zu (Abb. 4).

Für alle SK-I(rot)-Patienten kombiniert nahm die Sensitivität von ASAV von 80 % (OV) auf 90 % (V5+6) zu. Die Spezifität nahm von 83 % (OV) auf 67 % (V5+6) ab. Der Youden-Index nahm konstant von 0,63 (OV) auf 0,57 (V5+6) ab. Die Untertriage nahm von 20 % (OV und V1) auf 10 % (V5+6) ab, wohingegen die Übertriage von 17 % (OV) auf 33 % (V5+6) anstieg (Abb. 4).

Zusammenfassend lässt sich festhalten, dass eine Rotation der Items bei ASAV zu einer Verschlechterung der Performance führt. Dabei nimmt insbesondere die Übertriage zu. Dennoch erreicht die Originalvariante weiterhin die besten Ergebnisse im Vergleich zu mSTaRT und PRIOR.

PRIOR

Für die internistischen Patienten lag die Sensitivität zwischen 71 % und 87 %. Das Maximum erzielten die Varianten OV und V6. Dies war die höchste Sensitivität für internistische Patienten im Projekt. Die Spezifität lag zwischen 46 % und 75 % (Maximum V2). Dabei stellt eine Spezifität von 46 % den insgesamt niedrigsten Wert aller Algorithmen dar. Der Youden-Index erreiche Werte zwischen 0,34 (niedrigster Wert im gesamten Projekt) und 0,48. Die Untertriage lag zwischen 13 % (OV und V6) und 29 % (V2) und die Übertriage zwischen 25 % (V2) und 54 % (OV und V6, Abb. 4).

Hinsichtlich der chirurgischen Patienten lag die Sensitivität konstant bei 95 %. Die Spezifität lag zwischen 65 % (OV und V6) und 77 % (V2). Dabei erzielte PRIOR die geringste Sensitivität für die chirurgischen Patienten. Der Youden-Index lag zwischen 0,6 (OV und V6) und 0,72 (V2). Die Untertriage lag konstant bei 5 % und die Übertriage zwischen 23 % (V2) und 35 % (OV und V6, Abb. 4). Für alle SK-I(rot)-Patienten lag die Sensitivität zwischen 80 % (V2) und 90 % (OV und V6). Dabei erzielte PRIOR zusammen mit ASAV V5 und V6 die höchste Sensitivität. Die Spezifität lag zwischen 54 % (OV und V6) und 76 % (V2). Die Spezifität von OV und V6 war damit die geringste aller Algorithmen. Der Youden-Index lag zwischen 0,44 (OV und V6) und 0,56 (V2). Dabei erzielte PRIOR die geringsten Werte aller Algorithmen. Die Untertriage lag zwischen 10 % (OV und V6) und erzielte damit die geringsten Werte aller Algorithmen. Die Übertriage lag zwischen 24 % (V2) und 46 % (OV und V6) und erreichte damit die höchsten Werte aller Algorithmen (Abb. 4).

Zusammenfassend lässt sich festhalten, dass PRIOR weiterhin stark zur Übertriage neigt. Dies kann jedoch durch den ersten Rotationsschritt von OV auf V2 deutlich verbessert werden (−22 % Übertriage für alle SK-I[rot]-Patienten). Dies zeigt sich auch am Youden-Index. Der Schritt von OV zu V2 führt zu einem Anstieg von 0,12 Punkten. Dies ist der größte Sprung, den wir in diesem Projekt feststellen konnten.

„Gehfähigkeit“ am Anfang vs. am Ende

Einen besonders starken Einfluss auf die Qualität der Algorithmen hatte die Position der Abfrage nach der Gehfähigkeit. Wie in Abb. 5 dargestellt führte die Verlagerung dieser Abfrage bei ASAV zu einer deutlichen Abnahme der Spezifität (∆ = −0,15) bei gleichzeitig verbesserter Sensitivität (∆ = +0,1). Dies führte insgesamt zu einer Zunahme der Übertriage (∆ = +15 %).

Abb. 5
figure 5

Veränderung von Sensitivität und Spezifität zwischen der Originalvariante (OV) und Variante 6 (V6) von ASAV. Bei ASAV_OV steht die Abfrage nach der Gehfähigkeit am Anfang, bei V6 hingegen am Ende des Algorithmus

Dem gegenüber ist in Abb. 6 dargestellt, welchen Impact die Verlagerung der Abfrage „Gehfähigkeit“ in PRIOR hat. In der Originalvariante steht diese Abfrage am Ende, bei V2 am Anfang des Algorithmus. Es zeigte sich eine deutliche Zunahme der Spezifität (∆ = +0,22) bei relativ geringer Abnahme der Sensitivität (∆ = −0,1). Dies führte zu einer Abnahme der Übertriage von 22 %.

Abb. 6
figure 6

Veränderung von Sensitivität und Spezifität zwischen der Originalvariante (OV) und Version 2 (V2) von PRIOR. Bei PRIOR_OV steht die Abfrage nach der Gehfähigkeit am Ende und bei V2 am Anfang des Algorithmus

Diskussion

Mit dieser Untersuchung konnten wir aufzeigen, dass die Reihenfolge der Abfragen innerhalb der Vorsichtungsalgorithmen ASAV und PRIOR einen Einfluss auf die diagnostische Qualität hinsichtlich der SK-I(rot)-Patienten hat. mSTaRT zeigte allerdings keinerlei Veränderungen bei Rotation der Items. Eine mögliche Ursache hierfür wäre, dass in mSTaRT für die initial grün gesichteten Patienten eine zweite Vorsichtungsrunde vorgesehen ist, die wir in unseren Berechnungen mitberücksichtigten. Dies ist in den Algorithmen ASAV und PRIOR zunächst nicht vorgesehen [1, 3, 13].

Interessanterweise scheint jedoch genau diese Abfrage nach der Gehfähigkeit der Patienten den größten Impact auf die Qualität der Algorithmen zu besitzen. Insbesondere waren die Spezifität und Übertriage für die SK I (rot) in unserer Arbeit von der Position dieser Abfrage abhängig. Bei dem Algorithmus ASAV zeigte sich, dass die Übertriage stetig zunahm, je weiter die „Gehfähigkeit“ nach hinten rückte (Abb. 4b). Hinsichtlich der diagnostischen Qualität ergab sich gemessen am Youden-Index jedoch keine große Änderung.

PRIOR hingegen profitierte stark von der Verlagerung der „Gehfähigkeit“ an den Anfang des Algorithmus. Dies zeigt sich insbesondere in einer Zunahme der Spezifität (Abb. 6) und einer drastischen Abnahme der Übertriage (Abb. 4b). Auch die diagnostische Qualität gemessen am Youden-Index stieg durch diesen Schritt stark an. Kein anderer Rotationsschritt hat in unserem Projekt einen stärkeren Impact hervorgerufen.

Zu bedenken wäre hierbei, dass die Gehfähigkeit bei einem großen Anteil der Patienten der Schritt ist, bei dem der Algorithmus beendet wird. Dementsprechend bestimmt die Position dieser Abfrage auch häufig, wie viele Abfragen bis zur Entscheidung für SK III (grün) erfolgen. Die bloße Zu- oder Abnahme der Anzahl der Abfragen wird sich ebenfalls auf die Über- und Untertriage direkt auswirken. Dies wird verstärkt, wenn, wie bei PRIOR und ASAV, keine zweite Vorsichtungsrunde der SK-III-(grün)-Gesichteten vorgesehen ist. Wir konnten diesbezüglich bereits in einem früheren Projekt zeigen, dass sich bei fehlender Nachsichtung ein zum Teil erheblicher Anteil von SK-I(rot)-Patienten unter den initial als SK-III(grün)-gesichteten Patienten befindet [11].

Ob nun die Vorsichtungsalgorithmen aufgrund der neuen Erkenntnisse flächendeckend modifiziert werden sollten, ist anzuzweifeln. Rein rechnerisch würde man dadurch zwar potenziell eine deutlich verbesserte Vorsichtung erzielen können. Jedoch steht dem gegenüber der hohe Organisations- und Ausbildungsaufwand, alle Einsatzkräfte auf die „neuen“ Varianten zu schulen. Sinnvoller wäre es aus unserer Sicht, die verantwortlichen Führungskräfte (insbesondere OrgL und LNA) für die verschiedenen Charakteristika der Algorithmen zu sensibilisieren und ihnen dadurch Kenntnisse an die Hand zu geben, die dabei helfen, die Lage besser zu beurteilen.

Ein weiteres Problem besteht in der erfahrungsgemäß häufig mangelhaften Anwendung der Algorithmen [4, 5]. Hier wäre es interessant zu untersuchen, wie weit man die Algorithmen vereinfachen kann. Wie viele Schritte sind in einem Vorsichtungsalgorithmus überhaupt notwendig, um eine akzeptable Sensitivität und Spezifität zu erzielen? Eine Diskussion, welche Werte dabei als „akzeptabel“ angesehen werden können, wäre wünschenswert.

Unser Projekt zeigt erneut, dass die Funktionsweise der Vorsichtungsalgorithmen noch nicht ausreichend verstanden ist und es weiterer Forschung bedarf. Gleichzeitig muss die inhaltliche Weiterentwicklung der Algorithmen vorangetrieben werden. Den größten Fortschritt wird man nur durch Verbesserungen auf sowohl der Prozess- als auch der Inhaltsebene erzielen können.

Ausblick

Da es aktuell noch nicht gelungen ist, einen „idealen“ Vorsichtungsalgorithmus mit annähernd 100%iger Sensitivität und Spezifität für chirurgische und internistische Patienten zu schaffen, ist weitere Entwicklungsarbeit sowohl auf Prozess- als auch auf Inhaltsebene notwendig [8, 9]. Hierfür lohnt sich auch eine Kooperation mit weiteren nichtmedizinischen Fachrichtungen, die die Vorsichtung mit Methoden des Prozessmanagements analysieren und somit wertvollen neuen Input erzeugen.

Eine denkbare Lösung des Problems wäre eventuell ein zweistufiges Verfahren, ähnlich wie es bereits im europäischen Ausland existiert. Hierbei könnte ein Algorithmus mit sehr hoher Sensitivität zur Vorsichtung zum Einsatz kommen, gefolgt von einem hoch spezifischen zur ärztlichen Sichtung.

Alternativ wäre eine starke Vereinfachung der Algorithmen bedenkenswert. Hierzu muss untersucht werden, wie viele Schritte ein Vorsichtungsalgorithmus mindestens besitzen müsste, um eine akzeptable Sensitivität und Spezifität zu erreichen.

Fazit für die Praxis

Die Vorsichtung bei einem Massenanfall von Verletzten stellt einen kritischen Prozess für das Outcome der Patienten dar. Verantwortliche und Anwender sollten Stärken und Schwächen der Algorithmen kennen, die im eigenen Rettungsdienstbereich zum Einsatz kommen. Eine zeitnahe Nachsichtung der initial als SK III (grün) gesichteten Patienten ist essenziell.