Die SARS-CoV-2-Pandemie hat im Rahmen der ersten COVID-19-Welle im Frühjahr 2020 zu einer Spitzenbelastung der Intensivstationen mit mehr als 3500 COVID-19-Patienten im April 2020 geführt, die durch den ersten Lockdown bis Anfang Oktober 2020 auf niedriges Niveau zurückgeführt werden konnten. Der im Oktober einsetzende starke Anstieg der Infektionen führte zu einer zunehmenden Belastung der Intensivmedizin. Trotz der hohen Intensivbettenzahl drohen die Ressourcen im Winter 2020/2021 vollständig ausgelastet zu werden [1]. Im Hinblick auf eine Kapazitätssteuerung im deutschen Gesundheitswesen ist eine Planung mithilfe von Prognosemodellen zum weiteren Verlauf der COVID-19-Infektionsdynamik essenziell. Hierbei spielt die Latenzzeit bis zum Auftreten der respiratorischen Insuffizienz und Intensivpflichtigkeit eine besondere Rolle.

Integrierte Prognosemodelle für den Verlauf der Covid19-Infektion und die damit einhergehenden Belastungen für die Krankenversorgung auf Basis von SEIR(Susceptible – Exposed – Infected – Removed – Modelle)-Modellen [2,3,4,5,6] modellieren sowohl die Infektionsdynamik als auch die daraus resultierenden Belastungen in einem einheitlichen Modellsystem. Hierbei wird die Bevölkerungspopulation in Kompartimente eingeteilt mit jeweils homogener intrinsischer stochastischer Dynamik. Die Belegungen von Normalstationen, Intensivstationen sowie der Beatmungsplätze können jeweils als eigenständige Kompartimente integriert oder als separates Modell dargestellt werden. Das mittlere Verhalten des Systems wird durch gewöhnliche Differenzialgleichungen quantifiziert, deren Parametrisierung durch Anpassung an retrospektive Daten zur Infektionsdynamik und der Bettenbelegungssituation vorgenommen wird.

Modelle vom SEIR-Typ weisen in einer Pandemiephase weit unterhalb der Herdenimmunität eine intrinsische exponentielle Instabilität des Lösungsverhaltens auf. Hierdurch resultieren Unsicherheiten im Gesamtmodell, die tendenziell exponentiell mit dem Prognosehorizont wachsen. Außerdem ist die Verknüpfung der Parametrisierung durch veränderte politische Rahmenbedingungen nicht explizit integriert, sondern muss aus Daten retrospektiv geschätzt werden, wodurch ein Zeitverzug resultiert. Netzwerkbasierte Modelle [7], die das Kontaktverhalten der Bevölkerung explizit abbilden, sind in Deutschland wegen der unzulänglichen Datenlage nur sehr schwer zu parametrisieren.

Daher schlagen wir ein Belastungsmodell vor, bei dem die Dynamik des Infektionsgeschehens explizit entkoppelt wird von der Modellierung der Bettenbelegungen und nur die zu erwartende Dynamik der Bettenbelegung bei vorgegebener Infektionsdynamik simuliert wird. Das Belastungsmodell ist dabei so ausgelegt, dass es die reale Verteilung der Bettenbelegungsdauern explizit erfasst und so auch atypische Verteilungen simulieren kann. Das Modell wird dabei bis auf wenige Parameter nicht mithilfe einer gegebenen Infektionsdynamik und zugehörigen Bettenbelegungen parametrisiert, sondern mithilfe von separat erhobenen Belegungsdaten aus „Sentinel“-Kliniken. Daher ist die Identifizierung des Belastungsmodells numerisch robust, d. h., kleine Veränderungen in den Parametern und den Infektionsdynamiken können qua Design keine zeitlich exponentiell anwachsenden Auswirkungen auf die Bettenbelegungen haben. Durch unser Modelldesign wird numerische Robustheit und Prognosesicherheit gewonnen, dafür verlangt unser Ansatz eine geeignete Auswahl von „Sentinel“-Kliniken mit ausreichender Verfügbarkeit von Daten. Die vorliegende Arbeit soll zeigen, dass schon mit Daten von wenigen „Sentinel“-Kliniken mit hohen Belegungszahlen eine gute Modellqualität mit großer Generalisierbarkeit auf Länder- und Bundesebene erreicht werden kann.

Mathematische Struktur des Belastungsmodells

Das Belastungsmodell geht von einer gegebenen Infektionsdynamik, u1(t), … um(t), aus mit ui(t) als der täglichen Infektionszahl der i‑ten Altersgruppe im zu simulierenden Gebiet. ui(t) können aus Datenquellen, Prognosen oder Simulationen von Szenarien gewonnen werden.

Der Kern des Modells ist die Quantifizierung des erwarteten zukünftigen Bettenbedarfs der Kategorie k (Hospitalisierung allgemein, Intensivbett, Intensivbett mit Beatmung) zum Zeitpunkt t für einen zum Zeitpunkt t′ infizierten Patienten der Altersgruppe i quantifiziert durch die Belastungsfunktion B(t-t′,k,i), B(t-t′,k,i) = 0 für t < t′.

Die Gesamtbelastung GB(t) des Gesundheitssystems der Kategorie k im zu simulierenden Gebiet zum Zeitpunkt t ist dann eine Faltung der Belastungsfunktion B(t-t′,k,i) mit den Infektionszahlen uk(t):

$$GB_{k}\left(t\right)=\sum _{i}\int _{0}^{t}B\left(t-t',k,i\right)\cdot u_{i}\left(t'\right)dt'.$$
(1)

Abweichungen δui(t′) der Infektionsdynamik vom angenommenen Szenario ui(t) resultieren in einer Abweichung δGB(t):

$$\delta GB_{k}\left(t\right)=\sum _{i}\int _{0}^{t}B\left(t-t\mathrm{'},k,i\right)\cdot \delta u_{i}\left(t\mathrm{'}\right)dt\mathrm{'}.$$

Die Hölder-Ungleichung garantiert, dass die resultierende Abweichung stets innerhalb eines Korridors von der Breite

$$|\updelta GB_{k}\left(t\right)|\leq \sum _{i}\int _{0}^{t}B\left(t-t\mathrm{'},k,i\right)dt\mathrm{'}\cdot \max \left(\left| \delta u_{i}\left(t\mathrm{'}\right)\right| \right)$$
(1a)

liegen muss. Das Modell erlaubt daher die Berechnung von Korridoren für maximale Ausschläge der Belastung in Abhängigkeit der Infektionsdynamik unabhängig von deren konkreter Realisierung.

Die Berechnung der Belastungsfunktion B(t-t′,k,i) aus gemessenen Belegungs- und Infektionsdaten mithilfe von Maximum-Likelihood-Verfahren aus der Modellgleichung Gl. 1 ist jedoch instabil. Daher schätzen wir die Belastungsfunktion B(t-t′,k,i) direkt aus Belegungsdaten von „Sentinel“-Krankenhäusern.

Da weder der Zeitpunkt der Infektion t′ noch der genaue Zeitpunkt der Aufnahme auf die Intensivstation sowie der Beginn der Beatmung bekannt ist, muss im Modell für jede Bettenkategorie ein unbekannter Zeitverzug aus den Belegungsdaten für jede Bettenkategorie einzeln geschätzt werden. Hierfür wird die Belastungsfunktion B(t-t′,k,i) approximiert werden durch

$$B\left(t-t\mathrm{'},k,i\right)=R\left(k,i\right)\cdot \int S\left(t_{\text{aufnahme}}-t\mathrm{'},k\right)\cdot B'\left(t_{\mathrm{LoS}},k,i\right)dt\mathrm{'},$$
(2)

wobei B′(tLoS,k,i) die Verteilung der Aufenthaltsdauer der Patienten in Bettenkategorie k ist. S(taufnahme − t′,k) ist die Wahrscheinlichkeitsverteilung für den Zeitverzug zwischen Einweisung und Infektion und R(k,i) die Wahrscheinlichkeit für einen Bettenbedarf der Kategorie k für einen infizierten Patienten der Altersgruppe i.

S wurde normalverteilt um te(k) mit einer Spannbreite von 7 Tagen angenommen. Da zwischen Infektion, Erfassung der Diagnose und Einweisung ein unbekannter Zeitverzug besteht, der außerdem zeitlich leicht schwanken kann, wird te(k) aus Belegungs- und Infektionsdaten mithilfe der Gl. 1 direkt geschätzt.

Das Risiko R(k,i) wird approximiert als Produkt aus dem relativen Risiko der Altersgruppen Rrel(k,i) multipliziert mit einem von der Kategorie k abhängigen Gesamtrisikofaktor Rg(k):

$$R\left(k,i\right)=R_{g}\left(k\right)R_{\mathrm{rel}}\left(k,i\right).$$

Rrel(k,i) wird aus der Verteilung der Altersgruppen in den „Sentinel“-Kliniken und der Altersverteilung der Infektionsdynamiken geschätzt. Das absolute Risiko Rg(k) für jede Bettenkategorie wird mit Gl. 1 aus der Infektions- und Bettenbelegungdynamik geschätzt.

Für die Schätzung von Rg(k) und te(k) wird ein „least square fit“ mit Kreuzvalidierung (80 % Trainingsdaten, 20 % Testdaten) verwendet, die te(k) und Rg(k) werden als Erwartungswert der in jedem Kreuzvalidierungslauf gefitteten Parameter berechnet. Als Modellunsicherheit wird der Fehler im Testset angenommen.

Daten

In der vorliegenden Modellversion wurden zur Modellidentifizierung Daten aus den folgenden Quellen verwendet:

Infektionsdynamik

  • Dashboard Robert Koch Institut (RKI) [8]. Es wurden die verfügbaren 6 Altersstufen zur Stratifizierung verwendet, eine weitere Stratifizierung nach Geschlecht wurde nicht vorgenommen

  • tägliche Infektionszahlen (RKI) [9]: Für die jeweils letzten 14 Tage werden die relativen Fallzahlen der jeweiligen Altersgruppen berechnet und mithilfe der gemeldeten Infektionszahlen (ohne Altersstratifizierung) kalibriert, ansonsten werden die Daten direkt verwendet.

    Zur Kompensation der 7‑Tage-Periodizität der Infektionsreportings wurden die tagesaktuellen Daten geglättet. Hierzu wurden die Daten des jeweiligen Tags über die letzten 5 Wochen mit einem kubischen „spline“ interpoliert und jeder Tag durch den Median der resultierenden 7 „splines“ approximiert.

    Testintensität (RKI) [10]: Die Infektionszahlen der ersten Welle wurden entsprechend der in den RKI-Situationsberichten gemeldeten Testintensitäten korrigiert. Die Korrektur spielt keine Rolle für die Daten der zweiten Welle sowie für die Szenarioprognosen

Bettenbelegungen

  • Die Parameterschätzung des lokalen Modells für die Städteregion Aachen wurde anhand der Daten IG NRW durchgeführt

  • Für Deutschland wurden Daten des DIVI-Intensivregisters [11] verwendet. Die Simulationen für die einzelnen Bundesländer wurden mit dem an den Daten für Deutschland gesamt parametrisierten Modell ohne länderspezifische Parameteranpassung durchgeführt.

Belegungsdauern

  • Die Belastungsfunktionen B′(tLoS,k,i) wurden mithilfe von anonymisierten Patientendaten der Uniklinik RWTH Aachen (N = 451) sowie des Krankenhauses Köln-Merheim (Klinikum der Universität Witten-Herdecke; N = 66 Intensivpatienten) berechnet. Es werden nur Patienten eingeschlossen, die die Behandlung zum Zeitpunkt der Modellierung abgeschlossen haben und ab Mai 2020 aufgenommen wurden.

Implementierung und Parametrisierungsstrategie

Alle Berechnungen wurden mithilfe von MatLab, Version R2020a, The Mathworks Inc, Natick, MA, USA, Basisversion und Toolbox „Statistics and Machine Learning“, durchgeführt.

Die Schätzungen der Belastungsfunktionen B′(tLoS,k,i) sowie der Risikofunktionen wurden mit 100-fach-Bootstrapping mit jeweils 80 % der Daten durchgeführt.

Bei der Berechnung der Parameter te(k) und Rg(k) für die Städteregion wurden die gemeldeten Bettenbelegungen um die Zuweisungen von außerhalb der Städteregion für das UK Aachen als Hauptträger der Zuweisungen reduziert. Die Parameter für Deutschland wurden aus den DIVI-Intensivregisterdaten ohne Korrekturen geschätzt. Es wurde 20-fache Kreuzvalidierung mit jeweils 80/20-Splitting in Trainings- und Testdatensatz verwendet. Als Fehlerfunktion wurde für jede Kategorie der mit der absoluten Belegungszahl gewichtete quadratische relative Fehler sowohl im Training- als auch im Testdatensatz verwendet.

Modellparametrisierung

Alle Belegungsdaten wurden auf die Altersgruppen des RKI-Dashboard bezogen. Die Verteilung der Patienten des UK Aachen seit Mai 2020 mit abgeschlossener Behandlung ist in Tab. 1 dargestellt.

Tab. 1 Anzahl der Patienten im Uniklinikum der RWTH Aachen in der 2. Welle (Aufnahme ab Mai 2020) mit abgeschlossenem Krankenhausaufenthalt (Stand 23.12.2020)

Die daraus berechneten Belastungsfunktionen B′ für die Altersgruppen 4–6 sind in Abb. 1a–c dargestellt. Die zusätzlichen Daten aus Köln-Merheim ergeben keine signifikante Änderung.

Abb. 1
figure 1

Die Belastungsfunktionen B′(tLoS,k,i) quantifizieren den Anteil der Patienten je Altersgruppe i und Bettenkategorie k, die mindestens x Tage ein Bett der jeweiligen Kategorie benötigen

Das relative Risiko Rrel (k,i), geschätzt aus den Belegungsdaten des Universitätsklinikums Aachen ist in Abb. 2 dargestellt.

Abb. 2
figure 2

Relatives Risiko je Altersgruppe in Bezug auf Aufenthalt in Hospitalisierung, Intensiv- und Beatmungskategorie. Das relative Risiko ist für jede Kategorie normiert, daher sind die Werte zwischen den Kategorien nicht vergleichbar!

Wie erwartet steigt das Risiko innerhalb jeder Bettenkategorie mit dem Alter deutlich an, wobei in der Intensiv- und Beatmungskategorie der Abfall in der Altersgruppe ≥ 80 Jahre auffällt. Dieser kann jedoch auf die Patientenverfügungen zurückgeführt werden.

Mithilfe der in Abb. 1 und 2 angegebenen Verteilungen für die Parametrisierungen werden die verbleibenden Parameter te(k) und Rg(k) anhand eines Maximum-Likelihood-Schätzers mit Kreuzvalidierung identifiziert. Der relative gewichtete Fehler für die Städteregion Aachen zum Zeitpunkt 16.12.2020 liegt zwischen 10–20 % (Tab. 2):

Tab. 2 Modellierungsfehler am Beispiel der Städteregion Aachen

Der Modellfehler für die Städteregion Aachen wird stark geprägt durch lokale Spreading-Events in Alters- und Pflegeheimen. Durch die Glättung der Wochenperioden in den Meldezahlen kann das Modell nur mit einem Zeitverzug von mindestens einer Woche auf sprunghafte Ereignisse reagieren, die besonders bei der Simulation kleinerer Regionen einen deutlichen Beitrag zur Infektionsdynamik liefern. Hiervon sind besonders die Simulationen der Hospitalisierung gesamt betroffen, die ICU- und ICU-MV-Belegungen zeigen eine niedrigere dynamische Varianz.

Für die Simulation der Bettenbelegungen in Deutschland und den Bundesländern wurden die Parameter te und Rg zusätzlich mithilfe der DIVI-Intensivregisterdaten für Deutschland gesamt geschätzt. Hier ergab sich ein Modellierungsfehler im Bereich 5 % für die ICU-Bettenbelegung und 7 % für die ICU-MV-Belegung.

Die Simulationen für die Bundesländer wurden ohne weitere Parameteranpassungen durchgeführt.

Szenariosimulationen

Das parametrisierte Belastungsmodell wurde eingesetzt zur Simulation verschiedener Szenarien.

Szenario 1: Simulation von Belegungskorridoren

Als Basisszenario wird der aktuelle 7‑Tage-Infektionswert des jeweiligen Gebiets in den 6 Altersgruppen angenommen und die Basisbelegung für die 3 Belegungskategorien berechnet. Dann wird eine sprunghafte altersproportionale Erhöhung/Reduktion der Infektionszahlen ab dem jeweiligen Stichtag um 10, 25 und 50 % angenommen und die resultierenden Belegungszahlen simuliert. Dadurch ergeben sich jeweils obere und untere Schranken für die Belegungszahlen, die sich wegen der Trägheit des individuellen Infektionsverlaufs dynamisch im Verlauf von wenigen Wochen an die jeweiligen stationären Werte anpassen. Diese Korridore bilden obere und untere Schranken für die Belastungen, sodass unabhängig von der realen Infektionsdynamik diese simulierten Belastungsgrenzen nicht über- oder unterschritten werden können, solange die Infektionsdynamik den jeweiligen Schwellwert nicht überschreitet.

Die jeweiligen Simulationen für Deutschland sind Stand 22.12.2020 exemplarisch in Abb. 3 dargestellt. Die Fehlerschranken sind jeweils die oben angegebenen Modellfehler. Als Basiswert für die mittlere 7‑Tage-Inzidenz in der Woche vor dem 22.12.2020 wurde 24.800 Infektionen pro Tag berechnet. Die Belegungsdaten für eine konstante Inzidenz von 24.800/Tag ab dem 22.12.2020 werden von der blauen Kurve beschrieben. Die jeweiligen Inzidenzwerte für die Korridore sind in der Legende angegeben. Die Korridore können wie im folgenden Beispiel interpretiert werden: Bei einer täglichen Inzidenz über einen längeren Zeitraum zwischen 12.400 und 18.600 werden sich die Belegungen zwischen der untersten und der unteren roten Kurve einpendeln. Hiermit können die Belegungskorridore zur Abschätzung der Belastungen beim Stopp eines Lockdowns eingesetzt werden. Entsprechende Daten für die ICU-Belegungen der Länder sind im elektronischen Zusatzmaterial online dargestellt.

Abb. 3
figure 3

Simulation der Prognosekorridore für Deutschland gesamt, Basis 22.12.2020. Basisinfektionsrate (blaue Kurve): 24.800 Infektionen/Tag, 50 %-Schranke (magenta): 12.400 I/Tag, 75 %-Schranke (rot): 18.600 I/Tag, 90 %-Schranke: 22.310 I/Tag, 110 %-Schranke (cyan): 27.300 I/Tag, 125 %-Schranke (rot): 31.000 I/Tag, 150 %-Schranke (magenta): 37.200 I/Tag. a Hospitalisierung, b ICU-Belegung, c ICU- & MV-Belegung

Szenario 2: Simulation von Lockdownmaßnahmen

Im Gegensatz zur Simulation der Prognosekorridore, bei der keine Modellierung der Infektionsdynamik notwendig war, ist die Simulation von dynamischen Szenarien mit einem zusätzlichen Fehler für die Annahmen des Szenarios versehen. Die Infektionsdynamik eines Szenarios kann epidemiologischen Modellen oder datengetrieben aus Analogien mit früheren/ausländischen Lockdowns geschätzt werden. Die Szenariosimulationen sind weniger als quantitative Prognose geeignet, sondern können primär zur Durchführung von Sensitivitätsstudien als auch zur Schätzung von Ober- und Untergrenzen für zu erreichenden Steuergrößen dienen.

Als Beispiel sei hier eine Simulation mit einem Lockdownszenario demonstriert, das analog zur Dynamik des Herbstlockdowns in Frankreich simuliert wurde. Hierzu wurde angenommen, dass sich bis zur Aktivierung des Lockdowns die aktuelle Infektionsdynamik in allen Altersgruppen unverändert fortsetzt. Aus den französischen Infektionsdaten [12] wurde der niedrigste durch den Lockdown in Frankreich erreichte R‑Wert berechnet. Als Dynamik des lockdowninduzierten Übergangs von hohem zu niedrigem Ziel-R-Wert wurde eine exponentielle Dynamik angenommen, deren Parametrisierung aus den Daten des November-Lockdowns aus Deutschland geschätzt wurde. Hieraus wurden die resultierenden Infektionszahlen ulockdown(t) als Lösung einer dynamischen Folge simuliert und mithilfe des parametrisierten Modells die resultierenden erwarteten Bettenbelegungen in jeder Kategorie simuliert.

Als Beispiel können die Intensivbettenbelegungen für den Start des Lockdownszenarios ab dem 16.12. simuliert werden (Abb. 4).

Abb. 4
figure 4

Simulation der Bettenbelegung der Intensivstationen in Deutschland für variable Startdaten eines harten Lockdowns

Ein weiteres Beispiel ist die Simulation der Konsequenzen von „weichen“ vs. „harten“ Lockdownszenarien am Beispiel des zweiten Lockdowns in Österreich. Es wird dabei der Start am 16.12. simuliert mit Parametrisierung des zweiten Lockdowns in Österreich sowie 50 und 25 % Effizienz (Abb. 5). Alle simulierten Lockdownszenarien führen zu einem R‑Wert kleiner 1 und damit zu einem mehr oder weniger schnellen Abklingen der Infektionsdynamik. Bis zum 24.12. ist eine Diskriminierung zwischen den Lockdownszenarien nicht sicher erreichbar. Der beobachtete Anstieg der geglätteten Daten sind stark beeinträchtig durch den erheblichen Zeitversatz zwischen Infektion und Reporting.

Abb. 5
figure 5

Simulation der ICU-Belegungen bei hartem Lockdown, 50 % Effizienz und 25 % Effizienz (a). Die Parametrisierung anhand der Belegungsdaten wird mit Daten vor dem 15.12.2020 durchgeführt. Die simulierten jeweiligen Infektionsdynamiken werden zusammen mit den RKI-Daten (roh und geglättet) bis zum 10.01.2021 in b dargestellt

Resümee

Das vorgestellte Belastungsmodell erlaubt die Simulation der Bettenbelegung in den Kategorien Krankenhaus, Intensivstation und Intensivstation mit mechanischer Beatmung für beliebige Szenarien der Infektionsdynamik. Der Schwerpunkt des Modells ist die numerisch robuste Simulation der resultierenden Bettenbelegungen ohne exponentielles Wachstum der Unsicherheiten. Dies wird durch die weitgehende Schätzung der Modellparameter aus separaten Daten von „Sentinel“-Klinken erreicht. Es erlaubt eine numerisch stabile Simulation von Infektionsszenarien und eignet sich als Simulator bei Optimierungsfragestellungen. Es ist daher nicht als Ersatz, sondern als Ergänzung zu den etablierten epidemiologischen Modellen der Infektionsdynamik zu sehen.

Trotz der numerischen Stabilität des Modellansatzes bleiben für eine breite Nutzung, insbesondere für die lokale Simulation, offene Herausforderungen zu lösen: Die Belastungsfunktion wurde bisher auf Basis von Daten der Uniklinik der RWTH Aachen und des Krankenhauses Köln-Merheim berechnet. Auch wenn die Fallzahlen ausreichend erscheinen und beide Kliniken als repräsentativ für entsprechende Maximalversorger in Deutschland für COVID19-Patienten gelten können, sind für eine robuste Prognose insbesondere in ländlich geprägten Gebieten weitere repräsentative Daten erforderlich.

Eine weitere Unsicherheit liegt in der Konstanz der Datenqualität, insbesondere der Infektionsdaten, die durch Meldeverzug sowie limitierte Laborkapazitäten einen variablen zeitlichen Verzug haben können.

Des Weiteren enthalten die Simulationen durch die wochenperiodischen Glättungen einen Zeitverzug, der besonders bei lokalen Simulationen bei lokalen Outbreak-Events zu zeitverzögerten Prognosen führen kann.

Insgesamt konnten wir zeigen, dass eine Modellierungsstrategie, die die Modellierung der Infektionsdynamik von der Modellierung der resultierenden Bettenbelegungen numerisch und datentechnisch entkoppelt, zu einer deutlichen Reduktion der Prognosefehler beitragen kann und für Szenariosimulationen geeignet ist. Eine systematische Weiterentwicklung in Richtung einer breiten, lokalen Nutzung, auch für zukünftige Infektionslagen, erfordert jedoch die systematische Verfügbarkeit entsprechender Versorgungsdaten aus einem breiteren Panel von „Sentinel“-Kliniken und unterstreicht damit die Bedeutung einer landesweiten Koordination der Datenverfügbarkeit für Forschung und Versorgung.