Hintergrund

In Deutschland wird derzeit geprüft, ob und wenn ja unter welchen Voraussetzungen der Bluttest auf die Trisomien 13, 18 und 21 von den gesetzlichen Krankenkassen gezahlt werden soll. In diesem Zusammenhang hatte der Gemeinsame Bundesausschuss (G-BA) das Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) mit der Bewertung der diagnostischen Eigenschaften von NIPT beauftragt. Der G‑BA ist das höchste Beschlussgremium der gemeinsamen Selbstverwaltung im deutschen Gesundheitswesen, der in Form von Richtlinien bestimmt, welche medizinischen Leistungen die ca. 73 Mio. Versicherten beanspruchen können. Das IQWiG ist ein unabhängiges Institut, das im Auftrag des G‑BA fachlich unabhängige, evidenzbasierte Gutachten erstellt, so beispielsweise zu Arzneimitteln und nicht medikamentösen Behandlungsmethoden und Verfahren der Diagnose und Früherkennung. Während zeitgleich auf politischer Ebene das Für und Wider auch und gerade in Hinblick auf ethische Implikationen diskutiert wurde und noch wird [7], sollte das IQWiG allein die Frage beantworten, wie genau die auf dem Markt stark beworbenen und für Selbstzahlerinnen längst verfügbaren Tests sind und wie es sich auswirkt, wenn diese Tests angewendet werden. Die Beleuchtung ethischer Implikationen war nicht Gegenstand des Auftrages [17].

Methoden

Die Methodik für dieses systematische Review wurde prospektiv festgelegt, als Berichtsplan veröffentlicht und öffentlich zur Anhörung gestellt. Der Bericht wurde sodann nach Abschluss des 2. Anhörungsverfahrens fertiggestellt [17].

Zur Bewertung der diagnostischen Eigenschaften wurden Studien mit schwangeren Frauen herangezogen. Den Indextest bildeten die NIPT mittels molekulargenetischer Analyse von cffDNA im mütterlichen Blut zur Bestimmung des Risikos für die Trisomien 13, 18 und 21. Als Referenztest galten die zytogenetische Diagnostik (pränatal nach invasiver Gewebeentnahme durch Amniozentese, Chorionzottenbiopsie oder Chordozentese beziehungsweise postnatal) oder die postnatale klinische Untersuchung.

Für die Untersuchung wurden Studien betrachtet, aus denen die personenbezogenen Vierfeldertafeldaten zur Berechnung der diagnostischen Eigenschaften im Hinblick auf die Trisomien 13, 18 und 21 ableitbar waren. Studiendaten ohne beobachtetes Ereignis wurden in der Auswertung nicht berücksichtigt. Es wurden prospektive diagnostische Kohortenstudien in die Bewertung eingeschlossen. Hinsichtlich der Studiendauer bestand keine Einschränkung.

Eine systematische Literaturrecherche nach Primärliteratur und nach relevanten systematischen Übersichten wurde in verschiedenen Datenbanken durchgeführt. Darüber hinaus wurden Studienregister, vom G‑BA übermittelte Dokumente, die Sichtung von Referenzlisten, aus Anhörungsverfahren zur Verfügung gestellte Dokumente und Autorenanfragen berücksichtigt.

Die Ergebnisse der Studien wurden mithilfe von bivariaten Metaanalysen quantitativ zusammengefasst. Zur Überprüfung der Robustheit der Schätzungen wurden Sensitivitätsanalysen durchgeführt. Hierfür wurden die gepoolten Schätzungen der Studien mit niedrigem Verzerrungspotenzial sowie die gepoolten Schätzungen der Studien, in denen nach eigenen Angaben ausschließlich Risikoschwangerschaften betrachtet wurden, den gepoolten Schätzungen aller Studien gegenübergestellt.

Für jede der 3 untersuchten Arten von Trisomien wurde eine separate Aussage zu den jeweiligen diagnostischen Eigenschaften getroffen. Basierend auf dem Ergebnis der Bewertung, erfolgte eine zusätzliche Berechnung hypothetischer Szenarien zur Abschätzung des Einflusses der möglichen Anwendung der NIPT z. B. auf die falsch-positive Rate des NIPT oder die Anzahl invasiver Eingriffe. Die Datenquellen der für die Berechnung erforderlichen Schätzungen (Inzidenzen) und Annahmen wurden mit einer orientierenden Recherche identifiziert. Die Quellen wurden insbesondere anhand der Kriterien Repräsentativität und Aktualität bewertet.

Ergebnisse

Ergebnisse der umfassenden Informationsbeschaffung

Die Informationsbeschaffung identifizierte 23 prospektive diagnostische Kohortenstudien (27 Dokumente) als relevant für die Fragestellung der vorliegenden Bewertung der diagnostischen Eigenschaften der NIPT (Tab. 1). Des Weiteren wurden 9 laufende, 3 abgeschlossene und 2 Studien mit unklarem Status ohne berichtete Ergebnisse identifiziert [17]. Die letzte Suche fand am 14.12.2017 statt (Abb. 1).

Tab. 1 Studienpool der Bewertung
Abb. 1
figure 1

Ergebnis der bibliografischen Recherche und der Studienselektion.

Die vorliegenden Informationen geben keine Hinweise darauf, dass ein Publication Bias vorliegt.

Beschreibung der Datengrundlage

Die 23 eingeschlossenen prospektiven diagnostischen Kohortenstudien wurden (sofern ersichtlich) zwischen September 2009 und Oktober 2016 durchgeführt. Sie schlossen jeweils zwischen 87 und 18.955 schwangere Frauen ein. Mehrheitlich wurden in den Studien ausschließlich Frauen mit Einlingsschwangerschaften untersucht.

Neun der 23 Studien betrachteten Studienteilnehmerinnen mit und ohne erkennbar erhöhtes Risiko für eine Trisomie 13, 18 und/oder 21, die übrigen Studien insbesondere schwangere Frauen im Alter ab 35 Jahren oder mit anderweitig erhöhtem Risiko. Häufig wurden jedoch keine Grenzwerte genannt, und die Kriterien zur Definition einer Risikoschwangerschaft variierten zwischen den einzelnen Studien. Das Alter der Studienteilnehmerinnen zum Zeitpunkt der NIPT-Blutentnahme lag studienübergreifend, sofern als Median oder Mittelwert angegeben, zwischen 29 und 37 Jahren und das Gestationsalter zwischen der 8. und der 40. SSW. Angaben zu den familiären Risiken chromosomaler Anomalien fanden sich nur in wenigen Publikationen.

Als Indextests wurden in einigen Studien am Markt erhältliche NIPT verwendet, während in den übrigen Studien lediglich die angewendeten molekulargenetischen Verfahren genannt wurden.

Als Referenztest wurde in allen Studien – in manchen nur nach auffälligem NIPT – pränatal eine invasive zytogenetische Diagnostik mittels Amniozentese, Chorionzottenbiopsie oder auch mittels Chordozentese durchgeführt. Diese erfolgten zumeist erst nach der Blutentnahme zur cffDNA-Analyse. Bei Studienteilnehmerinnen, die die invasive pränatale Diagnostik nicht durchliefen, wurde beim Neugeborenen eine zytogenetische Untersuchung mittels Blutentnahme oder eine klinische Untersuchung mit Bestimmung des Phänotyps durchgeführt.

Zur Bewertung der diagnostischen Eigenschaften der NIPT hinsichtlich der Trisomien 13, 18 und 21 wurden die Sensitivitäten und Spezifitäten berechnet. Für eine [4] der 23 eingeschlossenen Studien wurden die Daten als nicht verwertbar eingestuft. Somit waren nur die Ergebnisse aus 22 der 23 eingeschlossenen Studien verwertbar.

Das Verzerrungspotenzial nach QUADAS‑2 (Quality Assessment of Diagnostic Accuracy Studies included in Systematic Reviews; ein Werkzeug zur Bewertung der Qualität diagnostischer Genauigkeitsstudien) auf Studienebene wurde für 5 [2, 15, 23, 33, 41] der 22 verwertbaren Studien als niedrig und für 17 Studien als hoch eingestuft (zu Einzelheiten vgl. [17]).

Die Übertragbarkeit der Studienergebnisse auf die vorliegende Fragestellung war für alle verwertbaren 22 Studien gewährleistet.

Ergebnisse der Bewertung der diagnostischen Eigenschaften

Die Identifikation der Trisomien 13 und 18 wurde nicht in allen Studien untersucht oder es wurden keine verwertbaren Ergebnisse berichtet, sodass diese Ergebnisse nicht dargestellt und die jeweilige Sensitivität und Spezifität nicht berechnet wurden. Insgesamt konnten aber Daten aus 18 Studien zur Identifikation der Trisomie 18 und aus 12 Studien zur Identifikation der Trisomie 13 herangezogen werden.

In den 12 verwertbaren Studien lag die Punktschätzung der Sensitivität zur Identifikation der Trisomie 13 zwischen 0 und 100 % und die der Spezifität zwischen 99,8 und 100 %. Die gepoolte Sensitivität lag in der metaanalytischen Auswertung bei 87,47 % (95 %-KI: [58,86 %; 97,15 %]) und die gepoolte Spezifität bei 99,97 % (95 %-KI: [99,88 %; 99,99 %]).

Zur Identifikation der Trisomie 18 lag die Punktschätzung der Sensitivität in den 18 verwertbaren Studien zwischen 50 und 100 %. Die Punktschätzung der Spezifität lag zwischen 99,8 und 100 %. Die gepoolte Sensitivität lag in der metaanalytischen Auswertung bei 93,01 % (95 %-KI: [88,13 %; 95,98 %]) und die gepoolte Spezifität bei 99,94 % (95 %-KI: [99,87 %; 99,97 %]).

Die Punktschätzung der Sensitivität zur Identifikation der Trisomie 21 lag über alle 22 verwertbaren Studien hinweg zwischen 92,9 und 100 %. Die der Spezifität lag zwischen 99,7 und 100 %. Die gepoolte Sensitivität lag in der metaanalytischen Auswertung bei 99,13 % (95 %-KI: [97,39 %; 99,72 %]) und die gepoolte Spezifität bei 99,95 % (95 %-KI: [99,88 %; 99,98 %]).

Zur Überprüfung der Robustheit der Schätzungen aus allen Studien wurden Sensitivitätsanalysen durchgeführt, in denen die Studien anhand ihres Verzerrungspotenzials und des Risikograds der Schwangerschaft gruppiert zusammengefasst wurden (Tab. 2).

Tab. 2 Ergebnisse der Sensitivitätsanalysen

Für Trisomie 13 und 18 können in Anbetracht der Breite der Konfidenzintervalle der Sensitivität in den Primäranalysen und auch auf Basis der Ergebnisse zur Sensitivität aus den Sensitivitätsanalysen die Schätzungen der diagnostischen Eigenschaften (auch aus allen Studien) nicht als robust bewertet werden.

Für Trisomie 21 zeigen die Sensitivitätsanalysen kaum abweichende Ergebnisse im Vergleich zur Schätzung aus allen Studien. Aufgrund der präzisen Schätzung für Sensitivität und Spezifität aus der Primäranalyse und auch auf Basis der Sensitivitätsanalysen, die dem Ergebnis nicht entgegenstehen, können die gepoolten Schätzungen aus allen Studien als robust angesehen und als eine präzise Schätzung der diagnostischen Eigenschaften herangezogen werden.

Bezüglich Mehrlingsschwangerschaften liegen Daten aus 4 Studien vor [8, 15, 21, 38], in denen Ergebnisse zu Zwillingsschwangerschaften separat berichtet werden. Die Ergebnisse unterscheiden sich nicht wesentlich von den Studien, die ausschließlich Einlingsschwangerschaften eingeschlossen haben oder separat über diese berichten. Auf eine metaanalytische Zusammenfassung wurde daher verzichtet.

Ergebnisse der hypothetischen Berechnungen

Zu den Berechnungen im Einzelnen siehe Tab. 1 in [17]. Die Berechnungen vermitteln einen groben Eindruck zu den Auswirkungen. Wegen fehlender Informationen, z. B. zum Grad der Inanspruchnahme derzeitiger Pränataldiagnostik, insbesondere eines Ersttrimesterscreenings (ETS), sind genauere quantitative Angaben zur deutschen Versorgungssituation nicht möglich.

Es erfolgten Abschätzungen der Testausgänge und deren Konsequenzen (invasive Diagnostik; nicht erkannte Trisomien) für 3 Szenarien: Risikoermittlung bei allen schwangeren Frauen nach aktuellem Vorgehen ohne NIPT am Beispiel von ETS, NIPT als Zweitlinien- und als Erstlinienstrategie. Bei der Risikoermittlung nach aktuellem Vorgehen nehmen alle schwangeren Frauen einen ETS-Test zur Risikoermittlung in Anspruch, aber nicht NIPT. Bei der Zweitlinienstrategie nehmen schwangere Frauen mit erhöhtem Risiko nach einer solchen Risikoeinstufung (also ETS) NIPT in Anspruch. Bei der Erstlinienstrategie nehmen alle schwangeren Frauen NIPT in Anspruch.

Die in die Berechnungen als Annahmen eingestellten Zahlen z. B. zur Inanspruchnahme der verschiedenen Tests zur Risikobestimmung und zur Inanspruchnahme der invasiven Diagnostik von jeweils 100 % beruhen nicht auf tatsächlichen Zahlen. In Abb. 2 ist dargestellt, wie sich die Inanspruchnahme der Tests zur Risikobestimmung (angegeben in %) auf die Anzahl invasiver Diagnostiken auswirkt.

Abb. 2
figure 2

Anzahl invasiver Diagnostiken bezogen auf 100.000 Schwangerschaften abhängig von der Inanspruchnahme des Ersttrimesterscreenings (ETS) und invasiver Diagnostik im Vergleich zu einer Inanspruchnahme von nicht invasiver Pränataldiagnostik (NIPD) mittels molekulargenetischer Tests und invasiver Diagnostik von 100 %.

In Abb. 2 bedeutet 50 % auf der X‑Achse beispielsweise, dass 50 % aller schwangeren Frauen eine Risikoermittlung mittels ETS bei einem Risikogrenzwert von 1:100 in Anspruch nehmen und dass von den schwangeren Frauen mit auffälligem Testergebnis wiederum 50 % eine invasive Diagnostik in Anspruch nehmen (offener Kreis).

Daten für eine realistische Darstellung im deutschen Versorgungssystem standen für die Berechnungen nicht zur Verfügung. Jedoch würde sich durch den Einsatz von NIPT die Anzahl invasiver Diagnostiken unter den betrachteten Szenarien reduzieren, wenn man unterstellt, dass alle Frauen mit auffälligem ETS einen invasiven Test in Anspruch nehmen. Genauere Aussagen über die quantitativen Auswirkungen waren jedoch nicht möglich. Weitere nicht berücksichtigte Faktoren (insbesondere die Anzahl von NIPT-Versagern mit der Folge einer invasiven Abklärungsdiagnostik, vgl. z. B. Mackie [24]) können die Einschätzung der Häufigkeit von invasiven Diagnostiken in den Szenarien verändern.

Diskussion

Mithilfe von NIPT lässt sich zuverlässig erkennen, wenn eine Trisomie 21 vorliegt. Sehr selten übersehen sie eine Trisomie 21, und noch seltener weisen sie eine Trisomie 21 aus, die sich später nicht bewahrheitet. Allerdings liefert der Test in einigen Fällen keine Ergebnisse. Wie hoch der Anteil solcher Testversager ist, konnte nicht ermittelt werden.

Für den Einsatz der Tests sind 2 mögliche Zielrichtungen ablesbar, abhängig vom Einsatz als Erstlinie oder als Zweitlinie. Wenn das Ziel ist, möglichst wenig Trisomien 21 zu übersehen, dann eignet sich der Einsatz als Erstlinie, also als Angebot für alle schwangeren Frauen, unabhängig von einem erhöhten Risiko. Das führte dazu, dass so gut wie keine Trisomie 21 übersehen würde. Auffällige Ergebnisse könnten mit invasiver Diagnostik überprüft werden, womit eine relativ hohe Anzahl invasiver Diagnostiken entstünde. Hinzu kommen die sogenannten Testversager, die die Anzahl invasiver Diagnostiken weiter erhöhen und möglicherweise dazu führen könnten, dass es dann im Vergleich zum Status quo mehr invasive Diagnostiken gibt.

Wenn das Ziel ist, die Anzahl invasiver Diagnostiken zu verringern, können NIPT bei Frauen mit erhöhtem Risiko als Zweitlinie eingesetzt werden. Damit könnten weniger invasive Diagnostiken vorgenommen werden als zurzeit und damit das Fehlgeburtsrisiko sinken. Im Unterschied zum risikounabhängigen Einsatz bei allen Frauen als Erstlinie werden dann vor allem bei Frauen mit geringem Risiko Feten mit Trisomie 21 nicht erkannt.

Die Punktschätzungen zur Sensitivität und Spezifität der vorliegenden Bewertung stimmen insbesondere zur Trisomie 21 mit den Ergebnissen anderer systematischer Übersichten überein [1, 11,12,13, 19, 24, 26, 32, 42, 43]. Auch zur Trisomie 18 sind die Ergebnisse der systematischen Übersichten (SÜs) mit den hier vorliegenden Ergebnissen weitestgehend vergleichbar, wohingegen die Punktschätzungen der SÜs zur Trisomie 13 größtenteils deutlich darüber lagen. Hierbei ist jedoch zu beachten, dass sich die Punktschätzungen zur Sensitivität für diese beiden Trisomien im vorliegenden Bericht als wenig robust erwiesen haben. Grundsätzlich können die Unterschiede zwischen den einzelnen Übersichten und im Vergleich zum vorliegenden Bericht durch abweichende Studienpools aufgrund abweichender Recherchezeiträume und Einschlusskriterien erklärt werden. So wurden für die vorliegende Bewertung – anders als beispielsweise für die SÜs Mackie [24] und Taylor-Phillips [43] – einzig prospektive Kohortenstudien herangezogen, in denen eine konsekutive Rekrutierung erfolgte und vor Studienbeginn ein prospektiv festgelegter Schwellenwert zur NIPT-Auswertung vorlag. Somit blieben u. a. frühe Studien zur Testvalidierung unberücksichtigt.

Zwei der gesichteten SÜs [12, 24] sowie weitere Publikationen ([44] sowie insbesondere Arbeiten zur Kosteneffektivität von NIPT: Hulstaert [16]; Neyt [29], Kagan [20], Benn [3], Morris [28], zu Vor- und Nachteilen verschiedener Screeningstrategien: Mersy [25]) präsentieren Modellierungen zum Einsatz von NIPT in unterschiedlichen Anwendungsstrategien. Wie auch vorliegend, führen die Schätzungen dieser Modelle zu der Vorhersage, dass bei Anwendung von NIPT als Erstlinienstrategie (im Vergleich zur herkömmlichen Versorgung ohne NIPT, insbesondere im Vergleich zum Einsatz des ETS) häufiger Trisomie 21 bei Feten erkannt wird. Bei Anwendung als Zweitlinienstrategie stützen auch diese Modelle die Vorhersage, dass der Einsatz von NIPT die Anzahl invasiver Diagnostiken im Vergleich zu einer Strategie ohne der invasiven Diagnostik vorgeschaltete NIPT verringern wird. Im EUnetHTA-Bericht [44] wurden insbesondere die Inanspruchnahme der verschiedenen Diagnostiken sowie das Testversagen von NIPT als entscheidende Faktoren benannt, die zu Verzerrungen der Berechnungen im Vergleich zum realen Versorgungskontext führen könnten.

Abweichend von den vorliegend berechneten hypothetischen Szenarien, wurde in einigen dieser Modelle als weitere Zielgröße die Lebendgeburtsrate von Kindern mit Trisomie 21 ermittelt (Mackie [24], Hulstaert [16], Neyt [29]). Dem liegt als Annahme eine Rate von Schwangerschaftsabbrüchen nach der Diagnose von Trisomie 21 zugrunde, die in den unterschiedlichen Modellen zwischen 50 % (Mackie [24]) und 95 % (Neyt [29]) liegt. Schließlich adressiert eine SÜ [44] ethische Aspekte der NIPT.

Limitationen

Aufgrund fehlender (robuster) und nicht seriös schätzbarer Daten beschränkt sich die Berechnung hypothetischer Szenarien auf die Risikoermittlung bei allen Schwangeren nach aktuellem Vorgehen (ohne NIPT), Erst- und Zweitlinienstrategie, letztere in 3 Risikogruppen.

Die Berechnung hypothetischer Szenarien für die Trisomien 13 und 18 war nicht möglich, da wesentliche Kenngrößen nicht bekannt und nur sehr unsicher bestimmbar sind (siehe Tab. 2).

Mit den Risikogrenzwerten ab 1:100, ab 1:200 und ab 1:300 werden nicht alle praxisrelevanten Risikogrenzwerte wie zum Beispiel 1:150 oder 1:1000 abgedeckt, wohl aber die wesentlichen Varianten.

Ferner ist nicht zu erwarten, dass die Annahme zutrifft, dass alle schwangeren Frauen mit erhöhtem Trisomierisiko einen NIPT und alle schwangeren Frauen mit einem positiven Ergebnis eines NIPT eine invasive Diagnostik in Anspruch nehmen werden. Auch ist unklar, ob und in welchem Ausmaß sich die NIPT-Versager auf die Anzahl invasiver Diagnostiken auswirken (vgl. z. B. Mackie [24]).

Es blieb schließlich unberücksichtigt, dass sich die Anzahl schwangerer Frauen wegen natürlicher Fehlgeburten über den Zeitraum zwischen nicht invasiver und invasiver Diagnostik verringert, was in der Versorgungsrealität Einfluss auf die Anzahl invasiver Diagnostiken nimmt.

Ausblick

Bei einer Implementierung von NIPT in die Schwangerschaftsvorsorge sind in erster Linie die möglichen Implikationen zu beachten, die ein auffälliger Befund für eine schwangere Frau, ihren Partner und den weiteren Verlauf der Schwangerschaft birgt. Vor diesem Hintergrund wurde seitens des G‑BA der Bedarf gesehen, Frauen und Paare über die in Deutschland bestehenden Möglichkeiten der Pränataldiagnostik zu informieren und damit in ihrer selbstbestimmten Entscheidung zu unterstützen. Die Erstellung einer Versicherteninformation soll dem nachkommen [18].

Auf der Grundlage des IQWiG-Berichts hat der G‑BA einen Richtlinienentwurf veröffentlicht, der seit März 2019 nun zur Stellungnahme steht [10]. Dieser Vorschlag sieht als Leistung der GKV den Einsatz von NIPT bei „besonderen Risiken oder zur Abklärung von Auffälligkeiten im Einzelfall“ vor. Er hat sich gegen die Festlegung von Kriterien entschieden, die zur Feststellung einer sogenannten Risikoschwangerschaft und damit zur Erstattungsfähigkeit von NIPT führen. Stattdessen wird vorgeschlagen, die Kosten immer dann zu erstatten, wenn „ein entsprechender Test geboten ist, um der Schwangeren eine Auseinandersetzung mit ihrer individuellen Situation hinsichtlich des Vorliegens einer Trisomie im Rahmen der ärztlichen Begleitung zu ermöglichen. Ein statistisch erhöhtes Risiko für eine Trisomie allein reicht für die Anwendung dieses Tests nicht aus“.

Inwiefern das, sofern es bei dieser Regelung bleibt, tatsächlich zum Einsatz von NIPT nur bei „besonderen Risiken oder zur Abklärung von Auffälligkeiten im Einzelfall“ führt oder aber zu einer sehr breiten Anwendung, bleibt abzuwarten.