Durch einen parteiübergreifenden Bundestagsbeschluss wurde am 28. Juni 2002 die Einführung eines bundesweiten qualitätsgesicherten, bevölkerungsbezogenen Mammographie-Screening-Programms beschlossen. Die Konzeption des bundesdeutschen Screening-Programms wurde von Anfang an eng an die Vorgaben der Leitlinie Brustkrebsfrüherkennung [8] der Europäischen Kommission angelehnt, welche durch die Pioniertätigkeit anderer europäischer Länder im Mammographie-Screening zum Zeitpunkt der Konzeption des deutschen Programms schon vorhanden war. Mit zusätzlichen Erfahrungen aus drei Pilotregionen wurde hierzulande eine neue Versorgungsstruktur parallel zu der bestehenden aufgebaut und in den Jahren 2005–2009 in Betrieb genommen: Die „Kooperationsgemeinschaft Mammographie“ wurde als bundesweit übergeordnete Stelle mit Verantwortung für die Zertifizierung und Rezertifizierung der regionalen Screening-Einheiten und für die Evaluation des bundesdeutschen Programms geschaffen. Ebenfalls neu institutionalisiert wurden fünf sog. Referenzzentren. Diese übernehmen die Aufgaben der Fortbildung des ärztlichen und nichtärztlichen Personals sowie der Überwachung der ärztlichen und nichtärztlichen Qualität, als auch der physikalisch-technischen Qualität der eingesetzten Geräte. Sie sind in den Städten Berlin, Oldenburg, Münster, Marburg und München angesiedelt.

Die bundesweite einheitliche Dokumentation eines jeden Screening-Falls ist ein wesentlicher Eckpfeiler für die Evaluation und Qualitätssicherung. Zur Vereinheitlichung hat die Kooperationsgemeinschaft Mammographie „Protokolle zur Dokumentation“ festgelegt und passt diese bei Bedarf an. Alle teilnehmenden Ärzte sind verpflichtet, jeden Screening-Fall in einer protokollkonform zertifizierten Software zu dokumentieren. Aus dieser können die Referenzzentren anonymisierte und aggregierte Daten zur qualitativen Beurteilung aller ihnen zugeordneten Screening-Einheiten herausziehen. Die Kooperationsgemeinschaft verwendet die Daten für jährliche deutschlandweite Evaluationsberichte, welche im InternetFootnote 1 jedermann zugänglich sind.

Während des flächendeckenden Betriebs seit etwa 10 Jahren unterlag das Programm ständigen Anpassungen und Erweiterungen. Es ist Ziel dieser Übersicht, anhand der Erfahrungen und am Beispiel des bundesdeutschen Mammographie-Screening-Programms jene wichtigen Lektionen herauszuarbeiten, welche jedes strukturierte bevölkerungsweite Früherkennungsprogramm beachten muss.

Welche Erkrankung und welche Untersuchungsmethode?

Vor der Einführung jeglicher Früherkennungsuntersuchung gilt es, die wesentlichen Fragen zu beantworten [4]:

  • Kann die zugrundeliegende Erkrankung durch eine Vorverlegung des Diagnosezeitpunkts hinsichtlich ihres klinischen Verlaufs entscheidend beeinflusst werden?

  • Existiert eine geeignete Testmethode, die unter dem Aspekt einer Schaden-Nutzen-Abwägung für jeden gesunden Menschen der Zielgruppe regelmäßig durchgeführt werden kann?

Nur wenn diese beiden Fragen mit hoher Sicherheit mit „Ja“ beantwortet werden können, macht die Implementierung eines Früherkennungsprogramms Sinn.

Das Mammographie-Screening senkt die Mortalität teilnehmender Frauen

Im Falle des bundesdeutschen Mammographie-Screenings hatte die „International Agency for Research on Cancer“ (IARC) der Weltgesundheitsorganisation (WHO) aufgrund der ausgewerteten Studien in verschiedenen Ländern am 12. März 2002 festgestellt, dass „in der Altersgruppe von 50 bis 69 Jahren durch ein Mammographie-Screening-Programm mit einer Reduktion der Mortalität um 35 % zu rechnen ist“ [5]. Diese Einschätzung der WHO wurde sodann in der Stufe-III-Leitlinie Brustkrebsfrüherkennung in Deutschland im Jahre 2003 übernommen, welche zwischenzeitlich in erster Überarbeitung aus dem Jahr 2008 vorliegt [1]. Auch hinsichtlich der Testmethode besteht bis zum heutigen Tage weitestgehend Einigkeit unter den beteiligten Experten, dass die Mammographie für die Erkennung von Brustkrebsvorstufen oder frühen Tumorstadien zurzeit als einzige wirksame Methode anerkannt ist (Evidenzlevel 1a, Empfehlungsgrad A). Ebenso stellt die Stufe-III-Leitlinie Brustkrebsfrüherkennung fest, dass der individuelle Nutzen der Mammographie ab dem 40. Lebensjahr die aus der Strahlenexposition ergebenden Risiken überwiegt: Das Optimum des Verhältnisses aus Nutzen und Risiko liegt zwischen dem 50. und 70. Lebensjahr (Evidenzlevel 4–5, Empfehlungsgrad A). Von der Screening-Mammographie wird erwartet, dass die Vorverlegung einer Mammakarzinomdiagnose das T‑Stadium herabgesetzt, die Wahrscheinlichkeit einer lymphogenen oder hämatogenen Metastasierung sinkt und dadurch letztlich die Mortalität in der Gruppe der Screening-Teilnehmerinnen gegenüber Nichtteilnehmerinnen reduziert wird [5]. Darüber hinaus gingen die Beteiligten davon aus, dass sich aufgrund der Früherkennung von kleineren Tumoren oder präinvasiven Stadien zusätzliche Vorteile durch eine schonendere operative Behandlung der betroffenen Patientinnen und einen niedrigeren Prozentsatz notwendiger Axilladissektionen und Chemotherapien ergeben.

Bereits kurz nach der flächendeckenden Einführung des Programms kamen jedoch zusätzliche Fragen auf.

Wie hoch sind Sensitivität und Spezifität der Früherkennungsmethode?

Bei Screening-Untersuchungen ist mit Sensitivität der Prozentsatz der richtig entdeckten Fälle von allen Erkrankungen im untersuchten Kollektiv gemeint. Unter Spezifität versteht man den Prozentsatz der als richtig gesund klassifizierten Personen von allen gesunden Personen im Untersuchungskollektiv. Um die Sensitivität und Spezifität errechnen zu können, müssen alle Erkrankungen im untersuchten Kollektiv bekannt sein. Wird eine Erkrankung im zeitlichen Abstand zwischen zwei Screening-Untersuchungen festgestellt, wird diese im Mammographie-Screening als sog. Intervallkarzinom bezeichnet. Naturgemäß kommen Intervallkarzinome nicht innerhalb eines Screenings-Programms zur Diagnose, sondern auf Betreiben der Patienten und ihrer Ärzte im kurativen Bereich. In Deutschland werden Krebserkrankungen generell flächendeckend den Krebsregistern gemeldet. Eine automatisierte Rückübermittlung an die das Screening durchführende Stelle ist jedoch nicht vorgesehen. Also mussten Möglichkeiten geschaffen werden, damit Teilnehmerinnen von Nichtteilnehmerinnen am deutschen Mammographie-Screening-Programm im Krebsregister differenziert werden können. Die Idee dabei ist, dass die Entscheidung, ob es sich um ein Intervallkarzinom handelt oder ob eine Karzinomdiagnose bei einer Nichtteilnehmerin aufgetreten ist, in der Vertrauensstelle des Krebsregisters gefällt werden kann. In den letzten 10 Jahren wurden dafür die rechtlichen Grundlagen inkl. der notwendigen Datenflüsse für die Identifizierung, Klassifizierung und Evaluation der Intervallkarzinome erarbeitet und die Krebsregistergesetze auf Landesebene entsprechend abgeändert. Nachdem dies alles implementiert ist, werden die Tumordaten der Intervallkarzinome in anonymisierter Form an die Referenzzentren zurückgemeldet. Dadurch sollen die Zentren zum einen in die Lage versetzt werden, alle Intervallkarzinome zu analysieren und daraus mögliche Schlüsse zur Optimierung des Programms zu ziehen, zum anderen soll letztlich die Programmsensitivität und -spezifizität berechenbar werden. Dieser Vorgang befindet sich aktuell in der Endphase; erste landesweite Evaluationen sind nach nunmehr 10 Jahren in einzelnen Bundesländern bereits möglich. Eine statistische Auswertung des epidemiologischen Krebsregisters in Nordrhein-Westfalen ergab für den Regierungsbezirk Münster eine Programmsensitivität von 78 % [3].

Ohne Meldepflicht der Zielerkrankung lässt sich ein Screening-Programm nicht bevölkerungsweit auswerten

Bei der Einführung eines neuen strukturierten und qualitätsgesicherten Screening-Programms für meldepflichtige Erkrankungen im Bereich Pneumologie sollte die Notwendigkeit des Registerabgleichs zeitnäher angedacht und umgesetzt werden. Fehlt eine Meldepflicht für die Zielerkrankung völlig, ist jegliche bevölkerungsweite Auswertung der neuen Screening-Methode unmöglich.

Nebenwirkungen und Belastungen im Fall einer falsch-positiven Diagnose

Jedwede Früherkennung versucht Erkrankungen von asymptomatischen Personen zur Diagnose zu bringen, im Wissen, dass die ganz überwiegende Mehrheit der Untersuchten gesund ist. Eine Testmethode kann nie perfekt sein, jeder Test hat eine Spezifität unterhalb 100 %, d. h. der Test wird mit einer gewissen Wahrscheinlichkeit auch ein positives Ergebnis liefern, obwohl der Untersuchte gesund ist. Das bedeutet, dass nach einem positiven Früherkennungstestergebnis immer Folgeuntersuchungen notwendig sind, um das Ergebnis zu erhärten oder zu negieren. So auch im Mammographie-Screening-Programm: Hat die Screening-Mammographie eine Auffälligkeit in der Brust gezeigt, wird die betroffene Frau zu einem zweiten Termin zur „Abklärungsdiagnostik“ eingeladen. Die Wiedereinbestellung zu Folgeuntersuchungen ist für die Patientin mit einer hohen psychischen Belastung verbunden und notwendige Abklärungsuntersuchungen können ihr schaden. Deswegen müssen auch dieser Prozess und seine Ergebnisse der kontinuierlichen Qualitätssicherung unterliegen. Dazu werden alle Schritte und Ergebnisse der Abklärungsdiagnostik sowie deren Dauer in der Datenbank protokolliert und regelmäßig überprüft. Zur Sicherstellung einer höchstmöglichen Qualität wurde im Mammographie-Screening-Programm das Konzept des „programmverantwortlichen Arztes“ (PVA) geschaffen, welcher für eine jeweils etwa 100.000 anspruchsberechtigte Frauen umfassende Region verantwortlich ist. Es handelt sich im Regelfall um Radiologen oder Gynäkologen, welche hauptsächlich Mammadiagnostik betreiben und eine umfangreiche Spezialausbildung durchlaufen haben. Der PVA wird dann persönlich Zusatzuntersuchungen, beispielsweise eine klinische Untersuchung, eine Ultraschalluntersuchung, ergänzende Mammographieaufnahmen, Tomosyntheseaufnahmen oder eine Magnetresonanztomographie durchführen. Ergibt sich bei dieser weiteren Bildgebung eine auffällige Läsion, wird der PVA eine minimal-invasive ultraschallgesteuerte Stanzbiopsie oder eine stereotaktische Vakuumbiopsie anordnen und somit letztlich ein histologisches Ergebnis erwirken. Durch den PVA wird schließlich die Diagnose eines Mammakarzinoms erbracht oder das Testergebnis der Screening-Untersuchung widerlegt.

Die Abklärung einer Verdachtsdiagnose sollte zeit- und ortsnah erfolgen

Vor der Einführung eines neuen Früherkennungsprogramms muss abgeschätzt werden, wie aufwändig und invasiv die notwendige Abklärungsdiagnostik wird. Die dazu notwendigen Gerätschaften und das Personal müssen von qualifizierten Ärzten und Ärztinnen zeitnah und in vertretbarer räumlicher Entfernung angeboten werden. Insgesamt 92 % der Abklärungstermine im Mammographie-Screening wurden den Frauen innerhalb von 7 Tagen angeboten [7]. Auch die mögliche Dauer einer Abklärung spielt eine Rolle: Im Mammographie-Screening lässt sich die Abklärung im Regelfall innerhalb des ersten Termins oder weniger Tage nach Erkennen einer Auffälligkeit in der Screening-Mammographie abwickeln und zum Ende bringen. Nur bei 0,4 % der untersuchten Frauen wurden Sicherheitskontrolluntersuchungen nach 6 oder 12 Monaten indiziert [7]. Würde die Abklärungsdiagnostik eines anderen Früherkennungsprogramms regelmäßige Kontrollen über einen längeren Zeitraum erfordern, wäre die psychologische Dauerbelastung solcher Folgeuntersuchungen abzuschätzen.

Welchen Stellenwert hat die Qualitätssicherung?

Im Rahmen der Rezertifizierung werden im Mammographie-Screening multiple Qualitätsparameter überprüft. Die Kategorien der externen Qualitätssicherung sind in Abb. 1 übersichtlich zusammengefasst.

Abb. 1
figure 1

Säulen der Qualitätssicherung im deutschen Mammographie-Screening-Programm. KoopG Kooperationsgemeinschaft, RZ Referenzzentren, SE Screeningeinheit, PVA Programmverantwortlicher Arzt, EUREF European Reference Organisation for Quality Assured Breast Screening and Diagnostic Services. (Bereitgestellt mit Genehmigung durch die Kooperationsgemeinschaft Mammographie)

Zum Start jeder Screening-Einheit mussten wesentliche Strukturen und Prozesse nachgewiesen werden. Im Rahmen der Ergebnisqualität wird anfangs jährlich und später alle 30 Monate ein ganzes Portfolio an Qualitätsparametern ermittelt und ausgewertet. Zur Erstellung und Befundung von Screening-Mammographien werden Personal und Geräte fortlaufend überprüft, die Mammographiegeräte sogar arbeitstäglich. In der Abklärungsdiagnostik muss der PVA eine niedrige Wiedereinbestellungsrate zur Abklärungsdiagnostik bei dennoch ausreichend hoher Brustkrebsentdeckungsrate sowie eine niedrige Quote von Rebiopsien nachweisen. Durch die Einbeziehung aller Prozessschritte in die Qualitätssicherung werden die negativen Effekte der Abklärungsdiagnostik auf das Kollektiv der Screening-Untersuchungen quantifiziert und gering gehalten. Die Ergebnisse der bundesweiten Evaluation und Qualitätssicherung werden regelmäßig veröffentlicht und liegen aktuell für das Kalenderjahr 2014 vor [7]: Allein im Jahr 2014 wurden 2,9 Mio. Frauen im Mammographie-Screening untersucht. Insgesamt 124.173 wurden zur Abklärung eines auffälligen Befunds zu weiterführenden Untersuchungen eingeladen, was einer Wiedereinbestellungsrate von etwa 4,3 % entspricht. In 73 % der Abklärungsfälle konnte ein Mammakarzinom durch weitere bildgebende Maßnahmen ausgeschlossen werden, in 27 % der Fälle, somit bei 32.988 Frauen, bestand die Indikation zur Biopsie. Setzt man diese Zahl in Relation zu der Zahl der Teilnehmerinnen, wird klar, dass bei je 100 untersuchten Frauen eine Biopsie notwendig wird.

Alle Prozessschritte der Abklärung müssen dokumentiert und evaluiert werden

Biopsien der Brust sind aufgrund der guten anatomischen Zugänglichkeit und dem Fehlen lebenswichtiger Strukturen mit einer sehr niedrigen Komplikationsrate verbunden. Dennoch wird durch die genannten Häufigkeiten klar, dass auch die Abklärungsuntersuchungen und besonders die Biopsien durch speziell geschultes ärztliches Personal vorgenommen werden müssen und innerhalb der Qualitätssicherung des Früherkennungsprogramms dokumentiert werden sollten. Etwa 50 % der Biopsien ergaben letztlich ein Karzinom.

Ohne eine flächendeckend einheitliche und vollständige Datenerfassung und Qualitätssicherung ist in jeglichem Früherkennungsprogramm die Evaluation der Wirksamkeit und der Nebenwirkungen des Programms unmöglich. Nur durch die zusätzliche externe Qualitätssicherung und Überwachung durch unabhängige Organisationen (hier die Referenzzentren und die Kooperationsgemeinschaft) werden die Daten objektiviert.

Früherkennungserfolge versus Überdiagnosen/Übertherapien

Anhand der bisher ausgewerteten statistischen Kennzahlen (Brustkrebsentdeckungsrate, Tumorstadium, Nodalstatus) sowie dem bundesweit erkennbaren Anstieg der diagnostizierten Mammakarzinome war schnell ersichtlich, dass das Screening-Programm als Früherkennungsmethode funktioniert. Abb. 2 zeigt die Brustkrebsinzidenz getrennt nach den neuen und alten Bundesländern und den Effekt durch die Einführung des Mammographie-Screenings: Wie erwartet, stieg die Anzahl der gemeldeten Neuerkrankungen durch das Programm zunächst stark an und fiel dann im Verlauf wieder ab. Zwischenzeitlich konnte sogar gezeigt werden, dass die Rate der hohen Tumorstadien und fortgeschrittener Karzinome rückläufig ist [9]. Entsprechend ist die Begeisterung der Beteiligten groß.

Abb. 2
figure 2

Brustkrebsinzidenz in den alten und neuen Bundesländern 2000–2013. (Daten mit freundl. Genehmigung der Kooperationsgemeinschaft Mammographie)

Von Kritikern des Programms wird aber in den letzten Jahren vermehrt die Thematik „Überdiagnose/Übertherapie“ in den Fokus gerückt. Bei einer Überdiagnose handelt es sich keinesfalls um eine falsche Diagnose, vielmehr beginnt eine Überdiagnose immer zunächst mit einer korrekt in einem Screening-Programm erkannten Erkrankung. In dessen Folge wird der Patient dann bezüglich der Erkrankung behandelt. Verstirbt derselbe Patient dann jedoch innerhalb der nächsten Jahre – gleich an welcher Ursache – und wäre die Erkrankung bis dahin noch klinisch inapparent geblieben, d. h. der Betroffene hätte bis zum Lebensende niemals davon erfahren, handelt es sich retrospektiv um eine Überdiagnose. Die medizinisch korrekte Therapie, welche der Patient nach der Früherkennung erhalten hatte, wird dann retrospektiv zur Übertherapie. Ohne Diagnose wären die gesamte Behandlung mit allen Nebenwirkungen, Langzeitfolgen und resultierende Kosten vermieden worden. Somit wird jedes denkbare Früherkennungsprogramm immer einen gewissen Anteil an Überdiagnosen und Übertherapien verursachen.

Jedes Screening verursacht Überdiagnosen und Übertherapie

Eine Abschätzung des prozentualen Anteils von Überdiagnosen und der damit einhergehenden Übertherapien an den korrekten Karzinomdiagnosen eines Früherkennungsprogramms ist naturgemäß schwierig. Der Anteil der Überdiagnosen im Mammographie-Screening wird höchst unterschiedlich geschätzt. So geht die EUROSCREEN Working Group [2] im Mittel von einem Anteil in Höhe von 6,5 % an Überdiagnosen von allen im Screening erkannten Mammakarzinomen aus, während das Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) auf Basis von zwei älteren Studien die Überdiagnoserate mit 17,3 % ermittelt und dahingehend die Informationsmaterialen für die Einladung zum Mammographie-Screening überarbeitet hat [6].

Das Konzept der aufgeklärten Entscheidung

Der nationale Krebsplan sieht vor, dass die zu einer Früherkennung eingeladene Bevölkerungsgruppe mit Hilfe von geeignetem Informationsmaterial so beraten werden muss, dass jeder Angesprochene für sich selbst eine informierte Entscheidung bezüglich der Teilnahme oder Nichtteilnahme an einer Früherkennungsmaßnahme fällen kann. Aufgrund dieses erklärten Ziels wurden auch die Aufklärungsmaterialien für das bundesdeutsche Mammographie-Screening sukzessive überarbeitet und jüngst in einer neuen Fassung vorgelegt [6]. In diesem Informationsmaterial werden Negativeffekte des Mammographie-Screening-Programms, beispielsweise falsch-positive Befunde, welche zur Abklärungsdiagnostik führen, aber auch die Thematik Überdiagnose und Übertherapie intensiv diskutiert. Die Darstellung dieser Themen ist naturgemäß für den medizinischen Laien und teilweise auch schon für den medizinisch Sachverständigen schwierig zu begreifen, sodass das Einladungsschreiben und das Begleitmaterial auf einen Teil der eingeladenen Frauen oftmals einen abschreckenden Effekt hat.

Letztlich ist aus dieser Erfahrung heraus die Thematik Überdiagnose/Übertherapie vor Einführung eines neuen Früherkennungsprogramms in der Pneumologie ebenfalls zu diskutieren. Je langsamer eine spezifische Erkrankung verläuft und zum Tode führt, desto besser ist die Erkrankung zwar für den Einsatz von Früherkennungsmethoden geeignet, desto stärker tendiert die Früherkennung jener Erkrankung jedoch auch zu Überdiagnosen und assoziierten Übertherapien. Dieser Effekt beeinflusst letztlich die Langzeitergebnisse eines Früherkennungsprogramms: Nach dem zu erwartenden Anstieg der Häufigkeit der Diagnosestellung einer spezifischen Erkrankung durch ein Früherkennungsprogramm (Inzidenz) wird letztlich nach vielen Jahren eine Senkung der Sterblichkeit an der spezifischen Erkrankung (Mortalität) erwartet. Diese tritt jedoch nicht ein, wenn ein überwiegender Anteil von Frühdiagnosen letztlich Überdiagnosen sind. Dem kann entgegengesteuert werden, wenn die Teilnahme an einem Früherkennungsprogramm nur bis zu einem bestimmten Lebensalter erlaubt wird. Aus diesem Grund und gemäß der WHO-Empfehlung wird im deutschen Mammographie-Screening-Programm nur bis zum vollendeten 70. Lebensjahr eingeladen. Finden zudem parallel zu der Einführung eines Früherkennungsprogramms relevante Verbesserungen der Therapie der spezifischen Erkrankung statt, kann zu einem späteren Zeitpunkt dieser Effekt auf die Mortalitätssenkung nur schwer von dem Effekt des Früherkennungsprogramms getrennt werden. Auch dadurch können Zweifel hinsichtlich der Wirksamkeit einer Früherkennungsmethode aufkommen.

Aufklärungsmaterial eines Screenings muss auch schwierige Themen vermitteln

Die teilweise öffentlich geführten Diskussionen rund um Überdiagnosen und Übertherapien im bundesdeutschen Mammographie-Screening-Programm sind für alle aktiv am Programm beteiligten Kolleginnen und Kollegen frustrierend und stehen im Gegensatz zu dem persönlichen Erleben einer erfolgreichen Früherkennung eines Kleinstmalignoms. Weil es jedoch absehbar ist, dass sich eine ähnliche Diskussion letztendlich für jedes neu eingeführte, qualitätsgesicherte Früherkennungsprogramm ergeben wird, sollte der Anteil der Überdiagnosen schon bei der Konzeption abgeschätzt werden und darüber von Anfang an aufgeklärt werden.

Fazit für die Praxis

  • Vor der Einführung eines neuen Screening-Programms in die medizinische Versorgung sind grundlegende Überlegungen hinsichtlich der Auswahl des Kollektivs, dessen Altersbereichs, der Testmethode und der notwendigen Abklärungsuntersuchungen anzustellen. Es genügt nicht, lediglich über ein geeignetes Testverfahren zu verfügen.

  • Eine Meldepflicht der Zielerkrankung und ein Datenaustausch zwischen Screening und dem Melderegister sind unumgänglich.

  • Jegliche Früherkennung sollte zukünftig in einem qualitätsgesicherten Setting mit standardisierter Datenerfassung und mit unabhängiger wissenschaftlicher Begleitung sowie mit Vorgaben zur Zertifizierung installiert werden.

  • Alle Ergebnisse der bundesweiten Evaluation sollten in Berichtsform öffentlich zugänglich gemacht werden.

  • Vor- und Nachteile müssen im Informationsmaterial der eingeladenen Zielgruppe verständlich erläutert werden, sodass eine individuelle Entscheidung zur Teilnahme oder Nichtteilnahme an der Früherkennung ermöglicht wird.