1 Hintergrund, Ziel und Methode der Studie

Am 01.01.2011 trat das Arzneimittelneuordnungsgesetz (AMNOG) in Kraft. Dieses Gesetz sieht in §35a SGB V eine bisher in Deutschland nicht geforderte frühe Nutzenbewertung für neue Arzneimittel vor. Der Gemeinsame Bundesausschuss (G-BA) hat in 2011 daraufhin für 23 neue Arzneimittel Verfahren zur frühen Nutzenbewertung eingeleitet, worauf 13 Hersteller für 19 Produkte ihre Dossiers eingereicht haben. Obwohl noch nicht alle Verfahren aus 2011 bis zum 1. Quartal 2012 durch Beschlussfassung des G-BA abgeschlossen waren, befragte die Deutsche Fachgesellschaft für Market Access (DFGMA) die betroffenen Unternehmen zu ihren Erfahrungen mit der frühen Nutzenbewertung.

Ziel der Experten-Umfrage war es, frühzeitig einen Einblick zu bekommen, inwieweit das AMNOG die klinische Forschung beeinflusst, um hieraus zu antizipieren, welche neuen Anforderungen und Rahmenbedingungen bei der Entwicklung neuer Medikamente in Zukunft zu berücksichtigen sind. Es ging daher nicht um die quantitative Erfassung bestimmter Probleme und Lösungsmöglichkeiten, sondern mehr um eine möglichst umfassende Aufdeckung von kritischen Faktoren, die einerseits bei der Entwicklung neuer Arzneimittel im Hinblick auf eine erfolgreiche frühe Nutzenbewertung überprüft oder berücksichtigt werden sollten und die andererseits den Prozess der klinischen Prüfungen beeinflussen. Um diesem Ziel gerecht zu werden, wurde das offene, leitfadengestützte Gespräch gewählt.

Bei der Ansprache der Teilnehmer im Februar 2012 lagen erst für zwei Produkte die Beschlussfassungen des G-BA vor, so dass ein Großteil der Teilnehmer darum bat, die Gespräche nach diesem Zeitpunkt durchzuführen. Daher erfolgte die sukzessive Durchführung der Gespräche von Februar bis Mai 2012.

Die Anzahl der Interviews ist mit zehn Teilnehmern aus neun Firmen absolut gesehen klein, allerdings hatten in 2011 nur 13 Firmen ein Nutzendossier nach §35a SGB V abgegeben. Die Gespräche, die im Durchschnitt ca. 60 Minuten dauerten, waren sehr detailreich, beleuchteten viele unterschiedliche Aspekte und ergaben daher einen guten Überblick, welche Probleme auftraten, was das für die klinische Forschung in Zukunft bedeuten könnte und wie der Prozess zu Nutzenbewertung für alle Beteiligten verbessert werden könnte.

Die Interviewteilnehmer kamen aus den Abteilungen Market Access, Gesundheitsökonomie, Health Outcome, Medical Affairs, Marketing und Klinische Forschung und waren in den meisten Fällen die Projektleiter für das/(die) Nutzendossier(s). In vier Fällen wurden Mitarbeiter benannt, die maßgeblich an der Erstellung der Nutzendossiers beteiligt waren.

2 Ergebnisse

Die Gespräche deckten sehr schnell drei wesentliche Hauptproblemfelder bei der Erstellung von Nutzendossiers auf:

  • Zweckmäßige Vergleichstherapie

  • Subgruppen

  • Surrogatparameter – klinische Endpunkte

Die Lösung der damit verbundenen Fragen ist für eine erfolgreiche frühe Nutzenbewertung so entscheidend, dass sich die Gespräche in erster Linie um diese Themen drehten. Diese Problemfelder wurden bereits in der Öffentlichkeit adressiert und in einem Expertengespräch des G-BA vom 22.03.2012 [6] diskutiert, so dass sich dieser Bericht auf die Auswirkungen der frühen Nutzenbewertung auf die Klinische Forschung konzentrieren kann.

2.1 Problemfeld: Vergleichstherapie

2.1.1 Situation

Zu 16 der 19 Nutzendossiers hatten die Hersteller Beratungsgespräche des G-BA in Anspruch genommen (s. Tab. 1). Nach Ansicht der Interviewpartner ließen die Gespräche kaum Möglichkeiten zum Dialog zu und entsprachen eher einer „Verlesung“ eines G-BA Beschlusses zur zweckmäßigen Vergleichstherapie (ZVT). Der Beschluss zur ZVT wurde dabei zunächst weder begründet noch in irgendeiner Form diskutiert oder beraten. Da die klinischen Studien zu einer Zeit geplant und begonnen wurden, als vom AMNOG noch keine Rede war, enthielten auch nur acht Dossiers bereits die geforderten Studien mit der ZVT für die gesamte Zulassungspopulation. In weiteren fünf Dossiers waren wenigstens für eine Subgruppe der Zulassungspopulation Studien für die geforderte ZVT vorhanden. Die restlichen sechs Dossiers enthielten keine Studien zur geforderten ZVT (s. Tab. 1).

Tab. 1 2011 eingereichte Dossiers zur frühen Nutzenbewertung nach §35 a SGB V

Für die Nutzenbewertung eines Produktes ist jedoch die Verfügbarkeit von Studien mit der geforderten ZVT von essentieller Bedeutung: Alle Produkte bei denen keine direkten Vergleichsstudien mit der geforderten ZVT vorgelegt wurden, erhielten die Bewertung „kein Zusatznutzen belegt“ (s. Tab. 1). Dies führt laut Gesetz zur Konsequenz, dass der Preis für diese Produkte nicht über dem Preis der ZVT festgesetzt werden darf, sofern er nicht direkt auf dem Festbetragsniveau der ZVT festgelegt wird. Umgekehrt wurde allen Produkten, die wenigstens für eine Patientengruppe einen direkten Vergleich vorlegen konnten, wenigstens für eine Subpopulation der Zulassungspopulation ein Zusatznutzen anerkannt.

2.1.2 Inhalt der Gespräche zum Thema Vergleichstherapie

Prinzipiell wird die Forderung nach einem Vergleich zwischen dem Entwicklungsprodukt und der Standardtherapie von den Interviewpartnern akzeptiert. Der Diskussionsbedarf entsteht bei der Frage nach der „richtigen“ Standardtherapie. Nach der Verfahrensordnung des G-BA soll die ZVT nach den Maßstäben der internationalen Standards der evidenzbasierten Medizin bestimmt werden. Dies ist weder weltweit noch europäisch eindeutig und sollte nach Meinung der Interviewpartner vor der Festlegung der Vergleichstherapie für die Nutzendossiers unter wissenschaftlichen und evidenzbasierten Gesichtspunkten für einzelne Vergleichstherapien diskutiert werden. In Zukunft sollte über die ZVT vor dem Start der Phase III-Prüfungen (evtl. späte Phase II) beraten und beschlossen werden. Dabei wird konzediert, dass sich bis zur Zulassung des Entwicklungsprodukts der Stand des Wissens verändern und sich daraus eine andere Vergleichstherapie ergeben könnte.

Bei den laufenden Entwicklungsprojekten, die sich in der späten Phase III befinden und für die keine head-to-head-Studien mit der geforderten ZVT begonnen wurden, sehen die Interviewpartner keine Möglichkeit mehr, noch klinische Studien mit der geforderten ZVT für die Nutzendossiers nach §35a SGB V nachzuholen. Es erscheint zweifelhaft, ob sich die Erstellung eines Nutzendossiers in diesen Fällen lohnt, weil die nach der Verfahrensordnung möglichen indirekten Vergleiche bisher nicht zu einem positiven Ergebnis geführt haben und die Datenlage für mögliche Brückenkomparatoren eher mangelhaft eingestuft wird.

Problematisch erscheint den Interviewpartnern die Bestimmung einer generischen ZVT, insbesondere wenn bereits patentgeschützte Therapien auf dem Markt sind. Hier wird mehrheitlich angenommen, dass in Zukunft für Deutschland das entsprechende Produkt nicht entwickelt und auch keine Zulassung angestrebt wird, weil es sich ökonomisch vermutlich nicht mehr lohnt. Allerdings kann eine endgültige Entscheidung in dieser Richtung erst gefällt werden, wenn deutlich wird, welche Ergebnisse in solchen Fällen die Preisverhandlungen erbracht haben.

Kritisch sehen die Experten, dass eine mit den Zulassungsbehörden vereinbarte Vergleichstherapie evtl. nicht der für den Nutzenbeweis geforderten ZVT entspricht. Zulassung und Erstattungsfähigkeit sollten als Gesamtprozess gesehen werden und die Entscheidungsgremien sollten hier eine einheitliche Linie verfolgen, nach der sich der Hersteller richten kann. Klinische Prüfungen mit mehreren Vergleichsarmen sind technisch möglich, aber aus ethischen Gründen (sorgfältiger Umgang mit Versuchspersonen, Stichwort: „Patientensparsamkeit“) kritisch zu hinterfragen. Bei Orphan-Drugs wird dies evtl. aus Patientenmangel gar nicht möglich sein.

Insbesondere bei Orphan-Präparaten kommt es zu einem weiteren Problem, weil es häufig keine zugelassene Therapie gibt, d. h. die Bestimmung einer Vergleichstherapie ist nicht möglich. Die stattdessen geforderte patientenindividuelle Best Supportive Care (BSC) ist nicht standardisierbar und steht unter Umständen in Konflikt zu der Zulassungsforderung, Wirksamkeit und Unbedenklichkeit nachzuweisen, insbesondere weil die Interpretation von BSC international sehr unterschiedlich sein kann. Wegen der geringen Patientenanzahl und der ethischen Forderung nach bedachter Auswahl von Versuchspersonen ist eine zentrale Koordination der behördlichen Anforderungen wünschenswert.

In einigen Fällen entschied sich der G-BA für eine nicht-medikamentöse Vergleichstherapie. Die Experten weisen darauf hin, dass die Zulassungsverfahren für medikamentöse und nicht-medikamentöse Therapien völlig unterschiedlich sind, dementsprechend gibt es im nicht-medikamentösen Bereich häufig keine Standardisierung (z. B. bei Operationen und in der Physiotherapie wird das Ergebnis wesentlich von den individuellen Fähigkeiten des Therapeuten beeinflusst), was einen methodisch eindeutigen Nutzenbeweis unmöglich macht. Außerdem wird die Datenlage in den betrachteten nicht-medikamentösen Feldern als „chaotisch“ bezeichnet. Um einigermaßen verlässliche und robuste Aussagen treffen zu können, müsse die geforderte ZVT eine medikamentöse Therapie sein.

2.2 Problemfeld Subgruppen

2.2.1 Situation

Im Studienprotokoll einer klinischen Prüfung wird die Studienpopulation definiert und alle Auswertungen präspezifiziert. Die Patientenanzahlen der Studienpopulation sowie evtl. relevanter Untergruppen werden so bestimmt, dass sinnvolle Auswertungen möglich sind. Eine post-hoc Analyse von nicht präspezifizierten Gruppen ist daher aus methodischen Gründen kritisch zu beurteilen. Die Anforderungen von G-BA bzw. IQWiG haben dazu geführt, dass bei sieben Nutzenbewertungen mit direkten Vergleichen Studienpopulationen nachträglich verändert oder für die Nutzenbewertung in Subgruppen unterteilt und Nutzenbewertungen für diese veränderten Subpopulationen bzw. Subgruppen durchgeführt wurden (s. Tab. 1).

2.2.2 Inhalt der Gespräche zum Thema Subgruppen

Die post-hoc Betrachtung von Subgruppen, die bei der Planung der Studie nicht berücksichtigt wurden und für die dementsprechend auch keine Auswertung im Studienprotokoll vorgesehen war, wird von allen Interviewpartnern kritisch gesehen: Diese Vorgehensweise sei wissenschaftlich fragwürdig, entspräche eigentlich nicht der methodischen Haltung des IQWiG und würde auch von anderen Gremien bzw. Institutionen nicht akzeptiert. Im Falle der klinischen Prüfungen kommt hinzu, dass auch aus Gründen des Gebots der Patientensparsamkeit die notwendigen Fallzahlen für die geplanten Auswertungen im Vorfeld der Prüfung genau berechnet werden. Post-hoc Subgruppenanalysen führten damit automatisch zu inadäquaten Fallzahlen, so dass die Ergebnissicherheit sinkt und damit auch die Interpretation über Nutzen bzw. Nicht-Nutzen unsicher wird. Aus Sicht der Experten ist es wissenschaftlich zwingend erforderlich, Subgruppen und die zugehörige Auswertung bei der Studienplanung zu berücksichtigen und im Studienprotokoll festzulegen.

Die Vorgehensweise des G-BA und IQWiG zur Subgruppenbildung stellt sich wie folgt dar:

  • Die Definition der Studienpopulation wurde genau hinterfragt. Soweit Ungenauigkeiten oder Interpretationsspielräume bei der Definition der Studienpopulationen festgestellt werden konnten, wurde die Studienpopulation für die Analyse durch das IQWiG entsprechend bereinigt, was zur Kürzung der Fallzahlen und damit zur Verminderung der Ergebnissicherheit führte. Dieses Vorgehen war teilweise nachvollziehbar, stand allerdings im Dissens zur Zulassungsbehörde, die hier keinen Mangel in der klinischen Prüfung sah. In der Zukunft sollte dies zu mehr Präzision bei der Definition der Studienpopulation führen.

  • Es wurden Subgruppen aufgrund von Klassifikationen, z. B. Schweregraden, gebildet. Für jede Subgruppe wurden gegebenenfalls unterschiedliche Vergleichstherapien bestimmt. Es ist fraglich, ob bei starker Fragmentierung klinische Prüfungen in den Subgruppen noch realisierbar sind.

  • Weiterhin wurden Subgruppenbildungen aufgrund des Behandlungsschemas in der Zulassung definiert und gesondert für die Nutzenbewertung ausgewertet.

  • Außerdem ergaben sich Subgruppen aufgrund des Zulassungsstatus der Vergleichstherapien. In diesem Fall war die vom Hersteller gewählte Vergleichstherapie für bestimmte Subgruppen zwar nicht offiziell zugelassen, wurde aber in der Realität bei diesen Subgruppen routinemäßig eingesetzt. Die Experten empfehlen in solchen Fällen, von einer De-Facto-Zulassung auszugehen, um arbiträre Subgruppen, die nicht der Versorgungsrealität entsprechen, zu vermeiden.

  • Denkbar sind nach Meinung der Experten auch Subgruppen, die sich aufgrund von Leitlinien (z. B. durch unterschiedliche Vorbehandlungen) oder Geschlechts- und Altersgruppen ergeben. Die Suche nach Subgruppen, für die die geprüfte Substanz besondere Vorteile oder Nachteile hat, ist nachvollziehbar und eventuell sogar wünschenswert. Allerdings sollte auch eine summarische Nutzenbewertung für die Gesamtgruppe durchgeführt werden, solange die Gesamtgruppe mit der gleichen Therapie behandelt wird.

Während das Thema „post-hoc Subgruppenanalyse“ eindeutig negativ von den Experten beurteilt wird, sehen einige in geplanten und gezielten Subgruppenanalysen durchaus Chancen für die zukünftige Produktentwicklung. In Zukunft würde in Phase II der Produktentwicklung deutlich stärker darauf geachtet, mögliche Patientengruppen zu identifizieren, bei denen erhebliche Vorteile oder auch Risiken gegenüber der Standardtherapie zu erwarten wären. Ob in diesem Fall weiterhin für eine größere Population die Zulassung angestrebt wird bzw. wie mit der Situation umzugehen sei, dass die Zulassung für eine größere Population erteilt, aber die Erstattung nur für eine bestimmte Patientengruppe erreicht wird, müsse noch diskutiert werden.

2.3 Problemfeld Surrogatendpunkte

2.3.1 Situation

In klinischen Studien wird anhand vorab festgelegter Endpunkte das Ergebnis der Studie festgestellt. Die in den Nutzendossiers vorgelegten Studien waren zuvor von den Zulassungsbehörden begutachtet worden, d. h. sowohl das Ergebnis der Studien als auch die dafür gewählten Endpunkte waren akzeptiert worden. Die Endpunkte der Studien wurden im Rahmen der Nutzenbewertung einer kritischen Prüfung unterzogen, was dazu führte, dass das IQWiG in sieben Nutzenbewertungen mindestens einen Endpunkt aus den entsprechenden Studien nicht als patientenrelevanten Endpunkt einstufte. Bei den nicht anerkannten Endpunkten bemängelte das IQWiG, dass diese Endpunkte nur Surrogatparameter seien, für die es bislang keine Validierung gäbe. Ein Endpunkt (SVR Sustained Viralogical Response) wurde nach eingehender Prüfung entsprechender Studien durch das IQWiG zwar weiterhin als nicht validierter Endpunkt angesehen, aber dennoch zur Nutzenbewertung herangezogen, weil recherchierte Studien die Validität zumindest nahelegten.

2.3.2 Inhalt der Gespräche zum Thema Surrogatendpunkte

Aus der Sicht der Interviewpartner ist die Forderung nach validierten patientenrelevanten Endpunkten berechtigt, obwohl dies zumindest teilweise nur schwierig zu realisieren sei. Mortalität und Morbidität entwickeln sich in bestimmten Indikationen sehr langsam, was dazu führen würde, dass sich die Studiendauer erheblich verlängert und sich damit in der Folge der medizinische Fortschritt verzögert. Diese Problematik wurde von der EMA und FDA erkannt, so dass sogar beschleunigte Zulassungsverfahren etabliert wurden [3]. Erneut zeige sich hier ein Dissens zwischen den Gremien, der praktikabel gelöst werden müsse. Die Validierung von Surrogatparametern wird dabei nur selten eine Lösung sein, weil die Validierung von Surrogatparametern genauso lange dauert wie die eigentliche Endpunktstudie. Eine mögliche praktikable Lösung wäre ein Konsens über akzeptierte Surrogatparameter für die Zulassungs- und Nutzenstudien der Phase III, um eine konditionale Zulassung und Erstattung zu erhalten, mit der Verpflichtung, die entsprechende Endpunktstudie zum frühestmöglichen Zeitpunkt (festzulegen im Studienprotokoll) zu beginnen. Insgesamt wünscht man sich eine flexiblere, pragmatischere Haltung von IQWiG und G-BA gegenüber Surrogatparametern, die sich an den anerkannten Verfahren der medizinischen Wissenschaft orientieren sollte.

Da es bisher nicht üblich ist, grundsätzlich Quality of Life-Erhebungen (QoL) in die klinischen Prüfungen zu integrieren, erachten die Experten es als vorteilhaft, wenn in Zukunft validierte QoL-Fragebögen prinzipiell in klinische Prüfungen integriert werden.

3 Implikationen

3.1 Anforderungen an die Klinische Forschung

Generell betonen alle Interviewpartner, dass in Zukunft bei der Entwicklung neuer Präparate, die in Deutschland eingeführt werden sollen, Market-Access Aspekte und dabei ganz besonders das Erstattungspotential von Anfang an berücksichtigt werden müssen. Aus den Interviews leiten sich folgende Anforderungen an die Klinische Forschung ab:

  1. (a)

    Bereits zum Ende der Phase I sollten Pipelinekandidaten bewertet werden, das heißt konkret: Welche Vergleichstherapien – ggf. noch in der Prüfung befindliche – kommen in Frage? Welche Erstattungsszenarien sind ableitbar? Für welche Länder ist die Entwicklung dieses Pipelinepräparates ökonomisch und medizinisch sinnvoll?

    Insbesondere bei Klärung der letzten Frage wird sich nach Meinung der Experten für etliche Produkte entscheiden, inwieweit die Produkte speziell nach der deutschen Bedingungslage entwickelt werden oder inwieweit die jeweils deutsche Ländervertretung eines global agierenden Pharmakonzerns noch Einfluss nehmen kann.

  2. (b)

    Die Phase II-Studien sollten für eine gründliche und breite Erforschung der Entwicklungskandidaten genutzt werden und zwar sowohl hinsichtlich ihres medizinischen als auch ökonomischen Potentials, das impliziert im Weiteren die Forderungen nach

    • Durchführung von Proof of Concept-Studien evtl. mit mehreren Vergleichstherapien;

    • Identifikation von Patientenpopulationen (auch Alters- und Geschlechtsgruppen) für die ein besonderer Nutzen oder ein höheres Risiko erwartet werden kann;

    • Berücksichtigung von Biomarkers zur Identifikation von Respondern/Non-Respondern, sofern das möglich ist;

    • Kritische Reflexion der Prüfprotokolle auf Interpretationsspielräume;

    • Berücksichtigung der Anforderungen von IQWiG und G-BA und Prüfung von Machbarkeit und Konsequenzen für die klinische Forschung (Einbeziehung von patientenrelevanten Endpunkten, validierten Surrogatendpunkten, QoL, Alters-/Geschlechtsauswertungen etc.);

    • Durchführung umfassender Marktanalysen im Hinblick auf das Erstattungspotential in Deutschland;

    • Ausstattung von Phase II-Prüfungen mit adaptivem Design (damit bei positiven Interimsanalysen unmittelbar in die Phase III-Prüfung übergeleitet werden kann);

    • Prüfung auf Superiority, (d. h. die Durchführung von Phase III-Prüfungen, macht nur Sinn, wenn aufgrund der Phase II die Überlegenheit der neuen Therapie wahrscheinlich ist);

    • Anstreben eines Scientific Advice der Zulassungsbehörden;

    • Inanspruchnahme der Frühberatung des G-BA (Wunsch nach „protocol assistance“, d. h. ein mit Zulassungs- und Erstattungsbehörden abgestimmtes Prüfprotokoll).

  3. (c)

    Nachdem in Phase II die Erfolgsaussichten des neuen Präparates sehr sorgfältig geprüft wurden, bleiben für die Phase III nur noch wenige Anforderungen:

    • Idealerweise Kombination von Nutzen- und Zulassungsstudie (Koordination von Zulassung und Erstattungsautoritäten erforderlich);

    • Interimsauswertungen bei der Phase III-Prüfung (d. h. bei Erreichen des Meilensteins „Non-Inferiority“ – ausreichend für Zulassung), unmittelbare Fortführung als „Superiority“-Prüfung – notwendig für den Nutzenbeweis;

    • frühzeitige Einbindung (gegebenenfalls vor Zulassung und Nutzenbewertung) von Endpunktstudien bei Phase III Studien mit Surrogatparametern.

3.2 Anforderungen an den Nutzenbewertungsprozess

Im Hinblick auf den Nutzenbewertungsprozess ist den Experten wichtig, mit G-BA und IQWiG eine faire Diskussion zu führen und auch von ihnen beraten zu werden, um medizinischen Fortschritt nicht zu behindern. Man wünscht sich eine Zusammenarbeit wie mit den Zulassungsbehörden: auch hier gibt es keine absolute Sicherheit, dass am Ende die Zulassung steht, aber die Wahrscheinlichkeit, die Zulassung zu bekommen, ist bei Einhaltung der Regeln und Absprachen sowie einem positiven Ergebnis der Prüfungen sehr hoch.

Im Zulassungsprozess hat der Hersteller die Möglichkeit, innerhalb einer festgelegten Frist festgestellte Mängel im Dossier zu korrigieren. Dies ist beim Nutzenbewertungsprozess in Deutschland noch nicht möglich, wäre aber wünschenswert.

Das in den Dossiers verwendete Kostenmodell entspricht nicht dem internationalen Standard. Besonders die Gesundheitsökonomen unter den Experten fordern hier die Berücksichtigung adäquater gesundheitsökonomischer Modelle, um die tatsächlichen ökonomischen Effekte einer Therapie präziser und umfassender darstellen zu können.

Post-hoc Subgruppenanalysen sind nach wissenschaftlichem Standard hypothesengenerierend und sollten daher nicht die Basis für eine abschließende Nutzenbewertung sein.

Einige Interviewpartner weisen auf das Problem hin, dass die methodische Haltung von G-BA/IQWiG an ethische Grenzen stoße: Im ersten Fall war zunächst eine zweckmäßige ZVT für ein neues Medikament bestimmt worden, das nur bei Patienten angewendet werden sollte, die bezüglich der ZVT bereits refraktär geworden waren. Hier wurde vom Bundesinstitut für Arzneimittel und Medizinprodukte (BfArM ) bestätigt, dass entsprechende klinische (Nutzen-)Studien durch die Ethikkommissionen nicht genehmigungsfähig sind. Der G-BA hat daraufhin die ZVT geändert.

Im zweiten Fall waren die Interviewteilnehmer darauf hingewiesen worden, dass das Methodenpapier des IQWiG regelhaft zwei RCT mit gleichgerichtetem Ergebnis verlangt [1]. Die Vorlage einer randomisierten klinischen Prüfung (RCT) reicht demnach nicht aus. Diese Anforderung wird in Deutschland nicht erfüllbar sein, weil die Ethikkommissionen die zweite Studie nicht mehr genehmigen werden. Ein Interviewteilnehmer merkt dazu an, wenn es bei dieser Anforderung bleibe, müsse die Prüfung in wenig glaubwürdigen Ländern, wie z. B. Nordkorea, durchgeführt werden, was wiederum der Konzern nicht dulde.

Ein weiterer Diskussionspunkt war die Verquickung von Kosten und Nutzengesichtspunkten. Da sich der Gesetzgeber mit dem AMNOG ein Einsparpotenzial bei neuen Arzneimitteln erhofft, seien die Strategien des G-BA bzw. des IQWiG bei der Wahl der ZVT, der Subgruppenbildung und der Endpunktdiskussion auch unter dem Gesichtspunkt zu sehen, dass damit die Verhandlungsposition der Krankenkassen für die Preisverhandlungen verbessert werden sollte.

Alles in allem sei die bisherige Vorgehensweise sehr formalistisch, starr und realitätsfern (insbesondere die Feststellung des Ausmaßes des Zusatznutzens). Für eine hohe Ergebnissicherheit nähmen G-BA und IQWiG in Kauf, eventuell vorhandenen Zusatznutzen nicht (an-) zu erkennen. Leider findet zurzeit auch keine Bewertung der klinischen und medizinischen Relevanz der neuen Therapien statt, sondern allein die formale Erfüllung vorgegebener Verfahrensregeln bestimme die frühe Nutzenbewertung.

4 Abschließende Diskussion der Ergebnisse

Unter dem Punkt 3.1 wurde bereits zusammenfassend dargestellt, wie sich die Prozesse zur Arzneimittelentwicklung aufgrund der frühen Nutzenbewertung im Hinblick auf die klinischen Prüfungen verändern könnten. Die Teilnehmer der Interviews hatten hier bereits mehrheitlich angesprochen, dass diese Prozessanpassungen, falls möglich und (ökonomisch und medizinisch) sinnvoll, erfolgen werden. Außerdem machen die Interviews deutlich, dass Ausgestaltung und Handhabung der frühen Nutzenbewertung unmittelbar Einfluss auf die Präparateentwicklung und damit auf die für die Nutzenbewertung notwendigen klinischen Prüfungen nehmen. Der Wert einer klinischen Prüfung für die medizinische Versorgung wird jedoch entscheidend durch die Wahl der Vergleichstherapie, der klinischen Endpunkte und der untersuchten Patientengruppen bestimmt. Wenn in Zukunft durch die Nutzenbewertung die Wahl der genannten Parameter bei der Entwicklung neuer Präparate in den klinischen Prüfungen festgelegt wird, ist es von erheblicher Bedeutung, dass die Anforderungen der frühen Nutzenbewertung bezüglich ZVT, klinischer Endpunkte und Patientengruppen allein dem Erkenntnisgewinn für die medizinische Versorgung dienen. Dies entspricht auch den Zielen des AMNOG:

In der Begründung zum Gesetzentwurf des AMNOG beschreiben die Regierungsfraktionen die Ziele des AMNOG wie folgt:

1. Den Menschen müssen im Krankheitsfall die besten und wirksamsten Arzneimittel zur Verfügung stehen.

2. Die Preise und Verordnungen von Arzneimittel müssen wirtschaftlich und kosteneffizient sein.

3. Es müssen verlässliche Rahmenbedingungen für Innovationen, die Versorgung der Versicherten und die Sicherung von Arbeitsplätzen geschaffen werden.“ (Zitat SGB V Handbuch [3])

Die ersten Erfahrungen mit der frühen Nutzenbewertung sollen hier unter dem Aspekt diskutiert werden, inwieweit die bisherige Verfahrensweise in Bezug auf ZVT, klinische Endpunkte und Patientengruppen diesen Zielen genügt.

Der Gesetzgeber hat mit Bedacht die Bewertung neuer Arzneimittel (frühe Nutzenbewertung) von der Preisverhandlung und Preisfestsetzung getrennt. Bei Feststellung des Ausmaßes des Zusatznutzens wurde kein Algorithmus für die Preisfestsetzung festgelegt. Die Themen Preis und Kosten sollten daher in der Preisverhandlung abgehandelt werden, während die frühe Nutzenbewertung allein der Feststellung des Patientennutzens dienen sollte, d. h. auch bei der Wahl der ZVT, der Analyse von Subgruppen und der Ablehnung von Surrogatparametern sollte dieses Ziel im Vordergrund stehen und nicht mit Kostengesichtspunkten vermischt werden.

Die Festlegung der ZVT wurde in den hier betrachteten Nutzendossiers nicht vom G-BA begründet und in den Fällen, in denen Hersteller Studien mit anderen als den geforderten ZVT vorlegten, wurden ihre Begründungen zur Zweckmäßigkeit der abweichenden Vergleichstherapie nicht akzeptiert. Um diese Blockade aufzuheben, hat der G-BA bereits als ersten Schritt beschlossen, seine Wahl der Vergleichstherapie zu begründen. Im Sinne des Patientennutzens wäre es zu begrüßen, wenn es zu einem transparenten und dem Stand der Wissenschaft entsprechenden Diskurs über die zweckmäßige ZVT käme [5]. Da in der nächsten Zeit noch Medikamente zugelassen werden, deren Phase III-Prüfungen vor der AMNOG Gesetzgebung begonnen wurden, wird es immer wieder vorkommen, dass die vom G-BA geforderte ZVT nicht geprüft wurde. Im Falle positiver Ergebnisse und Nicht-Anerkenntnis der Vergleichsstudien des Herstellers würde wahrscheinlich zumindest den Patienten, die bisher mit der vom Hersteller geprüften Vergleichstherapie versorgt werden, nicht die beste und wirksamste Therapie zur Verfügung stehen. Da die Erstattungsfähigkeit des neuen Medikamentes vom G-BA auf die entsprechende Patientengruppe beschränkt werden könnte, würde in solchen Fällen auf eine Verbesserung der Patientenversorgung aus formalen Gründen verzichtet.

Dies führt direkt zu der Frage, in welchem Umfang der Nutzenbeweis nach AMNOG über den Vergleich mit der geforderten ZVT dazu führt, die besten und wirksamsten Medikamente zu Verfügung zu stellen. In vielen Indikationsgebieten gibt es vielfältige Therapieoptionen, weil patientenindividuelle Therapiestrategien aufgrund der biologischen Varianz zu besseren therapeutischen Ergebnissen führen. In vielen Indikationsgebieten wird daher nur ein Teil der Patienten mit der vom G-BA bestimmten Vergleichstherapie behandelt, d. h. nur für diesen Teil ergäbe sich bei positiver Nutzenbewertung auch der Nachweis, dass es eine bessere Therapie gibt. Für alle anderen Patienten mit einer anderen Therapie würde kein Zusatznutzen nachgewiesen. Es stellt sich daher die Frage, warum Dossiers in denen eine vom Hersteller gewählte Vergleichstherapie bewertet wird, nicht zur Nutzenbewertung nach AMNOG zugelassen werden. Wenn für die vom Hersteller gewählte Vergleichstherapie nach den Kriterien des IQWiG ein Zusatznutzen durch das neue Medikament nachgewiesen wird, könnte zumindest auch für den Teil der Patienten, die bisher die vom Hersteller gewählte Vergleichstherapie erhalten, eine Verbesserung der Therapie erzielt werden. Wenn es nicht nur um Kostensenkung sondern auch um Verbesserung der Therapie geht, sollte jedem nach den Kriterien des IQWiG durchgeführtem Zusatznutzenbeweis ein Stellenwert zugebilligt werden.

Der Gesetzgeber hat als Vergleichstherapien auch nicht-medikamentöse Therapien, sofern sie von den Kassen erbringbar sind und erstattet werden, für die Nutzenbewertung zugelassen. Trotzdem sollten nicht-medikamentöse Therapien nur nach sorgfältiger Prüfung und in Ausnahmefällen als Vergleichstherapie für die Nutzenbewertung gewählt werden: Im Falle der Nicht-Standardisierbarkeit der Vergleichstherapie ist ein konfirmatorischer Nutzenbeweis mit der von G-BA/ IQWiG gewünschten Sicherheit nicht möglich, da die Ergebnisse durch unerkannte Confounder verfälscht sein könnten.

Im Sinne des Zieles, Patienten die bestmöglichen Therapien zur Verfügung zu stellen, ist die Identifikation von Subgruppen mit hohem Nutzen oder besonderem Risiko auf jeden Fall sinnvoll und wünschenswert. Dieses Ziel wird in Zukunft nach Aussage der Interviewteilnehmer stärker berücksichtigt. Vielleicht löst sich damit in der Zukunft das Problem der methodisch fragwürdigen post-hoc Subgruppenanalysen. Post-hoc Subgruppenanalysen sollten nur hypothesengenerierend eingesetzt werden.

Bei dem Thema Surrogatparameter sollte berücksichtigt werden, dass die Zulassungsbehörden beschleunigte Zulassungsverfahren geschaffen haben, damit Patienten so rasch wie möglich neue Therapien zur Verfügung gestellt werden können. Dabei werden ausdrücklich in Absprache mit den Gremien Surrogatendpunkte für die Zulassung akzeptiert. Die beschleunigte Zulassung kann beantragt werden, wenn der Nachweis des klinischen Endpunkts sehr lange dauert oder ein öffentliches Interesse an der Bereitstellung einer solchen Therapie besteht [4]. Wenn das IQWiG bei seiner Haltung bleibt, Surrogatendpunkte nicht für den konfirmatorischen Nutzenbeweis anzuerkennen, würde dies bedeuten, dass Medikamente, denen die Zulassungsbehörden durch die Zustimmung zu einem beschleunigten Verfahren mit der Prüfung auf Surrogatendpunkte eine gewisse Wichtigkeit eingeräumt haben, kein Zusatznutzen zuerkannt wird. Im Regelfall wird dieses Medikament deutschen Patienten zumindest eine Zeit lang nicht zur Verfügung stehen. Wünschenswert wäre, ähnlich wie bei der Zulassung, die Verhandlungen zur Festlegung des Erstattungspreises unter der Bedingung zu gewähren, dass die eigentliche Endpunktstudie die Ergebnisse der Studie mit den Surrogatendpunkten bestätigt.

Alles in allem sollte der Nutzenbewertungsprozess, der als starr und formalistisch empfunden wird, flexibler und pragmatischer gestaltet werden, um dem Ziel, Patienten die beste und wirksamste Therapie zur Verfügung zu stellen, unter klinischen und medizinischen Gesichtspunkten gerecht werden zu können.

Im Hinblick auf die in der Begründung zum AMNOG als Ziel genannten „verlässlichen Rahmenbedingungen für Innovationen“ haben die Interviewteilnehmer bereits ihre Vorstellungen benannt: Nach einer qualitativ und quantitativ breiteren, auch im Sinne einer Nutzenbewertung ausgeweiteten Erforschung des neuen Medikamentes in Phase II-Prüfungen sollte eine fachlich fundierte und faire Frühberatung vor den Phase III-Prüfungen stattfinden, in der die Anforderungen des G-BA zur Nutzenbewertung des neuen Produktes (wenn möglich) einvernehmlich festgelegt werden. Soweit diese Anforderungen in den Phase III-Studien berücksichtigt wurden, die Ergebnisse der Prüfungen positiv ausfallen und sich der Stand des Wissens nicht grundlegend verändert hat, sollte eine Anerkennung des (Zusatz-) Nutzens und damit der Zugang zu Preisverhandlungen, der Innovationen gerecht wird, im Regelfall gewährleistet sein.