Die gesetzlichen Krankenkassen erhalten für Abrechnungszwecke Angaben zu allen Leistungen, die für ihre Versicherten von den verschiedenen Leistungserbringern erbracht wurden. Damit liegen bei den Kassen Informationen vor, die seit mehr als 30 Jahren als wichtige Datenquelle für Versorgungsforschung, Public Health und Politikberatung geschätzt werden. Arzneimittelrezeptdaten waren die ersten Daten, die bereits seit Mitte der 1970er-Jahre systematisch ausgewertet wurden. Auch wenn inzwischen die Daten in elektronischer Form vorliegen, sind belastbare Auswertungen nicht auf „Knopfdruck“ erhältlich, sondern erfordern, zumal die Daten nicht für Forschungszwecke erhoben wurden, Auswertungskonzepte und methodisches Know-how.

Im Oktober 2021 erschien in der Zeitschrift Pharmacoepidemiology and Drug Safety ein Letter to the Editor, in dem sieben in der Pharmakoepidemiologie ausgewiesene Wissenschaftler:innen aus fünf Ländern methodische Publikationen zur Pharmakoepidemiologie – im Sinne eines methodischen Curriculums – zusammengestellt haben [36]. Die 30 Artikel, denjenigen empfohlen, die „neu im Feld“ sind, wurden in die fünf Themenbereiche: methodische Grundlagen, Bias, Berichterstellung, Methoden und Studiendesign sowie Statistik eingeteilt; 12 Beiträge beziehen sich dabei auch explizit auf die Analyse von Routinedaten. Die methodisch-statistischen Grundlagen beziehen sich auf analytische Studien der Pharmakoepidemiologie, die einen Schwerpunkt in der Pharmakovigilanz haben. Es geht um das Erkennen von erwünschten und unerwünschten Wirkungen der Arzneimittelanwendung in der Bevölkerung nach der Zulassung sowie um einen Vergleich von Wirkstoffen in Bezug auf Sicherheit und Wirksamkeit. Exposition und (gesundheitliches) Outcome sind hierbei zentrale Begriffe.

Einen etwas anderen Fokus setzt die Arzneimittelverbrauchsforschung („drug utilisation research“), die den gesamten Prozess von der Arzneimittelentwicklung, über die Vermarktung, Verordnung, Abgabe bis hin zur Anwendung in den Blick nimmt. Arzneimittelverbrauchsforschung fragt kurz gesagt danach, wer, wann, warum, welche Arzneimittel erhält, welche Faktoren die Verordnung und Anwendung von Arzneimitteln beeinflussen und ob die Arzneimittelauswahl dem Stand der Wissenschaft entspricht. Es geht nicht nur um die Quantifizierung des Arzneimittelverbrauchs, sondern auch um ein Verständnis der Prozesse des Verordnens, Abgebens und der Anwendung der Arzneimittel sowie einer Bewertung dieser Prozesse [50]. Damit kommen nicht nur die medizinischen Folgen einer Arzneimittelanwendung in den Blick, sondern auch gesellschaftliche und wirtschaftliche Aspekte werden adressiert. Die Forschung will zu einer angemessenen und sicheren Arzneimitteltherapie beitragen. Das beinhaltet die Entwicklung von Maßnahmen für eine Verbesserung der Arzneimitteltherapiesicherheit und Verordnungsqualität sowie deren Evaluation. Arzneimittelverbrauchsforschung wurde auch als Schnittmenge von Pharmakoepidemiologie und Versorgungsforschung („health services research“) beschrieben [50]. Mit anderen Worten: Versorgungsforschung mit Fokus auf die Arzneimittelanwendung. (Für einen kurzen historischen Abriss zur Entwicklung der Arzneimittelverbrauchsforschung siehe Wettermark et al. 2016Footnote 1 [50]. Bergman et al. 1979 und WHO 2003 bzw. in deutscher Fassung durch das Wissenschaftliche Institut der AOK, 2004Footnote 2 [3, 51]).

Arzneimitteldaten der Krankenkassen wurden in Deutschland schon seit Mitte der 1970 Jahren – v. a. mit Blick auf die Mengen und Kosten der Arzneimittel – untersucht, seit 1985 erscheint jährlich der auf dem GKV-Arzneimittelindex beruhende Arzneiverordnungsreport des Wissenschaftlichen Instituts der AOK [29], der allerdings keinen Versichertenbezug aufweist, jedoch Daten zum Gesamtverbrauch aller gesetzlich Krankenversicherten nach Indikationsgruppen enthält und die häufig verordneten Wirkstoffe u. a. vor dem Hintergrund der Studienlage bewertet. Seit Ende der 1990er-Jahre untersuchen auch anderen Krankenkassen den Arzneimittelverbrauch ihrer Versicherten und veröffentlichen hierzu regelmäßig (z. B. GEK bzw. BARMER ArzneimittelreporteFootnote 3). Befördert wurde die Nutzung der Krankenkassendaten für die Arzneimittelverbrauchsforschung durch gesetzliche Änderungen, die dazu führten, dass die Krankenkassen seit 2004Footnote 4 auch die Informationen zu ambulanten ärztlichen Leistungen (wieder) erhalten, wodurch das Spektrum an Fragestellungen (Indikationsstellung in der ambulanten Versorgung) deutlich erweitert wurde. In dieser Zeit entstanden einige methodische Publikationen wie die Leitlinie Gute Praxis Sekundärdaten [45] oder das Handbuch Routinedaten (1. Auflage 2005, 2. Auflage 2014; [44]) sowie Publikationen, die einzelne Datenquellen und Datenprofile beschreiben (z. B. [12, 13, 23, 34]). Hoffmann (2009; [18]) zeigte, welche arzneimittelbezogenen Studien auf der Basis von Routinedaten im Zeitraum 1998–2008 durchgeführt wurden und analysierte sie hinsichtlich der herangezogenen Datenquellen, des Analysezeitraums, der Betrachtung weiterer Versorgungssektoren, des Studientyps und der Finanzierung. Es fehlt bislang jedoch ein Überblick zu den Fragestellungen pharmakoepidemiologischer Studien, die mit Routinedaten bearbeitet wurden. Der vorliegende Beitrag schließt an Hoffmann an. Ziel ist zum einen, einen Überblick über die auf Basis von Daten der gesetzlichen Krankenkassen (GKV-Daten) bearbeiteten Fragestellungen zum Arzneimittelgebrauch zu geben, zum anderen auf einige der methodischen Anforderungen bei der Analyse von Arzneimitteldaten hinzuweisen.

Forschungsthemen im Überblick

Zur Darstellung der Forschungsaktivitäten und um das Spektrum an Fragestellungen zu erfassen, wurde zunächst eine Literaturrecherche im MEDLINE (mittels PubMed) zu Begriffen wie z. B. „pharmacoepidemiology, pharmacovigilance, drug utilisation, drug utilization (…)“ durchgeführt (s. e-Suppl.). Unter Anwendung der Ein- und Ausschlusskriterien verblieben von 548 Studien 266, die auf der Basis der Abstracts und ggf. der Volltexte in die beiden Gruppen Methodenstudie (n = 31) und arzneimittelbezogene Studie (n = 235) eingeteilt wurden. Unter Methodenstudien wurden solche Publikationen gefasst, bei denen eine methodische Fragestellung wie beispielsweise das Vorgehen bei Datenlinkage, Übereinstimmung zwischen Dokumentation in Routinedaten und Selbstangabe, und nicht ein bestimmter Wirkstoff oder eine Wirkstoffgruppe im Fokus stehen. Auf Methodenstudien wird im Folgenden nicht gesondert eingegangen.

Die zeitliche Entwicklung der in MEDLINE gelisteten Publikationen zeigt die Abb. 1.

Abb. 1
figure 1

Entwicklung der Publikationszahlen zu Pharmakoepidemiologie und Routinedaten*. MEDLINE-Recherche (30.12.2021; *Suchbegriffe in e‑Suppl.)

Es wird deutlich, dass in Deutschland die international sichtbaren Publikationen erst später einsetzen, was dem späteren Datenzugang (aber auch der erst sich langsam durchsetzenden Akzeptanz der Datenquelle und Methodik) geschuldet ist.

Von 235 identifizierten arzneimittelbezogenen Studien wurden in 188 Studien ausgewählte Wirkstoff(gruppen) untersucht, 10 Studien thematisierten potenziell inadäquate Medikation (PIM), 26 Studien den Arzneimittelgebrauch insgesamt oder krankheitsbezogene Medikation verschiedener ATC (Anatomisch-therapeutisch-chemisches Klassifikationssystem)-Gruppen. Arzneimittel, die auf das Nervensystem wirken (ATC: N), stellten mit 74 Studien die größte Gruppe dar, darunter 56 Studien zu Psychopharmaka (N05 und N06; zur Übersicht s. e-Abb. 1 im e‑Suppl.). Bezogen auf die verwendete Statistik waren 114 Studien ausschließlich deskriptiv, 121 Studien verwendeten Methoden der analytischen Statistik.

Fragestellungen und methodische Anforderungen

Datenprofile

Die gesetzliche Grundlage für die Erhebung der Daten und Übermittlung an die gesetzlichen Krankenkassen (GKV) ist im Sozialgesetzbuch V und XI (SGB V und SGB XI) geregelt. Auch wenn der Fokus in diesem Beitrag auf Arzneimitteln liegt, werden in den Studien neben den Angaben zu Arzneimitteln (SGB V, § 300) Informationen aus anderen Leistungssektoren wie ambulante ärztliche Versorgung (SGB V, §§ 294/295), stationäre Versorgung (SGB V, § 301), Heil- und Hilfsmittel (SGB V, §§ 84, 300, 302) oder auch Pflegeleistungen (SGB XI, § 94) herangezogen. Die Verknüpfung erfolgt mittels einem in allen Profilen für jeden Versicherten vorhandenen pseudonymisierten Identifikator. Eine Erläuterung zu Sekundärdaten allgemein findet sich bei Gothe et al. (2021; [14]), eine Übersicht über die Datenprofile beispielsweise bei Gothe (2008; [13]) und Garbe/Pigeot (2015; [12]) jeweils ohne Verknüpfung zu den Pflegedaten. In den GKV-Daten liegen außerdem Angaben zu den Kosten der Arzneimittel sowie zu den Kosten in anderen Sektoren vor, sodass hier sowohl Krankheitskostenstudien als auch komplexere gesundheitsökonomische Analysen möglich sind. Auf diese wird im Folgenden nicht weiter eingegangen (z. B. [38]). Angemerkt sei an dieser Stelle, dass Arzneimitteldaten einen Datumsbezug haben (Verordnungsdatum/Abgabedatum), ambulante Diagnosen hingegen nur quartalsweise übermittelt werden; d. h., dass der Verordnungsanlass nur indirekt aus dem Spektrum der Diagnosen ermittelt werden kann (s. hierzu den Abschnitt Limitationen). Hierbei ist das methodische Vorgehen, beispielsweise bei Fragen der Qualität der Indikationsstellung oder der Behandlungshäufigkeit bei bestimmten Erkrankungen, transparent darzulegen.

Die Tab. 1 gibt einen Überblick über die vorhandenen Variablen und Beispiele für ihre Heranziehung in pharmakoepidemiologischen Studien (zu den Datenprofilen s. [16]).

Tab. 1 Übersicht zu zentralen Variablen der GKV-Daten und ihre Nutzung für Pharmakoepidemiologie und Arzneimittelverbrauchsforschung

Deskriptive Studien zum Arzneimittelgebrauch

Welche Fragestellungen wurden untersucht? Betrachtet man die 114 deskriptiven Studien, so stehen Schätzungen zur Häufigkeit von (Erst)verordnungen (Prävalenz/Inzidenz), zu verordneten Mengen und verordnende Arztgruppen, zu Mustern der Verordnung sowie Bewertungen der Arzneimittelauswahl durch Vergleich mit Therapieempfehlungen im Vordergrund (siehe Infobox).

Infobox Themen deskriptiver Studien

  • Häufigkeit der Verordnung bzw. Behandlungsprävalenz nach Altersgruppen und Geschlecht (Versicherte insgesamt/für Versicherte mit ausgewählten Erkrankungen)

  • Anzahl der Versicherten mit Erstverordnung

  • Verordnungsprävalenz nach Regionen (z. B. Bundesländer)

  • Zeitliche Entwicklung der Verordnungshäufigkeit, saisonale Unterschiede

  • Anzahl an Verordnungen im Beobachtungszeitraum/Anzahl an verordneten Tagesdosen (z. B. nach Wirkstoffen), Anzahl an „high utilizer“

  • Anzahl Versicherte nach Anzahl verschiedener, gleichzeitig verordneter Wirkstoffe (Multimedikation)

  • Häufigkeit potenzieller Interaktionen

  • Wechsel der Wirkstoffe (Switches/Shift nach Rückruf oder Warnhinweisen), Häufigkeit von Generikaverordnung

  • Häufigkeit bestimmter (erklärungsintensiver) Darreichungsformen

  • (Erst)verordnende Arztgruppen

  • Kodierte Diagnosen bei Versicherten mit beobachteter Arzneimittelverordnung/Verordnungen bei Vorliegen bestimmter Diagnosen

  • Bewertung der Arzneimittelverordnungen in Bezug auf Therapieempfehlungen (Leitlinien, Ständige Impfkommission, Listen potenziell inadäquater Medikation im Alter, anticholinerge Belastung) oder auch Zulassungsstatus (Off-Label-Verordnungen)

  • Häufigkeit arzneimittelbezogener Qualitätsindikatoren (z. B. Erstlinientherapie, Reserveantibiotika)

Die Durchführung deskriptiver Studien auf der Basis von Krankenkassendaten erfordert eine Reihe von methodischen Festlegungen, die im Folgenden kurz skizziert werden. Vielfach gibt es keinen methodischen Standard, sondern die Vorgehensweise richtet sich nach der Zielsetzung der Studie. Wichtig ist allerdings, dass das Vorgehen transparent dargelegt wird (s. hierzu die Leitlinie „Gute Praxis Sekundärdatenanalyse“ [45], Grundlagen zur Nutzung von Daten dieser Art sind im Handbuch „Routinedaten im Gesundheitswesen“ beschrieben [44]).

Datenquelle

Die erste Frage gilt der Datenbasis. Bislang erfolgten die Studien auf der Datengrundlage einzelner (oder auch zusammengeführter verschiedener) Krankenkassen. Einige wenige der hier in MEDLINE identifizierten Studien konnten auf Basis von Versorgungsdaten des Deutschen Instituts für Medizinische Dokumentation und Information (DIMDI) durchgeführt werden. Hier lagen für alle GKV-Versicherten einige Datenprofile (u. a. Diagnosen und Arzneimittelverordnungen) vor. Das neue Forschungsdatenzentrum Gesundheit des Bundesinstituts für Arzneimittel und MedizinprodukteFootnote 5 (BfArM) sieht einen deutlich erweiterten Datenkranz vor [46].

Im ersten Schritt ist zu prüfen, ob es bei der vorhandenen Datengrundlage Besonderheiten gibt (z. B. in der Zusammensetzung der Population, regional tätige Krankenkasse) und mögliche Verzerrungen zu erwarten sind. Da sich der Arzneimittelgebrauch regional unterscheidet [31], ist diese Frage bei Heranziehung einzelner oder regional tätiger Kassen zu klären, wenn auf der Datenbasis Hochrechnungen auf alle GKV-Versicherten erfolgen sollen. Des Weiteren ist von Bedeutung, ob GKV-Versicherte oder nur Personen mit Arztkontakt (Daten der Kassenärztlichen Vereinigung – VersorgungsatlasFootnote 6) die Datengrundlage darstellen, da dies Einfluss auf Prävalenzschätzung nimmt. Für einige wenige Datenquellen liegen Beschreibungen [23] und Vergleiche zur (GKV-)Bevölkerung vor [2, 34].

Festlegung der zu untersuchenden Population

Krankenkassendaten haben den Vorteil des Bevölkerungsbezugs, jedoch stellt die Population eine sich ständig verändernde Grundgesamtheit dar – Personen treten im Laufe eines Jahres ein und aus. Aus diesem Grund muss für die Auswertung festgelegt werden, welche Population untersucht werden soll. Gängige Festlegungen sind beispielsweise für Prävalenzschätzungen, alle Versicherte (der zu untersuchenden Altersgruppe) einzubeziehen, die mindestens einen Tag im Beobachtungsjahr versichert waren. Zur Beschreibung der Inanspruchnahme und Versorgung werden – da eine lückenlose Beobachtung erforderlich ist – durchgängig Versicherte oder bis zum Tod durchgängig Versicherte als Untersuchungspopulation herangezogen. Um das Problem unterschiedlicher Versicherungszeiten zu umgehen, werden in manchen Studien auch Versichertenjahre (statt einzelner Versicherter) ausgewiesen. Die hierzu notwendigen Informationen zur Definition der zu untersuchenden Population und Festlegung des Nenners finden sich in den Stammdaten der Versicherten [16]. Auf methodische Probleme zwischen dem Ende einer Versicherungszeit (z. B. durch Tod) und noch später dokumentierten Abrechnungen haben Ditscheid et al. (2020; [6]) hingewiesen.

Altersgruppen werden anhand des in der Regel für Auswertungen zur Verfügung stehenden Geburtsjahres festgelegt. Für andere Untersuchungspopulationen wie beispielsweise Frühgeborene, Neugeborene, Schwangere, Palliativpatient:innen, Versicherte mit bestimmten Erkrankungen oder Leistungen (z. B. Disease-Management-Programme [DMP]) oder Versicherte in bestimmten Regionen, um nur einige Beispiele zu nennen, müssen mittels der vorhandenen Daten Aufgreifkriterien vorab festgelegt werden (z. B. ausgewählte ICD-10-Diagnose-Codes oder EBM(Einheitlicher Bewertungsmaßstab)-Leistungen, Angaben aus den Stammdaten zum Bundesland des Wohnortes usw.). Hierzu finden sich nur selten eigenständige Publikationen zum methodischen Vorgehen wie beispielsweise zur Identifikation von Schwangerschaft und Schwangerschaftsoutcomes in Routinedaten [33, 49]. Wird die Arzneimitteltherapie von Versicherten mit bestimmten Erkrankungen untersucht (z. B. Demenz, koronare Herzkrankheit, multiple Sklerose, Parkinson), sind die jeweiligen Aufgreifkriterien wie einbezogene Diagnosen (ICD-10-GM-Codes mit Modifikatoren), Anforderungen an die Dokumentationshäufigkeit (Stichwort interne Validierung [40]), Ausschlusskriterien etc. darzulegen. Bislang wurden nur vereinzelt Validierungsstudien i. S. einer Übereinstimmung der Dokumentation mit dem Vorliegen der Erkrankung bei den Versicherten durchgeführt. In der Regel werden die Ergebnisse zu Erkrankungshäufigkeiten indirekt durch Vergleich mit anderen Datenquellen plausibilisiert [20].

Arzneimittel

Rezeptpflichtige und durch die GKV erstattete Arzneimittel lassen sich im Prinzip gut in GKV-Routinedaten durch ihre Pharmazentralnummer (PZN) bzw. durch den in den Krankenkassendaten vorhandenen sog. ATC-CodeFootnote 7 zur Klassifizierung nach Indikationen und Wirkstoff(gruppen) erkennen. Vor einer Auswertung ist eine Reihe von Fragen zu klären:

  • Gibt es Veränderungen in der ATC-Kodierung über die Zeit? Sofern nicht jeweils der für das entsprechende Auswertungsjahr aktuelle ATC-Code herangezogen wird, sind unter Nutzung des zum Zeitpunkt der Auswertung vorliegenden aktuellsten ATC-Codes die Codes der Vorjahre entsprechend zu aktualisieren.

  • Wird der Wirkstoff in verschiedenen Indikationen eingesetzt? Für die Analyse ist festzulegen, welche ATC-Codes für den Wirkstoff einbezogen werden sollen. So finden sich z. B. für Acetylsalicylsäure aufgrund unterschiedlicher Indikationen 10 verschiedene ATC-Codes.

  • Wird das ambulant verordnete Arzneimittel durch die GKV erstattet (nur dann finden sich hierzu Daten bei den Krankenkassen)? Gibt es für den Wirkstoff oder die Wirkstoffgruppe auch apothekenpflichtige und somit nicht erstattungsfähige Medikamente (z. B. geringere Dosierungen bei nichtsteroidalen Antirheumatika, Migränemittel, Protonenpumpenhemmer)? Ist dies der Fall, muss eine Unterschätzung der Behandlungsprävalenz und Exposition berücksichtigt werden.

  • Wird das Arzneimittel vorwiegend im stationären Sektor eingesetzt? Wird es dort durch einen eigenen Operationen- und Prozeduren(OPS)-Code kodiert (OPS Version 2021, Kap. 6: Medikamente)? Die während eines stationären Aufenthaltes notwendige Arzneimitteltherapie wird von Ausnahmen abgesehen (z. B. Onkologika, Immuntherapeutika) nicht gesondert durch die Krankenkassen erstattet und somit nicht in den Routinedaten abgebildet.

  • Wird das Arzneimittel, obwohl erstattungsfähig, ggf. auf einem Privatrezept verordnet? Der Umfang der Privatverordnungen ist schwer abzuschätzen, aber wie für Benzodiazepine und Z‑Drugs gezeigt werden konnte, nicht unerheblich [19, 21].

  • Sollen bei der Analyse die in Kombinationen und in Rezepturen vorhandenen Wirkstoffe sowie bei Rezepturen der mögliche Verwurf erfasst werden? Hierzu sind eigene Aufbereitungsschritte der Daten – Zerlegung und Kodierung der jeweiligen Kombinationspartner, Heranziehung der Hilfstaxe – notwendig.

  • Für eine Darstellung des Arzneimittelverbrauchs sind auch Angaben zur Zahl der Verordnungen sowie der verordneten Tagesdosen („defined daily dose“ [DDD]) erforderlich. Letzteres steht i. d. R. in den Krankenkassendaten durch die Arzneimittel Stammdateiplus des Wissenschaftlichen Institut der AOKFootnote 8 zur Verfügung, jedoch ist zu berücksichtigen, dass es sich bei den DDD-Angaben um eine rechnerische Einheit für die Hauptindikation und nicht um eine Dosierungsempfehlung handelt. Sind Informationen zur Dauer einer Therapie notwendig (Bestimmung von Adhärenz, Persistenz, Arzneimittelepisoden, Expositionszeitraum), müssen Annahmen zur täglichen Dosierung getroffen oder datengestützt aus der Verordnungsmenge und dem Zeitraum ermittelt werden (s. unten).

  • Vielfach ist von Interesse, für welche Indikation ein bestimmter Wirkstoff verordnet wird. In den Routinedaten liegt bislang keine Angabe zum Verordnungsanlass vor, sodass nur indirekt auf die Indikation (z. B. anhand der Dokumentation einer Erkrankung bzw. durch Vergleich mit einer Kontrollgruppe ohne die untersuchte Medikation) geschlossen werden kann.

Analytische Studien zum Arzneimittelgebrauch

Bei den in MEDLINE identifizierten 121 Studien stehen drei zentrale Fragestellungen im Zentrum: Risiken/Nutzen der Therapie, Determinanten der Verordnung und zeitliche Trends der Verordnungshäufigkeit (siehe Infobox).

Infobox Themen analytischer Studien

  • Untersuchung des Zusammenhangs zwischen der Exposition mit einem Wirkstoff und einem definierten Outcome wie Hospitalisierung, spezifische Erkrankungen und unerwünschten Ereignissen (z. B. Schlaganfall, Blutungen, Unfälle/Stürze, Hyperkaliämie, „torsades de pointes“), zeitlicher Zusammenhang zum Auftreten von Komorbiditäten, Gesamtmortalität und kardiovaskuläre Mortalität. Diese Studien zur Pharmakovigilanz und Arzneimitteltherapiesicherheit untersuchen Effektivität und Sicherheit einer Medikation unter den Rahmenbedingungen der Alltagspraxis.

  • Untersuchung von Einflussfaktoren auf die Verordnung eines bestimmten Wirkstoffs oder einer Wirkstoffgruppe (z. B. Antipsychotika, Antibiotika, Erstlinientherapie), von Off-Label-Verordnungen, Polypharmazie oder PIM (potenziell inadäquate Medikation) in verschiedenen Populationen (z. B. ältere Versicherte, die zuhause oder in Pflegeheimen leben, Demenzpatienten). Neben Alter und Geschlecht werden u. a. Einflussfaktoren wie Pflegestatus, Arztgruppen, Inanspruchnahme allgemein, (Ko)morbidität oder Wohnort/Region untersucht. Untersucht werden auch Einflussfaktoren auf eine nach Leitlinien zu erwartende, jedoch fehlende Therapie wie z. B. Antithrombotika bei Vorhofflimmern (Stichwort: Unterversorgung).

  • Untersuchung von Einflussfaktoren auf die Adhärenz/Non-Adhärenz und Persistenz einer Arzneimitteltherapie (z. B. Biologika, Osteoporosemedikation, Methotrexat) in unterschiedlichen Patientengruppen.

  • Untersuchung von Einflussfaktoren (u. a. durch Datenlinkage mit Befragungsdaten) auf Leitlinienadhärenz bzw. Umsetzung medizinischer Empfehlungen (STIKO [Ständige Impfkommission], DMP [Disease-Management-Programme]), z. T. verbunden mit der Evaluation von Maßnahmen zur Optimierung der Arzneimitteltherapie (Qualitätszirkel, DMP, Pharmazeutische Betreuung, Antibiotika Stewardship).

  • Untersuchung von Outcomes bei Leitlinienadhärenz/Nichtadhärenz, Untersuchung von Einflussfaktoren (u. a. in Abhängigkeit vom Therapieregime) auf die Zeit bis zum Therapieabbruch (z. B. bei Verordnung von Antipsychotika).

  • Untersuchung von zeitlichen Trends der Verordnung und Veränderungen in der Arzneimittelauswahl, z. B. im Zusammenhang mit Warnhinweisen oder Rückrufaktionen oder gezielten Informationsmaßnahmen, z. B. zu Antiepileptika in der Schwangerschaft, Verordnung kombinierter hormoneller Kontrazeptiva.

Auch hier soll im Folgenden auf einige zu beachtende methodischen Fragen hingewiesen werden.

Studiendesign und statistische Verfahren

In Bezug auf die vielfältigen Anforderungen bei der Durchführung von Zusammenhangsanalysen stehen die beiden Aspekte Confounder und Bias im Vordergrund. Bei den von Pottegard et al. [36] empfohlenen 30 methodischen Publikationen befassen sich 9 Publikation mit Studiendesign, allein 7 mit Bias und 4 mit statischer Analyse. Bei der Nutzung von Routinedaten hat in der Regel die zu beobachtende Therapie bereits stattgefunden und Randomisierungen wie in klinischen Studien („randomized controlled trial“ [RCT]) sind nicht möglich. Dennoch wird versucht, durch das Studiendesign (z. B. „new user design“ [30], Negativkontrollen [10]) und durch statistische Verfahren die vorhandenen Gruppenunterschiede so weit wie möglich auszugleichen, um somit zur Wirksamkeit und Sicherheit oder auch Determinanten einer Therapie in nicht selektiven Populationen, d. h. unter Alltagsbedingungen, Aussagen treffen zu können. Hierbei wird versucht, die klinischen Studien soweit möglich mit Routinedaten nachzubilden [17, 26, 48]. Eine Schwierigkeit und oftmals auch Einschränkung hinsichtlich der Aussagekraft der mit Routinedaten durchgeführten Outcome-Studien liegt in den – zumindest noch gegenwärtig – nicht messbaren Einflussfaktoren (z. B. Schwere der Erkrankung/Frailty, Einstellungen der Versicherten und der Ärzteschaft, Lebensstilfaktoren, Gesundheitsverhalten). Zum Teil können in Routinedaten vorliegende Informationen als Proxies herangezogen werden, wie GKV-Kosten, Krankenhausaufenthalte, Pflegestufe, Morbiditätsindizes wie der Charlson oder Elixhauser-Komorbiditätsindex [4, 9, 37], Multimedikation oder auch die Zahl der behandelnde Ärzte, um den Gesundheitsstatus zu charakterisieren und auf Unterschiede zwischen den Gruppen zu kontrollieren. Gegebenenfalls können Lebensstilfaktoren in Annäherung z. B. anhand von Diagnosen zur Erkrankungen im Zusammenhang mit Rauchen, Alkoholkonsum oder Ernährung [7, 8] abgebildet werden sowie sozioökonomische Einflussfaktoren durch Indizes (Deprivationsindex mit der Gefahr eines ökologischen Trugschlusses; [27]). Eine Zusammenfassung relevanter Aspekte von Strategien zur Reduktion von Verzerrungen findet sich bei Stürmer et al. (2020; [42]), Sendor/Stürmer et al. (2022; [41]) und Pigeot et al. (2021; [35]). In diesem Zusammenhang sei insbesondere auf den „immortal time bias“ (Berücksichtigung von Zeitspannen, in denen das Outcome nicht auftreten kann; [43]) sowie das „new user design“ in Kombination mit dem sog. „active comparator design“ (Vergleich mit einer anderen erstmaligen Therapie bei gleicher Indikation; [30]) zur Vermeidung eines Indikationsbias hingewiesen. Ein Datenlinkage mit anderen (primären) Datenquellen könnte dazu beitragen, einige der bislang vorhandenen Einschränkungen bei der Nutzung von Routinedaten zu beseitigen. Neben diesen zentralen Aspekten soll im Folgenden noch auf einige Punkte eingegangen werden, die bei der Studienplanung zu berücksichtigen sind.

Festlegung der Exposition und des Expositionszeitraums

Die Arzneimitteltherapie als Exposition wird mittels des ATC-Codes erfasst. Voraussetzung ist, wie oben dargestellt, dass die Verordnung erstattet wurde und die für die Untersuchung herangezogenen ATC-Codes begründet werden. Zu prüfen ist, welche Verzerrung des Studienergebnisses dadurch entstehen kann, dass für die Fragestellung relevante Wirkstoffe auch in Selbstmedikation erhältlich sind, wozu in den Daten keine Angaben vorliegen und die Häufigkeit der Selbstmedikation sich zwischen den untersuchten Populationen unterscheiden kann. Grundlegende Annahme bei pharmakoepidemiologischen Studien ist, dass verordnete Arzneimittel im Prinzip auch (regelmäßig) eingenommen werden. Finden sich nur Einmalverordnungen, wenn eigentlich längere Therapien erwartet würden, sollten die Empfänger gesondert untersucht werden, da möglicherweise Nebenwirkungen die Fortsetzung der Therapie verhindert haben oder andere Gründe gegen eine Einnahme gesprochen haben [24].

Studien zur Adhärenz, aber auch die Untersuchung zwischen einer Behandlung und einem erwünschten oder unerwünschten Ergebnis erfordern, dass die Dauer der Exposition bestimmt wird. Es sind Kenntnisse bzw. Festlegungen zum Zeitpunkt des Therapiebeginns (was nicht zwingend das Abgabedatum der Verordnung sein muss), zur Kontinuität der Anwendung (tägliche Behandlung/Zyklen) und zum Zeitpunkt des Therapieendes erforderlich. Angaben zur individuellen Dosierung liegen in den Daten nicht vor. Die Reichweite einer Therapie wird beeinflusst von der täglichen Dosis und den möglichen Therapieunterbrechungen (z. B. Krankenhausaufenthalt, Therapiepausen, Einnahmefehler; [15, 25]). Zur verordneten Dosis müssen in der Regel vorab Annahmen getroffen werden bzw. es muss vorab geprüft werden, ob sich die international festgelegte DDD von der ermittelbaren verordneten Wirkstoffmenge in einem bestimmten Zeitraum („prescribed daily dose“ [PDD]) unterscheidet. Bei Wirkstoffen, bei denen – wie z. B. bei Phenprocoumon – die individuelle Dosierung einen weiten Range umfasst, unterscheidet sich entsprechend die DDD von der PDD und somit auch der Zeitraum der potenziellen Exposition. Damit würde z. B. bei Annahme von einer Tagesdosis der Expositionszeitraum bzw. die Adhärenz deutlich unterschätzt werden, da in der Regel die tägliche Dosis deutlich geringer und damit die Anwendungsdauer länger ist, und auftretende Ereignisse wie eine Blutung oder ein Infarkt würden nicht mehr der Therapie zugeordnet werden. Eine Strategie besteht darin, den individuelle Expositionszeitraum anhand des Musters der Verordnung zu ermitteln [32]. Expositionszeiträume und damit auch Angaben zur Adhärenz können auf Basis von Routinedaten nur unter Festlegung verschiedener Annahmen wie tägliche Dosis, Einnahme während Krankenhauszeiten etc. näherungsweise ermittelt werden. Zu empfehlen sind deshalb Sensitivitätsanalysen z. B. mit unterschiedlichen Dosierungen [22, 48]. Eine Darstellung möglicher Missklassifikationen hinsichtlich der Arzneimittelanwender bzw. Nichtanwender sowie des Expositionszeitraum und die Folgen für analytische Studien findet sich bei Funk und Landi [11].

Indikation und Erkrankungen als Outcomes

Soll ein Ereignis unter einer Medikation für eine bestimmten Indikation untersucht werden (z. B. Blutung unter Antithrombotika bei Vorhofflimmern), so sind die Aufgreifkriterien – Auswahl der ICD-Codes sowie die Anforderungen an die interne Validität der Kodierung, Angaben zu Tod, Hospitalisierung etc. – darzulegen. Dies gilt für die Indikation wie für Erkrankungen [28] als Outcomes. Außerdem ist darzulegen, wie in den Routinedaten der zeitliche Zusammenhang zwischen einer Behandlung und beispielsweise einem unerwünschten Ereignis – erhoben über eine oder mehrere Diagnosen – sichergestellt wurde. Stationäre Diagnosen (Aufnahme- und Entlassdiagnosen) sind mit einem Datum versehen, ambulante Diagnosen werden hingegen nur quartalsweise übermittelt, sodass auch hier ggf. Annahmen zu treffen sind.

Im Unterschied zu anderen LändernFootnote 9 liegen für Deutschland nur wenige Studien zur externen Diagnosevalidierung vor [47]. In diesem Zusammenhang ist auch zu prüfen, ob die Möglichkeit eines „confounding by indication“ – Therapiewahl unter Alltagsbedingungen entsprechend bestimmter Charakteristika der Patienten wie Schweregrad, Nierenwerte, Demenz, Frailty etc. [41] – besteht, wodurch das Ergebnis, sofern nicht kontrollierbar, ebenfalls verzerrt werden kann. Des Weiteren ist festzulegen, ob inzident oder prävalent Erkrankte untersucht werden. Für erstere ist eine Festlegung nötig, in welchem Vorbeobachtungszeitraum die Diagnose nicht kodiert sein darf. Schwierigkeiten bestehen bei Erkrankungen, die lange zurückliegen und bei denen keine Behandlung dokumentiert ist sowie bei Erkrankungen, die schubförmig verlaufen (z. B. multiple Sklerose, Colitis ulcerosa) oder die auch vor der ärztlichen Indikationsstellung schon vorhanden sein können, was die Feststellung des Zeitpunktes der Erstdiagnose erschwert [1, 5].

Stärken und Limitationen der Routinedaten

Die Nutzung von Routinedaten geht wie auch Verfahren bei Primärstudien mit Vor- und Nachteilen einher. Diese sind schon vielfach dargestellt worden [39, 44], deshalb werden hier nur kurz einige Punkte benannt. Als Vorteile werden der große Datenumfang mit einer definierten Grundgesamtheit, lange Beobachtungszeiträume und das Fehlen eines Erinnerungs- und Interviewer-Bias genannt. Auch die im Unterschied zu Feldstudien vergleichsweise schnelle – wenn auch nicht immer aktuelle – und kostengünstige Verfügbarkeit stellt einen Vorteil dar. Die Daten umfassen außerdem alle Versicherte, d. h., es bestehen kein Drop-out oder Selbstselektion, was die Repräsentativität der Aussagen (bezogen auf die herangezogene Grundgesamtheit einer Kasse) erhöht. Da die Daten personenbezogen (pseudonymisiert) zur Verfügung stehen, sind sektorenübergreifende Analysen möglich. Die Daten erlauben die Bearbeitung einer Vielzahl von Fragestellungen und unterschiedlicher Studiendesigns.

Bei der Nutzung der Daten sind jedoch, wie z. T. schon erwähnt, Limitationen zu berücksichtigen. Es handelt sich um administrative Daten, die zur Leistungsabrechnung an die Krankenkassen übermittelt wurden, d. h., es stehen keine Angaben zu den Ergebnissen von Untersuchungen (Laborwerte u. a.), aber auch keine Informationen zu patientenbezogenen Parametern wie Lebensqualität oder Zufriedenheit zur Verfügung. Auch liegen nur wenige soziodemografische Angaben vor. Dies schränkt die Kontrolle von Confoundern in analytischen Studien deutlich ein. Die Diagnosen sind nach ICD-10 verschlüsselt und geben nur in diesem Rahmen Informationen zu Schweregraden oder Stadien der Erkrankung, was für manche Studien die Aussagekraft einschränkt. Für pharmakoepidemiologische Studien ist von Nachteil, dass keine Dosierungsangaben – eine wichtige Information zur Ermittlung von Adhärenz und Exposition – übermittelt werden und der Verordnungsanlass (ICD-10-Diagnose) nicht an die Verordnung geknüpft ist. Auch werden nur Leistungen dokumentiert, die zu Lasten der GKV erbracht wurden. Im hier genannten Kontext fehlen somit Angaben zur Selbstmedikation und zu ärztlich verordneten aber nicht erstatteten Medikamenten. Aus dem stationären Sektor werden nur eine begrenzte Auswahl von Arzneimitteltherapien (z. B. Chemotherapie) in den Daten erfasst, eine neu initiierte Therapie lässt sich nur indirekt aus dem zeitlichen Verlauf ermitteln.

Fazit für die Praxis

  • Routinedaten sind in der Arzneimittelverbrauchsforschung inzwischen auch in Deutschland als wertvolle Datenquelle anerkannt.

  • Routinedatenbasierte Studien untersuchen die Versorgung sowie Nutzen und Risiken von Intervention unter Alltagsbedingungen und stellen durch ihren Bevölkerungsbezug wichtige Informationen über den Arzneimittelgebrauch nach der Zulassung bereit (Nachmarktkontrolle, Auswirkungen von regulatorischen Maßnahmen).

  • Nachteile und Grenzen der nicht für Forschungszwecke generierten Daten sind vielfach beschrieben und Verfahren zur adäquaten Nutzung aufgezeigt worden. Die in Routinedaten nicht messbaren Confounder könnten zukünftig in größerem Umfang – sofern datenschutzrechtlich möglich – mit Informationen aus anderen Datenbeständen wie elektronische Patientenakte oder Primärdaten aus Studien erhoben werden.

  • Studien zur Arzneimitteltherapie wurden bislang vorwiegend auf den Datensätzen einzelner Krankenkasse durchgeführt. Eine Verbesserung der Datenlage wird durch das im Aufbau befindliche Forschungsdatenzentrum Gesundheit des BfArM mit Daten aller GKV-Versicherten erwartet.