Prävention und Gesundheitsförderung

, 6:305

Die Eignung von Sekundärdaten zur Evaluation eines Interventionsprojekts

Erfahrungen aus der AGil-Studie

Authors

    • Institut für Sozialmedizin und GesundheitsökonomieMedizinische Fakultät der Otto-von-Guericke-Universität Magdeburg
  • D. Thomas
    • Institut für Sozialmedizin und GesundheitsökonomieMedizinische Fakultät der Otto-von-Guericke-Universität Magdeburg
  • S. March
    • Institut für Sozialmedizin und GesundheitsökonomieMedizinische Fakultät der Otto-von-Guericke-Universität Magdeburg
  • T. Salomon
    • Zentrum für Sozialpolitik (ZeS)Universität Bremen
  • O. von dem Knesebeck
    • Institut für Medizinische Soziologie, Sozialmedizin und GesundheitsökonomieUniversitätsklinikum Hamburg-Eppendorf
Forschungsmethoden und Evaluation

DOI: 10.1007/s11553-011-0309-y

Cite this article as:
Swart, E., Thomas, D., March, S. et al. Praev Gesundheitsf (2011) 6: 305. doi:10.1007/s11553-011-0309-y

Zusammenfassung

Hintergrund

Die individuelle Verknüpfung von Primärdaten mit Sekundärdaten der gesetzlichen Krankenversicherung wird als vielversprechender Weg zur Überwindung der Limitationen der jeweiligen Datenkörper gesehen. Neben der Klärung rechtlicher, organisatorischer und technischer Fragen müssen bei der konkreten Nutzung von Sekundärdaten und der Interpretation ihrer Ergebnisse weitere Validierungen der Daten vorgenommen werden. Dies wird für eine Interventionsstudie beispielhaft vorgestellt.

Material und Methode

Das Programm „Aktive Gesundheitsförderung im Alter“ (AGil) setzt auf eigenverantwortliche Selbstbestimmung bzgl. körperlicher Aktivität, Ernährung und soziale Teilhabe und wurde realisiert im Rahmen eines Modellprojekts zur Integrierten Versorgung (IV). Die fragebogengestützte Ergebnisevaluation („Primärdaten“) in einem Prä-Post-Vergleich zielt auf gesundheitsrelevante Einstellungen und den subjektiven Gesundheitszustand. Darüber hinaus wurden Daten der AOK Baden-Württemberg zur Inanspruchnahme von Versorgungsleistungen genutzt („Sekundärdaten“).

Ergebnisse

Die individuelle Datenzusammenführung schlug bei 10% der Teilnehmer fehl. Auf der anderen Seite können in die Sekundärdatenanalyse rund 100 Teilnehmer einbezogen werden, die keinen t0-Fragebogen ausgefüllt hatten. Die Interpretation der Entwicklung der Inanspruchnahme bei den Teilnehmern wird durch die Auswirkungen des IV-Projekts und neuer Vergütungsregelungen überlagert. Der Prä-Post-Vergleich der Inanspruchnahme wird durch geringe Fallzahlen und einen kurzen 12-monatigen Nachbeobachtungszeitraum bei 50% der Studienteilnehmer sowie geringe Inzidenzen spezifischer Ergebnisindikatoren erschwert.

Schlussfolgerung

Die Nutzung von Sekundärdaten bei der Evaluation eines Interventionsprojekts bietet zahlreiche Chancen, wirft bei der konkreten Realisierung der Datenzusammenführung aber Probleme auf, die beim Studiendesign und der Interpretation der Ergebnisse beachtet werden müssen.

Schlüsselwörter

SekundärdatenPrimärdatenDatenverknüpfungInterventionsstudieInanspruchnahme

Using claims data in an evaluation study

Experiences from the AGil-Studie

Abstract

Background

The linkage of health-related primary data with claims data of the statutory health insurance is seen as a promising way to overcome the limitations of each data body and thereby provides new opportunities for health services research. Besides the consideration of legal, organizational and technical aspects, for the practical usage of secondary data and the interpretation of their results further validation of the data has to be done. Moreover, methodological issues arise when linking more data sets and operating a combined data analysis. Occurring problems and possible solutions for an intervention study are exemplified.

Methods

The program Aktive Gesundheitsförderung im Alter (AGil) – active health promotion and prevention for the elderly – is based on empowerment (independent self-determination), physical activity, nutrition and social participation. It was implemented in the context of a regional pilot project on integrated health care. The target group of the intervention consisted of participants of the pilot project from the age of 60, who were not in need of high maintenance and could live independently without cognitive impairment at home. In addition to the process evaluation an outcome evaluation in a pre-post comparison with respect to health-related attitudes and knowledge as well as the subjective state of health was conducted. Furthermore claims data on utilization of health services from the health insurance AOK Baden-Württemberg were used, which included information of all insured for all medical services in the period of 2004 to the second quarter in 2009.

Results

The individual data merging did not succeed for the whole data set and all participants. However, in the secondary data analysis participants can also be included who did not fill out the t0-questionnaire. The interpretation of the data – the utilization patterns of the participants and the development over time – will be impeded by the effects of the integrated health project and new compensation arrangements. Thus, a rise in the treatment prevalence of confirmed diagnoses and the intensity of outpatient care is not necessarily traced back to the intervention. The pre-post comparison of inpatient and outpatient utilization is hampered by the low number of cases. Claims data for at least 1 year after the intervention are available for only half of the study participants. A longer observation period was not feasible due to the delay in the provision of claims data. The low incidence of the outcome indicators (such as hospitalization and the onset of the need for care) results in considerably lower statistical power.

Conclusions

For the evaluation of an intervention project the use of claims data and their individual linkage with primary data provides many opportunities. In the specific realization of the data linkage problems can occur which have to be considered when planning the study design and interpreting the results. Besides, there are limitations of claims data arising from their origin in connection with the billing of medical services. On the basis of the experiences recommendations can be derived which could enhance the scientific use of claims data in the future.

Keywords

Primary dataClaims dataData linkageIntervention studyUtilization

Ausgangspunkt

Die Nutzung von Sekundärdaten gesetzlicher Krankenversicherungen im Rahmen der Evaluationsforschung wird seit längerem als Option diskutiert, um Limitationen von Primärstudien bzgl. objektiver und „harter“ Endpunkte zu überwinden. GKV-Prozessdaten zeichnen sich dabei durch zahlreiche Vorteile aus: sie sind populationsbasiert, relativ kostengünstig und zeitnah zu erschließen, weitgehend frei von Verzerrungen und umfassen hohe Fallzahlen und dadurch eine hohe statistische Präzision, ebenso wie sie für ein langes Follow-up genutzt werden können [13]. Aus Routinedaten können bei Beachtung der in den letzten Jahren entwickelten methodischen Standards [15] spezifische Outcomeindikatoren bzgl. Morbidität und Inanspruchnahme abgeleitet werden [10, 18]. Gerade diese Ergebnisindikatoren können in vielen Interventionsstudien nicht über Primärdaten abgebildet werden, so auch in der weiter unten beschriebenen AGil-Studie.

Die Nutzung von Sekundärdaten – ergänzend zu den Primärerhebungen – und ihre gezielte Verknüpfung stellen sich damit als Chance für die Evaluationsforschung dar. Die gesetzlichen und methodischen Grundlagen dieser Datenverknüpfung sowie das konkrete Vorgehen sind dabei ein eigener Problembereich [16]. Hinzu kommt, dass bei der Festlegung eines Studiendesigns zur Evaluation eines Präventionsprogramms (und ceteris paribus anderer Fragestellungen) die Nutzbarkeit von Sekundärdaten vor dem Hintergrund der konkreten wissenschaftlichen Fragen explizit geprüft werden muss. Schließlich muss bei der Auswertung der Sekundärdaten entsprechend dem a priori festgelegten Analyseplan die Validität der Ergebnisse ausdrücklich einer Bewertung unterzogen werden.

In diesem Beitrag sollen die Erfahrungen mit der Nutzung von GKV-Routinedaten in der AGil-Studie geschildert und daraus Empfehlungen für vergleichbare Studien abgeleitet werden. Er wird untersucht, inwieweit die oben beschriebenen Eigenschaften der Routinedaten, wie sie sich aus reinen Sekundärdatenanalysen ergeben, auch bei einer Verknüpfung mit Primärdaten zur Geltung kommen. Die AGil-Studie hat in der kombinierten Nutzung von Primär- und Sekundärdaten Neuland betreten. Die positiven wie negativen Erfahrungen sollen daher dazu beitragen, diesen Evaluationsansatz weiter zu entwickeln. Einzelergebnisse der Studie werden nur insoweit präsentiert, wie sie grundsätzliche methodische Aspekte der Sekundärdatennutzung berühren, die inhaltlichen Ergebnisse werden separat publiziert [7].

Hintergrund: Die AGil-Studie

Das Programm Aktive Gesundheitsförderung im Alter (AGil) setzt auf eigenverantwortliche Selbstbestimmung im Alter („Empowerment“) und zielt dabei ab auf die drei Bereiche körperliche Aktivität, Ernährung und soziale Teilhabe. AGil wurde in einem städtischen Kontext (Hamburg) entwickelt und dort erstmals umgesetzt [8]. In der im Frühjahr 2011 beendeten AGil-Studie wird dieses Programm im Hinblick auf seine Umsetzbarkeit in einen ländlichen Kontext untersucht. Die vom BMBF geförderte Studie wurde vor dem Hintergrund eines Modellprojekts zur Integrierten Versorgung (IV) „Gesundes Kinzigtal“ [4] realisiert, das von der AOK und der Landwirtschaftlichen Krankenkasse Baden-Württemberg (LKK BaWü) getragen wird. Die Zielgruppe der Intervention bestand aus eingeschriebenen Teilnehmern des Modellprojektes im Alter von >60 Jahren, die nicht pflegebedürftig sind (d. h. keine Pflegestufe besitzen) und noch unabhängig und ohne kognitive Beeinträchtigungen zu Hause leben. Das Programm besteht aus einer eintägigen Schulung mit Informationen und individueller Beratung incl. persönlicher Empfehlungen für ein gesundheitsbewusstes Verhalten. Für die Interpretation der hier präsentierten Erfahrungen ist relevant, dass aufgrund des schwierigen Rekrutierungsprozesses die Umsetzung des Studiendesigns nicht in vollem Umfang gelang. Die Schulungen wurden im Zeitraum September 2007 bis März 2009 durchgeführt statt wie geplant bis Frühjahr 2008; außerdem wurde nur eine Teilnehmerzahl von 468 statt 600 realisiert.

Die Prozessevaluation beschäftigte sich mit den förderlichen und hinderlichen Faktoren bei der Übertragung des Programms in eine ländliche Region, der Zielgruppenereichung und der Akzeptanz des Programms. Im Mittelpunkt der Ergebnisevaluation stand die Frage nach Veränderungen in den Zielbereichen der Intervention wie Ernährung und Bewegung in Form eines Prä-Post-Vergleichs mittels vier fragebogengestützter Erhebungen zu Beginn der Intervention und bis zu 18 Monaten danach [7]. Zusätzlich wurden Daten der AOK Baden-Württemberg (AOK BaWü) zur Inanspruchnahme von Versorgungsleistungen im Prä-Post-Vergleich genutzt. Weiterhin erfolgte ein individuelles Datenlinkage mit den Primärdaten. Die Nutzung der Sekundärdaten wurde möglich durch die besonderen Rahmenbedingungen des IV-Projekts „Gesundes Kinzigtal“, das eine Einschreibung der Versicherten an das Einverständnis zur (pseudonymisierten) Datennutzung der individuellen Prozessdaten koppelt [4].

Struktur und Inhalte der GKV-Routinedaten

Die für die AGil-Evaluation genutzten Sekundärdaten der AOK BaWü umfassen für den 5,5-jährigen Beobachtungszeitraum 2004 bis Quartal II/2009 u. a. folgende Variablen:
  • Stammdaten der Versicherten: Alter und Geschlecht, PLZ des Wohnortes, Versichertenzeiten (Beginn, Ende) u. a.,

  • ambulante Versorgung: Scheine, ICD-10-verschlüsselte Diagnosen (quartalsbezogen), Leistungsziffern inklusive Punktzahlen und Tag der Leistungserbringung,

  • stationäre Versorgung: Einweisungs- und Entlassungsdiagnosen, Leistungen nach dem OPS-Katalog u. a.,

  • Arzneimittel: Angabe von Pharmazentralnummer (PZN) und (Brutto-)Preis der Verordnung, Verordnungsdatum, verordnender Arzt/Institution.

Grundlage der Nutzung der GKV-Routinedaten für die Evaluation der AGil-Studie war ein separater Vertrag incl. einer umfänglichen Datenschutzvereinbarung zwischen den an der Evaluation beteiligten Forschungseinrichtungen und der AOK BaWü. Mit der LKK BaWü wurde kein separater Vertrag über die Nutzung ihrer Routinedaten im Rahmen der AGil-Evaluation geschlossen. Der Aufwand dafür wurde bei dieser kleinen Kasse (2000 Versicherte im Kinzigtal vs. 30.000 der AOK BaWü) als zu hoch angesehen. In der Evaluation der Studie anhand der Primärdaten sind Versicherte der LKK BaWü enthalten, ohne dass das Merkmal Kassenzugehörigkeit verfügbar war. Aussagen über Unterschiede zwischen AOK- und LKK-Versicherten sind daher nicht möglich.

Grundgesamtheit der Sekundärdatenanalyse waren alle Versicherte der AOK BaWü (nicht nur AOK-Versicherte des Modellprojekts Gesundes Kinzigtal), die zum Stichtag 1. Oktober 2007, dem Beginn der Intervention, ≥55 Jahre waren. Die Absenkung des Mindestalters für die Sekundärdatenanalyse erfolgte, weil in der Intervention ebenfalls einige Teilnehmer jünger als 60 Jahre waren. Ausgeschlossen wurden Versicherte, die im Berichtszeitraum nicht durchgängig versichert waren und solche, die nicht im Kinzigtal wohnten. Dadurch verringerte sich die Versichertenzahl um 3,8% von 10.522 auf 10.118 Personen.

Ergebnisse der AGil-Studie

Die AGil-Studie wies kein kontrolliertes Design auf, dies ließ sich unter den Rahmenbedigungen der IV-Vorsorgung nicht realisieren. Den AGil-Teilnehmern konnten aber sowohl die in das Modellprojekt eingeschriebenen Versicherten der AOK, die an der Intervention nicht teilgenommen hatten („IV-Teilnahme, keine AGil-Teilnahme“), gegenübergestellt werden als auch die Gruppe der nicht eingeschriebenen Versicherten („AOK versichert, keine IV-Teilnahme“). Aufgrund des Designs sind Selektionseffekte und ihre Konsequenzen bzgl. der Interpretation der Ergebnisse nicht auszuschließen. Dieser Aspekt ist jedoch nicht Gegenstand dieses Artikels, der sich mit methodischen und technisch-organisatorischen Aspekten der Nutzung von GKV-Routinedaten und ihrer Zusammenführung mit Primärdaten beschäftigt. Die Diskussion um die Verallgemeinerbarkeit der Studienergebnisse wird daher hier nicht weiter vertieft.

Für die Evaluation anhand der Primärdaten konnten nur Teilnehmer mit einem ausgefüllten t0-Fragebogen berücksichtigt werden (319 „AGil-Teilnehmer, Fragebogen to ausgefüllt“), für die Sekundärdatenanalyse aber sämtliche Teilnehmer der Intervention, wodurch sich die Zahl der Versicherten in der Interventionsgruppe um fast einhundert erhöhte („AGil-Teilnahme, kein Fragebogen to“; Tab. 1).

Tab. 1

Interventions- und Vergleichsgruppen im Rahmen der AGil-Evaluation (Sekundärdatenanalyse)

Gruppe

Versicherte

n

%

AOK versichert, keine IV-Teilnahme

7.477

73,9

IV-Teilnahme, keine AGil-Teilnahme

2.227

22,0

AGil-Teilnahme, kein Fragebogen to

95a

0,9

AGil-Teilnehmer, Fragebogen to ausgefüllt

319a

3,2

Gesamt

10.118

100

aNur AGil-Teilnehmer, bei denen individuell Sekundärdaten zugespielt werden konnten; Gesamtpopulation: alle im Zeitraum 2004–2009 durchgängig Versicherten der AOK Baden-Württemberg im Alter von ≥55 Jahren (zu Beginn der Studie am 1. Oktober 2007) mit Wohnsitz im Kinzigtal (PLZ 777XX und 78132).

Rund ein Viertel der AGil-Teilnehmer füllte den t0-Fragebogen nicht aus, da dies nicht Voraussetzung für die Teilnahme an der Intervention war. Dieser Umstand ist nur relevant für die noch ausstehende Verknüpfung der Sekundärdaten mit den Inhalten der Evaluationsfragebögen, nicht jedoch für die Inhalte dieses Beitrags, weshalb darauf hier nicht weiter eingegangen wird.

Bei der Bewertung dieser Zahlen ist zu berücksichtigen, dass die Zusammenführung der Primärdaten (u. a. mit Informationen über den Zeitpunkt der AGil-Teilnahme und das Ausfüllen der verschiedenen Fragebögen) mit den Sekundärdaten anhand von Schlüsselvariablen nicht bei allen AGil-Teilnehmern gelang. Dies lag an fehlerhaften oder unvollständigen KV-Nummern in der IV-Geschäftsstelle, die der oben genannten Datenschutzvereinbarung gemäß für die Zusammenführung von AGil-Teilnehmernummer und pseudonymisierter KV-Nummer zuständig war. Außerdem machte sich die Tatsache bemerkbar, dass mit der LKK Baden-Württemberg keine Datenschutzvereinbarung geschlossen werden konnte. Insgesamt verringerte sich dadurch die Zahl der in den Sekundärdaten identifizierbaren AGil-Teilnehmer von 468 (davon 361 mit t0-Fragebogen) auf 414 (davon 319 mit t0-Fragebogen; Tab. 2).

Tab. 2

Teilnehmer an der AGil-Studie nach Quartal der Rekrutierung (unabhängig vom Ausfüllen des t0-Fragebogens)

Quartal

Teilnehmer

n

%

3. Quartal 2007

21

4,5

4. Quartal 2007

70

15,0

1. Quartal 2008

76

16,2

2. Quartal 2008

65

13,9

Zwischensumme

232

Davon in GKV-Daten identifizierbar

204

3. Quartal 2008

43

9,2

4. Quartal 2008

69

14,7

1. Quartal 2009

124

26,5

Gesamt

468

100

Davon in GKV-Daten identifizierbar

414

Diese Übersicht zeigt weiter, dass aufgrund des verlängerten Interventionszeitraums nur für die 232 Teilnehmer, die bis einschließlich zweites Quartal 2008 an der Intervention teilnahmen, ein mindestens einjähriger Follow-up-Zeitraum in den GKV-Daten abbildbar war. So konnten letztendlich nur 204 AOK-Versicherte in einen Prä-Post-Vergleich einbezogen werden. Es ist daher geplant, aus Eigenmitteln über die Projektförderung hinaus AOK-Daten aus zwei weiteren Quartalen zu nutzen und damit die Prä-Post-Evaluation auf eine breitere empirische Basis zu stellen.

Die insgesamt geringe Teilnehmerzahl an der Intervention und die deutlich verzögerte Rekrutierung erklärt sich durch Probleme bei der praktischen Umsetzung des Studiendesigns unter den spezifischen Bedingungen der ländlichen Region Kinzigtal gegenüber der erstmaligen Erprobung der Intervention in der Großstadt Hamburg [7, 9] und ist kein grundsätzlicher Nachteil der GKV-Routinedaten.

Positive Effekte der AGil-Schulung bzgl. Ernährung, Bewegung und soziale Teilnahme könnte man in einer weniger intensiven ambulanten Inanspruchnahme erwarten, die sich in einer geringeren Zahl der quartalsweise abgerechneten Scheine widerspiegeln müsste. Dabei zeigt sich jedoch, dass die Zahl der Scheine, unter denen alle in einem Quartal von einem niedergelassenen Arzt bei einem einzelnen Versicherten erbrachten Leistungen subsummiert werden, aufgrund einer EBM-Reform (Einheitlicher Bewertungsmaßstab) im Jahr 2008 sowohl bei der Gesamtheit der Versicherten als auch bei den AGil-Teilnehmern erheblich anstieg (Tab. 3). Die Identifikation möglicher Effekte der Intervention bzgl. dieses Indikators der Inanspruchnahme wird durch die oben genannten veränderten Rahmenbedingungen nahezu unmöglich. Dieses Beispiel zeigt auch, dass ausgehend von der inhaltlichen Fragestellung der Studie spezifische Indikatoren der Inanspruchnahme aus den Routinedaten abgeleitet und auf ihre Validität überprüft werden müssen.

Tab. 3

Durchschnittliche Zahl an Scheinen pro Jahr nach Scheinart (2004–2008, standardisiert)

Jahr

AOK-Versicherte Kinzigtal

Darunter AGil-Teilnehmer

Originalschein

Überweisung

Sonstigea

Originalschein

Überweisung

Sonstigea

2004

3,4

2,6

0,8

3,7

3,2

0,9

2005

3,5

2,6

0,9

3,7

3,4

1,0

2006

3,6

2,6

1,0

3,9

3,5

1,2

2007

3,7

2,8

1,0

4,0

3,7

1,1

2008

3,9

3,5

1,5

4,2

4,5

1,7

Delta 2008 vs. 2004 (%)

13,0

32,8

80,2

14,3

44,9

88,0

aNotfall, Vertretung, Konsiliar- und Zielbehandlung; Standard: Alters- und Geschlechtsstruktur aller AOK-Versicherten im Kinzigtal, 2006 (≥55   Jahre).

Ein weiterer, die Evaluation erschwerender Tatbestand stellt die Einführung des morbiditätsorientierten Risikostrukturausgleichs dar. Dadurch kam es bei allen Versicherten der AOK BaWü im Berichtszeitraum zu einer kontinuierlichen Erhöhung der dokumentierten Diagnosen. Der Anstieg der gesicherten Diagnosen (nach ICD-Kapiteln und einzelnen ICD-Codes) im Berichtszeitraum ist durch die Alterung der Versichertenpopulation allein nicht zu erklären, da er auch nach Alters- und Geschlechtsstandardisierung erkennbar bleibt (Tab. 4). Ähnliche Effekte waren bereits bei der Einführung der DRGs im stationären Sektor beobachtet worden [2]. Wenn in Tab. 4 z. B. Behandlungsprävalenzen von Augenerkrankungen berichtet werden, dann geschieht dies nicht, weil von der eintägigen Intervention im Rahmen der AGil-Studie diesbezüglich Auswirkungen zu erwarten gewesen wären, sondern weil durch dieses abstrakte Beispiel die allgemeine Tendenz zur Zunahme der Diagnosekodierungen verdeutlicht werden sollte und somit die Limitation der Daten in diesem konkreten Fall.

Tab. 4

Häufigkeit von gesicherten ambulanten Diagnosen nach ausgewählten ICD-Kapiteln (2005–2008, pro 1000 VJ, standardisiert)a

ICD-Kapitel

2005

2006

2007

2008

Delta 2008 vs. 2004 (%)

IX: Krhn. d. Kreislaufsystems

688

701

724

733

6,6

XIII: Krhn. Muskel-Skelett-System

591

606

623

642

8,6

IV: endokrine Stoffwechselkrhn.

561

587

612

626

11,7

XIV: Krhn. Urogenitalsystem

295

315

328

348

17,9

XVIII: Symptome

271

287

304

321

18,3

XI: Krhn. Verdauungssystem

252

272

290

304

20,6

V: psychische Krankheiten

256

270

282

288

12,2

VII: Krankheiten der Augen

235

244

258

263

11,8

VI: Krhn. des Nervensystems

190

198

205

216

13,5

X: Krhn. d. Atmungssystems

174

175

192

203

16,2

aVersicherte der AOK Baden-Württemberg mit Wohnsitz Kinzigtal (n =10.118).

Die eingeschränkte Belastbarkeit der Prä-Post-Evaluation ausschließlich für die AGil-Teilnehmer aufgrund der geringen Fallzahl zeigen Tab. 5 und Tab. 6. In der Kürze des einjährigen Nachbeobachtungszeitraums – über das Datum der eintägigen Intervention lassen sich bei der Zusammenführung von Primär- und Sekundärdaten exakte Nachbeobachtungszeiten berechnen – und aufgrund der geringen Versichertenzahl wurden lediglich 59 stationäre Aufnahmen (bei 39 Versicherten) beobachtet gegenüber 56 Aufnahmen (bei 43 Versicherten) im Jahr vor der Intervention. Auf der Ebene der Gesamtheit aller Krankenhausaufnahmen sind allerdings mögliche Effekte der Intervention angesichts der hohen Prävalenz chronischer Krankheiten und des damit verbundenen Risikos von Krankenhausaufenthalten nicht zu isolieren. Wenn man jedoch die stationären Aufenthalte nach Entlassungsdiagnosen differenziert, treten absolute Fallzahlen von weniger als zehn auf, die keine statistisch belastbaren Aussagen zulassen. Daneben ist zu bemerken, dass eine weitere Beschränkung auf Indikatoren erfolgen sollte, deren Ausprägung durch die Intervention beeinflusst werden (z. B. Krankenhausfälle wegen ernährungsbedingter Krankheiten, nicht jedoch Neubildungen). Die gleichen Einschränkungen für den kurzen Nachbeobachtungszeitraum gelten noch stärker für andere „harte“ Outcomeindikatoren wie Eintritt der Pflegebedürftigkeit oder Tod, deren Inzidenz noch geringer ist.

Tab. 5

Häufigkeit von Krankenhausbehandlungen bei AGil-Teilnehmern in Prä- und Postzeiträumena

Zeitraum

Fälle

Summe der KH-Tage

Durchschnittliche Verweildauer

>2 Jahre vor Intervention

119

1.102

9,3

1–2 Jahre vor Intervention

63

547

8,7

≤1 Jahr vor Intervention

56

417

7,5

≤1 Jahr nach Intervention

59

560

9,5

>1 Jahr nach Interventionb

31

248

8,0

aBezogen auf alle 204 Teilnehmer mit einer Schulung bis spätestens Quartal II/2008.

bFür einen großen Teil der Teilnehmer treten hier Zensierungen auf.

Tab. 6

Häufigkeit von Krankenhausaufnahmen bei AGil-Teilnehmern in Prä- und Postzeiträumena

Zeitraum

1. Jahr vor der Schulung

1. Jahr nach der Schulung

Krankheiten des Kreislaufsystems

14

22

Krankheiten Muskel, Skelett, Bindegewebe

12

6

Krankheiten des Verdauungssystems

8

4

Verletzungen, Vergiftungen

4

3

Symptome

4

2

Neubildungen

2

7

Krankheiten Ernährung und Stoffwechsel

1

3

Psychische Krankheiten

1

2

Andere Kapitel

10

12

Gesamt

56

59

aBezogen auf alle 204 Teilnehmer mit einer Schulung bis spätestens Quartal II/2008.

Nutzung von Sekundärdaten in Evaluationsstudien

Die grundsätzlichen Vor- und Nachteile von Sekundärdaten müssen hier nicht umfänglich wiedergegeben werden. Dazu sei auf Grundlagenliteratur verwiesen [3, 6, 12, 13, 14]. Diese zeigt eine breite Nutzbarkeit dieser Daten im Rahmen (versorgungs-)epidemiologischer Fragestellungen. Charakteristikum der dort beschriebenen Arbeiten ist jedoch der Tatbestand, dass allein Daten gesetzlicher Krankenkassen ohne eine weitergehende Verknüpfung mit anderen Daten genutzt wurden.

In der AGil-Studie wurde jedoch eine Zusammenführung mit den Primärdaten der Studienteilnehmer vorgenommen; und die Intervention erfolgte zudem vor dem Hintergrund spezieller Rahmenbedingungen des IV-Projekts „Gesundes Kinzigtal“. Beide Punkte sind zwar spezifisch für die Sekundärdatenanalyse in der AGil-Studie, könnten in ähnlicher Form aber auch in anderen Studien, die die Kombination von Primär- und Sekundärdaten vorsehen, wirksam werden, so dass die Erfahrungen aus AGil auch für andere Interventionsprojekte von Bedeutung sind. Die hier geschilderten Erfahrungen sprechen nicht grundsätzlich gegen eine Verknüpfung von Primär- und Sekundärdaten. Vielmehr sollte die Notwendigkeit betont werden, Schwierigkeiten, bei der individuellen Datenverknüpfung und anschließenden Datenanalyse frühzeitig zu antizipieren und in der Studienplanung zu berücksichtigen.

So spielte eine Rolle, dass sich im Rahmen des IV-Projekts „Gesundes Kinzigtal“ neue Kooperationsbeziehungen unter den beteiligten Ärzten herausgebildet haben, ebenso wie möglicherweise ein bewussteres Inanspruchnahmeverhalten der eingeschriebenen AOK-Versicherten. Eine höhere ambulante Inanspruchnahme der AGil- wie der IV-Teilnehmer gegenüber der Gesamtheit der AOK-Versicherten muss daher nicht auf höhere Morbidität zurückzuführen sein. Auch eine Kompensation von Fehl- oder Unterversorgung könnte zu einer erhöhten Inanspruchnahme im Vergleich zu den vorherigen Jahren führen. Durch den kurzen Betrachtungshorizont, das IV-Projekt begann erst in der zweiten Jahreshälfte 2006, ist dies nicht abschließend beurteilbar.

Ebenso müssen Änderungen in den Abrechnungs- und Kodiervorschriften (EBM-Katalog) oder in der Finanzierung der gesetzlichen Krankenversicherung (morbiditätsorientierter Risikostrukturausgleich) in ihren Auswirkungen auf die dokumentierte Morbidität berücksichtigt werden. Die Dokumentation von Diagnosen und anderen Merkmalen eines Behandlungsfalles müssen sowohl im ambulanten wie im stationären Bereich immer auch, wenn auch nicht ausschließlich, unter abrechnungsrelevanten und/oder organisationsrelevanten Aspekten gesehen werden.

Die Inanspruchnahme medizinischer Leistungen der AGil-Teilnehmer wurde der Inanspruchnahme von zwei Vergleichgruppen gegenübergestellt. Diese entsprechen aber nicht echten strukturgleichen Kontrollen in einem randomisierten Studiendesign. Die Übertragbarkeit der in den Sekundärdaten sichtbaren Entwicklung der Inanspruchnahme bei AGil-Teilnehmern auf andere Versichertenpopulationen muss daher anhand zusätzlicher Informationen, etwa aus den Primärerhebungen, überprüft werden. Diese liegen aber nur für die AGil-Teilnehmer vor. Eine Über- oder Unterschätzung der Effekte durch selektive Teilnahme muss für möglich erachtet werden, ohne dass sie mit den verfügbaren Daten abschließend überprüft werden könnte.

Durch den relativ langen Betrachtungszeitraum von insgesamt fünfeinhalb Jahren können Krankheitsepisoden zwar gut dargestellt werden. Allerdings ist innerhalb dieses gesamten Beobachtungszeitraums der besonders interessierende Follow-up-Zeitraum für die Beurteilung der Effektivität der Intervention relativ kurz. Die Auswirkung der Intervention wird durch u. U. schon länger bestehende chronische Krankheiten stark überdeckt.

Durch diese vielfachen Einflüsse auf die dokumentierte Inanspruchnahme wird eine saubere Trennung in Auswirkungen der Intervention von denen anderer Determinanten der Inanspruchnahme allein anhand von GKV-Routinedaten erschwert. Hinzu kommen die Limitationen der vorliegenden Datenbasis. Die geringen Fallzahlen bei den Teilnehmern und den Ergebnisindikatoren lassen nur eine sehr allgemeine Auswertung zu. Differenzierungen nach Untergruppen der Teilnehmer oder anhand spezifischer Indikatoren, die eine engere inhaltliche Verknüpfung zur Intervention aufweisen, besitzen bei Fallzahlen <10 keine statistische Aussagekraft. Diese unter den Erwartungen gebliebenen Fallzahlen sind v. a. Ausdruck der technischen, organisatorischen und rechtlichen Schwierigkeiten bei der Erhebung und Zusammenführung von Primär- und Sekundärdaten [16].

In dem Maße, in dem nicht primär die Inanspruchnahme im Mittelpunkt der Evaluation steht, sondern Indikatoren der Inanspruchnahme gleichberechtigt neben solchen wie subjektiver Gesundheit (z. B. SF12 oder SF36; [7, 9]) betrachtet werden, muss daran erinnert werden, dass die Sekundärdaten der gesetzlichen Krankenversicherung nur die Inanspruchnahme zu Lasten der GKV abbilden, und hier allein der AOK BaWü, die nicht automatisch mit der Morbidität der Versicherten oder ihrem Bedarf gleichzusetzen ist. Ebenso kann sich die Inanspruchnahme von Versicherten anderer Krankenkassen unterscheiden, anhand der Daten einer einzelnen Kasse nicht überprüft werden kann. Die externe Validität der Ergebnisse muss daher auf verschiedenen Ebenen (bzgl. der Nicht-Teilnehmer an der Intervention, anderer Rahmenbedingungen der Versorgung und der Versicherter anderer Kassen) bewertet werden.

Ausblick

Die Verknüpfung von Primär- und Sekundärdaten und damit die synergistische Nutzung beider Datenquellen hat sich in der Versorgungsforschung in den letzten Jahren als vielversprechender Weg für „eine umfassende patientenbezogene Versorgungsepidemiologie und die ergebnisbasierte Evaluation von neuartigen Versorgungsmodellen“ [6] erwiesen. Da Routinedaten im Rahmen administrativer Prozesse entstehen, besitzen sie in der Regel – bezogen auf ihren primären Erhebungszweck – eine hohe und einheitliche Qualität. Die Etablierung methodischer Standards fördert ebenfalls die Nutzung von Routinedaten [Gute Epidemiologische Praxis (GEP) und Gute Praxis Sekundärdatenanalyse (GPS) [5, 15]].

Routinedaten weisen bezüglich ihrer Informations- und Aussagekraft gewisse Grenzen auf, die es im Zusammenhang mit spezifischen Fragestellungen zu beachten gilt. Beispiele für Einschränkungen der Ergebnisse von Sekundärdatenanalysen wurden in diesem Beitrag angesprochen. Aus diesem Grund verlangt die Nutzung von Routinedaten für jede spezifische wissenschaftliche Fragestellung eine je gesonderte Überprüfung ihrer Validität [11].

Rechtliche und organisatorisch-technische Empfehlungen für die individuelle Datenverknüpfung sind einer separaten Publikation zu entnehmen [16]. Im Kontext dieses Beitrags ist relevant, dass erstens ein einheitlicher Pseudonymisierungsalgorithmus genutzt werden sollte, um berichtsjahrübergreifend eine längsschnittliche Verfolgung von Versichertenverläufen zu gewährleisten, und zweitens sollten Zuordnungstabellen bzgl. Studien-ID und pseudonymisierter Krankenversicherungs-Nummer gut gepflegt sein, um möglichst jedem Teilnehmer die individuellen GKV-Daten zuordnen zu können.

AGil- und andere Studien [1, 5, 16] liefern wichtige Erfahrungen mit der praktischen Umsetzung der Datenverknüpfung von Primär- und Sekundärdaten. Diese lassen erkennen, dass die Zusammenführung rechtlich zulässig und technisch möglich ist. Die Nutzung von Sekundärdaten und ihre Verknüpfung mit Primärdaten bietet sich vor allem dort an, wo umfangreiche Primärerhebungen die Reduzierung des Aufwands für die Studienteilnehmer nahe legen, wo aufgrund langer Studienzeiten ein hohes Ausmaß von „loss to follow-up“ erwartet werden muss oder wo aufgrund der Alterung der Studienteilnehmer die Vollständigkeit und Validität der Follow-up-Erhebungen eingeschränkt ist [17]. Für Evaluationsstudien liefern Sekundärdaten v. a. Informationen bzgl. objektiver Ergebnisindikatoren in Ergänzung von Prozess- und subjektiven Ergebnisindikatoren. Zu beachten ist jedoch, dass die externe Validität der Ergebnisse abhängig ist von diversen anderen beeinflussbaren und nichtbeeinflussbaren Faktoren wie z. B. der Anzahl der datenliefernden Kassen.

Fazit für die Praxis

Bei der Nutzung von GKV-Routinedaten im Rahmen der Evaluationsforschung sollte beachtet werden:
  • Beachten Sie rechtliche, insbesondere datenschutzrechtliche, organisatorische und technische Rahmenbedingung für die Nutzung von Sekundärdaten.

  • Denken Sie bei der Nutzung von Sekundärdaten an Verzögerungen bei der Datenbereitstellung. Daten zur ambulanten Inanspruchnahme stehen erst nach ungefähr einem Jahr zur Auswertung bereit. Auch die Abstimmungsprozesse mit den Datenlieferanten kosten Zeit.

  • Kalkulieren Sie die Fallzahlen bei der Intervention anhand der Inzidenz harter Ergebnisindikatoren in den Routinedaten (z. B. Krankenhausaufnahmen oder Pflegebedürftigkeit).

  • Stellen Sie einen ausreichenden Follow-up-Zeitraum bzgl. der Sekundärdaten sicher. Dieser sollte mindestens ein Jahr betragen.

  • Die Validität der Sekundärdaten und der daraus abgeleiteten Indikatoren der Inanspruchnahme muss für jede spezifische Fragestellung explizit geprüft werden.

  • Richten Sie Ihr Vorgehen an epidemiologischen Standards aus [Gute Epidemiologische Praxis (GEP) und hier speziell die Gute Praxis Sekundärdatenanalyse (GPS)].

Danksagung

Wir bedanken uns für die Unterstützung bei der Datenverknüpfung und -aufbereitung sowie bei der kritischen Diskussion dieses Artikels bei: E. Mnich und K. Hofreuter-Gätgens (UKE Hamburg), H. Rothgang (Zentrum für Sozialpolitik, Universität Bremen), H. Dold und F. Beckebans (Gesundes Kinzigtal GmbH, Haslach), B. Kähler (PrivCom Datenschutz GmbH, Hamburg), K. Gaiser (AOK Baden-Württemberg, Stuttgart).

Interessenskonflikt

Der korrespondierende Autor weist auf folgende Beziehung hin: Die Studie wurde gefördert vom Bundesministerium für Bildung und Forschung (BMBF) unter dem Kennzeichen: 01 EL 0715.

Copyright information

© Springer Medizin Verlag 2011