Skip to main content

Advertisement

Log in

Validierung von Sekundärdaten

Grenzen und Möglichkeiten

Validation of secondary data. Strengths and limitations

  • Leitthema: Nutzung von Sekundärdaten
  • Published:
Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz Aims and scope

Zusammenfassung

Arztbasierte Datenbanken (wie die General Practice Research Database, GPRD) und administrative Datenbanken [wie Daten aus der Gesetzlichen Krankenversicherung (GKV) in Deutschland] sind nützliche Quellen für die Pharmakoepidemiologie und Versorgungsforschung. Es muss allerdings berücksichtigt werden, dass diese Daten nicht primär für Forschungszwecke generiert werden. Deshalb sind Validierungsstudien erforderlich, um die Güte und Vollständigkeit der Daten in Abhängigkeit von der Forschungsfrage beurteilen zu können. Im vorliegenden Artikel werden Möglichkeiten vorgestellt, interne Konsistenzprüfungen und/oder eine interne Validierung von GKV-Daten anhand der Daten einer einzelnen Krankenkasse oder unter Berücksichtigung der Daten mehrerer Krankenkassen durchzuführen. Interne Konsistenzprüfungen dienen dazu, mögliche Unstimmigkeiten in den Daten zu erkennen. Bei der internen Validierung sollen sichere von unsicheren Fällen anhand der vorliegenden Sekundärdaten separiert bzw. bekannte Zusammenhänge innerhalb der Datenbank reproduziert werden. Erstrebenswert ist zusätzlich eine externe Validierung von Sekundärdaten, die unter Rückgriff auf Rezeptdaten, Patientenakten, Krankenhausentlassungsbriefe oder Patienten- bzw. Arztbefragungen als Goldstandard durchgeführt werden kann. Während insbesondere für die GPRD umfangreiche externe Validierungsstudien vorliegen, sind derartige Untersuchungen für deutsche GKV-Daten erst in Ansätzen vorhanden, aber dringend erforderlich.

Abstract

Medical records databases (such as the General Practice Research Database-GPRD) and administrative databases (such as German Statutory Health Insurance (SHI) claims data) are useful sources for pharmacoepidemiology and health services research. However, these data are not primarily collected for research purposes. Validation studies are needed to examine their completeness and accuracy depending on the corresponding research question. This article reviews strategies for checks of internal consistency within the data from one SHI as well as between data from several SHIs and possibilities of internal data validation. Descriptive analyses of consistency can help to determine the integrity of data. The aim of internal validation is to separate uncertain from true cases based on information from secondary data alone or to reproduce known associations within the database. In addition external validation of secondary data is desirable using original prescriptions, medical records, hospital discharge letters and/or patient or physician interviews as a gold standard. A considerable number of external validation studies of diagnostic coding have been conducted within the GPRD. In contrast, such validation studies of German SHI claims data are mostly lacking and are urgently needed in the near future.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Literatur

  1. AGENS & Arbeitsgruppe Epidemiologische Methoden– Arbeitsgruppe Erhebung und Nutzung vonSekundärdaten der DGSMP, Arbeitsgruppe EpidemiologischeMethoden DGEpi, GMDS, DGSMP(2008) GPS – Gute Praxis Sekundärdatenanalyse:Revision nach grundlegender Überarbeitung. Version2. Verfügbar unter: http://www.dgepi.de/pdf/infoboard/stellungnahme/gps-version2-final.pdf(letzter Zugriff: 25.3.2008)

  2. http://www.gprd.com (letzter Zugriff: 25.3.2008)

  3. http://www.kbv.de/publikationen/2422.html (letzter Zugriff: 26.3.2008)

  4. Evans JM, MacDonald TM (1997) Misclassificationand selection bias in case-control studies using anautomated database. Pharmacoepidemiol DrugSaf 6: 313–318

    Article  CAS  Google Scholar 

  5. Schneeweiss S, Avorn J (2005) A review of uses ofhealth care utilization databases for epidemiologicresearch on therapeutics. J Clin Epidemiol 58:323–337

    Article  PubMed  Google Scholar 

  6. Hennessy S, Bilker WB, Weber A, Strom BL (2003)Descriptive analyses of the integrity of a US Medicaidclaims database. Pharmacoepidemiol DrugSaf 12(2):103–111

    Article  Google Scholar 

  7. Hoffmann F, Pfannkuche M, Glaeske G (2007) Wiehäufig sind Verordnungs- und Abgabedatum von Arzneimitteln in Routinedaten korrekt erfasst?Bundesgesundheitsbl Gesundheitsforsch Gesundheitsschutz 50:1418–1423

    Article  CAS  Google Scholar 

  8. Hoffmann F, Pfannkuche MS, Glaeske G (2008)Validität forschungsrelevanter Informationen in Arzneimittelroutinedaten über die Jahre 2000 bis 2006. Dtsch Med Wochenschr 133:945–949

    Article  PubMed  CAS  Google Scholar 

  9. Vereinbarung über die Übermittlung von Daten(1994) Vereinbarung über die Übermittlung von Daten im Rahmen der Arzneimittelabrechnunggemäß § 300 SGB V. Stand 04.11.1994. Verfügbarunter: http://www.bkk.de/bkk/powerslave, id, 377, nodeid,.html (letzter Zugriff: 25.3.2008)

  10. Lawrenson R, Todd JC, Leydon GM, et al. (2000)Validation of the diagnosis of venous thromboembolismin general practice database studies. Br JClin Pharmacol 49:591–596

    Article  CAS  Google Scholar 

  11. Seaman HE, Langley SE, Farmer RD, de Vries CS(2007) Venous thromboembolism and cyproteroneacetate in men with prostate cancer: a studyusing the General Practice Research Database. BJU Int 99:1398–1403

    Article  Google Scholar 

  12. Meier CR, Jick H (1998) Tamoxifen and risk ofidiopathic venous thromboembolism. Br J ClinPharmacol 45:608–612

    Article  CAS  Google Scholar 

  13. Köster I, von Ferber L, Ihle P, et al. (2006) The costburden of diabetes mellitus: the evidence from Germany – the CoDiM Study. Diabetologia 9:1498–1504

    Article  Google Scholar 

  14. Hauner H, Köster I, Schubert I (2007) Trends in derPrävalenz und ambulanten Versorgung von Menschenmit Diabetes mellitus. Eine Analyse der VersichertenstichprobeAOK Hessen/KV Hessen imZeitraum von 1998–2004. Dtsch Ärztebl 104:A2799–A2805

    Google Scholar 

  15. Schubert I, Küpper-Nybelen J, Ihle P, Krappweis J(2007) Inanspruchnahmeverhalten von Demenzpatientenim Spiegel der GKV-Daten. Z Arztl Fortbild Qualitätssich 101:7–13

    Google Scholar 

  16. Andersohn F, Suissa S, Garbe E (2006) Use of firstandsecond-generation cyclooxygenase-2-selectivenonsteroidal antiinflammatory drugs and riskof acute myocardial infarction. Circulation 113:1950–1957

    Article  PubMed  CAS  Google Scholar 

  17. Lewis JD, Bilker WB, Brensinger C, et al. (2001) Inflammatorybowel disease is not associated withan increased risk of lymphoma. Gastroenterology121:1080–1087

    Article  PubMed  CAS  Google Scholar 

  18. Giersiepen K, Pohlabeln H, Egidi G, Pigeot I (2007)Die ICD-Kodierqualität für Diagnosen in der ambulantenVersorgung. Bundesgesundheitsbl Gesundheitsforsch Gesundheitsschutz 50:1028–1038

    Article  CAS  Google Scholar 

  19. Grobe T, Dörning H, Schwartz FW (2006) GEK-Reportambulant-ärztliche Versorgung 2006. Asgard, St. Augustin

  20. Erler A (2007) Garbage in – Garbage out? Validitätvon Abrechnungsdiagnosen in hausärztlichen Praxen als Voraussetzung für die Einführung einesdiagnosebasierten risikoadjustierten Vergütungssystems. Dissertation zur Erlangung des akademischenGrades Doctor medicinae (Dr. med.). Medizinische Fakultät der Charité UniversitätsmedizinBerlin, Berlin

  21. Scharnetzky E (2004) Neigen Philipp und Hanns zuUnfällen? Verletzungen und Vergiftungen bei Kindernund Jugendlichen mit ADHS. In: Glaeske G, Janhsen K (Hrsg) GEK-Arzneimittel-Report 2004.Asgard, St. Augustin, S 136–145

  22. Scharnetzky E, Schill W, Glaeske G, Jahnsen K(2004) Are children and youths with attention-deficit/hyperactivity disorder (ADHD) accidentprone? Pharmacoepidemiol Drug Saf 13:93

    Google Scholar 

  23. Brehaut JC, Miller A, Raina P, McGrail KM (2003)Childhood behavior disorders and injuries amongchildren and youth: a population-based study. Pediatrics 111:262–269

    Article  PubMed  Google Scholar 

  24. Lewis JD, Schinnar R, Bilker WB, et al. (2007) Validationstudies of the health improvement network(THIN) database for pharmacoepidemiology research.Pharmacoepidemiol Drug Saf 16:393–401

    Article  Google Scholar 

  25. van Staa TP, Parkinson J (2008) Response to: validationstudies of the health improvement network(THIN) database for pharmacoepidemiology researchby Lewis et al. Pharmacoepidemiol Drug Saf 17:103–104

    Article  CAS  Google Scholar 

  26. Strom BL, Carson JL, Halpern AC, et al. (1991) Usinga claims database to investigate drug-induced Stevens-Johnson syndrome. Stat Med 10:565–576

    Article  PubMed  CAS  Google Scholar 

  27. Jick H, Derby LE, Gurewich V, Vasilakis C (1996) Therisk of myocardial infarction associated with antihypertensivedrug treatment in persons with uncomplicatedessential hypertension. Pharmacotherapy16:321–326

    PubMed  CAS  Google Scholar 

  28. Meier CR, Jick SS, Derby LE, et al. (1998) Acuterespiratory-tract infections and risk of first-timeacute myocardial infarction. Lancet 351:1467–1471

    Article  PubMed  CAS  Google Scholar 

  29. de Abajo FJ, Montero D, Madurga M, Garcia RodriguezLA (2004) Acute and clinically relevant drug-inducedliver injury: a population based case-controlstudy. Br J Clin Pharmacol 58:71–80

    Article  PubMed  Google Scholar 

  30. van Staa TP, Boulton F, Cooper C, et al. (2003) Neutropenia and agranulocytosis in England and Wales: incidence and risk factors. Am J Hematol72:248–254

    Article  PubMed  CAS  Google Scholar 

  31. Huerta C, Castellsague J, Varas-Lorenzo C, Garcia Rodriguez LA (2005) Nonsteroidal anti-inflammatorydrugs and risk of ARF in the general population. Am J Kidney Dis 45:531–539

    Article  PubMed  CAS  Google Scholar 

  32. Hall GC, Brown MM, Mo J, MacRae KD (2004) Triptans in migraine: the risks of stroke, cardiovascular disease, and death in practice. Neurology62:563–568

    PubMed  CAS  Google Scholar 

  33. Lewis JD, Brensinger C, Bilker WB, Strom BL (2002) Validity and completeness of the General Practice Research Database for studies of inflammatorybowel disease. Pharmacoepidemiol Drug Saf11:211–218

    Article  PubMed  Google Scholar 

  34. van Staa TP, Abenhaim L (1994) The quality of informationrecorded on a UK database of primarycare records: a study of hospitalizations due tohyperglycemia and other conditions. Pharmacoepidemiol Drug Saf 3:15–21

    Article  Google Scholar 

  35. de Abajo FJ, Rodriguez LA, Montero D (1999) Associationbetween selective serotonin reuptake inhibitorsand upper gastrointestinal bleeding:population based case-control study. BMJ 319:1106–1109

    PubMed  CAS  Google Scholar 

  36. Pérez Gutthann S, García Rodríguez LA, CastellsagueJ, Duque Oliart A (1997) Hormone replacementtherapy and risk of venous thromboembolism: population based case-control study. BMJ314:796–800

    PubMed  Google Scholar 

  37. Harrold LR, Saag KG, Yood RA, et al. (2007) Validityof gout diagnoses in administrative data. ArthritisRheum 57:103–108

    Google Scholar 

  38. Rawson NS, D’Arcy C (1998) Assessing the validity of diagnostic information in administrative healthcare utilization data: experience in Saskatchewan. Pharmacoepidemiol Drug Saf 7:389–398

    Article  PubMed  CAS  Google Scholar 

  39. Crystal S, Akincigil A, Bilder S, Walkup JT (2007) Studying prescription drug use and outcomeswith medicaid claims data: strengths, limitations, and strategies. Med Care 45 (10 Suppl 2):S58–S65

    Article  PubMed  Google Scholar 

  40. West SL, Strom BL, Poole C (2006) Validity of pharmacoepidemiologicdrug and diagnosis data. In: Strom BL, Kimmel SE (eds) Textbook of pharmacoepidemiology. Chichester, Wiley, pp 239–258

  41. Hasford J, Schubert I, Garbe E, et al. (2004) Memorandumzu Nutzen und Notwendigkeit pharmakoepidemiologischer Datenbanken in Deutschland. Asgard, St. Augustin

  42. Sachverständigenrat zur Begutachtung der Entwicklungim Gesundheitswesen (2007) Kooperation und Verantwortung. Voraussetzungen einerzielorientierten Gesundheitsversorgung (Gutachten2007), hier besonders: Abschnitt 5.2.4.3. http://www.svr-gesundheit.de/Startseite/Langfassung060707-website.pdf

  43. Setoguchi S, Solomon DH, Glynn RJ, et al. (2007) Agreement of diagnosis and its date for hematologicmalignancies and solid tumors betweenmedicare claims and cancer registry data. Cancer Causes Control 18:561–569

    Article  Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Edeltraut Garbe.

Rights and permissions

Reprints and permissions

About this article

Cite this article

Hoffmann, F., Andersohn, F., Giersiepen, K. et al. Validierung von Sekundärdaten. Bundesgesundheitsbl. 51, 1118–1126 (2008). https://doi.org/10.1007/s00103-008-0646-y

Download citation

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1007/s00103-008-0646-y

Schlüsselwörter

Keywords

Navigation