Zusammenfassung
Die Nutzung umfangreicher Datenquellen stellt für die epidemiologische Forschung in Zukunft ein hohes Potenzial dar. Dabei sind sowohl Primärdatenbanken als auch Routinedaten, die vorrangig für administrative Zwecke erhoben werden, von Interesse. In diesem Artikel werden einige große bzw. für epidemiologische Forschung bedeutende Datenbanken beispielhaft vorgestellt und ihre generellen Nutzungsmöglichkeiten aufgezeigt. Große Datenbanken stellen besondere Herausforderungen an adäquate Methoden zu ihrer Auswertung, von denen typische Vertreter kurz vorgestellt werden. Am Beispiel der Pharmakoepidemiologie wird demonstriert, wie sich verschiedene Datenbanken verknüpfen lassen und welche Schwierigkeiten dabei zu überwinden sind. Abschließend werden zukünftige Herausforderungen diskutiert, mit denen man sich auf dem Weg zur Einrichtung, Pflege und Analyse von Datenbanken speziell bzgl. Datenschutz, Datenqualität und Datenaktualität konfrontiert sieht.
Abstract
The use of large databases has a high potential for future epidemiological research. Databases consisting of primary data as well as routine data that are mainly collected for administrative purposes will be of interest. This paper presents some large databases and some that are most relevant for epidemiological research, respectively, and shows how they might be exploited for research purposes. To make better use of large databases there are new requirements and challenges that we have to face regarding appropriate methods for their analysis. Some examples of such methods are given. An example of pharmacoepidemiology illustrates linkage of several administrative databases and specific problems that have to be solved in this context. Finally, future challenges are discussed that have to be overcome on the way towards establishment, maintenance and analysis of large databases, especially regarding data protection, data quality and regular updates.
Literatur
Forschungsverbund DHP (1998) Die Deutsche Herzkreislauf-Präventionsstudie (DHP). Design und Ergebnisse. Hans Huber, Bern
Thefeld W, Stolzenberg H, Bellach BM (1999) Bundes-Gesundheitssurvey: Response, Zusammensetzung der Teilnehmer und Non-Responder-Analyse. Gesundheitswesen 61 [Sonderheft 2]: S57–S61
Kurt BM, Bergmann KE, Dippelhofer A et al. (2002) Die Gesundheit von Kindern und Jugendlichen in Deutschland – Was wir wissen, was wir nicht wissen, was wir wissen werden. Bundesgesundheitsbl Gesundheitsforsch Gesundheitsschutz 45: 852–858
ISAAC Steering Committee (1998) Worldwide variation in prevalence of symptoms of asthma, allergic rhinoconjunctivitis, and atopic eczema: ISAAC. The International Study of Asthma and Allergies in Childhood. Lancet 351(9111): 1225–1232
Holle R, Happich M, Löwel H et al. (2005) KORA – a research platform for population based health research. Gesundheitswesen 67 [Sonderheft 1]: S19–S25
http://www2.gsf.de:6666/gem/kora.htm, zuletzt besucht im November 2005
Riboli E, Kaaks R (1997) The EPIC Project: rationale and study design. European Prospective Investigation into Cancer and Nutrition. Int J Epidemiol 26 [Suppl 1]: S6–S14
Keil U (2005) Das weltweite WHO-MONICA-Projekt: Ergebnisse und Ausblick. Gesundheitswesen 67 [Sonderheft 1]: S38–S45
Kreuzer M, Brachner A, Lehmann F et al. (2002) Characteristics of the German uranium miners cohort study. Health Physics 83: 26–34
http://www.gekid.de, zuletzt besucht im November 2005
Arbeitsgemeinschaft Bevölkerungsbezogener Krebsregister in Deutschland (2006) Krebs in Deutschland, 5. überarbeitete, aktualisierte Ausgabe. Saarbrücken (s. auch http://www.rki.de/krebs, zuletzt besucht im Januar 2006)
http://www.krebsregister.bremen.de, zuletzt besucht im November 2005
Giersiepen K, Brünings-Kuppe C, Lehmann C (2004) Der Bremer Mortalitätsindex. Bundesgesundheitsbl Gesundheitsforsch Gesundheitsschutz 47: 451–456
Pigeot I, Ahrens W, Bödeker W, Weidmann E (2004) Datenbanken als Grundlage für Monitoring-Systeme in der Arzneimittelsicherheit. Bundesgesundheitsbl Gesundheitsforsch Gesundheitsschutz 47: 513–517
Behrens T, Ahrens W (2006) Epidemiologische Studien als Teil des HTA-Bewertungsprozesses. Bundesgesundheitsbl Gesundheitsforsch Gesundheitsschutz 49: 264–270
http://www.imshealth.de, zuletzt besucht August 2005
http://www.gprd.com, zuletzt besucht August 2005
Brüggenjürgen B, Willich SN (2006) Nutzbarkeit von Datenbanken in der Gesundheitsökonomie. Bundesgesundheitsbl Gesundheitsforsch Gesundheitsschutz 49: 11–18
DuMouchel W (1999) Bayesian data mining in large frequency tables, with an application to the FDA Spontaneous Reporting System (with discussion). Am Stat 53: 177–190
Abello J, Capalbo M (in press) DIMACS computational methods in epidemiology. AMS-DIMACS Volume Series, American Mathematical Society
Carr DB (2005) Some recent templates and software for showing statistical summaries. In: Rao CR, Wegman EJ, Solka JL (eds) Data mining and data visualization. Elsevier, Amsterdam, pp 215–436
National Cancer Institute (2005) http://www.statecancerprofiles.cancer.gov, zuletzt besucht im Oktober 2005
Interessenkonflikt
Keine Angaben
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Pigeot, I., Ahrens, W. & Kübler, J. Datenquellen in der Epidemiologie. Bundesgesundheitsbl. 49, 628–636 (2006). https://doi.org/10.1007/s00103-006-1290-z
Issue Date:
DOI: https://doi.org/10.1007/s00103-006-1290-z