Advertisement

Intelligente Datenbereinigung in epidemiologischen Registern

  • Holger Hinrichs
Conference paper
Part of the Informatik aktuell book series (INFORMAT)

Zusammenfassung

In epidemiologischen Registern — in dieser Arbeit werden Krebsregister als durchgängiges Beispiel gewählt — sind umfassende Maßnahmen zur Datenbereinigung aufgrund der Heterogenität von Meldequellen unabdingbar. Sie stellen die für epidemiologische Auswertungen erforderliche Datenqualität sicher. Im einzelnen sind folgende, sequentiell auszuführende Arbeitsschritte zur Datenbereinigung erforderlich: eine Datenkorrektur, die Inkonsistenzen in Meldungsangaben beseitigt, eine Datenstandardisierung, die die Vergleichbarkeit und eine registerübergreifende Auswertbarkeit der Daten gewährleistet, ein Record Linkage, das redundante Meldungen identifiziert, sowie eine Datenverdichtung, die die Datenqualität für Auswertungen verbessert. Das in dieser Arbeit vorgestellte Werkzeug CARELIS zeigt, daß sich der Vorgang der Datenbereinigung weitgehend automatisieren läßt. CARELIS integriert ein probabilistisches Record Linkage—Verfahren mit Techniken der Wissensverarbeitung, um den Aufwand der manuellen Nachbearbeitung von Meldungen zu minimieren.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. 1.
    Adamek, J.: Fusion: Combining Data from Separate Sources. Marketing Research: A Magazine of Management and Applications 6 (1994) 48–50Google Scholar
  2. 2.
    Appelrath, H.-J., Michaelis, J., Schmidtmann, I., Thoben, W.: Empfehlung an die Bundesländer zur technischen Umsetzung der Verfahrensweisen gemäß Gesetz über Krebsregister (KRG). Informatik, Biometrie und Epidemiologie in Medizin und Biologie 27 (1996)Google Scholar
  3. 3.
    Brenner, H., Schmidtmann, I.: Determinants of Homonym and Synonym Rates of Record Linkage in Disease Registration Methods of Information in Medicine 35 (1996) 19–24Google Scholar
  4. 4.
    Deutscher Bundestag: Gesetz ueber Krebsregister (Krebsregistergesetz KRG). Bundesgesetzblatt (in German) 79 (1994) 3351–3355Google Scholar
  5. 5.
    Fellegi, I. P., Sunter, A. B.: A Theory for Record Linkage. Journal of the American Statistical Association 40 (1969) 1183–1210CrossRefGoogle Scholar
  6. 6.
    Hinrichs, H., Aden, T., Dirks, J.-C., Wilkens, T.: CARELIS-Record Linkage im EKN. Technical Report (in German). Epidemiological Cancer Registry of Lower-Saxony. Oldenburg (to appear)Google Scholar
  7. 7.
    Inmon, W. H.: Building The Data Warehouse. John Wiley and Sons. New York 1992Google Scholar
  8. 8.
    Jaro, M. A.: Advances in Record Linkage Methodology as Applied to Matching the 1985 Census of Tampa, Florida. Journal of the American Statistical Association 84 (1989) 414–420CrossRefGoogle Scholar
  9. 9.
    Jensen, O. M., Parkin, D. M., MacLennan, R., Muir, C. S., Skeet, R. G.: Cancer Registration: Principles and Methods. IARC Scientific Publications No. 95. International Agency for Research on Cancer (IARC). Lyon 1991Google Scholar
  10. 10.
    Lenz, H.-J., Schurig, S.: Zur Lösung semantischer Konflikte in heterogenen Datenbanken. Institut fr Produktion, Wirtschaftsinformatik und Operations Research. Freie Universität Berlin 1998Google Scholar
  11. 11.
    Moriarty, T., Hellwege, S.: Evaluating Data Transformation Tools. Database Programming & Design 3 (1998)Google Scholar
  12. 12.
    Parkin, D. M., Chen, V. W., Ferlay, J., Galceran, J., Storm, H. H., Whelan, S. L.: Comparability and Quality Control in Cancer Registration. IARC Technical Report No. 19. International Agency for Research on Cancer (IARC). Lyon 1994Google Scholar
  13. 13.
    Postel, H.-J.: Die Kölner Phonetik-Ein Verfahren zur Identifizierung von Personennamen auf Grundlage der Gestaltanalyse. IBM-Nachrichten 19 (1969) 925–931Google Scholar
  14. 14.
    Richman, D.: Extraction Tools: Better Than Nothing? DW-For Data Warehousing Management 10 (1997). http://www.sentrytech.com/data_whs/dwl0tool.htm
  15. 15.
    Schneier, B.: Applied Cryptography: Protocols, Algorithms, and Source Code in C. John Wiley and Sons. New York 1994Google Scholar
  16. 16.
    Thoben, W., Appelrath, H.-J.: Verschlüsselung personenbezogener und Abgleich anonymisierter Daten durch Kontrollnummern. Verläßliche IT-Systeme. Vieweg Verlag 1995Google Scholar
  17. 17.
    Winkler, W. E.: String Comparator Metrics and Enhanced Decision Rules in the Fellegi-Sunter Model of Record Linkage. ASA Proceedings of the Survey Research Methods Section 1990Google Scholar

Copyright information

© Springer-Verlag Berlin Heidelberg 1999

Authors and Affiliations

  • Holger Hinrichs
    • 1
  1. 1.Oldenburger Forschungs- und Entwicklungsinstitut für Informatik-Werkzeuge und -Systeme (OFFIS)OldenburgGermany

Personalised recommendations