Advertisement

Datenqualitätsmanagement in Data Warehouse-Umgebungen

  • Holger Hinrichs
Conference paper
Part of the Informatik aktuell book series (INFORMAT)

Zusammenfassung

Mit Data Warehouse-Systemen hat in den letzten Jahren eine neue Klasse von Informationssystemen stark an Bedeutung gewonnen. Eine zentrale Herausforderung bei Aufbau und Pflege eines Data Warehouse-Systems ist die Qualitätssicherung von Daten, die aus heterogenen Quellen integriert werden.

In dieser Arbeit präsentieren wir einen Überblick über das Forschungsprojekt CLIQ, das sich mit Konzepten für ein umfassendes Datenqualitätsmanagement und der Umsetzung dieser Konzepte in ein Software System beschäftigt. Dieses System basiert auf formalen Datenqualitätsmetriken und einem wohldefinierten Vorgehensmodell für das Datenqualitätsmanagement in Data Warehouse-Umgebungen. Eine umfassende Nutzung von Metadaten in einem standardkonformen Format ermöglicht dabei eine flexible Anpassung an verschiedene Anwendungsbereiche.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. [AL99]
    Await, D., Lawton, B. K.: Introduction to Data Transformation Services. In: SQL Server Magazine, 1(1): 34–36, 1999.Google Scholar
  2. [Ber97]
    Bernstein, P. A. et al.: The Microsoft Repository. In: Proc. of the 23rd Intl. Conf. on Very Large Databases (VLDB’97), Athens, Greece, 1997.Google Scholar
  3. [BGOO]
    Bauer, A., Giinzel, H. (Hrsg.): Data Warehouse Systeme-Architektur, Entwicklung, Anwendung, dpunkt-Verlag, Heidelberg, 2000.Google Scholar
  4. [CDN88]
    Chin, J. P., Diehl, V. A., Norman, K. L.: Development of an Instrument Measuring User Satisfaction of the Human-Computer Interface. In: Proc. of CHI’88 „Human Factors in Computing Systems“, S. 213–218, ACM Press, New York, 1988.Google Scholar
  5. [DM92]
    DeLone, W. H., McLean, E. R.: Information Systems Success: The Quest for the Dependent Variable. In: Inf. Systems Research, 3(1): 60–95, 1992.CrossRefGoogle Scholar
  6. [DINOO]
    Deutsches Institut für Normung: DIN EN ISO 9000: Qualitätsmanagementsysteme-Grundlagen und Begriffe. Beuth, Berlin, 2000.Google Scholar
  7. [Eng99]
    English, L. P.: Improving Data Warehouse and Business Information Quality. Wiley, New York, 1999.Google Scholar
  8. [GFSS00]
    Galhardas, H., Florescu, D., Shasha, D., Simon, E.: Declaratively Cleaning your Data using AJAX. In: Journ. Bases de Données Avancées, Oct. 2000.Google Scholar
  9. [FP97]
    Fenton, N. E., Pfleeger, S. L.: Soßware Metrics: A Rigorous and Practical Approach. 2nd Ed., Intl. Thomson Computer Press, London, 1997.Google Scholar
  10. [HS95]
    Hernandez, M. A., Stolfo, S. J.: The Merge/Purge Problem for Large Databases. In: Proc. of the 1995 ACM SIGMOD Conference, 1995.Google Scholar
  11. [HinOOa]
    Hinrichs, H.: Statistical Quality Control of Warehouse Data. In: Proc. of the 4 th IEEE Intl. Baltic Workshop on Databases and Information Systems, Vilnius, Lithuania, S. 125–139, Technika Press, Vilnius, 2000.Google Scholar
  12. [HinOOb]
    Hinrichs, H.: CLIQ—Intelligent Data Quality Management. In: Proc. of the 7 th Doct. Cons. CAiSE*00, Stockholm, S. 25–36, FU Berlin, 2000.Google Scholar
  13. [HW00]
    Hinrichs, H., Wilkens, T.: Metadata-Based Data Auditing. In: Data Mining II (Proc. of the 2 nd Intl. Conf. on Data Mining, Cambridge, UK), S. 141–150, WIT Press, 2000.Google Scholar
  14. [IIo00]
    Hog Inc.: http://www.ilog.com/products/rules, 2000.Google Scholar
  15. [JJQV98]
    Jarke, M., Jeusfeld, M. A., Quix, C, Vassiliadis, P.: Architecture and Quality in Data Warehouses. In: Proc. of the 10th Intl. Conf. CAiSE*98, Pisa, Italy, S. 93–113, Springer, Berlin, 1998.Google Scholar
  16. [Jar89]
    Jaro, M. A.: Advances in Record Linkage Methodology as Applied to Matching the 1985 Census of Tampa, Florida. In: Journal of the American Statistical Association, 84: 414–420, 1989.CrossRefGoogle Scholar
  17. [Kim98]
    Kimball, R.: The Data Warehouse Lifecycle Toolkit. Wiley, N. Y., 1998.Google Scholar
  18. [KSD96]
    Kohavi, R., Sommerfield, D., Dougherty, J.: Data Mining using MLC++ —A Machine Learning Library. In: Tools with AI 1996, S. 234–245, 1996.Google Scholar
  19. [LZW+97]
    Labio, W. J., Zhuge, Y., Wiener, J. L. et al.: The WHIPS Prototype for Data Warehouse Creation and Maintenance. In: Proc. of the 1997 ACM SIGMOD Conference, Tuscon, Arizona, 1997.Google Scholar
  20. [MDC00]
    Meta Data Coalition: http://www.MDCinfo.com, 2000.Google Scholar
  21. [Met99]
    Meta Group: Data Warehouse Scorecard, 1999.Google Scholar
  22. [NLF99]
    Naumann, F., Leser, IL, Freytag, J. C: Quality-driven Integration of Heterogeneous Information Sources. In: Proc. of the 1999 Intl. Conf. on Very Large Databases (VLDB’ 99), Edinburgh, UK, 1999.Google Scholar
  23. [OMG00]
    Object Management Group: Common Warehouse Metamodel (CWM) Specification, 2000.Google Scholar
  24. [Rij79]
    Rijsbergen, C. J. Van: Information Retrieval. Butterworth, London, 1979.Google Scholar
  25. [She31]
    Shewhart, W. A.: Economic Control of Quality of Manufactured Product. D. Van Nostrand, New York, 1931.Google Scholar
  26. [Va100]
    Vality Technology Inc.: http://www.vality.com, 2000.Google Scholar
  27. [Wan98]
    Wang, R. Y.: A Product Perspective on Total Data Quality Management. In: Communications of the ACM, 41(2): 58–65, 1998.CrossRefGoogle Scholar

Copyright information

© Springer-Verlag Berlin Heidelberg 2001

Authors and Affiliations

  • Holger Hinrichs
    • 1
  1. 1.Oldenburger Forschungs- und Entwicklungsinstitut für Informatik-Werkzeuge und -Systeme (OFFIS)OldenburgGermany

Personalised recommendations