Advertisement

Problemi Inerenti la Qualità dei Dati nei Sistemi di Integrazione dei Dati

  • Carlo Batini
  • Monica Scannapieco
Part of the UNITEXT book series (UNITEXT)

Riassunto

Negli ambienti distribuiti, le sorgenti di dati sono tipicamente caratterizzate da vari tipi di eterogeneità che possono essere in generale suddivise in (i) eterogeneità tecnologiche, (ii) eterogeneità di schema e (iii) eterogeneità a livello di istanza. Le eterogeneità tecnologiche sono dovute all’uso di prodotti di diversi fornitori, impiegati a vari livelli di un’infrastruttura di informazione e comunicazione. Un esempio di eterogeneità tecnologica è l’uso di due differenti sistemi di gestione di basi di dati relazionali, come DB2 dell’IBM ed SQL Server della Microsoft. Le eterogeneità a livello di schema sono causate soprattutto all’uso di (i) differenti modelli di dati, come tra una sorgente che adotta il modello di dati relazionali ed un’altra sorgente che adotta il modello di dati XML, e (ii) differenti rappresentazioni dei dati, quali ad esempio il fatto che una sorgente memorizza indirizzi inserendo i dati in un singolo campo mentre un’altra li memorizza usando campi separati per via, numero civico e città. Le eterogeneità a livello di istanza sono dovute a valori diversi, conflittuali, dei dati forniti da sorgenti distinte per gli stessi oggetti. Questo tipo di eterogeneità può essere causato da errori di qualità, come errori di accuratezza, completezza, livello di aggiornamento e consistenza; tali errori possono derivare, per esempio, da processi tra loro indipendenti che forniscono dati alle differenti sorgenti.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Copyright information

© Springer-Verlag Italia, Milano 2008

Authors and Affiliations

  • Carlo Batini
    • 1
  • Monica Scannapieco
    • 2
  1. 1.Department of Applied MathematicsWeizmann Institute of ScienceRehovotIsrael
  2. 2.The Interdisciplinary CenterHerzliyaIsrael

Personalised recommendations