Advertisement

Gegenstand der Arbeit

Chapter
  • 888 Downloads

Zusammenfassung

Duplikaterkennung beschreibt Verfahren, um in einem Datenbestand mehrere Datensätze zu identifizieren, die dasselbe Objekt der realenWelt beschreiben. In relationalen Daten wird dies durch den paarweisen Vergleich zweier Tupel mit einem Ähnlichkeitsmaß erreicht. Der Abstand der Tupel und ein vorgegebener Schwellwert bestimmen dann, ob die Tupel als Duplikat oder Nicht-Duplikat klassifiziert werden.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Copyright information

© Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden 2012

Authors and Affiliations

  1. 1.PotsdamDeutschland

Personalised recommendations