Advertisement

Informatik - Forschung und Entwicklung

, Volume 21, Issue 3–4, pp 179–195 | Cite as

Efficient reverse k-nearest neighbor estimation

  • Elke Achtert
  • Christian Böhm
  • Peer Kröger
  • Peter Kunath
  • Alexey Pryakhin
  • Matthias RenzEmail author
Themenheft Datenbanksysteme

Abstract

The reverse k-nearest neighbor (RkNN) problem, i.e. finding all objects in a data set the k-nearest neighbors of which include a specified query object, has received increasing attention recently. Many industrial and scientific applications call for solutions of the RkNN problem in arbitrary metric spaces where the data objects are not Euclidean and only a metric distance function is given for specifying object similarity. Usually, these applications need a solution for the generalized problem where the value of k is not known in advance and may change from query to query. In addition, many applications require a fast approximate answer of RkNN-queries. For these scenarios, it is important to generate a fast answer with high recall. In this paper, we propose the first approach for efficient approximative RkNN search in arbitrary metric spaces where the value of k is specified at query time. Our approach uses the advantages of existing metric index structures but proposes to use an approximation of the nearest-neighbor-distances in order to prune the search space. We show that our method scales significantly better than existing non-approximative approaches while producing an approximation of the true query result with a high recall.

Keywords

Reverse k-nearest neighbor Approximation Regression Euclidean space Metric space 

Zusammenfassung

In den letzten Jahren hat das Reverse k-Nearest Neighbor (RkNN) Problem eine vermehrte Aufmerksamkeit erfahren. Ziel ist es, alle Objekte in einer Datenbank zu finden, in deren k-nächster Nachbarumgebung ein gegebenes Anfrageobjekt enthalten ist. Viele industrielle und wissenschaftliche Anwendungen benötigen Lösungen des RkNN-Problems für beliebige metrische Räume. Dabei sind die Datenobjekte nicht mehr notwendigerweise euklidisch, die Ähnlichkeit dery Objekte wird lediglich durch eine metrische Distanzfunktion beschrieben. Üblicherweise benötigen diese Anwendungen eine Lösung für das verallgemeinerte RkNN-Problem, bei dem der Wert von k im voraus unbekannt ist und sich außerdem von Anfrage zu Anfrage ändern kann. Zusätzlich erfordern viele Applikationen eine schnelle, näherungsweise Antwort auf RkNN-Anfragen. In diesen Fällen ist es von besonderer Wichtigkeit, schnell eine Antwort mit hohem Recall zurückzuliefern. Wir schlagen den ersten Ansatz für eine effiziente, näherungsweise RkNN-Suche in beliebigen metrischen Räumen vor, wobei der Wert von k erst zur Anfragezeit angegeben werden muss. Unser Verfahren baut auf den Vorteilen existierender metrischer Indexstrukturen auf und verwendet eine Abschätzung der Nächsten-Nachbar-Distanzen, um den Suchraum zu beschränken. Wir zeigen, dass die von uns entwickelte Lösung signifikant besser skaliert als existierende nicht-approximative Verfahren und unsere Antwortmenge einen hohen Recall aufweist.

Schlagworte

Reverse k-nächste Nachbarn Approximation Regression Euklidischer Raum Metrischer Raum 

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

References

  1. 1.
    Achtert E, Böhm C, Kröger P, Kunath P, Pryakhin A, Renz M (2006) Approximate reverse k-nearest neighbor queries in general metric spaces. Proc CIKMGoogle Scholar
  2. 2.
    Achtert E, Böhm C, Kröger P, Kunath P, Pryakhin A, Renz M (2006) Efficient reverse k-nearest neighbor search in arbitrary metric spaces. Proc. SIGMODGoogle Scholar
  3. 3.
    Achtert E, Böhm C, Kröger P, Kunath P, Pryakhin A, Renz M (2007) Efficient reverse k-nearest neighbor estimation. Proc. BTWGoogle Scholar
  4. 4.
    Beckmann N, Kriegel HP, Schneider R, Seeger B (1990) The R-Tree: An efficient and robust access method for points and rectangles. In: Proc. SIGMOD, pp. 322–331Google Scholar
  5. 5.
    Berchtold S, Keim DA, Kriegel HP (1996) The X-Tree: An index structure for high-dimensional data. In: Proc. VLDBGoogle Scholar
  6. 6.
    Ciaccia P, Patella M, Zezula P (1997) M-Tree: an efficient access method for similarity search in metric spaces. In: Proc. VLDBGoogle Scholar
  7. 7.
    Peng CDH (2003) Minimum redundancy feature selection from microarray gene expression data. In: CSB03Google Scholar
  8. 8.
    Guttman A (1984) R-Trees: A dynamic index structure for spatial searching. In: Proc. SIGMOD, pp. 47–57Google Scholar
  9. 9.
    Korn F, Muthukrishnan S (2000) In: Fluenced sets based on reverse nearest neighbor queries. In: Proc. SIGMODGoogle Scholar
  10. 10.
    Schroeder M (1991) Fractals, Chaos, Power Laws: Minutes from an infinite paradise. W.H. Freeman and company, New YorkGoogle Scholar
  11. 11.
    Singh A (2003) Ferhatosmanoglu H, Tosun AS, High dimensional reverse nearest neighbor queries. In: Proc. CIKMGoogle Scholar
  12. 12.
    Stanoi I, Agrawal D, El Abbadi A (2000) Reverse nearest neighbor queries for dynamic databases. In: Proc. DMKDGoogle Scholar
  13. 13.
    Tao Y, Papadias D, Lian X (2004) Reverse kNN search in arbitrary dimensionality. In: Proc. VLDBGoogle Scholar
  14. 14.
    Xia C, Lu H, Ooi BC, Hu J (2005) Erknn: Efficient reverse k-nearest neighbors retrieval with local knn-distance estimation. In: Proc. CIKMGoogle Scholar
  15. 15.
    Yang C, Lin KI (2001) An index structure for efficient reverse nearest neighbor queries. In: Proc. ICDEGoogle Scholar

Copyright information

© Springer-Verlag 2007

Authors and Affiliations

  • Elke Achtert
    • 1
  • Christian Böhm
    • 1
  • Peer Kröger
    • 1
  • Peter Kunath
    • 1
  • Alexey Pryakhin
    • 1
  • Matthias Renz
    • 1
    Email author
  1. 1.Institute for Computer ScienceLudwig-Maximilians-Universität MünchenMunichGermany

Personalised recommendations