Metrik für multidimensionale Daten

Sartorius, Gerhard

doi:10.1007/978-3-658-23576-5_6

Gerhard Sartorius²

3465 Accesses

Zusammenfassung

Um Objekte, Zustände oder Vorgänge durch Daten zu repräsentieren, müssen große Mengen von Messwerten erfasst und jeder einzelne einer Dimension im multidimensionalen Raum zugeordnet werden. Die Anzahl der Dimensionen bei der Darstellung der Daten kann sehr groß werden, der Rechenaufwand zur Distanzberechnung nimmt mit der Dimensionalität zu und die Rechengenauigkeit ab. Diese Rechenungenauigkeit macht sich bereits bei etwa hundert Dimensionen bemerkbar. Um diesem Effekt entgegenzuwirken, muss bei NN-Verfahren eine Metrik gewählt werden, die die Ungenauigkeiten zur Berechnung der Distanzen vermeidet oder zumindest minimalisiert. Zunächst werden in diesem Kapitel die Probleme anhand von Untersuchungen, die in der Fachliteratur zu dem Thema durchgeführt und diskutiert wurden, erörtert und Maßnahmen genannt, die eine ausreichend genaue Ermittlung der Größen zur Klassifizierung gestatten.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 69.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Literatur

Aggerwal C, Hinneburg A, Keim D (2000) What is the Nearest Neighbor in High Dimensional Spaces? In: Abbadi Ae (ed) Marking the millennium, Morgan Kaufman, Orlando, Fla., pp pages 506–515
Google Scholar
Bellmann R (1961) Adaptive Control Processes: A Guided Tour. Princeton University Press
Book Google Scholar
Beyer K, Goldstein J, Ramakrishnan R, Shaft U (1999) When Is “Nearest Neighbor” Meaningful? In: Beeri C, Buneman P (eds) Database Theory - ICDT’99, Lecture Notes in Computer Science, vol 1540, Springer, Berlin and Heidelberg, pp 217–235, https://doi.org/10.1007/3-540-49257-7_15
Google Scholar
Breuer D (2014) Abstandsmaße für die multivariate adaptive Einbettung. Masterarbeit, FernUni Hagen
Google Scholar
Fehrmann L (2006) Alternative Methoden zur Biomasseschätzung auf Einzelbaumebene unter Berücksichtigung der k-Nearest Neighbor (k-NN) Methode. Dissertation, Georg-August-Universität Göttingen
Google Scholar
Francois D, Wertz V, Verleysen M (2005) Non-Euclidean metrics for similarity search in noisy datasets. URL https://perso.uclouvain.be/michel.verleysen/papers/esann05df.pdf
Ottmann T, Widmayer P (2002) Algorithmen und Datenstrukturen. Spektrum Akademischer Verlag, Heidelberg, Berlin
MATH Google Scholar
Sartorius G (2017) Data Preprocessing and Outlier Detection in Multivariate Data. In: Herwig Unger, Wolgang A Halang (ed) Autonomous Systems, VDI-Verlag GmbH, Düsseldorf, Reihe 10, Informatik/Kommunikation, vol 857, pp 105–140
Google Scholar
Schmid C (2006) Statistik Analyseverfahren, Hauptkomponentenanalyse durch neuronale Netze: Lineare Neuronen: Die Lernregel von Oja
Google Scholar
Stinson C, Dodge M (2001) Microsoft Excel Version 2002 Inside out. Redmond and Washington: Microsoft Press
Google Scholar
Weisstein, Eric, W (2013) Ball. URL http://mathworld.wolfram.com/UnitBall.html

Download references

Author information

Authors and Affiliations

Hagen, Deutschland
Gerhard Sartorius

Authors

Gerhard Sartorius
View author publications
You can also search for this author in PubMed Google Scholar

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Sartorius, G. (2019). Metrik für multidimensionale Daten. In: Erfassen, Verarbeiten und Zuordnen multivariater Messgrößen. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-23576-5_6

Download citation

DOI: https://doi.org/10.1007/978-3-658-23576-5_6
Published: 03 May 2019
Publisher Name: Springer Vieweg, Wiesbaden
Print ISBN: 978-3-658-23575-8
Online ISBN: 978-3-658-23576-5
eBook Packages: Computer Science and Engineering (German Language)

Publish with us

Policies and ethics