Zusammenfassung
Um Objekte, Zustände oder Vorgänge durch Daten zu repräsentieren, müssen große Mengen von Messwerten erfasst und jeder einzelne einer Dimension im multidimensionalen Raum zugeordnet werden. Die Anzahl der Dimensionen bei der Darstellung der Daten kann sehr groß werden, der Rechenaufwand zur Distanzberechnung nimmt mit der Dimensionalität zu und die Rechengenauigkeit ab. Diese Rechenungenauigkeit macht sich bereits bei etwa hundert Dimensionen bemerkbar. Um diesem Effekt entgegenzuwirken, muss bei NN-Verfahren eine Metrik gewählt werden, die die Ungenauigkeiten zur Berechnung der Distanzen vermeidet oder zumindest minimalisiert. Zunächst werden in diesem Kapitel die Probleme anhand von Untersuchungen, die in der Fachliteratur zu dem Thema durchgeführt und diskutiert wurden, erörtert und Maßnahmen genannt, die eine ausreichend genaue Ermittlung der Größen zur Klassifizierung gestatten.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Literatur
Aggerwal C, Hinneburg A, Keim D (2000) What is the Nearest Neighbor in High Dimensional Spaces? In: Abbadi Ae (ed) Marking the millennium, Morgan Kaufman, Orlando, Fla., pp pages 506–515
Bellmann R (1961) Adaptive Control Processes: A Guided Tour. Princeton University Press
Beyer K, Goldstein J, Ramakrishnan R, Shaft U (1999) When Is “Nearest Neighbor” Meaningful? In: Beeri C, Buneman P (eds) Database Theory - ICDT’99, Lecture Notes in Computer Science, vol 1540, Springer, Berlin and Heidelberg, pp 217–235, https://doi.org/10.1007/3-540-49257-7_15
Breuer D (2014) Abstandsmaße für die multivariate adaptive Einbettung. Masterarbeit, FernUni Hagen
Fehrmann L (2006) Alternative Methoden zur Biomasseschätzung auf Einzelbaumebene unter Berücksichtigung der k-Nearest Neighbor (k-NN) Methode. Dissertation, Georg-August-Universität Göttingen
Francois D, Wertz V, Verleysen M (2005) Non-Euclidean metrics for similarity search in noisy datasets. URL https://perso.uclouvain.be/michel.verleysen/papers/esann05df.pdf
Ottmann T, Widmayer P (2002) Algorithmen und Datenstrukturen. Spektrum Akademischer Verlag, Heidelberg, Berlin
Sartorius G (2017) Data Preprocessing and Outlier Detection in Multivariate Data. In: Herwig Unger, Wolgang A Halang (ed) Autonomous Systems, VDI-Verlag GmbH, Düsseldorf, Reihe 10, Informatik/Kommunikation, vol 857, pp 105–140
Schmid C (2006) Statistik Analyseverfahren, Hauptkomponentenanalyse durch neuronale Netze: Lineare Neuronen: Die Lernregel von Oja
Stinson C, Dodge M (2001) Microsoft Excel Version 2002 Inside out. Redmond and Washington: Microsoft Press
Weisstein, Eric, W (2013) Ball. URL http://mathworld.wolfram.com/UnitBall.html
Author information
Authors and Affiliations
Rights and permissions
Copyright information
© 2019 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this chapter
Cite this chapter
Sartorius, G. (2019). Metrik für multidimensionale Daten. In: Erfassen, Verarbeiten und Zuordnen multivariater Messgrößen. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-23576-5_6
Download citation
DOI: https://doi.org/10.1007/978-3-658-23576-5_6
Published:
Publisher Name: Springer Vieweg, Wiesbaden
Print ISBN: 978-3-658-23575-8
Online ISBN: 978-3-658-23576-5
eBook Packages: Computer Science and Engineering (German Language)