Skip to main content
  • 3465 Accesses

Zusammenfassung

Um Objekte, Zustände oder Vorgänge durch Daten zu repräsentieren, müssen große Mengen von Messwerten erfasst und jeder einzelne einer Dimension im multidimensionalen Raum zugeordnet werden. Die Anzahl der Dimensionen bei der Darstellung der Daten kann sehr groß werden, der Rechenaufwand zur Distanzberechnung nimmt mit der Dimensionalität zu und die Rechengenauigkeit ab. Diese Rechenungenauigkeit macht sich bereits bei etwa hundert Dimensionen bemerkbar. Um diesem Effekt entgegenzuwirken, muss bei NN-Verfahren eine Metrik gewählt werden, die die Ungenauigkeiten zur Berechnung der Distanzen vermeidet oder zumindest minimalisiert. Zunächst werden in diesem Kapitel die Probleme anhand von Untersuchungen, die in der Fachliteratur zu dem Thema durchgeführt und diskutiert wurden, erörtert und Maßnahmen genannt, die eine ausreichend genaue Ermittlung der Größen zur Klassifizierung gestatten.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 69.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Literatur

  1. Aggerwal C, Hinneburg A, Keim D (2000) What is the Nearest Neighbor in High Dimensional Spaces? In: Abbadi Ae (ed) Marking the millennium, Morgan Kaufman, Orlando, Fla., pp pages 506–515

    Google Scholar 

  2. Bellmann R (1961) Adaptive Control Processes: A Guided Tour. Princeton University Press

    Book  Google Scholar 

  3. Beyer K, Goldstein J, Ramakrishnan R, Shaft U (1999) When Is “Nearest Neighbor” Meaningful? In: Beeri C, Buneman P (eds) Database Theory - ICDT’99, Lecture Notes in Computer Science, vol 1540, Springer, Berlin and Heidelberg, pp 217–235, https://doi.org/10.1007/3-540-49257-7_15

    Google Scholar 

  4. Breuer D (2014) Abstandsmaße für die multivariate adaptive Einbettung. Masterarbeit, FernUni Hagen

    Google Scholar 

  5. Fehrmann L (2006) Alternative Methoden zur Biomasseschätzung auf Einzelbaumebene unter Berücksichtigung der k-Nearest Neighbor (k-NN) Methode. Dissertation, Georg-August-Universität Göttingen

    Google Scholar 

  6. Francois D, Wertz V, Verleysen M (2005) Non-Euclidean metrics for similarity search in noisy datasets. URL https://perso.uclouvain.be/michel.verleysen/papers/esann05df.pdf

  7. Ottmann T, Widmayer P (2002) Algorithmen und Datenstrukturen. Spektrum Akademischer Verlag, Heidelberg, Berlin

    MATH  Google Scholar 

  8. Sartorius G (2017) Data Preprocessing and Outlier Detection in Multivariate Data. In: Herwig Unger, Wolgang A Halang (ed) Autonomous Systems, VDI-Verlag GmbH, Düsseldorf, Reihe 10, Informatik/Kommunikation, vol 857, pp 105–140

    Google Scholar 

  9. Schmid C (2006) Statistik Analyseverfahren, Hauptkomponentenanalyse durch neuronale Netze: Lineare Neuronen: Die Lernregel von Oja

    Google Scholar 

  10. Stinson C, Dodge M (2001) Microsoft Excel Version 2002 Inside out. Redmond and Washington: Microsoft Press

    Google Scholar 

  11. Weisstein, Eric, W (2013) Ball. URL http://mathworld.wolfram.com/UnitBall.html

Download references

Author information

Authors and Affiliations

Authors

Rights and permissions

Reprints and permissions

Copyright information

© 2019 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Sartorius, G. (2019). Metrik für multidimensionale Daten. In: Erfassen, Verarbeiten und Zuordnen multivariater Messgrößen. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-23576-5_6

Download citation

Publish with us

Policies and ethics