Zusammenfassung
Die in praktischen Anwendungen zur Verfügung stehenden Daten sind oft fehlerbehaftet, verrauscht, ungünstig skaliert und verteilt gespeichert. Zur Datenanalyse müssen solche Rohdaten zunächst vorverarbeitet werden, was einen nicht unerheblichen Arbeits- und Zeitaufwand innerhalb von Data-Mining-Projekten darstellt. Zu den wichtigsten Aufgaben dieser Datenvorverarbeitung gehört die Erkennung und Behandlung von Fehlern, Ausreißern und Rauscheffekten sowie die Aufbereitung der Daten durch Standardisierung und die Zusammenfassung aller benötigten Daten, zum Beispiel zu einer einzigen Datenmatrix. Falls die Daten als Zeitreihen vorliegen, lassen sich Ausreißer und Rauschen durch Filtermethoden reduzieren. Abbildung 3.1 zeigt einige der wichtigsten Familien von Filtermethoden, die in diesem Kapitel beschrieben werden.
This is a preview of subscription content, log in via an institution.
Buying options
Tax calculation will be finalised at checkout
Purchases are for personal use only
Learn about institutional subscriptionsPreview
Unable to display preview. Download preview PDF.
Rights and permissions
Copyright information
© 2010 Vieweg+Teubner | GWV Fachverlage GmbH
About this chapter
Cite this chapter
Runkler, T. (2010). Datenvorverarbeitung. In: Data Mining. Vieweg+Teubner. https://doi.org/10.1007/978-3-8348-9353-6_3
Download citation
DOI: https://doi.org/10.1007/978-3-8348-9353-6_3
Publisher Name: Vieweg+Teubner
Print ISBN: 978-3-8348-0858-5
Online ISBN: 978-3-8348-9353-6
eBook Packages: Computer Science and Engineering (German Language)