Zusammenfassung
Noch nie wurden derart gewaltige Datenmengen produziert wie in jüngster Zeit. Daraus erwächst die Erwartung, dass sich in den Peta- und Exabyte an Daten interessante Informationen finden lassen, wenn es nur gelingt, dieses gewaltige Volumen zielgerichtet auszuwerten. Sowohl in der Wissenschaft als auch zunehmend in der Praxis werden daher Verfahren und Technologien diskutiert, die interessante Muster in umfangreichen Datenbeständen aufdecken und Prognosen über zukünftige Ereignisse und Gegebenheiten anstellen können. Zahlreiche der hierfür verwendeten Methoden sind unter dem Begriffsgebilde Data Mining bereits seit langer Zeit bekannt, wurden jedoch im Laufe der Jahre ausgebaut und verfeinert. Der vorliegende Beitrag setzt sich das Ziel, die wesentlichen Verfahren zur Datenanalyse im Überblick zu präsentieren und dabei auf die grundlegenden Vorgehensweisen sowie potenzielle Einsatzbereiche einzugehen.
Vollständig neuer Original-Beitrag
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Prinzipiell eignen sich Entscheidungsbäume auch zur Erstellung von Regressionsmodellen, wenn die Klassen Intervalle einer stetigen Regressionsvariablen darstellen. Allerdings werden in der Praxis eher die weit entwickelten statistischen Verfahren für diese Aufgabe eingesetzt. Aus diesem Grunde erfolgt hier die Konzentration auf den Einsatz zur Klassifikation.
- 2.
Salopp formuliert wird Entropie auch als Maß der Unordnung verstanden.
- 3.
Dabei darf es sich bei den betrachteten Attributen nur um kategoriale Attribute handeln.
Literatur
Agrawal R, Srikant R (1994) Fast algorithms for mining association rules. In: Bocca JB, Jarke M, Zaniolo C (Hrsg) Proceedings of the 20th international conference on very large data bases. Santiago de Chile, 12.09.1994–15.09.1994. Warren, San Francisco, S 487–499
Agresti A (2013) Categorical data analysis, 3. Aufl. Wiley, Hoboken
Bankhofer U (2004) Data Mining und seine betriebswirtschaftliche Relevanz. BFuP 56(4):395–412
Beekmann F, Chamoni P (2006) Verfahren des Data Mining. In: Chamoni P, Gluchowski P (Hrsg) Analytische Informationssysteme. Business Intelligence-Technologien und -Anwendungen, 3. Aufl. Springer, Berlin, S 263–282
Borgelt C, Kruse R (1998) Attributauswahlmaße für die Induktion von Entscheidungsbäumen. Ein Überblick. In: Nakhaeizadeh G (Hrsg) Data Mining: theoretische Aspekte und Anwendungen. Springer, Heidelberg, S 77–98
Breiman L, Friedman J, Stone CJ, Olshen RA (1984) Classification and regression trees. Wadsworth statistics/probability. Wadsworth International Group, Belmont
Chamoni P (2019) Data mining. In: Gronau N et al (Hrsg) Enzyklopädie der Wirtschaftsinformatik, 11. Aufl. GITO, Berlin. https://enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/daten-wissen/Business-Intelligence/Analytische-Informationssysteme%2D%2DMethoden-der-/Data-Mining/index.html. Zugegriffen am 07.04.2020
Dorer K (2019) Deep Learning. In: Haneke U (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 101–120
Derwisch S, Iffert L (2017) Advanced & Predictive Analytics Data Science im Fachbereich. BARC Anwenderstudie, Würzburg
Dittmar C, Felden C, Finger R, Scheuch R, Tams L (2016) Big Data – ein Überblick. dpunkt, Heidelberg
Dorschel J (2015) Praxishandbuch Big Data. Springer Gabler, Wiesbaden
Eaton C, Deroos D, Deutsch T, Lapis G, Zikopoulos P (2012) Understanding big data, analytics for enterprise class hadoop and streaming data. Mcgraw-Hill, New York
Fayyad UM, Piatetsky-Shapiro G, Smyth P (1996) From data mining to knowledge discovery in databases. AI Mag 17(3):37–54
Goodfellow I, Bengio Y, Courville A (2018) Deep Learning – das umfassende Handbuch: Grundlagen, aktuelle Verfahren und Algorithmen, neue Forschungsansätze. mitp, Frechen
Hastie T, Tibshirani R, Friedman J (2009) The elements of statistical learning – data mining, inference, and prediction, 2. Aufl. Springer, New York
Heinrich K, Zschech P, Möller B, Breithaupt L, Maresch J (2019) Objekterkennung im Weinanbau – eine Fallstudie zur Unterstützung von Winzertätigkeiten mithilfe von Deep Learning. HMD 56:964–985
Hochreiter S, Schmidhuber J (1997) Long short-term memory. Neural Comput 9(8):1735–1780
Holzinger A (2018) Explainable AI (ex-AI). Inform Spektrum 41(2):138–143. https://link.springer.com/content/pdf/10.1007/s00287-018-1102-5.pdf. Zugegriffen am 15.08.2020
Huber M (2019) Predictive maintenance. In: Haneke et al (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 225–244
Hunt EB, Marin J, Stone PJ (1966) Experiments in induction. Academic Press, University of Michigan
Larose DT, Larose CD (2015) Data mining and predictive analytics, 2. Aufl. Wiley, Hoboken
LeCun Y, Bengio Y, Hinton G (2015) Deep learning. Nature 521:436–444
Lee H, Grosse R, Ranganath R, Ng AY (2009) Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. In: Proceedings of the 26th International Conference on Machine Learning, Montreal, Canada
McCulloch PW (1943) A logical calculus of the ideas immanent in nervous activity. Bull Math Biophys 5:115–133
Morgan JA, Sonquist JN (1963) Problems in the analysis of survey data: and a proposal. J Am Stat Assoc 58:415–434
Ortiz C (2020) Augmented Analytics: Zusammenhänge der Daten zügig erkennen. BI Spektrum 15(3):8–11
Quinlan JR (1986) Induction of decision trees. Mach Learn 1(1):81–106
Quinlan JR (1993) C4.5: programs for machine learning. Kaufmann, San Mateo
Rojas R (1996) Neural networks. A systematic introduction. Springer, Berlin
Schulz H, Behnke SDeep learning: layer-wise learning of feature hierarchies. KI 2012, 26(4):357–363
Zeiler M, Fergus R (2014) Visualizing and understanding convolutional networks. In: Proceedings of the 13th European conference on computer vision. September 6–12, 2014, Zurich, Switzerland.
Author information
Authors and Affiliations
Corresponding author
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 2021 Der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this chapter
Cite this chapter
Gluchowski, P., Schieder, C., Chamoni, P. (2021). Methoden des Data Mining für Big Data Analytics. In: D'Onofrio, S., Meier, A. (eds) Big Data Analytics. Edition HMD. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-32236-6_2
Download citation
DOI: https://doi.org/10.1007/978-3-658-32236-6_2
Published:
Publisher Name: Springer Vieweg, Wiesbaden
Print ISBN: 978-3-658-32235-9
Online ISBN: 978-3-658-32236-6
eBook Packages: Computer Science and Engineering (German Language)