Methoden des Data Mining für Big Data Analytics

Gluchowski, Peter; Schieder, Christian; Chamoni, Peter

doi:10.1007/978-3-658-32236-6_2

Peter Gluchowski¹¹,
Christian Schieder¹² &
Peter Chamoni¹³

Part of the book series: Edition HMD ((EHMD))

16k Accesses
1 Citations

Zusammenfassung

Noch nie wurden derart gewaltige Datenmengen produziert wie in jüngster Zeit. Daraus erwächst die Erwartung, dass sich in den Peta- und Exabyte an Daten interessante Informationen finden lassen, wenn es nur gelingt, dieses gewaltige Volumen zielgerichtet auszuwerten. Sowohl in der Wissenschaft als auch zunehmend in der Praxis werden daher Verfahren und Technologien diskutiert, die interessante Muster in umfangreichen Datenbeständen aufdecken und Prognosen über zukünftige Ereignisse und Gegebenheiten anstellen können. Zahlreiche der hierfür verwendeten Methoden sind unter dem Begriffsgebilde Data Mining bereits seit langer Zeit bekannt, wurden jedoch im Laufe der Jahre ausgebaut und verfeinert. Der vorliegende Beitrag setzt sich das Ziel, die wesentlichen Verfahren zur Datenanalyse im Überblick zu präsentieren und dabei auf die grundlegenden Vorgehensweisen sowie potenzielle Einsatzbereiche einzugehen.

Vollständig neuer Original-Beitrag

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 54.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

1.
Prinzipiell eignen sich Entscheidungsbäume auch zur Erstellung von Regressionsmodellen, wenn die Klassen Intervalle einer stetigen Regressionsvariablen darstellen. Allerdings werden in der Praxis eher die weit entwickelten statistischen Verfahren für diese Aufgabe eingesetzt. Aus diesem Grunde erfolgt hier die Konzentration auf den Einsatz zur Klassifikation.
2.
Salopp formuliert wird Entropie auch als Maß der Unordnung verstanden.
3.
Dabei darf es sich bei den betrachteten Attributen nur um kategoriale Attribute handeln.

Literatur

Agrawal R, Srikant R (1994) Fast algorithms for mining association rules. In: Bocca JB, Jarke M, Zaniolo C (Hrsg) Proceedings of the 20th international conference on very large data bases. Santiago de Chile, 12.09.1994–15.09.1994. Warren, San Francisco, S 487–499
Google Scholar
Agresti A (2013) Categorical data analysis, 3. Aufl. Wiley, Hoboken
MATH Google Scholar
Bankhofer U (2004) Data Mining und seine betriebswirtschaftliche Relevanz. BFuP 56(4):395–412
Google Scholar
Beekmann F, Chamoni P (2006) Verfahren des Data Mining. In: Chamoni P, Gluchowski P (Hrsg) Analytische Informationssysteme. Business Intelligence-Technologien und -Anwendungen, 3. Aufl. Springer, Berlin, S 263–282
Google Scholar
Borgelt C, Kruse R (1998) Attributauswahlmaße für die Induktion von Entscheidungsbäumen. Ein Überblick. In: Nakhaeizadeh G (Hrsg) Data Mining: theoretische Aspekte und Anwendungen. Springer, Heidelberg, S 77–98
Chapter Google Scholar
Breiman L, Friedman J, Stone CJ, Olshen RA (1984) Classification and regression trees. Wadsworth statistics/probability. Wadsworth International Group, Belmont
MATH Google Scholar
Chamoni P (2019) Data mining. In: Gronau N et al (Hrsg) Enzyklopädie der Wirtschaftsinformatik, 11. Aufl. GITO, Berlin. https://enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/daten-wissen/Business-Intelligence/Analytische-Informationssysteme%2D%2DMethoden-der-/Data-Mining/index.html. Zugegriffen am 07.04.2020
Dorer K (2019) Deep Learning. In: Haneke U (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 101–120
Google Scholar
Derwisch S, Iffert L (2017) Advanced & Predictive Analytics Data Science im Fachbereich. BARC Anwenderstudie, Würzburg
Google Scholar
Dittmar C, Felden C, Finger R, Scheuch R, Tams L (2016) Big Data – ein Überblick. dpunkt, Heidelberg
Google Scholar
Dorschel J (2015) Praxishandbuch Big Data. Springer Gabler, Wiesbaden
Book Google Scholar
Eaton C, Deroos D, Deutsch T, Lapis G, Zikopoulos P (2012) Understanding big data, analytics for enterprise class hadoop and streaming data. Mcgraw-Hill, New York
Google Scholar
Fayyad UM, Piatetsky-Shapiro G, Smyth P (1996) From data mining to knowledge discovery in databases. AI Mag 17(3):37–54
Google Scholar
Goodfellow I, Bengio Y, Courville A (2018) Deep Learning – das umfassende Handbuch: Grundlagen, aktuelle Verfahren und Algorithmen, neue Forschungsansätze. mitp, Frechen
Google Scholar
Hastie T, Tibshirani R, Friedman J (2009) The elements of statistical learning – data mining, inference, and prediction, 2. Aufl. Springer, New York
Google Scholar
Heinrich K, Zschech P, Möller B, Breithaupt L, Maresch J (2019) Objekterkennung im Weinanbau – eine Fallstudie zur Unterstützung von Winzertätigkeiten mithilfe von Deep Learning. HMD 56:964–985
Google Scholar
Hochreiter S, Schmidhuber J (1997) Long short-term memory. Neural Comput 9(8):1735–1780
Article Google Scholar
Holzinger A (2018) Explainable AI (ex-AI). Inform Spektrum 41(2):138–143. https://link.springer.com/content/pdf/10.1007/s00287-018-1102-5.pdf. Zugegriffen am 15.08.2020
Huber M (2019) Predictive maintenance. In: Haneke et al (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 225–244
Google Scholar
Hunt EB, Marin J, Stone PJ (1966) Experiments in induction. Academic Press, University of Michigan
Google Scholar
Larose DT, Larose CD (2015) Data mining and predictive analytics, 2. Aufl. Wiley, Hoboken
MATH Google Scholar
LeCun Y, Bengio Y, Hinton G (2015) Deep learning. Nature 521:436–444
Article Google Scholar
Lee H, Grosse R, Ranganath R, Ng AY (2009) Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. In: Proceedings of the 26th International Conference on Machine Learning, Montreal, Canada
Google Scholar
McCulloch PW (1943) A logical calculus of the ideas immanent in nervous activity. Bull Math Biophys 5:115–133
Article MathSciNet Google Scholar
Morgan JA, Sonquist JN (1963) Problems in the analysis of survey data: and a proposal. J Am Stat Assoc 58:415–434
Article Google Scholar
Ortiz C (2020) Augmented Analytics: Zusammenhänge der Daten zügig erkennen. BI Spektrum 15(3):8–11
Google Scholar
Quinlan JR (1986) Induction of decision trees. Mach Learn 1(1):81–106
Google Scholar
Quinlan JR (1993) C4.5: programs for machine learning. Kaufmann, San Mateo
Google Scholar
Rojas R (1996) Neural networks. A systematic introduction. Springer, Berlin
MATH Google Scholar
Schulz H, Behnke SDeep learning: layer-wise learning of feature hierarchies. KI 2012, 26(4):357–363
Google Scholar
Zeiler M, Fergus R (2014) Visualizing and understanding convolutional networks. In: Proceedings of the 13th European conference on computer vision. September 6–12, 2014, Zurich, Switzerland.
Google Scholar

Download references

Author information

Authors and Affiliations

Technische Universität Chemnitz, Chemnitz, Deutschland
Peter Gluchowski
Ostbayerische Technische Hochschule Amberg-Weiden, Amberg, Deutschland
Christian Schieder
Mercator School of Management, Universität Duisburg-Essen, Duisburg, Deutschland
Peter Chamoni

Authors

Peter Gluchowski
View author publications
You can also search for this author in PubMed Google Scholar
Christian Schieder
View author publications
You can also search for this author in PubMed Google Scholar
Peter Chamoni
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Peter Gluchowski .

Editor information

Editors and Affiliations

IT Business Integration, Genossenschaft Migros Zürich, Zürich, Switzerland
Sara D'Onofrio
Universität Fribourg, Fribourg, Switzerland
Andreas Meier

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Gluchowski, P., Schieder, C., Chamoni, P. (2021). Methoden des Data Mining für Big Data Analytics. In: D'Onofrio, S., Meier, A. (eds) Big Data Analytics. Edition HMD. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-32236-6_2

Download citation

DOI: https://doi.org/10.1007/978-3-658-32236-6_2
Published: 02 April 2021
Publisher Name: Springer Vieweg, Wiesbaden
Print ISBN: 978-3-658-32235-9
Online ISBN: 978-3-658-32236-6
eBook Packages: Computer Science and Engineering (German Language)

Publish with us

Policies and ethics