Skip to main content

Methoden des Data Mining für Big Data Analytics

  • Chapter
  • First Online:
Big Data Analytics

Part of the book series: Edition HMD ((EHMD))

Zusammenfassung

Noch nie wurden derart gewaltige Datenmengen produziert wie in jüngster Zeit. Daraus erwächst die Erwartung, dass sich in den Peta- und Exabyte an Daten interessante Informationen finden lassen, wenn es nur gelingt, dieses gewaltige Volumen zielgerichtet auszuwerten. Sowohl in der Wissenschaft als auch zunehmend in der Praxis werden daher Verfahren und Technologien diskutiert, die interessante Muster in umfangreichen Datenbeständen aufdecken und Prognosen über zukünftige Ereignisse und Gegebenheiten anstellen können. Zahlreiche der hierfür verwendeten Methoden sind unter dem Begriffsgebilde Data Mining bereits seit langer Zeit bekannt, wurden jedoch im Laufe der Jahre ausgebaut und verfeinert. Der vorliegende Beitrag setzt sich das Ziel, die wesentlichen Verfahren zur Datenanalyse im Überblick zu präsentieren und dabei auf die grundlegenden Vorgehensweisen sowie potenzielle Einsatzbereiche einzugehen.

Vollständig neuer Original-Beitrag

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 54.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Prinzipiell eignen sich Entscheidungsbäume auch zur Erstellung von Regressionsmodellen, wenn die Klassen Intervalle einer stetigen Regressionsvariablen darstellen. Allerdings werden in der Praxis eher die weit entwickelten statistischen Verfahren für diese Aufgabe eingesetzt. Aus diesem Grunde erfolgt hier die Konzentration auf den Einsatz zur Klassifikation.

  2. 2.

    Salopp formuliert wird Entropie auch als Maß der Unordnung verstanden.

  3. 3.

    Dabei darf es sich bei den betrachteten Attributen nur um kategoriale Attribute handeln.

Literatur

  • Agrawal R, Srikant R (1994) Fast algorithms for mining association rules. In: Bocca JB, Jarke M, Zaniolo C (Hrsg) Proceedings of the 20th international conference on very large data bases. Santiago de Chile, 12.09.1994–15.09.1994. Warren, San Francisco, S 487–499

    Google Scholar 

  • Agresti A (2013) Categorical data analysis, 3. Aufl. Wiley, Hoboken

    MATH  Google Scholar 

  • Bankhofer U (2004) Data Mining und seine betriebswirtschaftliche Relevanz. BFuP 56(4):395–412

    Google Scholar 

  • Beekmann F, Chamoni P (2006) Verfahren des Data Mining. In: Chamoni P, Gluchowski P (Hrsg) Analytische Informationssysteme. Business Intelligence-Technologien und -Anwendungen, 3. Aufl. Springer, Berlin, S 263–282

    Google Scholar 

  • Borgelt C, Kruse R (1998) Attributauswahlmaße für die Induktion von Entscheidungsbäumen. Ein Überblick. In: Nakhaeizadeh G (Hrsg) Data Mining: theoretische Aspekte und Anwendungen. Springer, Heidelberg, S 77–98

    Chapter  Google Scholar 

  • Breiman L, Friedman J, Stone CJ, Olshen RA (1984) Classification and regression trees. Wadsworth statistics/probability. Wadsworth International Group, Belmont

    MATH  Google Scholar 

  • Chamoni P (2019) Data mining. In: Gronau N et al (Hrsg) Enzyklopädie der Wirtschaftsinformatik, 11. Aufl. GITO, Berlin. https://enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/daten-wissen/Business-Intelligence/Analytische-Informationssysteme%2D%2DMethoden-der-/Data-Mining/index.html. Zugegriffen am 07.04.2020

  • Dorer K (2019) Deep Learning. In: Haneke U (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 101–120

    Google Scholar 

  • Derwisch S, Iffert L (2017) Advanced & Predictive Analytics Data Science im Fachbereich. BARC Anwenderstudie, Würzburg

    Google Scholar 

  • Dittmar C, Felden C, Finger R, Scheuch R, Tams L (2016) Big Data – ein Überblick. dpunkt, Heidelberg

    Google Scholar 

  • Dorschel J (2015) Praxishandbuch Big Data. Springer Gabler, Wiesbaden

    Book  Google Scholar 

  • Eaton C, Deroos D, Deutsch T, Lapis G, Zikopoulos P (2012) Understanding big data, analytics for enterprise class hadoop and streaming data. Mcgraw-Hill, New York

    Google Scholar 

  • Fayyad UM, Piatetsky-Shapiro G, Smyth P (1996) From data mining to knowledge discovery in databases. AI Mag 17(3):37–54

    Google Scholar 

  • Goodfellow I, Bengio Y, Courville A (2018) Deep Learning – das umfassende Handbuch: Grundlagen, aktuelle Verfahren und Algorithmen, neue Forschungsansätze. mitp, Frechen

    Google Scholar 

  • Hastie T, Tibshirani R, Friedman J (2009) The elements of statistical learning – data mining, inference, and prediction, 2. Aufl. Springer, New York

    Google Scholar 

  • Heinrich K, Zschech P, Möller B, Breithaupt L, Maresch J (2019) Objekterkennung im Weinanbau – eine Fallstudie zur Unterstützung von Winzertätigkeiten mithilfe von Deep Learning. HMD 56:964–985

    Google Scholar 

  • Hochreiter S, Schmidhuber J (1997) Long short-term memory. Neural Comput 9(8):1735–1780

    Article  Google Scholar 

  • Holzinger A (2018) Explainable AI (ex-AI). Inform Spektrum 41(2):138–143. https://link.springer.com/content/pdf/10.1007/s00287-018-1102-5.pdf. Zugegriffen am 15.08.2020

  • Huber M (2019) Predictive maintenance. In: Haneke et al (Hrsg) Data Science. Grundlagen, Architekturen und Anwendungen. dpunkt, Heidelberg, S 225–244

    Google Scholar 

  • Hunt EB, Marin J, Stone PJ (1966) Experiments in induction. Academic Press, University of Michigan

    Google Scholar 

  • Larose DT, Larose CD (2015) Data mining and predictive analytics, 2. Aufl. Wiley, Hoboken

    MATH  Google Scholar 

  • LeCun Y, Bengio Y, Hinton G (2015) Deep learning. Nature 521:436–444

    Article  Google Scholar 

  • Lee H, Grosse R, Ranganath R, Ng AY (2009) Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations. In: Proceedings of the 26th International Conference on Machine Learning, Montreal, Canada

    Google Scholar 

  • McCulloch PW (1943) A logical calculus of the ideas immanent in nervous activity. Bull Math Biophys 5:115–133

    Article  MathSciNet  Google Scholar 

  • Morgan JA, Sonquist JN (1963) Problems in the analysis of survey data: and a proposal. J Am Stat Assoc 58:415–434

    Article  Google Scholar 

  • Ortiz C (2020) Augmented Analytics: Zusammenhänge der Daten zügig erkennen. BI Spektrum 15(3):8–11

    Google Scholar 

  • Quinlan JR (1986) Induction of decision trees. Mach Learn 1(1):81–106

    Google Scholar 

  • Quinlan JR (1993) C4.5: programs for machine learning. Kaufmann, San Mateo

    Google Scholar 

  • Rojas R (1996) Neural networks. A systematic introduction. Springer, Berlin

    MATH  Google Scholar 

  • Schulz H, Behnke SDeep learning: layer-wise learning of feature hierarchies. KI 2012, 26(4):357–363

    Google Scholar 

  • Zeiler M, Fergus R (2014) Visualizing and understanding convolutional networks. In: Proceedings of the 13th European conference on computer vision. September 6–12, 2014, Zurich, Switzerland.

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Peter Gluchowski .

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 2021 Der/die Autor(en), exklusiv lizenziert durch Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Gluchowski, P., Schieder, C., Chamoni, P. (2021). Methoden des Data Mining für Big Data Analytics. In: D'Onofrio, S., Meier, A. (eds) Big Data Analytics. Edition HMD. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-32236-6_2

Download citation

Publish with us

Policies and ethics