Advertisement

Verfahren des Data Mining

  • Frank Beekmann
  • Peter Chamoni

Abstract

Die im Rahmen der Wissensentdeckung in umfangreichen Datenbeständen eingesetzten Verfahren des Data Mining werden hinsichtlich Zielsetzung, Aufgabenstellung und logischer Vorgehensweise präsentiert. Die für die Datenanalyse wichtigen Fragestellungen der Klassifikation, der Regression, der Clusterung und der Abhängigkeitsentdeckung kennzeichnen die Kernaufgaben analytischer Informationssysteme. Ihnen werden Entscheidungsbaumverfahren, Künstlich Neuronale Netze, Clusterverfahren und Assoziationsanalyse als Lösungsansätze gegenübergestellt und an Beispielen die Einsatzfähigkeit erläutert.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. [AgSr94]
    Agrawal, R.; Srikant, R.: Fast algorithms for mining association rules. In: Bocca, J. B.; Jarke, M.; Zaniolo, C. (Hrsg.): Proceedings of the 20th international conference on very large data bases. Santiago de Chile, 12.09.1994–15.09.1994, San Francisco 1994, S. 487–499.Google Scholar
  2. [AgIS93]
    Agrawal, R.; Imielinski, T.; Swami, A.: Mining association rules between sets of large items in large databases. In: Buneman, P.; Jajodia, S. (Hrsg.): Proceedings of the 1993 ACM SIGMOD international conference on management of data. Washington, 26.05.1993–28.05.1993, New York 1993, S. 207–216.Google Scholar
  3. [Bach96]
    Bacher, J.: Clusteranalyse-anwendungsorientierte Einführung. 2. Aufl. München, Wien 1996.Google Scholar
  4. [BoKr98]
    Borgelt, C.; Kruse, R.: Attributsauswahlmaße für die Induktion von Entscheidungsbäumen. Ein Überblick. In: Nakhaeizadeh, G. (Hrsg): Data Mining: theoretische Aspekte und Anwendungen. Heidelberg 1998. S. 77–98.Google Scholar
  5. [BrFO84]
    Breiman, L.; Friedman, J. H.; Olshen, R. A.; Stone, C. J.: Classification and regression trees. Belmont 1984.Google Scholar
  6. [Dast00]
    Dastani, P.: Optimierte Werbeträgerplanung mit Neuronalen Netzen im Database Marketing. In: Alpar, P.; Niedereichholz, J. (Hrsg.): Data Mining im praktischen Einsatz. Verfahren und Anwendungsfälle für Marketing, Vertrieb, Controlling und Kundenunterstützung. Braunschweig, Wiesbaden 2000, S. 51–67.Google Scholar
  7. [Düsi00]
    Düsing, R.: Knowledge discovery in databases. Diskussionsbeiträge des Fachbereichs Wirtschaftswissenschaft der Gerhard-Mercator-Universität Duisburg, Nr. 272, Duisburg 2000.Google Scholar
  8. [EsSa00]
    Ester, M.; Sander, J.: Knowledge Discovery in Databases. Techniken und Anwendungen. Berlin et al. 2000.Google Scholar
  9. [FaKK96]
    Fahrmeir, L.; Kaufmann, H.; Kredler, C.: Regressionsanalyse. In: Fahrmeir, L.; Hamerle, A.; Tutz, G. (Hrsg.): Multivariate statistische Verfahren. 2. Aufl., Berlin, New York 1996, S. 93–168.Google Scholar
  10. [FaPS96a]
    Fayyad, U. M.; Piatetsky-Shapiro, G.; Smyth, P.: From data mining to knowledge discovery in databases. In: AI Magazine 17 (1996) 3, S. 37–54.Google Scholar
  11. [FaPS96b]
    Fayyad, U. M.; Piatetsky-Shapiro, G.; Smyth, P.: From data mining to knowledge discovery: An overview. In: Fayyad, U. M.; Piatetsky-Shapiro, G.; Smyth, P.; Uthurusamy, R. (Hrsg.): Advances in knowledge discovery and data mining. Menlo Park et al. 1996, S. 1–34.Google Scholar
  12. [Graf95]
    Graf, J.: Einsatz von Neuronalen Netzen zur Aktienmarktanalyse. In: Zimmermann, H.-J. (Hrsg.): Neuro+Fuzzy: Technologien — Anwendungen. Düsseldorf 1995, S. 183–201.Google Scholar
  13. [GrMu98]
    Grimmer, U.; Mucha, H.-J.: Datensegmentierung mittels Clusteranalyse. In: Nakhaeizadeh, G. (Hrsg): Data Mining: theoretische Aspekte und Anwendungen. Heidelberg 1998, S. 109–141.Google Scholar
  14. [HaEK02]
    Hartung, J.; Elpelt, B.; Klösener, K.-H.: Statistik: Lehr-und Handbuch der angewandten Statistik. 13. Aufl., München, Wien 2002.Google Scholar
  15. [Hipp98]
    Hippner, H.: Langfristige Absatzprognose mit Neuronalen Netzen in der Automobilindustrie. In: Biethahn, J. (Hrsg.): Betriebswirtschaftliche Anwendungen des Soft Computing. Braunschweig 1998, S. 81–96.Google Scholar
  16. [HiSc01]
    Hippner, H.; Schmitz, B.: Data Mining in Kreditinstituten-Die Clusteranalyse zur zielgruppengerechten Kundenansprache. In: Hippner, H.; Küsters, U.; Meyer, M.; Wilde, K. (Hrsg.): Handbuch Data Mining im Marketing. Knowledge Discovery in Databases. Braunschweig, Wiesbaden 2001, S. 607–641.Google Scholar
  17. [HoSw93]
    Houtsma, M.; Swami, A.: Set-oriented mining for association rules. IBM Almaden research center, research report RJ 9567, San Jose 1993.Google Scholar
  18. [HuMS66]
    Hunt, E., B.; Martin, J.; Stone, P. J.: Experiments in induction. New York 1966.Google Scholar
  19. [Kass80]
    Kass, G. V.: An exploratory technique for investigating large quantities of categorical data. In: Applied statistics 29 (1980) 2, S. 119–127.CrossRefGoogle Scholar
  20. [Kinn94]
    Kinnebrock, W.: Neuronale Netze. Grundlagen, Anwendungen, Beispiele. 2. Auflage, München et al. 1994.Google Scholar
  21. [Koho82]
    Kohonen, T.: Self-organized formation of topologically correct feature maps. In: Biological cybernetics 43 (1982) 1, S. 59–69.CrossRefGoogle Scholar
  22. [Koho01]
    Kohonen, T.: Self-organizing maps. 3. Aufl., Berlin et al. 2001.Google Scholar
  23. [Kraf99]
    Krafft, M.: Anwendungen der Logistischen Regression. In: Hippner, H.; Meyer, M; Wilde, K. D. (Hrsg.): Computer based marketing. Das Handbuch zur Marketinginformatik. 2. Aufl., Braunschweig, Wiesbaden 1999, S. 535–542.Google Scholar
  24. [KrWZ98]
    Krahl, D.; Windheuser, U.; Zick, F.-K.: Data Mining. Einsatz in der Praxis. Bonn et al. 1998.Google Scholar
  25. [Küpp99]
    Küppers, B.: Data Mining in der Praxis. Ein Ansatz zur Nutzung der Potentiale von Data Mining im betrieblichen Umfeld. Frankfurt et al. 1999.Google Scholar
  26. [LiMW95]
    Lieven, K.; Meier, W.; Weber, R.; Zimmermann, H. J.: Methoden und Anwendungen der Fuzzy Datenanalyse und Neuro-Fuzzy Systeme. In: Zimmermann, H.-J. (Hrsg.): Neuro+Fuzzy. Technologien Anwendungen. Düsseldorf 1995, S. 147–181.Google Scholar
  27. [Lohr94]
    Lohrbach, T.: Einsatz von Künstlichen Neuronalen Netzen für ausgewählte betriebswirtschaftliche Aufgabenstellungen und Vergleich mit konventionellen Lösungsverfahren. Göttingen 1994.Google Scholar
  28. [MeMa72]
    Messenger, R.; Mandell, L.: A model search technique for predictive nominal scale multivariate analysis. In: Journal of the American statistical association 67 (1972) 12, S. 768–772.CrossRefGoogle Scholar
  29. [MoSo63a]
    Morgan, J. A.; Sonquist, J., N.: Problems in the analysis of survey data: and a proposal. In: Journal of the American statistical association 58 (1963), S. 415–434.CrossRefGoogle Scholar
  30. [MoSo63b]
    Morgan, J. A.; Sonquist, J., N.: Some results from a nonsymmetrical branching process that looks for interaction effects. In: American statistical association (Hrsg.): Proceedings of the social statistics section. Washington 1963, S. 40–53.Google Scholar
  31. [NeZi98]
    Neuneier, R.; Zimmermann, H. G.: How to train neural networks. In: Orr, G. B.; Müller, K.-R.: Neural networks. Tricks of the trade. Berlin et al. 1998, S. 373–423.Google Scholar
  32. [PoSi01]
    Poddig, T.; Sidorovitch, I.: Künstliche Neuronale Netze. Überblick, Einsatzmöglichkeiten und Anwendungsprobleme. In: Hippner, H.; Küsters, U.; Meyer, M.; Wilde, K. (Hrsg.): Handbuch Data Mining im Marketing. Knowledge Discovery in Databases. Braunschweig, Wiesbaden 2001, S. 363–402.Google Scholar
  33. [Quin86]
    Quinlan, J. R.: Induction of decision trees. In: Machine learning 1 (1986) 1, S. 81–106.Google Scholar
  34. [Quin93]
    Quinlan, J. R.: C4.5: programs for machine learning. San Mateo 1993.Google Scholar
  35. [Roja96]
    Rojas, R.: Neural networks. A systematic introduction. Berlin et al. 1996.Google Scholar
  36. [Rudo99]
    Rudolph, A.: Data Mining in action. Statistische Verfahren der Klassifikation. Aachen 1999.Google Scholar
  37. [Saat00]
    Saathoff, I.: Kundensegmentierung aufgrund von Kassenbons-eine kombinierte Analyse mit Neuronalen Netzen und Clustering. In: Alpar, P.; Niedereichholz, J. (Hrsg.): Data Mining im praktischen Einsatz. Verfahren und Anwendungsfälle für Marketing, Vertrieb, Controlling und Kundenunterstützung. Braunschweig, Wiesbaden 2000, S. 119–142.Google Scholar
  38. [Schö93]
    Schöneburg, E. (Hrsg.): Industrielle Anwendung Neuronaler Netze. Fallbeispiele und Anwendungskonzepte. Bonn et al. 1993.Google Scholar
  39. [Stul02]
    Stulajter, F.: Predictions in time series using regression models. New York et al. 2002.Google Scholar
  40. [WiHu96]
    Williams, G. J.; Huang, Z.: A case study in knowledge acquisition for insurance risk assessment using KDD methodology. In: Compton, P.; Mizoguchi, R.; Motoda, H.; Menzies, T. (Hrsg.): Proceedings of the Pacific rim knowledge acquisition workshop, Sydney, 23.10.1996–25.10.1996, University of New South Wales, department of artificial intelligence, school of computer science and engineering, Sydney 1996, S. 117–129.Google Scholar
  41. [WiFr99]
    Witten, I. H.; Frank, E.: Data mining. Practical machine learning tools and techniques with Java implementations. San Francisco et al. 1999.Google Scholar
  42. [Zell00]
    Zell, A.: Simulation Neuronaler Netze. München, Wien, 2000.Google Scholar
  43. [Zimm95]
    Zimmermann, H.-J. (Hrsg): Datenanalyse: Anwendung von DataEngine mit Fuzzy Technologien und Neuronalen Netzen. Düsseldorf 1995.Google Scholar

Copyright information

© Springer Berlin Heidelberg 2006

Authors and Affiliations

  • Frank Beekmann
    • 1
  • Peter Chamoni
    • 2
  1. 1.Operational Risk ManagementWestLB AGDüsseldorf
  2. 2.Lehrstuhl für Wirtschaftsinformatik und Operations ResearchUniversität Duisburg-EssenDuisburg

Personalised recommendations