Advertisement

Ein Vergleich ausgewählter Klassifikationsverfahren im Kontext von Finanzdienstleistungen

  • Ralph Langner
  • Paul Alpar
  • Markus Pfuhl
Conference paper

Zusammenfassung

Verfahren des Data Mining sind in der Literatur oft anhand allgemein zugänglicher Datensätze verglichen worden. Diese Vergleiche sind jedoch von begrenztem Nutzen, wenn ein Verfahren für ein konkretes Anwendungsumfeld ausgewählt werden soll Der Beitrag beschreibt deswegen die Auswahl eines Verfahrens für die Klassifikation von Privatkunden im Bereich Finanzdienstleistungen.

Schlüsselworte

Klassifikation Scoring Entscheidungsbäume Regression Meta-lernverfahren ROC-Diagramme Data Mining Database Marketing 

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  1. [AlNi00]
    Alpar, P.; Niedereichholz, J.: Einführung zu Data Mining. In: Alpar, P. und Niedereichholz, J. (Hrsg.): Data Mining im praktischen Einsatz. Vieweg, Braunschweig u.a., 2000, S. 1–27.Google Scholar
  2. [BoKr98]
    Borgelt, C.; Kruse, R.: Attributauswahlmaße für die Induktion von Entscheidungsbäumen: Ein Überblick. In: Nakhaeizadeh, G. (Hrsg.): Data Mining — Theoretische Aspekte und Anwendungen. Physica, Heidelberg, 1998, S. 99–108.Google Scholar
  3. [Br+84]
    Breiman, L. et al.: Classification and Regression Trees. Wadsworth International Group, Belmont, 1984. [Reprint bei: Chapman & Hall, Boca Raton u.a., 1998].Google Scholar
  4. [Br96]
    Breiman, L.: Bagging Predictors. In: Machine Learning. 1996, 24(2), S. 123–140. ftp://ftp.stat.berkeley.edu/pub/users/breiman/bagging.ps.gz, 1996, Abruf am 2002-03-17.Google Scholar
  5. [Dr02]
    Marktinformationssystem der Dresdner Bank. 2002. http://www.mis.dresdner-bank.de; Abruf: 02.05.2002.Google Scholar
  6. [DrHo00a]
    Drummond, C.; Holte, R. C.: Explicitly Representing Expected Cost: An Alternative to ROC Representation. In: Proceedings of the Sixth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2000, S. 198–207.Google Scholar
  7. [DrHo00b]
    Drummond, C.; Holte, R. C.: Exploiting the Cost of (In)sensitivity of Decision Tree Splitting Criteria. In: Proceedings of the 17th International Conference on Machine Learning. Morgan Kaufmann, San Francisco, 2000, S. 239–246.Google Scholar
  8. [EsSa00]
    Ester, M.; Sander, J.: Knowledge Discovery in Databases: Techniken und Anwendungen. Springer, Berlin u.a., 2000.CrossRefGoogle Scholar
  9. [FaHa96]
    Fahrmeir, L.; Hamerle, A.; Tutz, G.: Multivariate statistische Verfahren. 2. Aufl., de Gruyter, Berlin u.a., 1996.Google Scholar
  10. [Fay+96]
    Fayyad, U.; Piatetsky-Shapiro, G.; Smyth, P.: From Data Mining to Knowledge Discovery in Databases. In: AI Magazine, 1996, Vol. 17(3), S. 37–54.Google Scholar
  11. [HaKa01]
    Han, J.; Kamber, M.: Data Mining: Concepts and Techniques. Morgan Kaufmann, San Francisco u.a., 2001.Google Scholar
  12. [Ka80]
    Kass, G.: An Exploratory Technique for Investigation Large Quantities of Categorical Data. In: Applied Statistics, 1980, Vol. 29(2), S. 119–127.CrossRefGoogle Scholar
  13. [Li00]
    Lim, T. S.: Polytomous Logistic Regression Trees. Dissertation, University of Wisconsin-Madison, 2000.]Google Scholar
  14. [LoSh97]
    Loh, W. Y.; Shih, Y. S.: Split Selection Methods for Classification Trees. In: Statistica Sinica, 1997, Vol. 7, S. 815–840.Google Scholar
  15. [Mi+94]
    Michie, D.; Spiegelhalter, D: J.; Taylor, C. C.: Machine Learning, Neural and Statistical Classification. Ellis Horwood, Ney York u.a., 1994.Google Scholar
  16. [Na+98]
    Nakhaeizadeh, G.; Reinartz, T.; Wirth, R.: Wissensentdeckung in Datenbanken und Data Mining: Ein Überblick. In: Nakhaeizadeh, G. (Hrsg.): Data Mining — Theoretische Aspekte und Anwendungen. Physica, Heidelberg, 1998, S. 1–33.Google Scholar
  17. [PrFa97]
    Provost, F.; Fawcett, T.: Analysis and Visualization of Classifier Performance: Comparison under Imprecise Class and Cost Distributions. In: Proceedings of the Third International Conference on Knowledge Discovery and Data Mining. AAAI Press, Menlo Park, 1997, S. 43–48.Google Scholar
  18. [Qu93]
    Quinlan, J. R.: C4.5: Programs for Machine Learning. Morgan Kaufmann, San Mateo, 1993.Google Scholar
  19. [Ro+94]
    Rohwer, R.; Wynne-Jones, M.; Wysotzki, F.: Neural Networks. In: Michie, D.; Spiegelhalter, D. J.; Taylor, C. C. (Hrsg.): Machine Learning, Neural and Statistical Classification. Ellis Horwood, 1994, S. 84–106.Google Scholar
  20. [WiFr01]
    Witten, I. H.; Frank, E.: Data Mining: Praktische Werkzeuge und Techniken für das maschinelle Lernen. Carl Hanser, München u.a., 2001.Google Scholar
  21. [Zi+98]
    Zighed, D.A., Rabaseda, S.; Rakotomalala, R.: FUSINTER: A Method for Discretization of Continuous Attributes. In: International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems. 1998, Vol. 6(3), S. 307–326.CrossRefGoogle Scholar

Copyright information

© Springer-Verlag Berlin Heidelberg 2003

Authors and Affiliations

  • Ralph Langner
    • 1
  • Paul Alpar
    • 2
  • Markus Pfuhl
    • 2
  1. 1.Dresdner BankDeutschland
  2. 2.Philipps-Universität MarburgDeutschland

Personalised recommendations