Skip to main content

Vorverarbeitung von Web-Daten — Pre-Processing

  • Chapter
  • 620 Accesses

Part of the book series: Aus dem Bereich IT erfolgreich nutzen ((XBC))

Zusammenfassung

Rohe Logfile-Daten als Ausgangspunkt eines Web-Mining-Projektes besitzen einige Defizite: Zunächst ist eine Vielzahl von protokollierten Zugriffen in den Logfiles für weitere Auswertungen nicht von Interesse. Wichtig für die Analyse sind im Allgemeinen nur diejenigen Elemente, die vom Benutzer explizit angefordert werden, nicht aber diejenigen, die automatisch vom Client des Benutzers mitgeladen werden (sogenannte Auxiliary Requests). Auch verwenden vor allem Suchmaschinenbetreiber häufig Computerprogramme (sogenannte Robots oder Spider), die automatisiert Web-Sites durchlaufen und ebenfalls für Einträge im Logfile sorgen.

This is a preview of subscription content, log in via an institution.

Buying options

Chapter
USD   29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD   64.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD   84.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Learn about institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Literatur

  • Broder, A.J. (2000): Data Mining, the Internet, and Privacy. In: Massand, B.; Spiliopoulou, M. (Hrsg.): Web Usage Analysis and User Profiling, Berlin, S. 56–73.

    Chapter  Google Scholar 

  • Catledge, L.D.; Pitkow, J. (1995): Characterizing Browsing Strategies in the World-Wide Web. In: Proceedings of the 3rd International World Wide Web Conference, Vol. 28 of Computer Networks and ISDN Systems, Darmstadt, Germany.

    Google Scholar 

  • Cooley, R.; Mobasher, B.; Srivastava, J. (1999): Data Preparation for Mining World Wide Web Browsing Patterns. In: Knowledge and Information-Systems, Vol. 1, No. 1, S. 5–32.

    Google Scholar 

  • IVW (2000). Das IVW Messverfahren — IVW-Pixel. http://www.ivw.de/online/mess-verfahren/pixel.php [05.10.2001].

    Google Scholar 

  • Kimbal, R.; Merz, R. (2000): The Data Webhouse Toolkit, New York.

    Google Scholar 

  • Lutzky (2001): Nutzung von Logfileanalysen in der Marktforschung. Diplomarbeit, Lehrstuhl für Betriebswirtschaftslehre, insbesondere Marketing II, Universität Frankfurt.

    Google Scholar 

  • Pirolli, P.; Pitkow, J.E. (1999): Distributions of Surfers’ Paths through the World Wide Web — Empirical Caracterizations. In: World Wide Web, Vol. 2, No. 1/2, S. 29–45.

    Google Scholar 

  • Smith, R.M. (2000): On Internet Privacy and Profiling, http://www.senate.gov/~commerce/hearings/0613smi.pdf[12.10.2001].

    Google Scholar 

  • Schmidt-Thieme, L. (2001). Web Mining. Vorlesungsskript, Institut für Entscheidungstheorie und Unternehmensforschung, Universität Karlsruhe (TH).

    Google Scholar 

  • Spiliopoulou, M. (2000): Web Usage Mining for Evaluation of Browsing Patterns. In: Communications of the ACM, Vol. 43, No. 8, S. 117–134.

    Google Scholar 

Download references

Authors

Editor information

Hajo Hippner Melanie Merzenich Klaus D. Wilde

Rights and permissions

Reprints and permissions

Copyright information

© 2002 Friedr. Vieweg & Sohn Verlagsgesellschaft mbH, Braunschweig/Wiesbaden

About this chapter

Cite this chapter

Säuberlich, F. (2002). Vorverarbeitung von Web-Daten — Pre-Processing. In: Hippner, H., Merzenich, M., Wilde, K.D. (eds) Handbuch Web Mining im Marketing. Aus dem Bereich IT erfolgreich nutzen. Vieweg+Teubner Verlag. https://doi.org/10.1007/978-3-322-89871-5_5

Download citation

  • DOI: https://doi.org/10.1007/978-3-322-89871-5_5

  • Publisher Name: Vieweg+Teubner Verlag

  • Print ISBN: 978-3-322-89872-2

  • Online ISBN: 978-3-322-89871-5

  • eBook Packages: Springer Book Archive

Publish with us

Policies and ethics