Zusammenfassung
Rohe Logfile-Daten als Ausgangspunkt eines Web-Mining-Projektes besitzen einige Defizite: Zunächst ist eine Vielzahl von protokollierten Zugriffen in den Logfiles für weitere Auswertungen nicht von Interesse. Wichtig für die Analyse sind im Allgemeinen nur diejenigen Elemente, die vom Benutzer explizit angefordert werden, nicht aber diejenigen, die automatisch vom Client des Benutzers mitgeladen werden (sogenannte Auxiliary Requests). Auch verwenden vor allem Suchmaschinenbetreiber häufig Computerprogramme (sogenannte Robots oder Spider), die automatisiert Web-Sites durchlaufen und ebenfalls für Einträge im Logfile sorgen.
This is a preview of subscription content, log in via an institution.
Buying options
Tax calculation will be finalised at checkout
Purchases are for personal use only
Learn about institutional subscriptionsPreview
Unable to display preview. Download preview PDF.
Literatur
Broder, A.J. (2000): Data Mining, the Internet, and Privacy. In: Massand, B.; Spiliopoulou, M. (Hrsg.): Web Usage Analysis and User Profiling, Berlin, S. 56–73.
Catledge, L.D.; Pitkow, J. (1995): Characterizing Browsing Strategies in the World-Wide Web. In: Proceedings of the 3rd International World Wide Web Conference, Vol. 28 of Computer Networks and ISDN Systems, Darmstadt, Germany.
Cooley, R.; Mobasher, B.; Srivastava, J. (1999): Data Preparation for Mining World Wide Web Browsing Patterns. In: Knowledge and Information-Systems, Vol. 1, No. 1, S. 5–32.
IVW (2000). Das IVW Messverfahren — IVW-Pixel. http://www.ivw.de/online/mess-verfahren/pixel.php [05.10.2001].
Kimbal, R.; Merz, R. (2000): The Data Webhouse Toolkit, New York.
Lutzky (2001): Nutzung von Logfileanalysen in der Marktforschung. Diplomarbeit, Lehrstuhl für Betriebswirtschaftslehre, insbesondere Marketing II, Universität Frankfurt.
Pirolli, P.; Pitkow, J.E. (1999): Distributions of Surfers’ Paths through the World Wide Web — Empirical Caracterizations. In: World Wide Web, Vol. 2, No. 1/2, S. 29–45.
Smith, R.M. (2000): On Internet Privacy and Profiling, http://www.senate.gov/~commerce/hearings/0613smi.pdf[12.10.2001].
Schmidt-Thieme, L. (2001). Web Mining. Vorlesungsskript, Institut für Entscheidungstheorie und Unternehmensforschung, Universität Karlsruhe (TH).
Spiliopoulou, M. (2000): Web Usage Mining for Evaluation of Browsing Patterns. In: Communications of the ACM, Vol. 43, No. 8, S. 117–134.
Editor information
Rights and permissions
Copyright information
© 2002 Friedr. Vieweg & Sohn Verlagsgesellschaft mbH, Braunschweig/Wiesbaden
About this chapter
Cite this chapter
Säuberlich, F. (2002). Vorverarbeitung von Web-Daten — Pre-Processing. In: Hippner, H., Merzenich, M., Wilde, K.D. (eds) Handbuch Web Mining im Marketing. Aus dem Bereich IT erfolgreich nutzen. Vieweg+Teubner Verlag. https://doi.org/10.1007/978-3-322-89871-5_5
Download citation
DOI: https://doi.org/10.1007/978-3-322-89871-5_5
Publisher Name: Vieweg+Teubner Verlag
Print ISBN: 978-3-322-89872-2
Online ISBN: 978-3-322-89871-5
eBook Packages: Springer Book Archive