Informatik-Spektrum

, Volume 33, Issue 6, pp 601–611 | Cite as

Visuelle Textanalyse

Interaktive Exploration von semantischen Inhalten
  • Christian Rohrdantz
  • Steffen Koch
  • Charles Jochim
  • Gerhard Heyer
  • Gerik Scheuermann
  • Thomas Ertl
  • Hinrich Schütze
  • Daniel A. Keim
HAUPTBEITRAG VISUELLE TEXTANALYSE

Zusammenfassung

Methoden und Techniken zur automatischen Verarbeitung und inhaltlichen Erfassung großer Mengen an Textdokumenten haben in den vergangenen Jahren enorm an Bedeutung gewonnen. Während einerseits die Verfügbarkeit und der Zugang zu digitalisierten Textdokumenten bis dato in ungeahntem Maße gestiegen sind, erweist sich die Erfassung des semantischen Inhalts solcher Dokumentsammlungen als problematisch. Dem expandierenden Forschungsfeld der visuellen Textanalyse und Textvisualisierung kommt dabei eine Schlüsselrolle bei der Lösung von Problemstellungen aus der Praxis zu. Anhand aktueller Anwendungsbeispiele und einem Überblick über den Stand der Forschung erläutert dieser Artikel die vielfältigen Möglichkeiten, die sich durch visuelle Textanalyse ergeben.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

References

  1. 1.
    Allan J (2002) Introduction to topic detection and tracking. Kluwer Academic Publishers, Norwell, MA, pp 1–16Google Scholar
  2. 2.
    de Saussure F (2001) Grundfragen der allgemeinen Sprachwissenschaft. Walter de GruyterGoogle Scholar
  3. 3.
    European Patent Office (2010) Patent information products and services, “products_services_en.pdf”. http://www.epo.org/about-us/publications/patent-information/products-services.html, letzter Zugriff 17.9.2010Google Scholar
  4. 4.
    Feldman R, Sanger J (2007) The Text Mining Handbook. Advanced Approaches in Analyzing Unstructured Data. Cambridge University PressGoogle Scholar
  5. 5.
    Han J, Kamber M (2006) Data Mining: Concepts and techniques, 2nd edn. Morgan Kaufmann, San Francisco, CAGoogle Scholar
  6. 6.
    Havre S, Hetzler B, Nowell L (2000) ThemeRiver: Visualizing Theme Changes over Time. In: Proceedings of the IEEE Symposium on Information Visualization 2000, pp 115f.Google Scholar
  7. 7.
    Holz F, Teresniak S (2010) Towards automatic detection and tracking of topic change. In:. Gelbukh A (ed) Proc. CICLing 2010, Iasi: Conference on Intelligent Text Processing and Computational Linguistics, LNCS 6008. Springer LNCSGoogle Scholar
  8. 8.
    Jurafsky D, Martin JH (2009) Speech and language processing. An introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, 2nd edn. Prentice Hall Series in Artificial IntelligenceGoogle Scholar
  9. 9.
    Keim DA, Mansmann F, Oelke D, Ziegler H (2008) Visual analytics. Combining automated discovery with interactive visualizations. In: Boulicaut J-F, Berthold MR, Horváth T (eds) Discovery Science, 11th International Conference, DS 2008, Budapest, Hungary, October 13–16, 2008. Proceedings Lect Notes Artif Intell, vol 5255, pp 2–14. Springer, HeidelbergGoogle Scholar
  10. 10.
    Keim DA, Oelke D, Rohrdantz C (2010) Analyzing Document Collections via Context-Aware Term Extraction. In: 14th International Conference on Applications of Natural Language to Information Systems (NLDB ’09). Lect Notes Comp Sci 5723, pp 154–168. Springer, HeidelbergGoogle Scholar
  11. 11.
    Koch S, Bosch H, Giereth M, Ertl T (2010) Iterative integration of visual insights during scalable patent search and analysis. Vis Comp Graph, IEEE Transactions, vol 99Google Scholar
  12. 12.
    Landauer TK, McNamara DS, Dennis SJ, Kintsch W (2007) Handbook of latent semantic analysis. Erlbaum, Mahwah, NJGoogle Scholar
  13. 13.
    Manning CD, Prabhakar R, Schütze H (2008) Introduction to Information Retrieval. Cambridge University PressGoogle Scholar
  14. 14.
    Oelke D, Hao M, Rohrdantz C, Keim DA, Dayal U, Haug L, Janetzko H (2009) Visual opinion analysis of customer feedback data. In: Proc IEEE Symp Vis Anal Sci Technol (VAST ’09), pp 187–194Google Scholar
  15. 15.
    Oesterling P, Heine C, Jaenicke H, Scheuermann G (2010) Visual analysis of high dimensional point clouds using topological landscapes. In: North S, Shen H-W, van Wijk JJ, (eds) IEEE Pacific Visualization 2010 Symposium Proceedings, pp 113–120Google Scholar
  16. 16.
    Shneiderman B (1996) The eyes have it: a task by data type taxonomy for information visualizations. Technical Report UMCP-CSD CS-TR-3665, College Park, MarylandGoogle Scholar
  17. 17.
    Soboroff I, Harman D (2005) Novelty detection: the TREC experience. In: HLT/EMNLP, pp 105–112Google Scholar
  18. 18.
    Teresniak S, Heyer G, Scheuermann G, Holz F (2009) Visualisierung von Bedeutungsverschiebungen in großen diachronen Dokumentkollektionen. Datenbank-Spektrum 31:33–39Google Scholar
  19. 19.
    Wanner F, Rohrdantz C, Mansmann F, Oelke D, Keim DA (2009) Visual Sentiment Analysis of RSS News Feeds featuring the US Presidental Election in 2008. In: Proceedings of the IUI’09 Workshop on Visual Interfaces to the Social and the Semantic Web (VISSW 2009). http://ceur-ws.org/Vol-443/paper7.pdf, letzter Zugriff 17.9.2010Google Scholar
  20. 20.
    Wanner L, Baeza-Yates R, Brügmann S, Codina J, Diallo B, Escorsa E, Giereth M, Kompatsiaris Y, Papadopoulos S, Pianta E, Piella G, Puhlmann I, Rao G, Rotard M, Schoester P, Serafini L, Zervaki V (2008) Towards content-oriented patent document processing. World Pat Inf 30(1):21–33CrossRefGoogle Scholar
  21. 21.
    World Intellectual Property Organization (2009) World Intellectual Property Indicators. http://www.wipo.int/export/sites/www/ipstats/en/statistics/patents/pdf/wipo_pub_941.pdf, letzter Zugriff 17.9.2010Google Scholar
  22. 22.
    World Intellectual Property Organization (2010) International Patent Classification (IPC). http://www.wipo.int/classifications/ipc/en/, letzter Zugriff 17.9.2010Google Scholar

Copyright information

© Springer-Verlag 2010

Authors and Affiliations

  • Christian Rohrdantz
    • 1
  • Steffen Koch
    • 2
  • Charles Jochim
    • 3
  • Gerhard Heyer
    • 4
  • Gerik Scheuermann
    • 5
  • Thomas Ertl
    • 2
  • Hinrich Schütze
    • 3
  • Daniel A. Keim
    • 1
  1. 1.Arbeitsgruppe Datenbanken, Datenanalyse und Visualisierung, Fachbereich Informatik und InformationswissenschaftUniversität KonstanzKonstanzDeutschland
  2. 2.Institut für Visualisierung und Interaktive SystemeUniversität StuttgartStuttgartDeutschland
  3. 3.Institut für Maschinelle SprachverarbeitungUniversität StuttgartStuttgartDeutschland
  4. 4.Abteilung Automatische Sprachverarbeitung, Institut für InformatikUniversität LeipzigLeipzigDeutschland
  5. 5.Abteilung Bild und Signalverarbeitung, Institut für InformatikUniversität LeipzigLeipzigDeutschland

Personalised recommendations