Analyse von Mikro-Blogging-Daten

Korrelation und Visualisierung von Twitter Hashtags

Zusammenfassung

Seit dem Entstehen des Web 2.0 gehören Blogs zum Kern der neuen Medienlandschaft. Insbesondere der Mikro-Blogging-Dienst Twitter stellt eine der schnellst wachsenden Informationsquellen unserer Zeit dar. Über 200 Millionen regelmäßige Nutzer schreiben täglich mehr als 340 Millionen Nachrichten.

Twitter-Nutzer haben die Möglichkeit über mit # annotierten Worten (sog. Hashtags) Nachrichten explizit zu verschlagworten. Diese Schlagworte sind nicht immer eindeutig und können für mehrere Themen verwendet werden. Den Überblick über mögliche Verbindungen zwischen Hashtags und deren Themen zu behalten, fällt schwer. Der hier vorgestellte Ansatz erfasst mittels Data-Mining-Methoden Zusammenhänge zwischen Hashtags und visualisiert diese. Dadurch soll der Nutzer unterstützt werden, einen Überblick über besprochene Themen und deren Hashtags zu bekommen.

This is a preview of subscription content, access via your institution.

References

  1. 1.

    Huang J, Thornton KM, Efthimiadis EN (2010) Conversational tagging in twitter. In: Proceedings of the 21st ACM conference on Hypertext and hypermedia. HT ’10, New York, NY, USA, ACM, 173–178

  2. 2.

    Infosthetics (2012) Hashtagify: Exploring the connections between twitter hashtags. http://infosthetics.com/archives/2011/05/hashtagify_exploring_the_connections_between_twitter_hashtags.html, Stand 31. Juli 2012

  3. 3.

    Bennett S (2012) Visually explore twitter hashtags and their relationships with hashtagify, http://www.mediabistro.com/alltwitter/, Stand 20. Juli 2012

  4. 4.

    Davidov D, Tsur O, Rappoport A (2010) Enhanced sentiment learning using twitter hashtags and smileys. In: Proceedings of the 23rd International Conference on Computational Linguistics: Posters. COLING ’10, Stroudsburg, PA, USA, Association for Computational Linguistics, 241–249

  5. 5.

    Hossmann T, Schatzmann D, Carta P, Legendre F (2012) Twitter in disaster mode: smart probing for opportunistic peers. In: Proceedings of the third ACM international workshop on Mobile Opportunistic Networks. MobiOpp ’12, New York, NY, USA, ACM, 93–94

  6. 6.

    Tsur O, Rappoport A (2012) What’s in a hashtag?: Content based prediction of the spread of ideas in microblogging communities. In: Proceedings of the fifth ACM international conference on Web search and data mining. WSDM ’12, New York, NY, USA, ACM, 643–652

  7. 7.

    Sadamitsu K, Mishina T, Yamamoto M (2007) Topic-based language models using dirichlet mixtures. Syst Comput Japan 38(12):76–85

    Article  Google Scholar 

  8. 8.

    Bishop CM (2007) Pattern Recognition and Machine Learning (Information Science and Statistics). 1st ed, 2006, corr. 2nd printing edn, Springer

  9. 9.

    Rodgers JL, Nicewunder AW (1988) Thirteen ways to look at the correlation coefficient. The American Statistician 42(1):59–66

    Article  Google Scholar 

  10. 10.

    Lord F, Novick M (1968) Statistical Theories of Mental Test Scores. Addison-Wesley series in behavioral science, Addison-Wesley Pub. Co.

  11. 11.

    Nakatani S (2012) Language detection library for java. code.google.com/p/language-detection/, Stand 19. Juli 2012

  12. 12.

    Usbeck R (2012) Analyse von mikro-blog-daten. Master-Arbeit

Download references

Author information

Affiliations

Authors

Corresponding author

Correspondence to Ricardo Usbeck.

Rights and permissions

Reprints and Permissions

About this article

Cite this article

Usbeck, R. Analyse von Mikro-Blogging-Daten. Informatik Spektrum 38, 400–405 (2015). https://doi.org/10.1007/s00287-014-0768-6

Download citation