Zusammenfassung
Bei der Dokumentklassifikation geht es darum, für ein Dokument zu entscheiden, ob es insgesamt eine positive, negative oder neutrale Meinungsäußerung ist. Diese Klassifikation nennt man “Polarität”. Bei der GermEval Shared Task 2017 (Wojatzki et al. 2017b) war die Dokumentklassifikation die Aufgabe, an der sich alle teilnehmenden Gruppen beteiligten.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Die Unterscheidung von relevanten (zur deutschen Bahn) und nicht-relevanten Texten war eine Aufgabe in GermEval 2017, die wir hier aber außer Acht lassen.
- 2.
Vielen Dank an unseren Kollegen Reginald Ferber für die Erklärung.
- 3.
(Heyer et al. 2006, S. 102)
- 4.
vgl. (Heyer et al. 2006, S. 106)
- 5.
(Heyer et al. 2006, S. 108)
- 6.
- 7.
- 8.
- 9.
- 10.
Beim Tf-idf-Maß handelt es sich um ein Maß aus dem Information Retrieval, bei dem die Häufigkeit des Auftretens eines Wortes in einem Dokument mit der Häufigkeit des Auftretens in der gesamten Dokumentmenge in Beziehung gesetzt wird. Für nähere Informationen dazu siehe (Ferber 2003).
- 11.
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2020 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this chapter
Cite this chapter
Siegel, M., Alexa, M. (2020). Polarität: Dokumente klassifizieren. In: Sentiment-Analyse deutschsprachiger Meinungsäußerungen. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-29699-5_3
Download citation
DOI: https://doi.org/10.1007/978-3-658-29699-5_3
Published:
Publisher Name: Springer Vieweg, Wiesbaden
Print ISBN: 978-3-658-29698-8
Online ISBN: 978-3-658-29699-5
eBook Packages: Computer Science and Engineering (German Language)