Morfeusz — a Practical Tool for the Morphological Analysis of Polish

  • Marcin Woliński
Part of the Advances in Soft Computing book series (AINSC, volume 35)

Abstract

This paper describes a morphological analyser for Polish. Its features include a large dictionary, a carefully designed tagset, presentation of results as a DAG of interpretations, high efficiency, and free availability for non-commercial use and scientific research.

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

References

  1. 1.
    1. Janusz Stanisław Bieñ. Koncepcja słownikowej informacji morfologicznej i jej komputerowej wery.kacji. Rozprawy Uniwersytetu Warszawskiego. Wydawnictwa Uniwersytetu Warszawskiego, 1991.Google Scholar
  2. 2.
    2. Jan Daciuk, Stoyan Mihov, Bruce Watson, and Richard Watson. Incremental construction of minimal acyclic .nite state automata. Computational Linguistics, 26(1):3–16, April 2000.CrossRefMathSciNetGoogle Scholar
  3. 3.
    3. Łukasz Dębowski. Trigram morphosyntactic tagger for Polish. In Mieczysław A. Kłopotek, Sławomir T. Wierzchoń, and Krzysztof Trojanowski, editors, Intelligent Information Processing and Web Mining. Proceedings of the International IIS:IIPWM'04 Conference held in Zakopane, Poland, May 17–20, 2004, pages 409–413. Springer, 2004.Google Scholar
  4. 4.
    4. Witold Doroszewski, editor. Słownik języka polskiego PAN. Wiedza Powszechna - PWN, 1958–1969.Google Scholar
  5. 5.
    5. Elść. Przegląd analizatorów morfologicznych dla języka polskiego. Prace IPI PAN 937, Instytut Podstaw Informatyki Polskiej Akademii Nauk, 2001.Google Scholar
  6. 6.
    6. Tomasz Obrębski. Automatyczna analiza składniowa języka polskiego z wykorzystaniem gramatyki zależnościowej. PhD thesis, Instytut Podstaw Informatyki PAN, Warszawa, April 2002.Google Scholar
  7. 7.
    7. Maciej Piasecki and Grzegorz Godlewski. Reductionistic, tree and rule based tagger for Polish. In this volume, 2006.Google Scholar
  8. 8.
    8. Jakub Piskorski, Peter Homola, Małgorzata Marciniak, Agnieszka Mykowiecka, Adam Przepiórkowski, and Marcin Woliñski. Information extraction for Polish using the SProUT platform. In Mieczysław Kłopotek, sławomirWierzchoñ, and Krzysztof Trojanowski, editors, Intelligent Information Processing and Web Mining, Advances in Soft Computing, pages 227–236. Springer, 2004.Google Scholar
  9. 9.
    9. Adam Przepiórkowski. Składniowe uwarunkowania znakowania morfosyntaktycznego w korpusie IPI PAN. Polonica, XXII–XXIII:57–76, 2003.Google Scholar
  10. 10.
    10. Adam Przepiórkowski and Marcin Woliñski. A .exemic tagset for Polish. In Proceedings of the Workshop on Morphological Processing of Slavic Languages, EACL 2003, pages 33–40, 2003.Google Scholar
  11. 11.
    11. Adam Przepiórkowski and Marcin Woliñski. A morphosyntactic tagset for Polish. In Peter Kosta, Joanna Błaszczak, Jens Frasek, Ljudmila Geist, and Marzena Żygis, editors, Investigations into Formal Slavic Linguistics (Contributions of the Fourth European Conference on Formal Description on Slavic Languages), pages 349–362, 2003.Google Scholar
  12. 12.
    12. Adam Przepiórkowski and Marcin Woliñski. The unbearable lightness of tagging: A case study in morphosyntactic tagging of Polish. In Proceedings of the 4th International Workshop on Linguistically Interpreted Corpora (LINC-03), EACL 2003, pages 109–116, 2003.Google Scholar
  13. 13.
    13. Zygmunt Saloni. Czasownik polski. Odmiana, słownik. Wiedza Powszechna, Warszawa, 2001.Google Scholar
  14. 14.
    14. Zygmunt Saloni and Marcin Woliñski. A computerized description of Polish conjugation. In Peter Kosta, Joanna Błaszczak, Jens Frasek, Ljudmila Geist, and Marzena Żygis, editors, Investigations into Formal Slavic Linguistics (Contributions of the Fourth European Conference on Formal Description on Slavic Languages), pages 373–384, 2003.Google Scholar
  15. 15.
    15. Krzysztof Szafran. Analizator morfologiczny SAM-95: opis uźytkowy. TR 96–05 (226), Instytut Informatyki Uniwersytetu Warszawskiego, Warszawa, 1996.Google Scholar
  16. 16.
    16. Jan Tokarski. Fleksja polska, jej opis w œwietle mechanizacji w urzłdzeniu przekładowym. Poradnik Językowy, 1961: z. 3 s. 97–112, z. 8 s. 343–353; 1962: z. 4 s. 145–158; 1963: z. 1 s. 2–21, z. 2 s. 55–77, z. 5/6 s. 173–184, z. 9 s. 360–378; 1964: z. 4 s. 135–152, z. 5 s. 185–196, z. 6 s. 241–261.Google Scholar
  17. 17.
    17. Jan Tokarski. Czasowniki polskie. Formy, typy, wyjłtki. słownik. Warszawa, 1951.Google Scholar
  18. 18.
    18. Jan Tokarski. Dialog: człowiek - maszyna cyfrowa. Prace Filologiczne, XXIII:183–185, 1972.Google Scholar
  19. 19.
    19. Jan Tokarski. Schematyczny indeks a tergo polskich form wyrazowych, red. Zygmunt Saloni. Wydawnictwo Naukowe PWN, Warszawa, second edition, 2002.Google Scholar
  20. 20.
    20. Marcin Woliñski. System znaczników morfosyntaktycznych w korpusie IPI PAN. Polonica, XXII–XXIII:39–55, 2003.Google Scholar
  21. 21.
    21. Marcin Woliñski. Komputerowa wery.kacja gramatyki œwidziñskiego. PhD thesis, Instytut Podstaw Informatyki PAN, Warszawa, December 2004.Google Scholar
  22. 22.
    22. Marcin Woliñski. An efficient implementation of a large grammar of Polish. In Zygmunt Vetulani, editor, Human Language Technologies as a Challenge for Computer Science and Linguistics. 2nd Language & Technology Conference April 21–23, 2005, pages 343–347, Poznañ, 2005.Google Scholar

Copyright information

© Springer 2006

Authors and Affiliations

  • Marcin Woliński
    • 1
  1. 1.Institute of Computer SciencePolish Academy of SciencesWarsawPoland

Personalised recommendations