Skip to main content

A Computer Science Electronic Dictionary for NOOJ

  • Conference paper
Natural Language Processing and Information Systems (NLDB 2007)

Part of the book series: Lecture Notes in Computer Science ((LNISA,volume 4592))

Abstract

An automatic text analysis system cannot lexically recognize a word unless it already exists in the electronic dictionary. Our works applies to the NOOJ system. Work remains to be made to build terminological dictionaries. To build the terms dictionary, it is necessary to identify the terms in the texts, to count and to acquire them, to locate the terms by deciding if a word group constitutes or not an entry in the dictionary, and for all that the problem is to find corpora.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 39.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 54.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

References

  1. Ancombre, J.C-L.: Pourquoi un moulin à vent n’est pas un ventilateur. In: Langue française 86, Sur les compléments circonstanciels, Paris (1990)

    Google Scholar 

  2. Aoughlis, F.: Building an Electronic Dictionary of Computer Science. In: 8th INTEX NOOJ workshop, Besançon (2005), Presentation at http://www.nooj4nlp.net

  3. Aoughlis, F., Métais, E.: Computer Science Terminology Extraction and Acquisition. WSEAS transactions on Computers 5(10), 2472–2478 (2006)

    Google Scholar 

  4. Balvet, A.: Approches catégoriques et non catégoriques en linguistique des corpus spécialisés, application à un système de filtrage d’information, doctorat thesis, université Paris X, Nanterre (2002)

    Google Scholar 

  5. Bauer, L.: English Word Formation. Cambridge University Press, Cambridge (1983)

    Google Scholar 

  6. Bauer, L.: Introducing linguistic morphology. Edinburgh university press, Edinburgh (1988)

    Google Scholar 

  7. Benveniste, E.: Fondements syntaxiques de la composition nominale » et « formes nouvelles de la composition nominale. In: Problèmes de la linguistique générale, Gallimard, Paris, vol. 2, pp. 145–176 (1974)

    Google Scholar 

  8. Bourigault, D.: LEXTER, un logiciel d’extraction de terminologie. Application à l’extraction de connaissances à partir de textes, doctorat thesis, Paris, Ecole des hautes Etudes en Sciences Sociales (1994)

    Google Scholar 

  9. Bourigault, D., Lepine, P.: Utilisation d’un logiciel d’extraction de terminologie (LEXTER) en acquisition de connaissances. In: Acquisition et ingénierie des connaissances: tendances actuelles, Cepaduès (1995)

    Google Scholar 

  10. Cadio, P.: À entre deux noms : vers la composition nominale. In: Lexique 1, PUL pp. 193–240 (1992)

    Google Scholar 

  11. Corbin, D.: Hypothèses sur les frontières de la composition nominale. In: Cahiers de grammaire, November 17, 1992, le MIR, université de Toulouse (1992)

    Google Scholar 

  12. Courtois, B., Silberztein, M.: Dictionnaires électroniques du français. In: Langue Française, vol. 87, Larousse, Paris (1990)

    Google Scholar 

  13. Courtois, B., Garrigues, M., Gross, M., Gross, G., Rung, M., Mathieu-Colas, Silberztein, M., Vives, R.: Dictionnaire électronique des noms composés DELAC : les composants NA et NN, version 4.0, technical report LADL N° 55 (1997)

    Google Scholar 

  14. Daille, B.: Approche mixte pour l’extraction automatique de terminologie: statistique lexicale et filtres linguistiques, Thèse de doctorat en informatique fondamentale, université de Paris 7 (1994)

    Google Scholar 

  15. David, S., Plante, P.: De la nécessité d’une approche morpho-syntaxique en analyse de textes. In: OICO, vol. 2(3), pp. 140–155, Québec (1990)

    Google Scholar 

  16. De Chalendar, G.: STEVLAN: un système de structuration du lexique guidé par la détermination automatique du contexte thématique ».Thèse de docteur de l’université de Paris XI, Orsay (2001)

    Google Scholar 

  17. De Chalendar, G.: Les systèmes d’acquisition de connaissances à partir de textes (2002), http://www.limsi.fr/individu/gael/manuscritThese/html/node64.html

  18. Drouin, P.: Acquisition automatique de termes : l’utilisation des pivots lexicaux spécialisés, Thèse de doctorat présenté à l’Université de Montréal, Montréal (2002)

    Google Scholar 

  19. Drouin, P.: Extraction de termes : techniques courantes. In: Ateliers sur les corpus spécialisés en terminologie (2003), http://www.ling.umontreal.ca/lhomme/cgi-bin/PD.zip

  20. Drouin, P.: Term extraction using non technical corpora as a point of leverage. Terminology 9(1), 99–117 (2003)

    Article  Google Scholar 

  21. Drouin, P.: Acquisition des termes simples fondé sur les pivots lexicaux spécialisés ». In: Actes des cinquièmes rencontres Terminologie et intelligence artificielle (TIA), Strasbourg, pp. 183–186 (2003)

    Google Scholar 

  22. Dubois, G., et al.: Dictionnaire de linguistique, édition Larousse (1973)

    Google Scholar 

  23. Enguehard, C.: Acquisition naturelle automatique d’un réseau sémantique, thèse de doctorat de l’UTC, Compiègne (1992)

    Google Scholar 

  24. Fotopoulou, A.: Analyse automatique des textes: Dictionnaires et thésaurus électroniques des termes des télécommunications, Actes de la 5-ème journée ERLA-GLAT Brest, université de Bretagne occidentale (1994)

    Google Scholar 

  25. Fotopoulou, A.: Elaboration d’un thésaurus des termes des télécommunications, rapport, Institut National des télécommunications, Program Human Capital & Mobility (1995)

    Google Scholar 

  26. Gonzales Rey, M.I., Lopez Diaz, M.: De l’opacité des séquences figées comme exception sémantique. In: Actes-Exception-2003 (2003), http://www.cavi.univ-paris3.fr/ilpga/Actes-Exception-2003/Auteurs/lopezdiaz-gonzalezrey/texte.pdf

  27. Gross, G.: Définition des noms composés dans un lexique-grammaire. In: Langue Française, september 1990, vol. 87 (1990)

    Google Scholar 

  28. Gross, M., Courtois, B.: Dictionnaire électronique DELAC: les noms composés ternaires et à plus de trois constituants, LADL (Décember 1998)

    Google Scholar 

  29. Habert, B.B., Jacquemin, Ch.: Noms composés, termes, dénominations complexes: problématiques linguistiques et traitements automatiques, traitement automatique des langues. Traitement automatique de la composition nominale 2 (1993)

    Google Scholar 

  30. Habert, B., Jacquemin, C.: Constructions nominales à contraintes fortes et grammaires d’unifications. linguisticae Investigationes XIX-2, 401–427 (1995)

    Google Scholar 

  31. Jacquemin, Ch.: Variation terminologique et acquisition automatique de termes et leurs variantes en corpus. Habilitation à diriger des recherches en informatique, IRIN, université de Nantes (1997)

    Google Scholar 

  32. Jung, R.: Remarques sur la constitution du lexique des noms composés. Langue française, Paris 87 (1990)

    Google Scholar 

  33. Lemay, C.: Utilisation de corpus de référence pour dégager la terminologie d’un corpus ». Ateliers sur les corpus spécialisés en terminologie, Downloadable presentation (2003), http://www.ling.umontreal.ca/lhomme/cgi-bin/CL2.zip

  34. Levi, J.: The syntax and semantics of complex nominals. Academic Press, New York, London (1978)

    Google Scholar 

  35. L’homme, M.C.: Évaluation de logiciels d’extraction de terminologie : examen de quelques critères ». In: JIAMCATT, Réunion Inter institutions sur la terminologie et la traduction assistées par ordinateur, Office des Nations Unies, Vienne (Autriche) (2000)

    Google Scholar 

  36. L’homme, M.C.: Nouvelles technologies et recherche terminologique. Techniques d’extraction des données terminologiques et leur impact sur le travail du terminographe. L’Impact des nouvelles technologies sur la gestion terminologique (Downloadable text) (2001)

    Google Scholar 

  37. Mathieu Colas, M.: Typologie des noms composés. In: Rapport de recherches, 7 du LLI, Université de Paris 13 (1989)

    Google Scholar 

  38. Meilland, J.C., Bellot, P.: Extraction de terminologie à partir de libellés textuels courts. In: P.U.R., (Presses Universitaires de Rennes), Linguistique de corpus (2003)

    Google Scholar 

  39. Monceaux, A.: La formation des noms composés de structure Nom Adj, élaboration d’un lexique électronique, Doctorat thesis, université de MLV, Noisy le Grand (1994)

    Google Scholar 

  40. Morin, E.: Extraction de liens sémantiques entre termes à partir de corpus de textes techniques, Doctorat thesis, IRIN, Nantes (1999)

    Google Scholar 

  41. Orliac, B.: Acquisition de collocations verbe + nom à partir de représentations syntaxiques. In: Ateliers sur les corpus spécialisés en terminologie (2003), Downloadable version at http://www.ling.umontreal.ca/lhomme/cgi-bin/BO.zip

  42. Oueslati, R.: Aide à l’acquisition de connaissances à partir de corpus. Thèse de doctorat, Université Louis Pasteur Strasbourg (1999)

    Google Scholar 

  43. Poibeau, T., Dutoit, D., Bizouar, S.: Evaluating Resource Acquisition Tools for Information Extraction. In: Proceeding of the International language Resource and Evaluation Conference (LRERC 2002),Las Palmas, Les canaries (2002)

    Google Scholar 

  44. Reymond, D.: La co-occurence en T.A.L: dis moi qui tu fréquentes et je te dirai qui tu es  ». In: L’Ecriture dans tous ses états. Approche en sciences cognitives. Colloque 20 et 21 mai 2003, Université d’Aix en Provence (2003)

    Google Scholar 

  45. Rochibeau, B.: Extraction de collocations fondée sur les méthodes statistiques, in Ateliers sur les corpus spécialisés en terminologie (2003), downloadable version at http://www.ling.umontreal.ca/lhomme/cgi-bin/BR.zip

  46. Savary, A.: Recensement et description des mots composés- Méthodes et applications. Doctorat thesis, université de Paris 7 (2000)

    Google Scholar 

  47. Silberztein, M.: Le dictionnaire électronique des mots composés, in Langue Française, septembre 1990 87 (1990)

    Google Scholar 

  48. Silberztein, M.: Dictionnaires électroniques et analyse automatique de textes: le système INTEX, Edition Masson, Paris (1993)

    Google Scholar 

  49. Silberztein, M.: Les groupes nominaux productifs et les noms composés lexicalisés, in Lingvisticae Investigationes XVII: 2, John Benjamins B.V., Amsterdam (1993)

    Google Scholar 

  50. Silberztein, M.: NOOJ’s dictionaries. In: The Proceedings of the LTC (2005)

    Google Scholar 

  51. Silberztein, M.: NOOJ’manual (2006), http://www.nooj4nlp.net

  52. Smadja, F.: XTRACT: an overview. Computers and Humanities 26, 399–413 (1993)

    Google Scholar 

  53. Smadja, F., McKeown, K., Hatzivassiloglou, V.: Translating collocations for bilingual lexicons: A statistical approach. Computational Linguistics 22(1), 1–38 (1996)

    Google Scholar 

  54. Term: Constitution de corpus à partir du Web pour l’acquisition automatique de terminologie: une expérience (2003), www.poleia.lip6.fr/~slodzian/sberland/

Download references

Author information

Authors and Affiliations

Authors

Editor information

Zoubida Kedad Nadira Lammari Elisabeth Métais Farid Meziane Yacine Rezgui

Rights and permissions

Reprints and permissions

Copyright information

© 2007 Springer-Verlag Berlin Heidelberg

About this paper

Cite this paper

Aoughlis, F. (2007). A Computer Science Electronic Dictionary for NOOJ. In: Kedad, Z., Lammari, N., Métais, E., Meziane, F., Rezgui, Y. (eds) Natural Language Processing and Information Systems. NLDB 2007. Lecture Notes in Computer Science, vol 4592. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-540-73351-5_30

Download citation

  • DOI: https://doi.org/10.1007/978-3-540-73351-5_30

  • Publisher Name: Springer, Berlin, Heidelberg

  • Print ISBN: 978-3-540-73350-8

  • Online ISBN: 978-3-540-73351-5

  • eBook Packages: Computer ScienceComputer Science (R0)

Publish with us

Policies and ethics