Abstract
An automatic text analysis system cannot lexically recognize a word unless it already exists in the electronic dictionary. Our works applies to the NOOJ system. Work remains to be made to build terminological dictionaries. To build the terms dictionary, it is necessary to identify the terms in the texts, to count and to acquire them, to locate the terms by deciding if a word group constitutes or not an entry in the dictionary, and for all that the problem is to find corpora.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
References
Ancombre, J.C-L.: Pourquoi un moulin à vent n’est pas un ventilateur. In: Langue française 86, Sur les compléments circonstanciels, Paris (1990)
Aoughlis, F.: Building an Electronic Dictionary of Computer Science. In: 8th INTEX NOOJ workshop, Besançon (2005), Presentation at http://www.nooj4nlp.net
Aoughlis, F., Métais, E.: Computer Science Terminology Extraction and Acquisition. WSEAS transactions on Computers 5(10), 2472–2478 (2006)
Balvet, A.: Approches catégoriques et non catégoriques en linguistique des corpus spécialisés, application à un système de filtrage d’information, doctorat thesis, université Paris X, Nanterre (2002)
Bauer, L.: English Word Formation. Cambridge University Press, Cambridge (1983)
Bauer, L.: Introducing linguistic morphology. Edinburgh university press, Edinburgh (1988)
Benveniste, E.: Fondements syntaxiques de la composition nominale » et « formes nouvelles de la composition nominale. In: Problèmes de la linguistique générale, Gallimard, Paris, vol. 2, pp. 145–176 (1974)
Bourigault, D.: LEXTER, un logiciel d’extraction de terminologie. Application à l’extraction de connaissances à partir de textes, doctorat thesis, Paris, Ecole des hautes Etudes en Sciences Sociales (1994)
Bourigault, D., Lepine, P.: Utilisation d’un logiciel d’extraction de terminologie (LEXTER) en acquisition de connaissances. In: Acquisition et ingénierie des connaissances: tendances actuelles, Cepaduès (1995)
Cadio, P.: À entre deux noms : vers la composition nominale. In: Lexique 1, PUL pp. 193–240 (1992)
Corbin, D.: Hypothèses sur les frontières de la composition nominale. In: Cahiers de grammaire, November 17, 1992, le MIR, université de Toulouse (1992)
Courtois, B., Silberztein, M.: Dictionnaires électroniques du français. In: Langue Française, vol. 87, Larousse, Paris (1990)
Courtois, B., Garrigues, M., Gross, M., Gross, G., Rung, M., Mathieu-Colas, Silberztein, M., Vives, R.: Dictionnaire électronique des noms composés DELAC : les composants NA et NN, version 4.0, technical report LADL N° 55 (1997)
Daille, B.: Approche mixte pour l’extraction automatique de terminologie: statistique lexicale et filtres linguistiques, Thèse de doctorat en informatique fondamentale, université de Paris 7 (1994)
David, S., Plante, P.: De la nécessité d’une approche morpho-syntaxique en analyse de textes. In: OICO, vol. 2(3), pp. 140–155, Québec (1990)
De Chalendar, G.: STEVLAN: un système de structuration du lexique guidé par la détermination automatique du contexte thématique ».Thèse de docteur de l’université de Paris XI, Orsay (2001)
De Chalendar, G.: Les systèmes d’acquisition de connaissances à partir de textes (2002), http://www.limsi.fr/individu/gael/manuscritThese/html/node64.html
Drouin, P.: Acquisition automatique de termes : l’utilisation des pivots lexicaux spécialisés, Thèse de doctorat présenté à l’Université de Montréal, Montréal (2002)
Drouin, P.: Extraction de termes : techniques courantes. In: Ateliers sur les corpus spécialisés en terminologie (2003), http://www.ling.umontreal.ca/lhomme/cgi-bin/PD.zip
Drouin, P.: Term extraction using non technical corpora as a point of leverage. Terminology 9(1), 99–117 (2003)
Drouin, P.: Acquisition des termes simples fondé sur les pivots lexicaux spécialisés ». In: Actes des cinquièmes rencontres Terminologie et intelligence artificielle (TIA), Strasbourg, pp. 183–186 (2003)
Dubois, G., et al.: Dictionnaire de linguistique, édition Larousse (1973)
Enguehard, C.: Acquisition naturelle automatique d’un réseau sémantique, thèse de doctorat de l’UTC, Compiègne (1992)
Fotopoulou, A.: Analyse automatique des textes: Dictionnaires et thésaurus électroniques des termes des télécommunications, Actes de la 5-ème journée ERLA-GLAT Brest, université de Bretagne occidentale (1994)
Fotopoulou, A.: Elaboration d’un thésaurus des termes des télécommunications, rapport, Institut National des télécommunications, Program Human Capital & Mobility (1995)
Gonzales Rey, M.I., Lopez Diaz, M.: De l’opacité des séquences figées comme exception sémantique. In: Actes-Exception-2003 (2003), http://www.cavi.univ-paris3.fr/ilpga/Actes-Exception-2003/Auteurs/lopezdiaz-gonzalezrey/texte.pdf
Gross, G.: Définition des noms composés dans un lexique-grammaire. In: Langue Française, september 1990, vol. 87 (1990)
Gross, M., Courtois, B.: Dictionnaire électronique DELAC: les noms composés ternaires et à plus de trois constituants, LADL (Décember 1998)
Habert, B.B., Jacquemin, Ch.: Noms composés, termes, dénominations complexes: problématiques linguistiques et traitements automatiques, traitement automatique des langues. Traitement automatique de la composition nominale 2 (1993)
Habert, B., Jacquemin, C.: Constructions nominales à contraintes fortes et grammaires d’unifications. linguisticae Investigationes XIX-2, 401–427 (1995)
Jacquemin, Ch.: Variation terminologique et acquisition automatique de termes et leurs variantes en corpus. Habilitation à diriger des recherches en informatique, IRIN, université de Nantes (1997)
Jung, R.: Remarques sur la constitution du lexique des noms composés. Langue française, Paris 87 (1990)
Lemay, C.: Utilisation de corpus de référence pour dégager la terminologie d’un corpus ». Ateliers sur les corpus spécialisés en terminologie, Downloadable presentation (2003), http://www.ling.umontreal.ca/lhomme/cgi-bin/CL2.zip
Levi, J.: The syntax and semantics of complex nominals. Academic Press, New York, London (1978)
L’homme, M.C.: Évaluation de logiciels d’extraction de terminologie : examen de quelques critères ». In: JIAMCATT, Réunion Inter institutions sur la terminologie et la traduction assistées par ordinateur, Office des Nations Unies, Vienne (Autriche) (2000)
L’homme, M.C.: Nouvelles technologies et recherche terminologique. Techniques d’extraction des données terminologiques et leur impact sur le travail du terminographe. L’Impact des nouvelles technologies sur la gestion terminologique (Downloadable text) (2001)
Mathieu Colas, M.: Typologie des noms composés. In: Rapport de recherches, 7 du LLI, Université de Paris 13 (1989)
Meilland, J.C., Bellot, P.: Extraction de terminologie à partir de libellés textuels courts. In: P.U.R., (Presses Universitaires de Rennes), Linguistique de corpus (2003)
Monceaux, A.: La formation des noms composés de structure Nom Adj, élaboration d’un lexique électronique, Doctorat thesis, université de MLV, Noisy le Grand (1994)
Morin, E.: Extraction de liens sémantiques entre termes à partir de corpus de textes techniques, Doctorat thesis, IRIN, Nantes (1999)
Orliac, B.: Acquisition de collocations verbe + nom à partir de représentations syntaxiques. In: Ateliers sur les corpus spécialisés en terminologie (2003), Downloadable version at http://www.ling.umontreal.ca/lhomme/cgi-bin/BO.zip
Oueslati, R.: Aide à l’acquisition de connaissances à partir de corpus. Thèse de doctorat, Université Louis Pasteur Strasbourg (1999)
Poibeau, T., Dutoit, D., Bizouar, S.: Evaluating Resource Acquisition Tools for Information Extraction. In: Proceeding of the International language Resource and Evaluation Conference (LRERC 2002),Las Palmas, Les canaries (2002)
Reymond, D.: La co-occurence en T.A.L: dis moi qui tu fréquentes et je te dirai qui tu es ». In: L’Ecriture dans tous ses états. Approche en sciences cognitives. Colloque 20 et 21 mai 2003, Université d’Aix en Provence (2003)
Rochibeau, B.: Extraction de collocations fondée sur les méthodes statistiques, in Ateliers sur les corpus spécialisés en terminologie (2003), downloadable version at http://www.ling.umontreal.ca/lhomme/cgi-bin/BR.zip
Savary, A.: Recensement et description des mots composés- Méthodes et applications. Doctorat thesis, université de Paris 7 (2000)
Silberztein, M.: Le dictionnaire électronique des mots composés, in Langue Française, septembre 1990 87 (1990)
Silberztein, M.: Dictionnaires électroniques et analyse automatique de textes: le système INTEX, Edition Masson, Paris (1993)
Silberztein, M.: Les groupes nominaux productifs et les noms composés lexicalisés, in Lingvisticae Investigationes XVII: 2, John Benjamins B.V., Amsterdam (1993)
Silberztein, M.: NOOJ’s dictionaries. In: The Proceedings of the LTC (2005)
Silberztein, M.: NOOJ’manual (2006), http://www.nooj4nlp.net
Smadja, F.: XTRACT: an overview. Computers and Humanities 26, 399–413 (1993)
Smadja, F., McKeown, K., Hatzivassiloglou, V.: Translating collocations for bilingual lexicons: A statistical approach. Computational Linguistics 22(1), 1–38 (1996)
Term: Constitution de corpus à partir du Web pour l’acquisition automatique de terminologie: une expérience (2003), www.poleia.lip6.fr/~slodzian/sberland/
Author information
Authors and Affiliations
Editor information
Rights and permissions
Copyright information
© 2007 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Aoughlis, F. (2007). A Computer Science Electronic Dictionary for NOOJ. In: Kedad, Z., Lammari, N., Métais, E., Meziane, F., Rezgui, Y. (eds) Natural Language Processing and Information Systems. NLDB 2007. Lecture Notes in Computer Science, vol 4592. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-540-73351-5_30
Download citation
DOI: https://doi.org/10.1007/978-3-540-73351-5_30
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-73350-8
Online ISBN: 978-3-540-73351-5
eBook Packages: Computer ScienceComputer Science (R0)