Méthode et outils pour la création automatiques et l'évaluation [i.e automatiques] de structures de bases lexicales multilingues (symétriques) à lexies et axies / Aree Teeraparbseree ; sous la direction de Christian Boitet et de Gilles Sérasset

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Boitet, Christian (19..-.... ; professeur de mathématiques appliquées) (Directeur de thèse / thesis advisor)

Sérasset, Gilles (19..-.... ; auteur en informatique) (Directeur de thèse / thesis advisor)

Université Joseph Fourier (Grenoble ; 1971-2015) (Organisme de soutenance / degree-grantor)

Relation : Méthode et outils pour la création automatiques et l'évaluation [i.e automatiques] de structures de bases lexicales multilingues (symétriques) à lexies et axies / Aree Teeraparbseree / Villeurbanne : [CCSD] , 2005

Relation : Méthode et outils pour la création automatiques et l'évaluation [i.e automatiques] de structures de bases lexicales multilingues (symétriques) à lexies et axies / Aree Teeraparbseree ; sous la direction de Christian Boitet et de Gilles Sérasset / Grenoble : Atelier national de reproduction des thèses , 2005

Résumé / Abstract : Cette thèse aborde le problème de la structuration de bases lexicales multilingues (BDLM) en lexies et axies, à partir de ressources existantes. Ce travail est motivé par l'inadéquation des techniques existantes utilisées isolément, pour la structuration de BDLM. Pour résoudre ce problème, la stratégie proposée est de composer des techniques existantes de désambiguïsation pour structurer semi-automatiquement des bases lexicales multilingues à lexies et acceptions interlingues. De plus, cette thèse propose une catégorisation des critères d'évaluation de la qualité des BDLM, ainsi que les mesures correspondantes. Cette stratégie a été implémentée dans Jeminie, un système logiciel adaptable qui permet d'implémenter à la fois des méthodes de structuration de BDLM et des mesures de qualité, sous la forme de modules logiciels réutilisables. Des compositions arbitraires de ces modules peuvent être définies par un lexicologue dans un langage de haut niveau d'abstraction, ce qui permet d'adapter facilement la structuration et l'évaluation de qualité en fonction des objectifs du lexicologue et des ressources disponibles sans nécessiter de connaissances en programmation. L'intérêt de cette approche a été validé expérimentalement : la qualité des BDLM obtenues est meilleure par combinaison de techniques qu'avec chaque technique antérieure utilisée seule.

Résumé / Abstract : This thesis studies the problems of structuring multilingual lexical databases (MLDB) from existing resources. This work is motivated by the inadequacy of existing techniques applied separately, for the construction of MLDB. In order solve this problem, the strategy proposed consists in composing existing disambiguation techniques, to semi-automatically build multilingual lexical databases consisting of monolingual and interlingual acceptions. Moreover, this thesis proposes a categorization of the criteria for the qualitative evaluation of MLDB, as well as corresponding measurements. This strategy has been implemented in Jeminie, an adaptable software system which allows to implement both MLDB building methods and qualitative measurements as reusable software modules. Arbitrary compositions of these modules can be defined by a lexicologist in a high-level language, which allows to easily adapt the structuration and evaluation processes according to the objectives of the lexicologist and to the available resources without requiring knowledge in programming. The interest of this approach has been validated in experiments: the quality of obtained MLDB is better than those obtained with each technique separately