Extraction dans les textes de connaissances structurées : une méthode fondée sur la sémantique lexicale linguistique / par Florence Pugeault ; sous la direction de P. Saint-Dizier

Date :

Editeur / Publisher : [S.l] : [s.n] , [1995]

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Systèmes d'information

Linguistique -- Informatique

Bases de données relationnelles

Connexionnisme

Lexicographie -- Informatique

Hypertextes

Classification automatique

Graphes, Théorie des

Thésaurus -- Informatique

Bases de données -- Gestion -- Logiciels

Langages formels

Systèmes experts (informatique)

Logique mathématique

Sémantique

Langages de programmation -- Sémantique

Saint-Dizier, Patrick (1954-.... ; chercheur en informatique) (Directeur de thèse / thesis advisor)

Université Toulouse 3 Paul Sabatier (1969-....) (Organisme de soutenance / degree-grantor)

Résumé / Abstract : CETTE THESE PRESENTE DES TRAVAUX QUI S'INSCRIVENT DANS LE CADRE DE L'INFORMATIQUE LINGUISTIQUE ET PLUS PRECISEMENT DANS LE DOMAINE DE L'EXTRACTION DE CONNAISSANCES A PARTIR DE TEXTES. NOTRE BUT EST D'ALLER AU-DELA DE L'INDEXATION CLASSIQUE PAR MOTS-CLES EN REPRESENTANT L'INFORMATION RETENUE COMME PERTINENTE SOUS UNE FORME STRUCTUREE. CE PROJET A FAIT L'OBJET D'UNE COLLABORATION AVEC LA DIRECTION DES ETUDES ET DES RECHERCHES D'EDF. POUR REPRESENTER LE CONTENU SEMANTIQUE DE TEXTES REDIGES SANS CONTRAINTE D'EXPRESSION, NOUS AVONS DISTINGUE TROIS NIVEAUX D'ANALYSE: LE NIVEAU PRAGMATIQUE, LE NIVEAU LINGUISTIQUE ET LE NIVEAU CONCEPTUEL. LE NIVEAU PRAGMATIQUE PERMET LE DECOUPAGE D'UN TEXTE SELON SES PARTIES RHETORIQUES QUI CORRESPONDENT A DES ARTICULATIONS. LE NIVEAU LINGUISTIQUE CONSISTE A STRUCTURER LES FRAGMENTS DE PHRASES PERTINENTS POUR CHAQUE ARTICULATION SOUS LA FORME DE STRUCTURES PREDICATIVES ETIQUETEES PAR DES ROLES THEMATIQUES PRECIS. ENFIN, LE NIVEAU CONCEPTUEL VISE A AMELIORER LA QUALITE D'EXPLOITATION DES RESULTATS DU NIVEAU LINGUISTIQUE, NOTAMMENT EN VUE DE L'INTERROGATION DE BASES DOCUMENTAIRES. APRES ANALYSE DE DIFFERENTES APPROCHES, NOUS AVONS RETENU LA LCS (STRUCTURE LEXICALE CONCEPTUELLE), THEORIE DE JACKENDOFF, POUR REPRESENTER CONCEPTUELLEMENT LES PREDICATS CONSIDERES. NOTRE CONTRIBUTION SUR LE PLAN LINGUISTIQUE A CONSISTE EN UN TRAVAIL EN PROFONDEUR SUR LA DEFINITION DE L'ENSEMBLE DES RESSOURCES LINGUISTIQUES NECESSAIRES AUX DIFFERENTES ETAPES D'ANALYSE QUE NOUS AVONS IDENTIFIEES. NOUS AVONS NOTAMMENT DEFINI UN ENSEMBLE DE ROLES THEMATIQUES QIO ONT UNE DIMENSION COGNITIVE ET UN CERTAIN NOMBRE DE DONNEES SUPPLEMENTAIRES EN RELATION AVEC LA LCS (PRIMITIVES, ETC.). NOUS AVONS AUSSI CARACTERISE DES ELEMENTS DE METHODE POUR LA DEFINITION DE RESSOURCES LCS SPECIFIQUES A UN CORPUS DONNE. NOS ANALYSES ONT ETE VALIDEES PAR LA MISE EN UVRE DU PROTOTYPE PAPINS (PROTOTYPE D'ANALYSE POUR LA PRODUCTION D'INDEX SEMANTIQUES) QUE NOUS AVONS DEVELOPPE EN PROLOG