Le résumé automatique des textes scientifiques et techniques : aspects linguistiques et computationnels : réalisation d'un prototype procédant par extraction de phrases du texte source : le système de Résumé Automatique à Fragments Indicateurs (RAFI) / Aberrafih Lehmam ; sous la direction de Hneri-Claude Grégoire

Date :

Editeur / Publisher : [S.l.] : [s.n.] , 1995

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Catalogue Worldcat

Traitement automatique du langage naturel

Analyse automatique (linguistique)

Grégoire, Henri-Claude (Directeur de thèse / thesis advisor)

Université de Nancy II (Organisme de soutenance / degree-grantor)

Résumé / Abstract : Le résumé de texte automatique s'inscrit dans le cadre des industries de la langue. Notre travail propose un système qui transforme automatiquement un texte source brut en un texte cible plus réduit. Ce système traite uniquement les textes scientifiques et techniques. Le système est fondé sur la reconnaissance d'éléments phrastiques qui lui permet d'évaluer la pertinence de la phrase en vue d'une éventuelle sélection pour la construction du résumé. La méthode mise en œuvre cherche à donner un score a toutes les phrases du texte et ensuite à procéder à l'élimination de celles ayant obtenu les scores les plus bas et de celles ayant réalisé un score nul. Nous avons fait appel, pour la réalisation du système RAFI (résumé automatique à fragments indicateurs), aux moyens linguistiques d'analyse du discours et aux capacités de calcul des outils informatiques.

Résumé / Abstract : The automatic text summary concerns the language. This thesis proposes a system automatically and directly transforming a source text into a reduced target text. It based on the identification of specific expressions allowing an evaluation of the relevance of the sentence concerned, which can then be selected for the elaboration of the summary. The procedure consists in attributing a score to each sentence of the text and then eliminating those having the lowest score. To produce RAFI (automatic summary based on indicative fragments) we resorted to the linguistic means of discourse analysis and the computing capacity of data processing instruments.