Analyse macro-sémantique des structures rhétoriques du discours : cadre théorique et modèle opératoire / Antoine Widlöcher ; [sous la direction de]Patrice Enjalbert

Date :

Editeur / Publisher : [S.l.] : [s.n.] , 2008

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Traitement automatique du langage naturel

Discours (linguistique)

Linguistique -- Informatique

Rhétorique

Discours argumentatif

Enjalbert, Patrice (Directeur de thèse / thesis advisor)

Université de Caen Normandie (1971-....) (Organisme de soutenance / degree-grantor)

Relation : Analyse macro-sémantique des structures rhétoriques du discours : cadre théorique et modèle opératoire / Antoine Widlöcher ; [sous la direction de]Patrice Enjalbert / Lille : Atelier national de reproduction des thèses , 2008

Résumé / Abstract : Dans le domaine du Traitement Automatique des Langues (TAL), notre étude porte sur l'analyse des structures rhétoriques du discours, c'est-à-dire des stéréotypes organisationnels qui participent au cheminement argumentatif des textes. Nous visons la constitution d'un cadre théorique et opérationnel général, permettant la modélisation et l'exploration computationnelle d'une variété significative de telles structures. Nous proposons notamment d'articuler leur analyse autour des trois catégories élémentaires que sont unités, relations et schémas, et envisageons différentes propriétés récurrentes des structures et des mécanismes indiciaires sous-jacents: variabilité du grain, flexibilité, non-linéarité et non-séquentialité potentielles, interactions local/global... Afin de procéder à la description formelle des phénomènes linguistiques étudiés et à l'opérationalisation de leur analyse sur corpus, nous proposons le formalisme CDML (Contraint-based Discourse Modeling Language), qui permet de modéliser des structures discursives par l'expression de contraintes sur des objets textuels de différentes natures (morphologique, syntaxique, sémantique...), à différents niveaux de grain. Un analyseur permet de projeter ces contraintes sur corpus pour identifier les structures décrites. Deux études de cas ont par ailleurs été entreprises, sur deux types de structures significativement différentes, qui illustrent nos principes d'analyses, notre modèle formel et notre méthode d'opérationalisation. La première porte sur l'hypothèse de l'encadrement du discours de M. Charolles, et la seconde explore les relations de contraste à différentes échelles, entre des objets linguistiques variés.

Résumé / Abstract : In the general field of Natural Language Processing (NLP), this work concerns the analysis of the rhetorical structure of discourse, which consists in the argumentative organization of texts through various stereotypes. Our main goal was to define a theoretical and computational framework allowing formal modeling and automatic exploration of various discursive structures involved in this textual organization. We notably propose to describe those structures using the three elementary categories of units, relations and schemas, and outline recurrent properties of discursive patterns and clues which signal their presence: variable granularity, fuzziness, possible non-linearity and non-sequentiality, local/global interactions... In order to give a formal description of the studied linguistic phenomena and to make their computational analysis possible, in a corpus-based approach, we propose the CDML formalism (Contraint-based Discourse Modeling Language). It allows to design formal models of discursive patterns by means of constraints expressed on textual objects whose nature (morphologic, syntactic, semantic...) and whose granularity level may vary. A CDML parser has been implemented and may be used to apply such a formal description to a corpus and automatically detect textual structures satisfying the given constraints. In addition, we present two case studies dedicated to significantly different discursive patterns and illustrating our analysis principles, formal model and computational approach. The first one concerns Charolles' discourse framing theory. The second considers contrastive relations between various kind of textual objects, at different granularity levels.