CONCEPTS ET ALGORITHMES POUR LA DECOUVERTE DES STRUCTURES FORMELLES DES LANGUES / HERVE DEJEAN ; SOUS LA DIRECTION DE KHALDOUN ZREIK

Date :

Editeur / Publisher : [S.l.] : [s.n.] , 1998

Format : 253 P.

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Zreik, Khaldoun (1957-....) (Directeur de thèse / thesis advisor)

Université de Caen Normandie (1971-....) (Organisme de soutenance / degree-grantor)

Relation : CONCEPTS ET ALGORITHMES POUR LA DECOUVERTE DES STRUCTURES FORMELLES DES LANGUES / HERVE DEJEAN / Villeurbanne : [CCSD] , 2007

Résumé / Abstract : QUE PEUT-ON APPRENDRE SUR LA STRUCTURE D'UNE LANGUE A PARTIR D'UN TEXTE ECRIT DANS CETTE LANGUE, ET CECI SANS CONNAISSANCE PARTICULIERE SUR CELLE-CI ET AVEC L'AIDE (DISONS L'UTILISATION) D'UN ORDINATEUR ? VOILA LA QUESTION A LAQUELLE NOUS AVONS ESSAYE DE REPONDRE. CETTE REPONSE PEUT ETRE VUE COMME UNE CONTINUATION DES TRAVAUX EN ANALYSE DISTRIBUTIONNELLE DEVELOPPEE DANS ZELLIG HARRIS. L'OBJECTIF DE CE TRAVAIL EST DONC DE DECOUVRIR LES STRUCTURES FORMELLES D'UNE LANGUE EN ETUDIANT CES REGULARITES FORMELLES CONTENUES DANS UN CORPUS. NOTRE METHODE DE DECOUVERTE SE BASE SUR UNE SIMPLE CONCEPTION FORMELLE DE LA LANGUE : UN OBJET LINEAIRE DANS LEQUEL LES FRONTIERES (DE DEBUT ET DE FIN) DES DIFFERENTES STRUCTURES SONT INDIQUEES PAR DES ELEMENTS CARACTERISTIQUES. LES STRUCTURES AINSI IDENTIFIEES SONT LE SYNTAGME SIMPLE (NON RECURSIF), ET LA PROPOSITION, STRUCTURES A LA FOIS MULTILINGUES ET FORMELLES. CES INDICATEURS DE FRONTIERES CORRESPONDENT A DES MORPHEMES (LIBRES OU LIES) POUR LE SYNTAGME, ET A DES MORPHEMES OU DES SYNTAGMES POUR LA PROPOSITION. A PARTIR DE CES STRUCTURES THEORIQUES, NOUS CONSTRUISONS LA LISTE DE TOUTES LES CATEGORIES QU'UN ELEMENT (MORPHEME OU MOT) PEUT PRENDRE. UNE FOIS CES STRUCTURES ET CATEGORIES RECENSEES, NOUS CONSTRUISONS DES CONTEXTES SPECIFIQUES A CHAQUE CATEGORIE AFIN DE CATEGORISER LES ELEMENTS DU TEXTE. NOUS OBTENONS DONC UN MECANISME PERMETTANT D'ASSIGNER A UN ELEMENT PLUSIEURS CATEGORIES SI CET ELEMENT APPARAIT DANS DIFFERENTS CONTEXTES. CES CONTEXTES SONT CONSTRUITS A L'AIDE DES ELEMENTS PROTOTYPIQUES DE MARQUEURS DE FRONTIERES DE STRUCTURES, IDENTIFIABLES GRACE A LEUR POSITION PAR RAPPORT A LA SEGMENTATION PHYSIQUE DU TEXTE (EN PARTICULIER LES PONCTUATIONS). LES RESULTATS OBTENUS PERMETTENT LA CATEGORISATION DES MOTS DU CORPUS, AINSI QU'UNE SEGMENTATION PARTIELLE EN SYNTAGMES. LA METHODE A ETE APPLIQUEE A UNE DIZAINE DE LANGUES COMME LE FRANCAIS, L'ALLEMAND, LE SWAH