Approches spectrales et boosting : extensions et synergie / Claudia Henry ; sous la direction de Richard Nock

Date :

Editeur / Publisher : [S.l.] : [s.n.] , 2008

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Catalogue Worldcat

Apprentissage automatique

Traitement automatique du langage naturel

Classification automatique

Nock, Richard (Directeur de thèse / thesis advisor)

Université des Antilles et de la Guyane (1982-2015) (Organisme de soutenance / degree-grantor)

Groupe de Recherche en Informatique et Mathématiques Appliquées des Antilles et de la Guyane (Schoelcher, Martinique) (Equipe de recherche associée à la thèse / thesis associated research team)

Centre d'études des langues indigènes d'Amérique (Villejuif, Val-de-Marne ; Paris) (Autre partenaire associé à la thèse / thesis associated third party)

Centre d'étude et de recherche en économie, gestion, modélisation et informatique appliquée (Schoelcher, Martinique) (Autre partenaire associé à la thèse / thesis associated third party)

Résumé / Abstract : L'apprentissage automatique est un champ d'investigation important en intelligence artificielle. Nous l'envisageons sous ses deux aspects : supervisé et non-supervisé, respectivement via deux techniques : Ie clustering spectral et Ie boosting. Le clustering spectral qui est basé sur des résultats algébriques s'est avéré être simple a utiliser et efficace. Nous proposons une interprétation probabiliste de cette méthode et une application à la distinction de langues dans un corpus de textes multilingues. Le boosting est une technique d'apprentissage permettant d'augmenter les performances d'arbres de décision. Nous généralisons ce concept en proposant un algorithme pour booster» les performances d' une classe assez large de classifieurs. Enfin, nous nous interessons aux interactions possibles de ces deux types d'apprentissage. Des résultats théoriques mais aussi expérimentaux étayent notre propos.

Résumé / Abstract : The machine learning is an important field of investigation in artificial intelligence. We consider it under his two aspects supervised and not-supervised, respectively via two techniques : the spectral clustering and the boosting. The spectral clustering which is based on algebraic results proved to be simple to use and effective. We propose a probabilistic interpretation of this method and an application to the distinction of languages in a multilingual corpus of texts. The boosting is a learning technology making it possible to increase the performances of decision trees. We generalize this concept by proposing an algorithm for enhancing the performances of a rather broad class classifieurs. Lastly, we are interested in the possible interactions of these two types of training. Theoretical but such experimental results support our matter