Méthodes spectrales pour l'inférence grammaticale probabiliste de langages stochastiques rationnels / Raphael Bailly ; sous la direction de François Denis

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Langages de programmation -- Sémantique

Inférence

Algorithmes

Denis, François (19..-.... ; informaticien) (Directeur de thèse / thesis advisor)

Gilleron, Rémi (Président du jury de soutenance / praeses)

Clark, Alexander (19..-....) (Rapporteur de la thèse / thesis reporter)

Oncina, Jose (1962-) (Rapporteur de la thèse / thesis reporter)

La Higuera, Colin de (19..-....) (Membre du jury / opponent)

Habrard, Amaury (1978-....) (Membre du jury / opponent)

Janodet, Jean-Christophe (1972-.... ; auteur en informatique) (Membre du jury / opponent)

Université de Provence (1970-2011) (Organisme de soutenance / degree-grantor)

Ecole Doctorale Mathématiques et Informatique de Marseille (Marseille) (Ecole doctorale associée à la thèse / doctoral school)

Résumé / Abstract : Nous nous plaçons dans le cadre de l’inférence grammaticale probabiliste. Il s’agit, étant donnée une distribution p sur un ensemble de chaînes S∗ inconnue, d’inférer un modèle probabiliste pour p à partir d’un échantillon fini S d’observations supposé i.i.d. selon p. L’inférence gram- maticale se concentre avant tout sur la structure du modèle, et la convergence de l’estimation des paramètres. Les modèles probabilistes dont il sera question ici sont les automates pondérés, ou WA. Les fonctions qu’ils modélisent sont appelées séries rationnelles. Dans un premier temps, nous étudierons la possibilité de trouver un critère de convergence absolue pour de telles séries. Par la suite, nous introduirons un type d’algorithme pour l’inférence de distributions rationnelles (i.e. distributions modélisées par un WA), basé sur des méthodes spectrales. Nous montrerons comment adapter cet algorithme pour l’appliquer au domaine, assez proche, des distributions sur les arbres. Enfin, nous tenterons d’utiliser cet algorithme d’inférence dans un contexte plus statistique d’estimation de densité.

Résumé / Abstract : Our framework is the probabilistic grammatical inference. That is, given an unknown distribution p on a set of string S∗ , to infer a probabilistic model for p from a sample S of observations assumed to be i.i.d. according to p. Grammatical inference focuses primarily on the structure of the probabilistic model, and the convergence of parameter estimate. Probabilistic models which will be considered here are weighted automata, or WA. The series they model are called rational series. Initially, we study the possibility of finding an absolute convergence criterion for such series. Subsequently, we introduce a algorithm for the inference of rational distrbutions (i.e. distributions modeled by WA), based on spectral methods. We will show how to fit this algorithm to the domain, fairly close, of rational distributions on trees. Finally, we will try to see how to use the spectral algorithm in a more statistical way, in a density estimation task.