Around the Langevin Monte Carlo algorithm : extensions and applications / Nicolas Brosse ; sous la direction de Éric Moulines

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Apprentissage automatique

Statistique mathématique

Processus décisionnels de Markov relationnels

Langevin, Équation de

Classification Dewey : 530.159 233

Moulines, Éric (19..-....) (Directeur de thèse / thesis advisor)

Gobet, Emmanuel (Président du jury de soutenance / praeses)

Eberle, Andreas (1969-....) (Rapporteur de la thèse / thesis reporter)

Stoltz, Gabriel (1979-....) (Rapporteur de la thèse / thesis reporter)

Ollivier, Yann (1978-....) (Membre du jury / opponent)

Université Paris-Saclay (2015-2019) (Organisme de soutenance / degree-grantor)

École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....) (Ecole doctorale associée à la thèse / doctoral school)

École polytechnique (Palaiseau, Essonne) (Autre partenaire associé à la thèse / thesis associated third party)

Centre de mathématiques appliquées (Palaiseau, Essonne) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Cette thèse porte sur le problème de l'échantillonnage en grande dimension et est basée sur l'algorithme de Langevin non ajusté (ULA).Dans une première partie, nous proposons deux extensions d'ULA et fournissons des garanties de convergence précises pour ces algorithmes. ULA n'est pas applicable lorsque la distribution cible est à support compact; grâce à une régularisation de Moreau Yosida, il est néanmoins possible d'échantillonner à partir d'une distribution suffisamment proche de la distribution cible. ULA diverge lorsque les queues de la distribution cible sont trop fines; en renormalisant correctement le gradient, cette difficulté peut être surmontée.Dans une deuxième partie, nous donnons deux applications d'ULA. Nous fournissons un algorithme pour estimer les constantes de normalisation de densités log concaves à partir d'une suite de distributions dont la variance augmente graduellement. En comparant ULA avec la diffusion de Langevin, nous développons une nouvelle méthode de variables de contrôle basée sur la variance asymptotique de la diffusion de Langevin.Dans une troisième partie, nous analysons Stochastic Gradient Langevin Dynamics (SGLD), qui diffère de ULA seulement dans l'estimation stochastique du gradient. Nous montrons que SGLD, appliqué avec des paramètres habituels, peut être très éloigné de la distribution cible. Cependant, avec une technique appropriée de réduction de variance, son coût calcul peut être bien inférieur à celui d'ULA pour une précision similaire.

Résumé / Abstract : This thesis focuses on the problem of sampling in high dimension and is based on the unadjusted Langevin algorithm (ULA).In a first part, we suggest two extensions of ULA and provide precise convergence guarantees for these algorithms. ULA is not feasible when the target distribution is compactly supported; thanks to a Moreau Yosida regularization, it is nevertheless possible to sample from a probability distribution close enough to the distribution of interest. ULA diverges when the tails of the target distribution are too thin; by taming appropriately the gradient, this difficulty can be overcome.In a second part, we give two applications of ULA. We provide an algorithm to estimate normalizing constants of log concave densities based on a sequence of distributions with increasing variance. By comparison of ULA with the Langevin diffusion, we develop a new control variates methodology based on the asymptotic variance of the Langevin diffusion.In a third part, we analyze Stochastic Gradient Langevin Dynamics (SGLD), which differs from ULA only in the stochastic estimation of the gradient. We show that SGLD, applied with usual parameters, may be very far from the target distribution. However, with an appropriate variance reduction technique, its computational cost can be much lower than ULA for the same accuracy.