Estimation robuste pour des distributions à queue lourde / Emilien Joly ; sous la direction de Gilles Stoltz et de Gábor Lugosi

Date : 2015

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Analyse multivariée

Estimation, Théorie de l'

Joly, Emilien (1987-....) (Auteur / author)

Stoltz, Gilles (1979-....) (Directeur de thèse / thesis advisor)

Lugosi, Gábor (Directeur de thèse / thesis advisor)

Massart, Pascal (1958-....) (Président du jury de soutenance / praeses)

Loubès, Jean-Michel (Rapporteur de la thèse / thesis reporter)

Catoni, Olivier (1965-....) (Membre du jury / opponent)

Chambaz, Antoine (1973-.... ; mathématicien) (Membre du jury / opponent)

Université Paris-Saclay (2015-2019) (Organisme de soutenance / degree-grantor)

École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....) (Ecole doctorale associée à la thèse / doctoral school)

Université Paris-Sud (1970-2019) (Autre partenaire associé à la thèse / thesis associated third party)

Laboratoire de mathématiques d'Orsay (1998-....) (Laboratoire associé à la thèse / thesis associated laboratory)

Accès en ligne / online access

Résumé / Abstract : Nous nous intéressons à estimer la moyenne d'une variable aléatoire de loi à queue lourde. Nous adoptons une approche plus robuste que la moyenne empirique classique communément utilisée. L'objectif est de développer des inégalités de concentration de type sous-gaussien sur l'erreur d'estimation. En d'autres termes, nous cherchons à garantir une forte concentration sous une hypothèse plus faible que la bornitude : une variance finie. Deux estimateurs de la moyenne pour une loi à support réel sont invoqués et leurs résultats de concentration sont rappelés. Plusieurs adaptations en dimension supérieure sont envisagées. L'utilisation appropriée de ces estimateurs nous permet d'introduire une nouvelle technique de minimisation du risque empirique pour des variables aléatoires à queue lourde. Quelques applications de cette technique sont développées. Nous appuyons ces résultats sur des simulations sur des jeux de données simulées. Dans un troisième temps, nous étudions un problème d'estimation multivarié dans le cadre des U-statistiques où les estimateurs précédents offrent, là aussi, une généralisation naturelle d'estimateurs présents dans la littérature.

Résumé / Abstract : In this thesis, we are interested in estimating the mean of heavy-tailed random variables. We focus on a robust estimation of the mean approach as an alternative to the classical empirical mean estimation. The goal is to develop sub-Gaussian concentration inequalities for the estimating error. In other words, we seek strong concentration results usually obtained for bounded random variables, in the context where the bounded condition is replaced by a finite variance condition. Two existing estimators of the mean of a real-valued random variable are invoked and their concentration results are recalled. Several new higher dimension adaptations are discussed. Using those estimators, we introduce a new version of empirical risk minimization for heavy-tailed random variables. Some applications are developed. These results are illustrated by simulations on artificial data samples. Lastly, we study the multivariate case in the U-statistics context. A natural generalization of existing estimators is offered, once again, by previous estimators.