Segmentation de Processus de Comptage et modèles Dynamiques / Elmokhtar Ezzahdi Alaya ; sous la direction de Stéphane Gaïffas et de Agathe Guilloux

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Langue / Language : anglais / English

Catalogue Worldcat

Variables (mathématiques)

Analyse de régression

Rupture (statistique)

Classification Dewey : 519.5

Gaïffas, Stéphane (1979-....) (Directeur de thèse / thesis advisor)

Guilloux, Agathe (19..-....) (Directeur de thèse / thesis advisor)

Le Pennec, Erwan (1976-.... ; mathématicien) (Rapporteur de la thèse / thesis reporter)

Uña-Álvarez, Jacobo de (1972-...) (Rapporteur de la thèse / thesis reporter)

Alquier, Pierre (1980-....) (Membre du jury / opponent)

Arlot, Sylvain (1983-....) (Membre du jury / opponent)

Biau, Gérard (19..-....) (Membre du jury / opponent)

Université Pierre et Marie Curie (Paris ; 1971-2017) (Organisme de soutenance / degree-grantor)

École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....) (Ecole doctorale associée à la thèse / doctoral school)

Laboratoire de statistique théorique et appliquée (Paris ; 2015-2017) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Dans la première partie de cette thèse, nous cherchons à estimer l'intensité d'un processus de comptage par des techniques d'apprentissage statistique en grande dimension. Nous introduisons une procédure d'estimation basée sur la pénalisation par variation totale avec poids. Un premier ensemble de résultats vise à étudier l'intensité sous une hypothèse a priori de segmentation sparse. Dans une seconde partie, nous étudions la technique de binarisation de variables explicatives continues, pour laquelle nous construisons une régularisation spécifique à ce problème. Cette régularisation est intitulée ``binarsity'', elle pénalise les valeurs différentes d'un vecteur de paramètres. Dans la troisième partie, nous nous intéressons à la régression dynamique pour les modèles d'Aalen et de Cox avec coefficients et covariables en grande dimension, et pouvant dépendre du temps. Pour chacune des procédures d'estimation proposées, nous démontrons des inégalités oracles non-asymptotiques en prédiction. Nous utilisons enfin des algorithmes proximaux pour résoudre les problèmes convexes sous-jacents, et nous illustrons nos méthodes sur des données simulées et réelles.

Résumé / Abstract : In the first part of this thesis, we deal with the problem of learning the inhomogeneous intensity of a counting process, under a sparse segmentation assumption. We introduce a weighted total-variation penalization, using data-driven weights that correctly scale the penalization along the observation interval. In the second part, we study the binarization technique of continuous features, for which we construct a specific regularization. This regularization is called “binarsity”, it computes the different values of a parameter. In the third part, we are interested in the dynamic regression models of Aalen and Cox with time-varying covariates and coefficients in high-dimensional settings. For each proposed estimation procedure, we give theoretical guaranties by proving non-asymptotic oracle inequalities in prediction. We finally present proximal algorithms to solve the underlying studied convex problems, and we illustrate our methods with simulated and real datasets.