L'approche Support Vector Machines (SVM) pour le traitement des données fonctionnelles / Yousri Henchiri ; sous la direction de Ali Gannoun et de Christophe Crambes

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Machines à vecteurs de support

Apprentissage automatique

Espaces de Hilbert

Gannoun, Ali (1958-....) (Directeur de thèse / thesis advisor)

Crambes, Christophe (1976-....) (Directeur de thèse / thesis advisor)

Ferraty, Frédéric (1966-.... ; mathématicien) (Président du jury de soutenance / praeses)

Girard, Stéphane (mathématicien) (Rapporteur de la thèse / thesis reporter)

Preda, Cristian (1971-....) (Rapporteur de la thèse / thesis reporter)

Mas, André (1973-.... ; mathématicien) (Membre du jury / opponent)

Université des sciences et techniques de Montpellier 2 (1970-2014) (Organisme de soutenance / degree-grantor)

Information, Structures, Systèmes (Montpellier ; École Doctorale ; 2009-2014) (Ecole doctorale associée à la thèse / doctoral school)

Institut Montpelliérain Alexander Grothendieck (Montpellier ; 2003-....) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : L'Analyse des Données Fonctionnelles est un domaine important et dynamique en statistique. Elle offre des outils efficaces et propose de nouveaux développements méthodologiques et théoriques en présence de données de type fonctionnel (fonctions, courbes, surfaces, ...). Le travail exposé dans cette thèse apporte une nouvelle contribution aux thèmes de l'apprentissage statistique et des quantiles conditionnels lorsque les données sont assimilables à des fonctions. Une attention particulière a été réservée à l'utilisation de la technique Support Vector Machines (SVM). Cette technique fait intervenir la notion d'Espace de Hilbert à Noyau Reproduisant. Dans ce cadre, l'objectif principal est d'étendre cette technique non-paramétrique d'estimation aux modèles conditionnels où les données sont fonctionnelles. Nous avons étudié les aspects théoriques et le comportement pratique de la technique présentée et adaptée sur les modèles de régression suivants. Le premier modèle est le modèle fonctionnel de quantiles de régression quand la variable réponse est réelle, les variables explicatives sont à valeurs dans un espace fonctionnel de dimension infinie et les observations sont i.i.d.. Le deuxième modèle est le modèle additif fonctionnel de quantiles de régression où la variable d'intérêt réelle dépend d'un vecteur de variables explicatives fonctionnelles. Le dernier modèle est le modèle fonctionnel de quantiles de régression quand les observations sont dépendantes. Nous avons obtenu des résultats sur la consistance et les vitesses de convergence des estimateurs dans ces modèles. Des simulations ont été effectuées afin d'évaluer la performance des procédures d'inférence. Des applications sur des jeux de données réelles ont été considérées. Le bon comportement de l'estimateur SVM est ainsi mis en évidence.

Résumé / Abstract : Functional Data Analysis is an important and dynamic area of statistics. It offers effective new tools and proposes new methodological and theoretical developments in the presence of functional type data (functions, curves, surfaces, ...). The work outlined in this dissertation provides a new contribution to the themes of statistical learning and quantile regression when data can be considered as functions. Special attention is devoted to use the Support Vector Machines (SVM) technique, which involves the notion of a Reproducing Kernel Hilbert Space. In this context, the main goal is to extend this nonparametric estimation technique to conditional models that take into account functional data. We investigated the theoretical aspects and practical attitude of the proposed and adapted technique to the following regression models.The first model is the conditional quantile functional model when the covariate takes its values in a bounded subspace of the functional space of infinite dimension, the response variable takes its values in a compact of the real line, and the observations are i.i.d.. The second model is the functional additive quantile regression model where the response variable depends on a vector of functional covariates. The last model is the conditional quantile functional model in the dependent functional data case. We obtained the weak consistency and a convergence rate of these estimators. Simulation studies are performed to evaluate the performance of the inference procedures. Applications to chemometrics, environmental and climatic data analysis are considered. The good behavior of the SVM estimator is thus highlighted.