Réduction de dimension et régularisation pour l'apprentissage statistique et la prédiction individuelle en IRMf / Cécilia Damon ; [sous la direction de] M. Jean-Baptiste Poline

Date :

Editeur / Publisher : [s.l.] : [s.n.] , 2010

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Imagerie par résonance magnétique

Statistiques -- Études comparatives

Cerveau

Poline, Jean-Baptiste (19..-....) (Directeur de thèse / thesis advisor)

Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne) (Autre partenaire associé à la thèse / thesis associated third party)

Université Paris-Sud (1970-2019) (Organisme de soutenance / degree-grantor)

Relation : Réduction de dimension et régularisation pour l'apprentissage statistique et la prédiction individuelle en IRMf / Cécilia Damon ; [sous la direction de] M. Jean-Baptiste Poline / Lille : Atelier national de reproduction des thèses , 2010

Résumé / Abstract : Les méthodes prédictives multivariées sont encore peu utilisées pour l'analyse de groupe en IRMf. La variabilité anatomo-fonctionnelle inter-¬individuelle et la grande dimension des données en comparaison au petit nombre de sujets rendent difficile l'identification de la variabilité fonctionnelle spécifiquement associée à un phénotype d'intérêt et accentuent le phénomène de sur-apprentissage des méthodes de prédiction multivariées. Notre premier objectif vise à explorer les différentes approches disponibles dans la littérature de l'apprentissage statistique supervisé pour gérer ce problème de sur-apprentissage et plus particulièrement les voies de la sélection d'attributs et de la classification linéaire régularisée. Notre deuxième objectif est de définir une méthodologie de comparaison à plusieurs niveaux des différentes stratégies proposées: (i) global: comparaison de l'ensemble des stratégies sur j'ensemble des jeux de données; (ii) local: comparaison limitée à un sous-ensemble de stratégies d'intérêt sur tous les jeux de données; (iii) individuel: comparaison de deux stratégies sur un seul jeu de données. Nous avons testé 4 couples de données (contraste d'IRMf, information phénotypique) extraits d'une base de données d'environ 200 sujets sains. Nous avons également construit deux jeux de simulation possédant un signal discriminant multivarié. L'analyse comparative ainsi que la visualisation des patterns fonctionnels a permis d'identifier une stratégie qui combine la sélection d'attributs multivariée RFE et le classifieur SRDA. Cette stratégie a identifié des patterns prédictifs parcimonieux et a obtenu de bonnes performances de prédiction.

Résumé / Abstract : Predictive multivariate methods have yet been rarely explored in fMRI at the inter-subject level. An important inter-subjects anatomo-functional variability and the large dimension of fMRI data in comparison to the few number of subjects complicates the identification of the inter-subjects functional variability specific to a phenotype of interest and increases the overfitting phenomenon of classification techniques. Our first objective aims to explore the various approaches available in the field of supervised statistical learning and well-known to control the overfitting problem and more specifically two means: the feature selection and the regularised classification. Our second goal consist in defining a rigorous methodology of the different proposed strategies at several levels: (i) global: comparison of all the strategies based on all the datasets; (ii) local: comparison restricted to a particular subset of strategies based on all the datasets; (iii) individual: comparison of a pair of strategies based on a single dataset. We tested four couples of data (fMRI contrast, phenotypic information) extracted from a large database, including about 200 healthy subjects that have realized the same experimental protocol. We also constructed simulated datasets with a multivariate discriminant signal. The comparative analysis and the function patterns visualisation revealed the strategy combining the multivariate features selection RFE and the SRDA classifier as the most efficient. This strategy identified parcimonious predictive patterns and obtained good predictive performances proved to be relevant only when the contrast-to-noise ratio was strong.