Modélisation de données cliniques de grande dimension : application aux pathologies respiratoires / Grégory Marin ; sous la direction de Nicolas Molinari et de Arnaud Bourdin

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Biométrie

Analyse de régression

Appareil respiratoire

Données massives -- Modèles mathématiques

Molinari, Nicolas (1973-....) (Directeur de thèse / thesis advisor)

Bourdin, Arnaud (1974-....) (Directeur de thèse / thesis advisor)

Giorgi, Roch (Rapporteur de la thèse / thesis reporter)

Laurent, François (1956-.... ; Professeur des Universités) (Rapporteur de la thèse / thesis reporter)

Vachier, Isabelle (Membre du jury / opponent)

Chanez, Pascal (Membre du jury / opponent)

Université des sciences et techniques de Montpellier 2 (1970-2014) (Organisme de soutenance / degree-grantor)

Information, Structures, Systèmes (Montpellier ; École Doctorale ; 2009-2014) (Ecole doctorale associée à la thèse / doctoral school)

Mathématiques, Informatique et STatistique pour l'Environnement et l'Agronomie (Montpellier) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Cette thèse est consacrée à l'application et au développement de méthodes biostatistiques originales pour des applications médicales et cliniques concernant plus particulièrement les pathologies respiratoires. Il s'agit ainsi d'un travail de recherche transversale, visant à la modélisation de données hétérogènes, colinéaires et de grande dimension pour des applications cliniques. Un état de l'art traitant du diagnostic de l'asthme et de hyperactivité bronchique a tout d'abord été dressé, avant de proposer une première application statistique, prenant la forme de modèles de régressions multiples. Ce type de modèle étant particulièrement sensible à la dimension et la colinéarité des données, les chapitres suivants proposent plusieurs améliorations, après avoir explicité en détail l'enjeu et les méthodes actuelles d'analyse de données de grande dimension. Un premier modèle de classification hiérarchique non supervisé a été mis au point et appliqué au cas de la quantification du piégeage aérique. Un algorithme de régression Partial Least Square a également été mis en œuvre, prédisant une ou plusieurs variables Y à partir d'un set de variables X hétérogènes et colinéaires, ce qui a permis de mettre en évidence l'impact de l'âge sur les petites voies aériennes, tout en considérant de nombreux autres paramètres. Enfin, un algorithme d'analyse fractale a été créé, en vue de quantifier en une seule valeur la complexité spatiale et géométrique d'images de scanners thoraciques, cela constituant un innovant outil d'aide au diagnostic radiologique.

Résumé / Abstract : This thesis outlines new statistic methods devoted to clinical and medical applications, dealing more precisely with respiratory diseases. Our goal was to model and analyze high-dimensional clinical data, often heterogeneous, and collinear. A clinical state of the art of asthma diagnosis and bronchial hyperreactivity was first stated, before proposing a first statistical application, which took the shape of multiple regression models. This type of models is particularly tricky when treating high-dimensional collinear data, which is why the other chapters are an enhancement of this first model. Firstly, a non-supervised hierarchical classification was carried out and applied to air trapping quantification. A Partial Least Square regression model was also executed, allowing prediction of one or more variables from a set of X variables, which allowed us to highlight the impact of age on small airway impairment. Finally, a fractal analysis was performed, in order to quantify the geometrical and spatial complexity of a CT scan image into a single value. This kind a prospective methodology, where the statistics are directly involved in the clinical work, represents a brand new tool which can help medical diagnosis.