Méthodes d'ensemble pour l'inférence de réseaux de régulation coopératifs / Inès Chebil ; sous la direction de Céline Rouveirol

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Régulation génétique

Modèles mathématiques

Analyse de régression

Rouveirol, Céline (Directeur de thèse / thesis advisor)

Bennani, Younès (Président du jury de soutenance / praeses)

Alché-Buc, Florence d' (19..-....) (Rapporteur de la thèse / thesis reporter)

Azé, Jérôme (1973-....) (Rapporteur de la thèse / thesis reporter)

Cornuéjols, Antoine (19..-....) (Membre du jury / opponent)

Université Paris 13 (Organisme de soutenance / degree-grantor)

École doctorale Galilée (Villetaneuse, Seine-Saint-Denis) (Ecole doctorale associée à la thèse / doctoral school)

Résumé / Abstract : La reconstruction des réseaux de régulation génétique (GRNs) est une étape importante pour la compréhension des mécanismes de régulation complexes régissant le fonctionnement de la cellule. De nombreuses approches de modélisation ont été introduites pour inférer le lien de causalité entre les gênes à l'aide des données d'expression génétiques. Cependant, les performances de ces approches sont limitées principalement a causé a des données de grande dimension. En plus, ces méthodes ne restent pas généralement la réalité biologique ou l'interaction entre gêne est réalisée d'une manière coopérative mais considèrent un modèle plus simple ou seules les interactions binaires sont considérées. Dans cette thèse, nous présentons de nouvelles méthodes d'inférence de GRN coopératifs afin améliorer la stabilité et la précision de la reconstruction des GRN en utilisant des techniques d'ensemble. Pour un gêne cible donne, nous extrayons un ensemble de GRNs coopératifs a partir de données discrétisées d'expression. Les GRNs ainsi que les interactions génétiques inférés sont classés selon leur importance en utilisant la régression linéaire sur la base des données d'expression continues. Les évaluations menées sur les données du challenge Dream5 et sur des données humaines de cancer de la vessie démontrent que nos méthodes sont efficaces, tout particulièrement si la taille des données d'apprentissage est petite.

Résumé / Abstract : Reconstruction of Gene Regulatory Networks (GRNs) is an important step towards understanding the complex regulatory mechanisms within the cell. Many modeling approaches have been introduced ti find the causal relationship between genes using expression data. However, they surfer from the high dimensionality problem i.e., having a large number of genes but a small number of samples negatively impacts the results. Moreover, these models do not truthfully reflect the biological system where genes interactions are performed in a cooperative manner but rather simplify the problem by tackling only binary interactions. In this thesis, we present new methods for cooperative GRN inference to improve the stability and accuracy of GRNs reconstruction leveraging ensemble methods. For a given target gene, we extract an ensemble of GRNs from discretized expression data. Inferred networks are then evaluated by ranking individual regulation relationships using a regression based technique and continuous expression data. Evaluations on Dream5 challenge data as well as human cancer data demonstrate that our methods are effcient, especially when operating on a small data set.