Modélisation stochastique de l'expression des gènes et inférence de réseaux de régulation / Ulysse Herbach ; sous la direction de Anne-Laure Fougères et de Olivier Gandrillon et de Thibault Espinasse

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Markov, Champs aléatoires de

Markov, Processus de

Régulation génétique

Classification Dewey : 519.8

Fougères, Anne-Laure (Directeur de thèse / thesis advisor)

Gandrillon, Olivier (1962-....) (Directeur de thèse / thesis advisor)

Espinasse, Thibault (1984-....) (Directeur de thèse / thesis advisor)

Saporta, Benoîte de (Président du jury de soutenance / praeses)

Crépieux, Pascale (Rapporteur de la thèse / thesis reporter)

Mazza, Christian (Rapporteur de la thèse / thesis reporter)

Guillotin-Plantard, Nadine (1971-....) (Membre du jury / opponent)

Löcherbach, Eva (1970-....) (Membre du jury / opponent)

Yvinec, Romain (1985-....) (Membre du jury / opponent)

Université de Lyon (2015-....) (Organisme de soutenance / degree-grantor)

École doctorale en Informatique et Mathématiques de Lyon (Ecole doctorale associée à la thèse / doctoral school)

Université Claude Bernard (Lyon) (Autre partenaire associé à la thèse / thesis associated third party)

ICJ - Institut Camille Jordan (Rhône) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : L'expression des gènes dans une cellule a longtemps été observable uniquement à travers des quantités moyennes mesurées sur des populations. L'arrivée des techniques «single-cell» permet aujourd'hui d'observer des niveaux d'ARN et de protéines dans des cellules individuelles : il s'avère que même dans une population de génome identique, la variabilité entre les cellules est parfois très forte. En particulier, une description moyenne est clairement insuffisante étudier la différenciation cellulaire, c'est-à-dire la façon dont les cellules souches effectuent des choix de spécialisation. Dans cette thèse, on s'intéresse à l'émergence de tels choix à partir de réseaux de régulation sous-jacents entre les gènes, que l'on souhaiterait pouvoir inférer à partir de données. Le point de départ est la construction d'un modèle stochastique de réseaux de gènes capable de reproduire les observations à partir d'arguments physiques. Les gènes sont alors décrits comme un système de particules en interaction qui se trouve être un processus de Markov déterministe par morceaux, et l'on cherche à obtenir un modèle statistique à partir de sa loi invariante. Nous présentons deux approches : la première correspond à une approximation de champ assez populaire en physique, pour laquelle nous obtenons un résultat de concentration, et la deuxième se base sur un cas particulier que l'on sait résoudre explicitement, ce qui aboutit à un champ de Markov caché aux propriétés intéressantes

Résumé / Abstract : Gene expression in a cell has long been only observable through averaged quantities over cell populations. The recent development of single-cell transcriptomics has enabled gene expression to be measured in individual cells: it turns out that even in an isogenic population, the molecular variability can be very important. In particular, an averaged description is not sufficient to account for cell differentiation. In this thesis, we are interested in the emergence of such cell decision-making from underlying gene regulatory networks, which we would like to infer from data. The starting point is the construction of a stochastic gene network model that is able to explain the data using physical arguments. Genes are then seen as an interacting particle system that happens to be a piecewise-deterministic Markov process, and our aim is to derive a tractable statistical model from its stationary distribution. We present two approaches: the first one is a popular field approximation, for which we obtain a concentration result, and the second one is based on an analytically tractable particular case, which provides a hidden Markov random field with interesting properties