Modélisation du déséquilibre de liaison en génomique des populations par méthodes d'optimisation / Thomas Dias Alves ; sous la direction de Michaël Blum et de Julien Mairal

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Algorithmes génétiques

Hybridation végétale

Génétique -- Méthodes statistiques

Classification Dewey : 510

Classification Dewey : 570

Blum, Michaël (1978-.... ; mathématicien) (Directeur de thèse / thesis advisor)

Mairal, Julien (1982-....) (Directeur de thèse / thesis advisor)

Génin, Emmanuelle (19..-.... ; chercheuse en génétique) (Président du jury de soutenance / praeses)

Chiquet, Julien (Rapporteur de la thèse / thesis reporter)

Patin, Etienne (1981-....) (Membre du jury / opponent)

Picard, Franck (1978-.... ; directeur de recherche en biologie) (Membre du jury / opponent)

Servin, Bertrand (1978-....) (Membre du jury / opponent)

Communauté d'universités et d'établissements Université Grenoble Alpes (2015-2019) (Organisme de soutenance / degree-grantor)

École doctorale ingénierie pour la santé, la cognition, l'environnement (Grenoble ; 1995-....) (Ecole doctorale associée à la thèse / doctoral school)

Techniques de l’ingénierie médicale et de la complexité - Informatique, mathématiques et applications (Grenoble) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Nous présentons un nouveau formalisme et des nouvelles méthodes pour modéliser le déséquilibre de liaison et tenir compte de la structure en haplotypes pour les données issues de la génomique des populations. La modélisation repose sur un problème d'optimisation avec contraintes qui est résolue avec un algorithme de programmation dynamique. Les méthodes établies ont toutes l'avantage d'avoir un coût algorithmique linéaire et donc de pouvoir traiter de grands jeux de données.Dans un premier temps, nous avons appliqué notre approche à l'étude des populations métisses et plus particulièrement au problème d'inférence des coefficients de métissage locaux.Notre méthode a été appliquée à des génotypes simulés de métissage humain ainsi qu'à des vrais génotypes obtenus dans des populations métisses de peupliers.Dans un second temps, nous avons développé notre formalisme d'optimisation pour traiter de l'inférence des haplotypes à partir des génotypes d'une population.L'ensemble de ces méthodes d'optimisation a été développé dans un module Python qui s'appelle Loter.

Résumé / Abstract : We present a new formalism and new methods to model linkage disequilibrium and to account for haplotype structure of population genomics data. Modeling relies on an optimization problem with constraints that is solved using dynamic programming. The algorithmic cost of proposed methods is linear, which is a desirable property to process large datasets.First, we applied our framework to study admixed populations and perform local ancestry inference. Our method is applied to simulated genotypes of admixed human populations and to real genotypes from admixed Populus species.Second, we developed our optimization framework to perform haploptype phasing and imputation based on a population of genotypes. All optimization methods have been developed in a Python package called Loter.