Détection de l'évolution convergente à l'échelle génomique : développement de méthodes et étude des adaptations indépendantes à la vie en milieu aride chez les rongeurs / Carine Rey ; sous la direction de Marie Sémon

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Catalogue Worldcat

Convergence évolutive

Génomique comparative

Bioinformatique

Rongeurs

Climat aride

Sémon, Marie (1979-....) (Directeur de thèse / thesis advisor)

Delattre, Marie (19..-.... ; biologiste) (Président du jury de soutenance / praeses)

Dessimoz, Christophe (Rapporteur de la thèse / thesis reporter)

Ranwez, Vincent (1972-....) (Rapporteur de la thèse / thesis reporter)

Boussau, Bastien (1981-....) (Membre du jury / opponent)

Gascuel, Olivier (1956-....) (Membre du jury / opponent)

Université de Lyon (2015-....) (Organisme de soutenance / degree-grantor)

École Doctorale de Biologie Moléculaire Intégrative et Cellulaire (Lyon) (Ecole doctorale associée à la thèse / doctoral school)

École normale supérieure de Lyon (Autre partenaire associé à la thèse / thesis associated third party)

Laboratoire de biologie et modélisation de la cellule. LBMC (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : La convergence phénotypique, c’est-à-dire l’acquisition indépendante de caractères similaires par des espèces différentes, est omniprésente dans la nature et a été souvent étudiée. Mais ce processus évolutif n’est pas bien compris. Par exemple, de nombreux chercheurs cherchent à comprendre s’il existe des bases génétiques convergentes sous-jacentes à ces convergences phénotypiques.Quelques substitutions convergentes corrélées à un phénotype convergent ont été décrites dans la littérature, mais il existe peu d’études à l’échelle génomique. Ceci peut s’expliquer par deux problèmes méthodologiques : 1/ D’une part, la difficulté de créer des jeux de données multi-espèces pour des analyses comparatives. 2/ D’autre part, le manque de méthodes dédiées à la détection de la convergence à l’échelle génomique.Au cours de ma thèse, j’ai proposé des solutions à ces deux défis. Dans un premier temps, j’ai créé un programme (CAARS) permettant d’automatiser l’assemblage de jeux de données composés de familles d’orthologues à partir de données RNA-Seq. Puis, j’ai créé un outil (PCOC) pour étudier les substitutions convergentes au sein de séquences codantes, basé sur l’identification de changements de profils d’acides aminés. Ces outils ont été développés dans un souci de reproductibilité et de facilité d’utilisation. J’ai ensuite étudié la capacité de différentes méthodes, dont PCOC, à détecter des substitutions convergentes en présence de facteurs confondants. Enfin, j’ai appliqué ces méthodes à un cas biologique où j’ai cherché à caractériser les bases génomiques de l’adaptation aux milieux arides chez les rongeurs.

Résumé / Abstract : Phenotypic convergence, the independent acquisition of similar characters by different species,is widespread in nature and has been extensively studied. But this evolutionary process is not well understood. For example, many researchers seek to understand whether there are convergent genetic bases underlying these phenotypic convergences.Some convergent substitutions correlated with a convergent phenotype have been described in the literature, but there are few studies at the genome scale. This can be explained by two methodological problems : 1 / On the one hand, the difficulty of creating multi-species datasets for comparative analyses. 2 / On the other hand, the lack of dedicated methods to detect convergence at the genomic scale.During my thesis, I proposed solutions to these two challenges. As a first step, I created a program (CAARS) to automate the assembly of datasets composed of orthologous families from RNA-Seq data. Then I created a tool (PCOC) to study convergent substitutions within coding sequences, based on the identification of amino acid profile changes rather than strict amino acid changes. These tools have been developed for the sake of reproducibility and ease of use. I then studied the ability of different methods, including PCOC, to detect convergent substitutions in the presence of confounding factors. Finally, I applied these methods to a biological case where I sought to characterize the genomic bases of adaptation to arid environments in rodents.