Etude de la diversité des génomes et des protéines de virus : développements bioinformatiques et analyse de familles d'intérêts / Eric Olo Ndela ; sous la direction de Télesphore Sime Ngando

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Langue / Language : français / French

Virus

Sime Ngando, Télesphore (Directeur de thèse / thesis advisor)

Petit , Marie-Agnès (19..-....) (Président du jury de soutenance / praeses)

Adriaenssens, Evelien (19..-....) (Rapporteur de la thèse / thesis reporter)

Pimentel Cachapuz Rocha, Eduardo (1972-...) (Rapporteur de la thèse / thesis reporter)

Enault, François (1977-....) (Membre du jury / opponent)

Toussaint, Ariane (19..-.... ; auteure en génétique) (Membre du jury / opponent)

Université Clermont Auvergne (2021-....) (Organisme de soutenance / degree-grantor)

École doctorale des sciences de la vie, santé, agronomie, environnement (Clermont-Ferrand) (Ecole doctorale associée à la thèse / doctoral school)

Laboratoire Microorganismes : Génome et environnement (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : L'avalanche de séquences génomiques de virus, acquises à partir de divers environnements sans étape de mise en culture, offre la possibilité de mieux comprendre un monde viral encore largement méconnu, et notamment de caractériser sa diversité en termes de génomes et de protéines. Dans le premier chapitre, nous avons tenté de mieux organiser les protéines des virus connus en groupes d'orthologues. La stratégie originale de clustering implémentée tient compte les relations d'homologie lointaines, nombreuses mais négligées, et a permis la création de groupes de protéines plus larges, distribués sous le nom de PHROG. Afin de mieux appréhender la diversité génomique du monde viral, nous avons analysé deux groupes de virus au profil très différent (chapitre II). Tout d'abord, l'analyse de nombreux prophages transposables, identifiés dans les génomes de Leptospires, a mis en évidence de nouveaux clades, enrichis chez les souches pathogènes et présentant une diversité protéique remarquable malgré une organisation génomique très conservée. En parallèle, des dizaines de milliers de génomes de microvirus ont été détectés et nous ont permis de mieux comprendre leur diversité, leur cycle de vie, ainsi que leurs hôtes infectés, ce qui nous a amené à proposer une réorganisation de la taxonomie de ce groupe viral. L'analyse détaillée de très petits génomes découverts parmi ces derniers virus nous a de plus permis de mieux comprendre les stratégies de compaction de leurs génomes. Dans le cadre de cette dernière analyse, nous avons développé CodingDiv, un outil s'appuyant sur la microdiversité pour faciliter la prédiction de tous les gènes au sein des génomes viraux, en particulier les gènes surimprimés (chapitre III). À une époque où les virus non cultivés dominent les bases de données de séquences virales, nous espérons que les méthodes et les analyses présentées ici se révéleront utiles pour mieux caractériser la virosphère.

Résumé / Abstract : The avalanche of viral genomic sequences, acquired from a variety of environments, offers the possibility of better understanding a still largely unknown viral world, and in particular of characterizing its diversity in terms of genomes and proteins. In the first chapter, we attempted to better organize the proteins of known viruses into groups of orthologs. The original clustering strategy implemented takes into account the numerous but neglected distant homology relationships, and has enabled the creation of larger protein families, distributed under the name PHROG. To gain a better understanding of the genomic diversity of the viral world, we analyzed two groups of viruses with very different characteristics (chapter II). Firstly, the analysis of numerous transposable prophages identified in Leptospiral genomes revealed new clades, enriched in pathogenic strains and displaying remarkable protein diversity despite a highly conserved genomic organization. At the same time, tens of thousands of microvirus genomes were detected, enabling us to gain a better understanding of their diversity, life cycle and infected hosts, and finally to propose a reorganization of the taxonomy of this viral group. Detailed analysis of the very small genomes discovered among these microviruses has also enabled us to gain a better understanding of their genome compaction strategies. As part of the analysis of these small genomes, we have developed CodingDiv, a tool based on the viral microdiversity to facilitate the prediction of all genes within viral genomes, particularly of overprinted genes (chapter III). At a time when uncultured viruses dominate viral sequence databases, we hope that the methods and analyses presented here will prove useful in better characterizing the virosphere.