Scaffold-based reconstruction method of genome-scale metabolic models / Nicolas Loira ; sous la direction de David James Sherman

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Cellules eucaryotes

Métabolisme

Sherman, David James (1964-....) (Directeur de thèse / thesis advisor)

Johnen, Colette (1961-....) (Président du jury de soutenance / praeses)

Gaillardin, Claude (Rapporteur de la thèse / thesis reporter)

Siegel, Anne (1975-.... ; spécialiste en bioinformatique) (Rapporteur de la thèse / thesis reporter)

Maass, Alejandro (1965-....) (Membre du jury / opponent)

Université Bordeaux-I (1971-2013) (Organisme de soutenance / degree-grantor)

École doctorale de mathématiques et informatique (Talence, Gironde ; 1991-....) (Ecole doctorale associée à la thèse / doctoral school)

Laboratoire bordelais de recherche en informatique (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : La compréhension des organismes vivant a été une quête pendant longtemps. Depuisles premiers progrès des derniers siècles, nous sommes arrivés jusqu’au point où desquantités massives de données et d’information sont constamment générées. Bien que,jusqu’au présent la plupart du travail a été concentré sur la génération d’un catalogued’éléments biologiques, ce n’est pas que récemment qu’un effort coordonné pour découvrirles réseaux de relations entre ces parties a été constaté. Nous nous sommes intéressésà comprendre non pas seulement ces réseaux, mais aussi la façon dont, à partir de sesconnexions, émergent des fonctions biologiques.Ce travail se concentre sur la modélisation et l’exploitation d’un de ces réseaux :le métabolisme. Un réseau métabolique est un ensemble des réactions biochimiquesinterconnectées qui se produisent à l’intérieur, ou dans les proximité d’une cellulevivante. Une nouvelle méthode de découverte, ou de reconstruction des réseaux métaboliquesest proposée dans ce travail, avec une emphase particulière sur les organismeseucaryotes.Cette nouvelle méthode est divisée en deux parties : une nouvelle approche pour lamodélisation de la reconstruction basée sur l’instanciation des éléments d’un modèlesquelette existant, et une nouvelle méthode de réécriture d’association des gènes. Cetteméthode en deux parties permet des reconstructions qui vont au-delà de la capacitédes méthodes de l’état de l’art, permettant la reconstruction de modèles métaboliquesdes organismes eucaryotes, et fournissant une relation détaillée entre ses réactions etses gènes, des connaissances cruciales pour des applications biotechnologiques.Les méthodes de reconstruction développées dans ce travail, ont été complétéespar un workflow itératif d’édition, de vérification et d’amélioration du modèle. Ceworkflow a été implémenté dans un logiciel, appelé Pathtastic.Comme une étude de cas de la méthode développée et implémentée dans le présenttravail, le réseau métabolique de la levure oléagineuse Yarrowia lipolytica, connucomme contaminant alimentaire et utilisé pour la biorestauration et comme usinecellulaire, a été reconstruit. Une version préliminaire du modèle a été générée avecPathtastic, laquelle a été améliorée par curation manuelle, à travers d’un travail avecdes spécialistes dans le domaine de cette espèce. Les données expérimentales, obtenuesà partir de la littérature, ont été utilisées pour évaluer la qualité du modèle produit.La méthode de reconstruction chez les eucaryotes, et le modèle reconstruit deY. lipolytica peuvent être utiles pour les communautés scientifiques respectives, lepremier comme un pas vers une meilleure reconstruction automatique des réseauxmétaboliques, et le deuxième comme un soutien à la recherche, un outil pour desapplications biotechnologiques et comme un étalon-or pour les reconstructions futures.

Résumé / Abstract : Understanding living organisms has been a quest for a long time. Since the advancesof the last centuries, we have arrived to a point where massive quantities of data andinformation are constantly generated. Even though most of the work so far has focusedon generating a parts catalog of biological elements, only recently have we seena coordinated effort to discover the networks of relationships between those parts. Notonly are we trying to understand these networks, but also the way in which, from theirconnections, emerge biological functions.This work focuses on the modeling and exploitation of one of those networks:metabolism. A metabolic network is a net of interconnected biochemical reactionsthat occur inside, or in the proximity of, a living cell. A new method of discovery, orreconstruction, of metabolic networks is proposed in this work, with special emphasison eukaryote organisms.This new method is divided in two parts: a novel approach to reconstruct metabolicmodels, based on instantiation of elements of an existing scaffold model, and a novelmethod of assigning gene associations to reactions. This two-parts method allows reconstructionsthat are beyond the capacity of the state-of-the-art methods, enablingthe reconstruction of metabolic models of eukaryotes, and providing a detailed relationshipbetween its reactions and genes, knowledge that is crucial for biotechnologicalapplications.The reconstruction methods developed for the present work were complementedwith an iterative workflow of model edition, verification and improvement. This workflowwas implemented as a software package, called Pathtastic.As a case study of the method developed and implemented in the present work,we reconstructed the metabolic network of the oleaginous yeast Yarrowia lipolytica,known as food contaminant and used for bioremediation and as a cell factory. A draftversion of the model was generated using Pathtastic, and further improved by manualcuration, working closely with specialists in that species. Experimental data, obtainedfrom the literature, were used to assess the quality of the produced model.Both, the method of reconstruction in eukaryotes, and the reconstructed model ofY. lipolytica can be useful for their respective research communities, the former as astep towards better automatic reconstructions of metabolic networks, and the latteras a support for research, a tool in biotechnological applications and a gold standardfor future reconstructions.