Modèles et algorithmes pour l'évolution biologique / Olivier Chabrol ; sous la direction de Gilles Didier et de Pierre Pontarotti

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Langue / Language : anglais / English

Algorithmes

Modèles mathématiques

Évolution (biologie)

Didier, Gilles (19..-....) (Directeur de thèse / thesis advisor)

Pontarotti, Pierre (Directeur de thèse / thesis advisor)

Rivals, Eric (19..-....) (Président du jury de soutenance / praeses)

Raffinot, Mathieu (1973-....) (Rapporteur de la thèse / thesis reporter)

Thomson, Julie (19..-....) (Rapporteur de la thèse / thesis reporter)

Boussau, Bastien (1981-....) (Membre du jury / opponent)

Pardoux, Etienne (1947-....) (Membre du jury / opponent)

Royer, Manuela (Membre du jury / opponent)

Aix-Marseille Université (2012-....) (Organisme de soutenance / degree-grantor)

Ecole Doctorale Mathématiques et Informatique de Marseille (Marseille) (Ecole doctorale associée à la thèse / doctoral school)

Institut de mathématiques de Marseille (I2M) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Cette thèse aborde plusieurs questions relatives à l’évolution biologique au moyen de modèles mathématiques et d’algorithmes de calcul les utilisant. Elle se trouve donc à l’intersection des mathématiques, de l’informatique et de la biologie. La question principale étudiée dans la thèse est la mise en évidence de signatures moléculaires de la convergence évolutive qui est le phénomène par lequel des espèces éloignées développent indépendamment des caractères similaires. Nous proposons une approche originale permettant de détecter les positions des protéines potentiellement impliquées dans la convergence d’un caractère binaire donné. Celle-ci repose sur une mesure du “niveau de convergence” des positions, qui est une espérance déterminée sous des modèles Markoviens d’évolution protéique. Nous donnons un algorithme de calcul polynomial de cet indice et montrons (i) qu’il discrimine mieux que les méthodes précédentes, les positions convergentes des “neutres” sur des simulations et (ii) que notre approche donne des résultats qui font sens biologiquement sur un exemple réel.Dans le but de pouvoir traiter à terme de la convergence de caractères continus, comme le poids ou la taille, nous nous sommes ensuite intéressés à la détection de changements de tendance évolutive le long d’un arbre représentant l’évolution des espèces. Nous proposons une nouvelle méthode qui, à notre connaissance, est la première à être basée sur un principe de parcimonie où l’on cherche à déterminer la position du changement permettant de minimiser un certain coût évolutif sur l’arbre.

Résumé / Abstract : In this thesis, we studied questions about biological evolution by using mathematical models and bio-informatic algorithms. This work is at the intersection of mathematics, computer science and biology.The major question addressed in this thesis is the detection molecular basisof phenotypic convergence. Evolutionary convergence is the process by which independent species develop similar traits. This evolutionary process is strongly related to fundamental questions such as the role of adaptation .After pointing out different biological concepts linked to evolutionary convergence, we proposed a novel approach combining an original measure of the extent to which a site supports a phenotypic convergence to a binary trait. Thismeasure is based on the “convergence level” of a site which is a mathematical expectation under Markov evolutionary model. We proposed a polynomial time algorithm to compute this index. Our algorithm outperformed two previous algorithms in distinguishing simulated convergent sites from non-convergent ones. With the aim to study the evolutionary convergence of continuous traits, like weight and size, we tried to detect change in evolutionary trends of continuous characters along the tree of life. We proposed a novel method based on anasymmetric version of the linear parsimony, for determining the position of the change in trend which minimizes the total evolutionary cost of the tree. By using the approach on two biological datasets, we obtained results consistentwith those given by previous stochastic approaches.