Développement d'une distance évolutive entre séquences prenant en compte la variabilité du taux de substitution entre sites et application à la reconstruction de phylogénies moléculaires anciennes / par Tourasse Nicolas Jacques

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Phylogénie moléculaire

Protistes eucaryotes -- Analyse cladistique

Bactéries -- Analyse cladistique

Relation : Développement d'une distance évolutive entre séquences prenant en compte la variabilité du taux de substitution entre sites et application à la reconstruction de phylogénies moléculaires anciennes / par Tourasse Nicolas Jacques ; sous la direction de Manolo Gouy / [S.l.] : [s.n.] , 1998

Résumé / Abstract : L'utilisation des séquences des gènes permet de retracer la phylogénie qui unit les organismes procaryotes et eucaryotes. Un des problèmes principaux liés à ces reconstructions profondes concerne l'estimation du nombre de substitutions qui se sont produites dans les séquences. Cette tache est très difficile lorsque les taxons sont très éloignés car les différences observées entre les séquences actuelles ne représentent qu'une faible part de la quantité totale de substitutions. Pour se rapprocher du nombre exact, il apparait obligatoire de prendre en compte le fait que tous les sites dans les séquences n'ont pas la même probabilité de subir un changement. Suite à l'analyse de nombreux jeux de données, nous proposons un modèle qui représente assez bien cette variabilité. Selon le modèle, une certaine fraction des sites sont invariants tandis que les sites variables accumulent des substitutions qui se distribuent selon une loi binomiale négative tronquée. L'inclusion des sites invariants est un point important pour le bon ajustement du modèle aux fréquences de substitutions determinées selon le critère du maximum de parcimonie. La distribution a ensuite été utilisée pour dériver de nouveaux estimateurs de distances évolutives entre paires de séquences. Ceux-ci détectent davantage de changements que les estimateurs classiques qui ignorent la variabilité des substitutions. La correction est d'autant plus forte que les séquences sont eloignées. Les arbres phylogénétiques construits à l'aide des nouvelles distances sont souvent différents de ceux estimés avec les distances usuelles. En particulier, ils sont moins sensibles au phénomène d'attraction des longues branches. Parmi les résultats les plus marquants, il apparait que les euglénozoaires auraient émergé beaucoup plus tardivement dans l'arbre des eucaryotes qu'on ne le pensait jusqu'ici et qu'au sein des archébactéries le phylum des crenarchebactéries partageraient un ancêtre commun avec les eucaryotes.