Analyse de signaux dans les séquences génomiques : recherche de microARN chez les eucaryotes [et] étude de la distribution des gènes chez Escherichia coli / Anthony Mathelier ; sous la direction de Alessandra Carbone

Date :

Editeur / Publisher : [S.l.] : [s.n.] , 2010

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Bioinformatique

Carbone, Alessandra (19..-.... ; mathématicienne) (Directeur de thèse / thesis advisor)

Université Pierre et Marie Curie (Paris ; 1971-2017) (Organisme de soutenance / degree-grantor)

Relation : Analyse de signaux dans les séquences génomiques : recherche de microARN chez les eucaryotes [et] étude de la distribution des gènes chez Escherichia coli / Anthony Mathelier ; sous la direction de Alessandra Carbone / Lille : Atelier national de reproduction des thèses , 2010

Résumé / Abstract : Nous proposons deux méthodes in silico pour découvrir des microARN dans les séquences génomiques eucaryotes. Les microARN sont de petites séquences non codantes de ~22nt issues de précurseurs et impliquées dans la régulation post-transcriptionnelle. La première méthode recherche des microARN par homologie ou à partir de données de deep sequencing en utilisant les propriétés de la structure secondaire des précurseurs. La validation se base sur seulement cinq critères numériques se révélant aussi puissants que des méthodes plus complexes proposées précédemment. La seconde méthode, basée sur une propriété de co-localisation, recherche de façon ab initio de nouveaux microARN organisés en clusters structuraux et permet également de considérer des données de deep sequencing. Nous proposons alors une identification génétique de régions des chromosomes humains susceptibles de contenir des informations importantes pour la régulation de plusieurs processus cellulaires clé par des microARN. Nous avons ensuite étudié la périodicité des gènes dans le génome d'Escherichia coli en utilisant une analyse de Fourier. La période génomique globale de 33kb trouvée suggère une organisation de la structure tri-dimensionnelle du chromosome codée au niveau génomique. Cette période est une caractéristique commune à plusieurs sous-ensembles fonctionnels de gènes. Cette organisation met en lumière deux réseaux fonctionnels indépendants de gènes. La méthodologie développée dans cette analyse peut être appliquée à n'importe quel ensemble de gènes et peut être utilisée pour une analyse à large échelle des bactéries et des archées.