Deep learning for computational phenotyping in cell-based assays / Joseph Boyd ; sous la direction de Thomas Edgar Walter

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Apprentissage profond

Criblage pharmacologique

Lignées cellulaires

Phénotype

Classification Dewey : 570.15

Walter, Thomas Edgar (1974-.... ; Ingénieur) (Directeur de thèse / thesis advisor)

Rousseau, David (1973-....) (Président du jury de soutenance / praeses)

Kervrann, Charles (Rapporteur de la thèse / thesis reporter)

Kreshuk, Anna (Rapporteur de la thèse / thesis reporter)

Genovesio, Auguste (1974- ....) (Membre du jury / opponent)

Jug, Florian (Membre du jury / opponent)

Paul-Gilloteaux, Perrine (Membre du jury / opponent)

Stoven, Véronique (Membre du jury / opponent)

Université Paris sciences et lettres (2020-....) (Organisme de soutenance / degree-grantor)

Ecole doctorale Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique (Paris) (Ecole doctorale associée à la thèse / doctoral school)

Centre de bio-informatique (Fontainebleau, Seine et Marne) (Laboratoire associé à la thèse / thesis associated laboratory)

École nationale supérieure des mines (Paris) (Autre partenaire associé à la thèse / thesis associated third party)

Résumé / Abstract : Le phénotypage computationnel est un ensemble de technologies émergentes permettant d’étudier systématiquement le rôle du génome dans l’obtention de phénotypes, les caractéristiques observables d’un organisme et de ses sous- systèmes. En particulier, les essais cellulaires permettent de cribler des panels de petites molécules ou de moduler l’expression des gènes, et de quantifier les effets sur les caractéristiques phénotypiques allant de la viabilité à la morphologie cellulaire. Le criblage à haut contenu étend les méthodologies des criblages cellulaires à une lecture à haut contenu basée sur des images, en particulier les canaux multiplexés de la microscopie à fluorescence. Les cribles basés sur de multiples lignées cellulaires sont aptes à différencier les phénotypes de différents sous-types d’une maladie, représentant l’hétérogénéité moléculaire concernée dans la conception de thérapies médicales de précision. Ces modèles biologiques plus riches sous-tendent une approche plus ciblée pour le traitement de maladies mortelles telles que le cancer. Un défi permanent pour le criblage à haut contenu est donc la synthèse des lectures hétérogènes dans les cribles à multiples lignées cellulaires. Parallèlement, l’état de l’art établi en matière d’applications d’analyse d’images et de vision par ordinateur est l’apprentissage profond. Cependant, son rôle dans le criblage à haut contenu ne fait que commencer à être réalisé. Cette thèse aborde deux problématiques de l’analyse à haut contenu des lignées cellulaires cancéreuses. Les contributions sont les suivantes : (i) une démonstration du potentiel d’apprentissage profond et de modèles générateurs dans le criblage à haut contenu ; (ii) une solution basée sur l’apprentissage profond au problème de l’hétérogénéité dans un criblage de médicaments sur plusieurs lignées cellulaires ; et (iii) de nouvelles applications de modèles de traduction d’image à image comme alternative à la microscopie à fluorescence coûteuse actuellement nécessaire pour le criblage à haut contenu.

Résumé / Abstract : Computational phenotyping is an emergent set of technologies for systematically studying the role of the genome in eliciting phenotypes, the observable characteristics of an organism and its subsystems. In particular, cell-based assays screen panels of small compound drugs or otherwise modulations of gene expression, and quantify the effects on phenotypic characteristics ranging from viability to cell morphology. High content screening extends the methodologies of cell-based screens to a high content readout based on images, in particular the multiplexed channels of fluorescence microscopy. Screens based on multiple cell lines are apt to differentiating phenotypes across different subtypes of a disease, representing the molecular heterogeneity concerned in the design of precision medicine therapies. These richer biological models underpin a more targeted approach for treating deadly diseases such as cancer. An ongoing challenge for high content screening is therefore the synthesis of the heterogeneous readouts in multi-cell-line screens. Concurrently, deep learning is the established state-of-the-art image analysis and computer vision applications. However, its role in high content screening is only beginning to be realised. This dissertation spans two problem settings in the high content analysis of cancer cell lines. The contributions are the following: (i) a demonstration of the potential for deep learning and generative models in high content screening; (ii) a deep learning-based solution to the problem of heterogeneity in a multi-cell-line drug screen; and (iii) novel applications of image-to-image translation models as an alternative to the expensive fluorescence microscopy currently required for high content screening.