Vers une gestion coopérative des infrastructures virtualisées à large échelle : le cas de l'ordonnancement / Flavien Quesnel ; sous la direction de Mario Südholt

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Systèmes virtuels (informatique)

Ordonnancement (informatique)

Südholt, Mario (Directeur de thèse / thesis advisor)

Martineau, Patrick (1967-....) (Président du jury de soutenance / praeses)

Desprez, Frédéric (1964-.... ; auteur en informatique) (Rapporteur de la thèse / thesis reporter)

Hagimont, Daniel (1965-.... ; enseignant-chercheur en informatique) (Rapporteur de la thèse / thesis reporter)

Menaud, Jean-Marc (Membre du jury / opponent)

Morin, Christine (1964-.... ; chercheur en informatique) (Membre du jury / opponent)

Goasguen, Sébastien (Membre du jury / opponent)

Lebre, Adrien (1977-.... ; auteur en informatique) (Membre du jury / opponent)

École nationale supérieure des mines (Nantes ; 1990-2016) (Organisme de soutenance / degree-grantor)

Laboratoire d’Informatique de Nantes Atlantique (UMR 6241) (Nantes) (Laboratoire associé à la thèse / thesis associated laboratory)

ASCOLA. ASpect and COmposition LAnguages (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Les besoins croissants en puissance de calcul sont généralement satisfaits en fédérant de plus en plus d’ordinateurs (ou noeuds) pour former des infrastructures distribuées. La tendance actuelle est d’utiliser la virtualisation système dans ces infrastructures, afin de découpler les logiciels des noeuds sous-jacents en les encapsulant dans des machines virtuelles. Pour gérer efficacement ces infrastructures virtualisées, de nouveaux gestionnaires logiciels ont été mis en place. Ces gestionnaires sont pour la plupart hautement centralisés (les tâches de gestion sont effectuées par un nombre restreint de nœuds dédiés). Cela limite leur capacité à passer à l’échelle, autrement dit à gérer de manière réactive des infrastructures de grande taille, qui sont de plus en plus courantes. Au cours de cette thèse, nous nous sommes intéressés aux façons d’améliorer cet aspect ; l’une d’entre elles consiste à décentraliser le traitement des tâches de gestion, lorsque cela s’avère judicieux. Notre réflexion s’est concentrée plus particulièrement sur l’ordonnancement dynamique des machines virtuelles, pour donner naissance à la proposition DVMS (Distributed Virtual Machine Scheduler). Nous avons mis en œuvre un prototype, que nous avons validé au travers de simulations (notamment via l’outil SimGrid), et d’expériences sur le banc de test Grid’5000. Nous avons pu constater que DVMS se montrait particulièrement réactif pour gérer des infrastructures virtualisées constituées de dizaines de milliers de machines virtuelles réparties sur des milliers de nœuds. Nous nous sommes ensuite penchés sur les perspectives d’extension et d’amélioration de DVMS. L’objectif est de disposer à terme d’un gestionnaire décentralisé complet, objectif qui devrait être atteint au travers de l’initiative Discovery qui fait suite à ces travaux.

Résumé / Abstract : The increasing need in computing power has been satisfied by federating more and more computers (called nodes) to build the so-called distributed infrastructures. Over the past few years, system virtualization has been introduced in these infrastructures (the software is decoupled from the hardware by packaging it in virtual machines), which has lead to the development of software managers in charge of operating these virtualized infrastructures. Most of these managers are highly centralized (management tasks are performed by a restricted set of dedicated nodes). As established, this restricts the scalability of managers, in other words their ability to be reactive to manage large-scale infrastructures, that are more and more common. During this Ph.D., we studied how to mitigate these concerns ; one solution is to decentralize the processing of management tasks, when appropriate. Our work focused in particular on the dynamic scheduling of virtual machines, resulting in the DVMS (Distributed Virtual Machine Scheduler) proposal. We implemented a prototype, that was validated by means of simulations (especially with the SimGrid tool) and with experiments on the Grid’5000 test bed. We observed that DVMS was very reactive to schedule tens of thousands of virtual machines distributed over thousands of nodes. We then took an interest in the perspectives to improve and extend DVMS. The final goal is to build a full decentralized manager. This goal should be reached by the Discovery initiative,that will leverage this work.