Big Graph Processing : Partitioning and Aggregated Querying / Ghizlane Echbarthi ; sous la direction de Hamamache Kheddouci

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Données massives

Partitionnement de graphes

Bases de données -- Interrogation

Classification Dewey : 004

Kheddouci, Hamamache (Directeur de thèse / thesis advisor)

Boughanem, Mohand (1964-.... ; enseignant-chercheur en informatique) (Président du jury de soutenance / praeses)

Bennis-Zeitouni, Karine (1964-.... ; enseignant-chercheur en informatique) (Rapporteur de la thèse / thesis reporter)

Couturier, Raphaël (Rapporteur de la thèse / thesis reporter)

Bonifati, Angela (Membre du jury / opponent)

Université de Lyon (2015-....) (Organisme de soutenance / degree-grantor)

École doctorale en Informatique et Mathématiques de Lyon (Ecole doctorale associée à la thèse / doctoral school)

Université Claude Bernard (Lyon) (Autre partenaire associé à la thèse / thesis associated third party)

LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information (Rhône) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Avec l'avènement du « big data », de nombreuses répercussions ont eu lieu dans tous les domaines de la technologie de l'information, préconisant des solutions innovantes remportant le meilleur compromis entre coûts et précision. En théorie des graphes, où les graphes constituent un support de modélisation puissant qui permet de formaliser des problèmes allant des plus simples aux plus complexes, la recherche pour des problèmes NP-complet ou NP-difficils se tourne plutôt vers des solutions approchées, mettant ainsi en avant les algorithmes d'approximations et les heuristiques alors que les solutions exactes deviennent extrêmement coûteuses et impossible d'utilisation.Nous abordons dans cette thèse deux problématiques principales: dans un premier temps, le problème du partitionnement des graphes est abordé d'une perspective « big data », où les graphes massifs sont partitionnés en streaming. Nous étudions et proposons plusieurs modèles de partitionnement en streaming et nous évaluons leurs performances autant sur le plan théorique qu'empirique. Dans un second temps, nous nous intéressons au requêtage des graphes distribués/partitionnés. Dans ce cadre, nous étudions la problématique de la « recherche agrégative dans les graphes » qui a pour but de répondre à des requêtes interrogeant plusieurs fragments de graphes et qui se charge de la reconstruction de la réponse finale tel que l'on obtient un « matching approché » avec la requête initiale

Résumé / Abstract : With the advent of the "big data", many repercussions have taken place in all fields of information technology, advocating innovative solutions with the best compromise between cost and accuracy. In graph theory, where graphs provide a powerful modeling support for formalizing problems ranging from the simplest to the most complex, the search for NP-complete or NP-difficult problems is rather directed towards approximate solutions, thus Forward approximation algorithms and heuristics while exact solutions become extremely expensive and impossible to use. In this thesis we discuss two main problems: first, the problem of partitioning graphs is approached from a perspective big data, where massive graphs are partitioned in streaming. We study and propose several models of streaming partitioning and we evaluate their performances both theoretically and empirically. In a second step, we are interested in querying distributed / partitioned graphs. In this context, we study the problem of aggregative search in graphs, which aims to answer queries that interrogate several fragments of graphs and which is responsible for reconstructing the final response such that a Matching approached with the initial query