On the efficient distributed evaluation of SPARQL queries / Damien Graux ; sous la direction de Nabil Layaida et de Pierre Genevès

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Catalogue Worldcat

Informatique

Web sémantique

SPARQL (langage de programmation)

Classification Dewey : 004

Layaida, Nabil (Directeur de thèse / thesis advisor)

Genevès, Pierre (1980-....) (Directeur de thèse / thesis advisor)

Euzenat, Jérôme (19..-....) (Président du jury de soutenance / praeses)

Valduriez, Patrick (Rapporteur de la thèse / thesis reporter)

Hacid, Mohand Saïd (1963-...) (Rapporteur de la thèse / thesis reporter)

Toumani, Farouk (Membre du jury / opponent)

Communauté d'universités et d'établissements Université Grenoble Alpes (Organisme de soutenance / degree-grantor)

École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble) (Ecole doctorale associée à la thèse / doctoral school)

Institut national de recherche en informatique et en automatique (France). Centre de recherche (Grenoble-Rhône-Alpes) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Le Web Sémantique est une extension du Web standardisée par le World Wide Web Consortium. Les différents standards utilisent comme format de base pour les données le Resource Description Framework (rdf) et son langage de requêtes nommé sparql. Plus généralement, le Web Sémantique tend à orienter l’évolution du Web pour permettre de trouver et de traiter l’information plus facilement. L'augmentation des volumes de données rdf disponibles tend à faire rendre standard la distribution des jeux de données. Par conséquent, des évaluateurs de requêtes sparql efficaces et distribués sont de plus en plus nécessaires. Pour faire face à ces challenges, nous avons commencé par comparer plusieurs évaluateurs sparql distribués de l'état-de-l'art tout en adaptant le jeu de métriques considéré. Ensuite, une analyse guidée par des cas typiques d'utilisation nous a conduit à définir de nouveaux champs de développement dans le domaine de l'évaluation distribuée de sparql. Sur la base de ces nouvelles perspectives, nous avons développé plusieurs évaluateurs efficaces pour ces différents cas d'utilisation que nous avons comparé expérimentalement.

Résumé / Abstract : The Semantic Web standardized by the World Wide Web Consortium aims at providing a common framework that allows data to be shared and analyzed across applications. Thereby, it introduced as common base for data the Resource Description Framework (rdf) and its query language sparql.Because of the increasing amounts of rdf data available, dataset distribution across clusters is poised to become a standard storage method. As a consequence, efficient and distributed sparql evaluators are needed.To tackle these needs, we first benchmark several state-of-the-art distributed sparql evaluators while adapting the considered set of metrics to a distributed context such as e.g. network traffic. Then, an analysis driven by typical use cases leads us to define new development areas in the field of distributed sparql evaluation. On the basis of these fresh perspectives, we design several efficient distributed sparql evaluators which fit into each of these use cases and whose performances are validated compared with the already benchmarked evaluators. For instance, our distributed sparql evaluator named sparqlgx offers efficient time performances while being resilient to the loss of nodes.