gestion efficace de Big Data dans le contexte Spatial et RDF

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

University of Tlemcen

Abstract

Depuis l’apparition du modelé relationnel, les systèmes de gestion de données relationnelles ont dominé les autres systèmes en raison de la simplicité liée `a la représentation des données et de leur capacité `a répondre aux requetés d´déclaratives. Cependant, le modelé relationnel souffre de plusieurs limitations qui le rendent indésirable pour de nombreux cas d’utilisation. En effet, le modelé relationnel ne convient pas `a certains types de données comme les données graphes (souvent utilisées dans la manipulation des graphes de connaissances) et les données spatiales (souvent utilisées dans les systèmes d’information géographique). Cette limitation a conduit `a l’introduction de bases de données spatiales et les systèmes de stockage des triplets pour les données spatiales et les données graphes respectivement. Dans cette thèse, nous considérons les deux types de données : Graphe et Spatial. Cependant, nous nous concentrons davantage sur les données spatiales et les défis imposés par les données hybrides (contenant des objets provenant des deux représentations : spatiale et graphe). Le premier problème est le coût ´élevé de l’´évaluation des opérateurs spatiaux. Nous essayons d’améliorer les performances des opérateurs spatiaux sur de grands jeux de données spatiales stockées sur disque. Le deuxième problème abordé est le traitement des jeux de données hybrides, puisqu’ils donnent lieu `a plusieurs problèmes `a plusieurs niveaux tels que le stockage, l’indexation, l’interrogation et l’optimisation. Afin d’améliorer les performances des opérateurs spatiaux, nous proposons une nouvelle technique pour explorer les indexes spatiaux tout en minimisant le nombre d’opérations d’E/S vers/depuis le disque. Nous comparons l’approche proposée avec l’état de l’art en utilisant des jeux de données réels. En plus de, et afin de résoudre les problèmes engendrés par les données hybrides, nous proposons une extension (Spatial-Qdag) d’un triplestore existant (RDF QDAG) qui couvre plusieurs couches du système : stockage, évaluation et optimisation. Nous comparons l’extension spatiale (Spatial-Qdag) avec des triplestores commerciaux en utilisant des jeux de données réels. Les résultats des expérimentations menées démontrent une amélioration significative des performances des opérateurs spatiaux pour la plupart des requêtes en utilisant l’approche proposée. Ce qui signifie une supériorité de l’extension proposée (Spatial-Qdag) par rapport aux systèmes comparés.

Description

Citation

Collections