Définition de résumés et incertitude dans les grandes bases de données / Georges Hébrail ; [sous la direction d'] Erol Gelenbe

Date :

Editeur / Publisher : [S.l.] : [s.n.] , 1987

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Bases de données

Analyse des données

Probabilités

Abiteboul, Serge (1953-....) (Membre du jury / opponent)

Gelenbe, Erol (1945-....) (Président du jury de soutenance / praeses)

Caseau, Paul (1935-2009) (Membre du jury / opponent)

Jomier, Geneviève (19..-2018) (Membre du jury / opponent)

Spyratos, Nicolas (19..-....) (Membre du jury / opponent)

Cellary, Wojciech (Rapporteur de la thèse / thesis reporter)

Léonard, Michel (1949-.... ; informaticien) (Rapporteur de la thèse / thesis reporter)

Université Paris-Sud (1970-2019) (Organisme de soutenance / degree-grantor)

Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne) (Autre partenaire associé à la thèse / thesis associated third party)

Relation : Définition de résumés et incertitude dans les grandes bases de données / Georges Hébrail ; [sous la direction d'] Erol Gelenbe / Grenoble : Atelier national de reproduction des thèses , 1987

Résumé / Abstract : Deux problèmes en apparence distincts sont abordés dans cette étude : la construction de résumés d'une base de données et la modélisation des erreurs contenues dans une base de données. Un modèle permettant de construire des résumés d'une base de données est proposé. Ces résumés sont stockés physiquement dans la base et maintenus à jour automatiquement et à faible coût eu cours de l'évolution du contenu de la base. Ils permettent alors d'interroger la base de données à un niveau synthétique avec un temps de réponse indépendant de la taille de la base. Il est montré que ces résumés trouvent de multiples applications dans le domaine des bases de données interrogation de la base à un niveau synthétique, optimisation des requêtes, confidentialité des données, vérification de contraintes d'intégrité, bases de données distribuées. Un modèle de représentation des erreurs contenues dans une base de données est ensuite proposé. Ce modèle, basé sur une approche probabiliste, permet d'évaluer l'impact des erreurs contenues dans la base sur le résultat es requêtes qui lui sont adressées. Les liens entre ces deux problèmes sont mis en évidence : une même notion est utilisée pour définir les résumés et l'incertitude, et la construction de résumés particuliers est nécessaire pour évaluer l'impact des erreurs sur le résultat d'une requête. L'étude est indépendante du modèle de données utilisé (relationnel, réseau, hiérarchique). Une application des résultats de cette étude dans le cadre du modèle relationnel est cependant présentée. Le domaine privilégié d'application des résultats de cette étude est celui des bases de données contenant un volume important de données.

Résumé / Abstract : Two apparently different problems are addressed in this study: building summaries of a database and modelling errors contained in a database. A model of summaries of a database is proposed. The summaries are physically stored in the database as redundant data and automatically updated when changes occur in the database. The cost of the summaries update is shown to be low. lt is then possible to extract synthetic information from the database with a response time which is independent of the size of the database. The multiple applications of summaries in a database are also presented: extraction of synthetic information, query optimisation, data security, check of integrity constraints, distributed databases. A model of representation of errors contained in a database is then proposed. The model, based on a probabilistic approach, leads to a computation of the effect of errors on the result of database queries. The links which exist between these two problems are pointed out: a single concept is used both for the definition of the summaries and for the representation of errors, and particular summaries are required to compute the error associated to a query. The study is independent of the data model (relational, network, hierarchical). The results of the study are nevertheless applied to the relational model. The best area for application of the developped concepts is the area of very large databases.