Extension du modèle multidimensionnel aux faits qualitatifs. Application à l'analyse en ligne des gênes des chantiers urbains / Fatiha Amanzougarene ; sous la direction de Pr Karine Zeitouni et Dr Mohamed Chachoua

Date :

Editeur / Publisher : [S.l.] : [s.n.] , 2014

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Entrepôts de données

OLAP (informatique)

Analyse multivariée

Programmation par contraintes

Bennis-Zeitouni, Karine (1964-.... ; enseignant-chercheur en informatique) (Directeur de thèse / thesis advisor)

Chachoua, Mohamed (Directeur de thèse / thesis advisor)

Laurent, Anne (1976-.... ; enseignante-chercheuse en informatique) (Président du jury de soutenance / praeses)

Hacid, Mohand Saïd (1963-...) (Rapporteur de la thèse / thesis reporter)

Quafafou, Mohamed (1956-....) (Rapporteur de la thèse / thesis reporter)

Université de Versailles-Saint-Quentin-en-Yvelines (1991-....) (Organisme de soutenance / degree-grantor)

Laboratoire Parallélisme, Réseaux, Systèmes, Modélisation (PRISM) (Equipe de recherche associée à la thèse / thesis associated research team)

Ecole doctorale sciences et technologies de Versailles (2010-2015) (Ecole doctorale associée à la thèse / doctoral school)

Relation : Extension du modèle multidimensionnel aux faits qualitatifs. Application à l'analyse en ligne des gênes des chantiers urbains / Fatiha Amanzougarene ; sous la direction de Pr Karine Zeitouni et Dr Mohamed Chachoua / Lille : Atelier national de reproduction des thèses , 2014

Résumé / Abstract : Les entrepôts de données et les systèmes OLAP constituent les principaux éléments d’un système d’information décisionnel. Ces dernières années, plusieurs travaux ont été menés, afin d’étendre les concepts des entrepôts de données classiques pour traiter de nouveaux types de données, dites complexes (texte, multimédia, géographique, etc.). Dans cette thèse, nous nous sommes intéressés à la problématique de l’intégration de l’information qualitative dans l’analyse multidimensionnelle. Nos travaux sont guidés par une étude de cas sur les gênes des chantiers urbains. Après avoir défini la notion de gêne et déterminé les différents facteurs qui interviennent dans son évaluation, nous avons mis en évidence le besoin d'un modèle de représentation qualitative s’appuyant sur des règles et des connaissances expertes. Or, l'analyse multidimensionnelle dans les entrepôts de données traditionnels ne considère que des mesures quantitatives. Notre principale contribution est donc d'étendre le modèle multidimensionnel aux mesures qualitatives exprimées sous forme de termes linguistiques. Partant du constat que les connaissances expertes sont parfois incomplètes, notre deuxième contribution est de proposer une méthode originale de reconstruction de données manquantes dans le contexte des entrepôts de données. Ce modèle consiste à combiner la technique des k-plus proches voisins (KPPV) avec la programmation par contraintes pour assurer une meilleure prédiction des valeurs manquantes dans une table de faits d’un entrepôt de données classique ou qualitatif

Résumé / Abstract : Data warehouses and OLAP systems constitute the main elements of decision support systems. In recent years, several studies have been conducted in order to extend the capabilities of conventional data warehouse to handle complex data types (e.g., text, multimedia, geographic, etc.) In this thesis, we focused on the integration problem of qualitative information in multidimensional analysis. Our work are guided by a case study on urban building sites annoyances. After defining the notion of annoyance and determined the factors involved in its evaluation, we highlighted the need for a qualitative representation model based on rules and expert knowledge. However, conventional multidimensional data models only consider quantitative measures. Therefore, our main contribution is to extend the multidimensional model to treat qualitative measures expressed as linguistic terms . Considering that expert knowledge are sometimes incomplete, our second contribution is to propose an original model for missing data reconstruction in the context of data warehouses. This model consists in combining the constraint programming and a technique of machine learning, namely the k-nearest neighbor algorithm. In addition to its application in classical data warehouses, our model adapts to qualitative data warehouses, as in the annoyances analysis of urban building sites