Leveraging User-Generated Content for Enhancing and Personalizing News Recommendation. / Youssef Meguebli ; sous la direction de Bich-Liên Doan

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Catalogue Worldcat

Portails Internet

Classification Dewey : 378.242

Doan, Bich-Liên (1970-....) (Directeur de thèse / thesis advisor)

Sabouret, Nicolas (1976-.... ; chercheur en informatique) (Président du jury de soutenance / praeses)

Boughanem, Mohand (1964-.... ; enseignant-chercheur en informatique) (Rapporteur de la thèse / thesis reporter)

Boyer, Anne (19..-.... ; chercheuse en informatique) (Rapporteur de la thèse / thesis reporter)

Kacimi , Mouna (Membre du jury / opponent)

Mothe, Josiane (19..-.... ; enseignante-chercheuse en informatique) (Membre du jury / opponent)

Piworwarski, Benjamin (1973-....) (Membre du jury / opponent)

Popineau, Fabrice (Membre du jury / opponent)

CentraleSupélec (2015-....) (Organisme de soutenance / degree-grantor)

Ecole doctorale Sciences et Technologies de l'Information, des Télécommunications et des Systèmes (Orsay, Essonne ; 2000-2015) (Ecole doctorale associée à la thèse / doctoral school)

Laboratoire de recherche en informatique (Orsay, Essonne ; 1998-2020) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : La motivation principale de cette thèse est de proposer un système de recommandation personnalisé pour les plateformes d’informations. Pour cela, nous avons démontré que les opinions peuvent constituer un descripteur efficace pour améliorer la qualité de la recommandation. Au cours de cette thèse, nous avons abordé ce problème en proposant trois contributions principales. Tout d’abord, nous avons proposé un modèle de profil qui décrit avec précision les intérêts des utilisateurs ainsi que le contenu des articles de presse. Le modèle de profil proposé repose sur trois éléments : les entités nommées, les aspects et les sentiments. Nous avons testé notre modèle de profil sur les trois applications différentes que sont l’identification des orientations politiques des utilisateurs, la recommandation personnalisée des articles de presse et enfin la diversification de la liste des articles recommandés. Deuxièmement, nous avons proposé une approche de classement des opinions permettant de filtrer et sélectionner seulement les opinions pertinentes. Pour cela, nous avons utilisé une variation de la technique de PageRank pour définir le score de chaque opinion. Les résultats montrent que notre approche surpasse deux approches récemment proposées pour le classement des opinions. Troisièmement, nous avons étudié différentes façons d’enrichir le contenu des articles de presse par les opinions : par toutes les opinions, par seulement le topk des opinions, et enfin par un ensemble d’opinions diversifiées. Les résultats montrent que l’enrichissement des contenus des articles de presse

Résumé / Abstract : In this thesis, we have investigated how to exploit user-generated-content for personalized news recommendation purpose. The intuition behind this line of research is that the opinions provided by users, on news websites, represent a strong indicator about their profiles. We have addressed this problem by proposing three main contributions. Firstly, we have proposed a profile model that accurately describes both users’ interests and news article contents. The profile model was tested on three different applications ranging from identifying the political orientation of users to the context of news recommendation and the diversification of the list of recommended news articles. Results show that our profile model give much better results compared to state-of-the-art models. Secondly, we have investigated the problem of noise on opinions and how we can retrieve only relevant opinions in response to a given query.The proposed opinion ranking strategy is based on users’ debates features. We have used a variation of PageRank technique to define the score of each opinion. Results show that our approach outperforms two recent proposed opinions ranking strategies, particularly for controversial topics. Thirdly, we have investigated different ways of leveraging opinions on news article contents including all opinions, topk opinions based on opinion ranking strategy, and a set of diverse opinion. To extract a list of diverse opinions, we have employed a variation of an existing opinion diversification model. Results show that diverse opinions give the best performance over other leveraging strategies.