Learning preferences with multiple-criteria models / Olivier Sobrie ; sous la direction de Vincent Mousseau et de Marc Pirlot et de Philippe Fortemps

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Apprentissage

Décision multicritère

Prise de décision

Systèmes d'aide à la décision

Mousseau, Vincent (19..-....) (Directeur de thèse / thesis advisor)

Pirlot, Marc (Directeur de thèse / thesis advisor)

Fortemps, Philippe (Directeur de thèse / thesis advisor)

Mahmoudi, Saïd (1974-...) (Président du jury de soutenance / praeses)

De Smet, Yves (Rapporteur de la thèse / thesis reporter)

Labreuche, Christophe (19..-....) (Rapporteur de la thèse / thesis reporter)

Gillis, Nicolas (19..-....) (Membre du jury / opponent)

Ouerdane, Wassila (1980-…) (Membre du jury / opponent)

Université Paris-Saclay (2015-2019) (Organisme de soutenance / degree-grantor)

Université de Mons (Organisme de cotutelle / degree co-grantor)

École doctorale Interfaces : matériaux, systèmes, usages (Palaiseau, Essonne ; 2015-....) (Ecole doctorale associée à la thèse / doctoral school)

CentraleSupélec (2015-....) (Autre partenaire associé à la thèse / thesis associated third party)

Laboratoire génie industriel (Gif-sur-Yvette, Essonne) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : L’aide multicritère à la décision (AMCD) vise à faciliter et améliorer la qualité du processus de prise de décision. Les méthodes d’AMCD permettent de traiter les problèmes de choix, rangement et classification. Ces méthodes impliquent généralement la construction d’un modèle. Déterminer les valeurs des paramètres de ces modèles n’est pas aisé. Les méthodes d’apprentissage indirectes permettent de simplifier cette tâche en apprenant les paramètres du modèle de décision à partir de jugements émis par un décideur tels que “l’alternative a est préférée à l’alternative b” ou “l’alternative a doit être classifiée dans la meilleure catégorie”. Les informations données par le décideur sont généralement parcimonieuses. Le modèle d’AMCD est appris au cours d’un processus interactif entre le décideur et l’analyste. L’analyste aide le décideur à formuler et revoir ses jugements si nécessaire. Le processus s’arrête une fois qu’un modèle satisfaisant les préférences du décideur a été trouvé. Le “preference learning” (PL) est un sous domaine du “machine learning” qui s’intéresse à l’apprentissage des préférences. Les algorithmes de ce domaine sont capables de traiter de grands jeux de données et sont validés au moyen de jeux de données artificiels et réels. Les jeux de données traités en PL sont généralement collectés de différentes sources et sont entachés de bruit.Contrairement à l’AMCD, il existe peu ou pas d’interaction avec l’utilisateur en PL. Le jeu de données fourni en entrée à l’algorithme est considéré comme un échantillon éventuellement bruité d’une “réalité” ou “vérité de terrain”. Les algorithmes utilisés dans ce domaine ont des propriétés statistiques fortes leur permettant de s’affranchir du bruit dans ces jeux de données. Dans cette thèse, nous développons des algorithmes d’apprentissage permettant d’apprendre lesparamètres de modèles d’AMCD. Plus précisément, nous développons une métaheuristique afin d’apprendre les paramètres d’un modèle appelé MR-Sort (“majority rule sorting”). Cette métaheuristique est testée sur des jeux de donnéesartificiels et réels utilisés dans le domaine du PL. Nous utilisons cet algorithme afin de traiter un problème concret dans le domaine médical. Ensuite nous modifions la métaheuristique afin d’apprendre les paramètres d’un modèle plus expressif appelé NCS (“non-compensatory sorting”). Finalement, nous développons un nouveau type de règle de veto pour les modèles MR-Sort et NCS qui permet de prendre les coalitions de critères en compte. La dernière partie de la thèse introduit les méthodes d’optimisation semi-définie positive (SDP) dans le contexte de l’aide multicritère à la décision. Précisément, nous utilisons l’optimisation SDP afin d’apprendre les paramètres d’un modèle de fonction de valeur additive.

Résumé / Abstract : Multiple-criteria decision analysis (MCDA) aims at providing support in order to make a decision. MCDA methods allow to handle choice, ranking and sorting problems. These methods usually involve the elicitation of models. Eliciting the parameters of these models is not trivial. Indirect elicitation methods simplify this task by learning the parameters of the decision model from preference statements issued by the decision maker (DM) such as “alternative a is preferred to alternative b” or “alternative a should be classified in the best category”. The information provided by the decision maker are usually parsimonious. The MCDA model is learned through an interactive process between the DM and the decision analyst. The analyst helps the DM to modify and revise his/her statements if needed. The process ends once a model satisfying the preferences of the DM is found. Preference learning (PL) is a subfield of machine learning which focuses on the elicitation of preferences. Algorithms in this subfield are able to deal with large data sets and are validated withartificial and real data sets. Data sets used in PL are usually collected from different sources and aresubject to noise. Unlike in MCDA, there is little or no interaction with the user in PL. The input data set is considered as a noisy sample of a “ground truth”. Algorithms used in this field have strong statistical properties that allow them to filter noise in the data sets.In this thesis, we develop learning algorithms to infer the parameters of MCDA models. Precisely, we develop a metaheuristic designed for learning the parameters of a MCDA sorting model called majority rule sorting (MR-Sort) model. This metaheuristic is assessed with artificial and real data sets issued from the PL field. We use the algorithm to deal with a real application in the medical domain. Then we modify the metaheuristic to learn the parameters of a more expressive model called the non-compensatory sorting (NCS) model. After that, we develop a new type of veto rule for MR-Sort and NCS models which allows to take criteria coalitions into account. The last part of the thesis introduces semidefinite programming (SDP) in the context of multiple-criteria decision analysis. We use SDP to learn the parameters of an additive value function model.