Planification multi-agents dans un cadre markovien : les jeux stochastiques à somme générale / Mohammed Amine Hamila ; sous la direction de René Mandiau et de Emmanuelle Grislin et de Abdel-Illah Mouaddib

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Analyse stochastique

Markov, Processus de

Théorie des jeux

Mandiau, René (1965-....) (Directeur de thèse / thesis advisor)

Grislin, Emmanuelle (1968-....) (Directeur de thèse / thesis advisor)

Mouaddib, Abdel-Illah (1964-.... ; enseignant-chercheur en informatique) (Directeur de thèse / thesis advisor)

Marquis, Pierre (19..-.... ; informaticien) (Président du jury de soutenance / praeses)

Charpillet, François (19..-....) (Rapporteur de la thèse / thesis reporter)

El Fallah Seghrouchni, Amal (19..-....) (Rapporteur de la thèse / thesis reporter)

Alami, Rachid (1954-....) (Membre du jury / opponent)

Koukam, Abder (Membre du jury / opponent)

Université de Valenciennes et du Hainaut-Cambrésis (Valenciennes, Nord ; 1970-2019) (Organisme de soutenance / degree-grantor)

École doctorale Sciences pour l'ingénieur (Lille ; 1992-2021) (Ecole doctorale associée à la thèse / doctoral school)

Laboratoire d'automatique, de mécanique et d'informatique industrielles et humaines (Valenciennes, Nord ; 1994-...) (Laboratoire associé à la thèse / thesis associated laboratory)

Communauté d'universités et d'établissements Lille Nord de France (2009-2013) (Autre partenaire associé à la thèse / thesis associated third party)

Résumé / Abstract : Planifier les actions d’un agent dans un environnement dynamique et incertain, a été largement étudié et le cadre des processus décisionnels de Markov offre les outils permettant de modéliser et de résoudre de tels problèmes. Le domaine de la théorie des jeux, a permis l’étude des interactions stratégiques entre plusieurs agents pour un jeu donné. Le cadre des jeux stochastiques, est considéré comme une généralisation du domaine des processus décisionnels de Markov et du champ de la théorie des jeux et permet de modéliser des systèmes ayant plusieurs agents et plusieurs états. Cependant, planifier dans unsystème multi-agents est considéré comme difficile, car la politique d’actions de l’agent dépend non seulement de ses choix mais aussi des politiques des autres agents. Le travail que nous présentons dans cette thèse porte sur la prise de décision distribuée dans les systèmes multi-agents. Les travaux existants dans le domaine, permettent la résolution théorique des jeux stochastiques mais imposent de fortes restrictions et font abstraction de certains problèmes cruciaux du modèle. Nous proposons un algorithme de planification décentralisée pour le modèle des jeux stochastiques, d’une part basé sur l’algorithme Value-Iteration et d’autre part basé sur la notion d’équilibre issue de la résolution des jeux matriciels. Afin d’améliorer le processus de résolution et de traiter des problèmes de taille importante, nous recherchons à faciliter la prise de décision et à limiter les possibilités d’actions à chaque étape d’interaction. L’algorithme que nous avonsproposé, a été validé sur un exemple d’interaction incluant plusieurs agents et différentes expérimentations ont été menées afin d’évaluer la qualité de la solution obtenue.

Résumé / Abstract : Planning agent’s actions in a dynamic and uncertain environment has been extensively studied. The framework of Markov decision process provides tools to model and solve such problems. The field of game theory has allowed the study of strategic interactions between multiple agents for a given game. The framework of stochastic games is considered as a generalization of the fields of Markov decision process and game theory. It allows to model systems with multiple agents and multiple states. However, planning in a multi-agent system is considered difficult : agent’s decisions depend not only on its actions but also on actions of the other agents. The work presented in this thesis focuses on decision making in distributed multi-agent systems. Existing works in this field allow the theoretical resolution of stochastic games but place severe restrictions and ignore some crucial problems of the model. We propose a decentralized planning algorithm for the model of stochastic games. Our proposal is based on the Value-Iteration algorithm and on the concept of Nash equilibrium. To improve the resolution process and to deal with large problems, we sought to ease decision making and limit the set of joint actions at each stage. The proposed algorithm was validated on a coordination problem including several agents and various experiments were conducted to assess the quality of the resulting solution.