Metric learning for structured data / Jiajun Pan ; sous la direction de Philippe Leray et de Hoël Le Capitaine

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Algorithmes

Leray, Philippe (informaticien) (Directeur de thèse / thesis advisor)

Le Capitaine, Hoël (1982-....) (Directeur de thèse / thesis advisor)

La Higuera, Colin de (19..-....) (Président du jury de soutenance / praeses)

Habrard, Amaury (1978-....) (Rapporteur de la thèse / thesis reporter)

Lesot, Marie-Jeanne (1978-....) (Rapporteur de la thèse / thesis reporter)

Capponi, Cécile (19..-.... ; chercheuse en apprentissage automatique) (Membre du jury / opponent)

Université de Nantes (1962-2021) (Organisme de soutenance / degree-grantor)

École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) (Ecole doctorale associée à la thèse / doctoral school)

Université Bretagne Loire (Autre partenaire associé à la thèse / thesis associated third party)

Laboratoire des Sciences du Numérique de Nantes (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : L’apprentissage à distance métrique est une branche de l’apprentissage par re-présentation des algorithmes d’apprentissage automatique. Nous résumons le développement et la situation actuelle de l’algorithme actuel d’apprentissage à distance métrique à partir des aspects de la base de données plate et de la base de données non plate. Pour une série d’algorithmes basés sur la distance de Mahalanobis pour la base de données plate qui ne parvient pas à exploiter l’intersection de trois dimensions ou plus, nous proposons un algorithme d’apprentissage métrique basé sur la fonction sousmodulaire. Pour le manque d’algorithmes d’apprentissage métrique pour les bases de données relationnelles dans des bases de données non plates, nous proposons LSCS (sélection de contraintes relationnelles de force relationnelle) pour la sélection de contraintes pour des algorithmes d’apprentissage métrique avec informations parallèles et MRML (Multi-Relation d’apprentissage métrique) qui somme la perte des contraintes relationnelles et les contraintes d’etiquetage. Grâce aux expériences de conception et à la vérification sur la base de données réelle, les algorithmes proposés sont meilleurs que les algorithmes actuels.

Résumé / Abstract : Metric distance learning is a branch of re-presentation learning in machine learning algorithms. We summarize the development and current situation of the current metric distance learning algorithm from the aspects of the flat database and nonflat database. For a series of algorithms based on Mahalanobis distance for the flat database that fails to make full use of the intersection of three or more dimensions, we propose a metric learning algorithm based on the submodular function. For the lack of metric learning algorithms for relational databases in non-flat databases, we propose LSCS(Relational Link-strength Constraints Selection) for selecting constraints for metric learning algorithms with side information and MRML (Multi-Relation Metric Learning) which sums the loss from relationship constraints and label constraints. Through the design experiments and verification on the real database, the proposed algorithms are better than the current algorithms.