Descripteurs augmentés basés sur l'information sémantique contextuelle / Samir Khoualed ; sous la direction de Thierry Chateau

Date : 2012

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Vision par ordinateur

Imagerie tridimensionnelle

Khoualed, Samir (1973-....) (Auteur / author)

Chateau, Thierry (19..-.... ; chercheur en robotique) (Directeur de thèse / thesis advisor)

Dhome, Michel (Président du jury de soutenance / praeses)

Miguet, Serge (19..-.... ; informaticien) (Rapporteur de la thèse / thesis reporter)

Cristani, Marco (19..-....) (Rapporteur de la thèse / thesis reporter)

Castellani, Umberto (Membre du jury / opponent)

Chausse, Frédéric (Membre du jury / opponent)

Université Blaise Pascal (Clermont-Ferrand ; 1976-2016) (Organisme de soutenance / degree-grantor)

École doctorale des sciences pour l'ingénieur (Clermont-Ferrand) (Ecole doctorale associée à la thèse / doctoral school)

Institut Pascal (Aubière, Puy-de-Dôme) (Equipe de recherche associée à la thèse / thesis associated research team)

Accès en ligne / online access

Résumé / Abstract : Les techniques de description des éléments caractéristiques d’une image sont omniprésentes dans de nombreuses applications de vision par ordinateur. Nous proposons à travers ce manuscrit une extension, pour décrire (représenter) et apparier les éléments caractéristiques des images. L’extension proposée consiste en une approche originale pour apprendre, ou estimer, la présence sémantique des éléments caractéristiques locaux dans les images. L’information sémantique obtenue est ensuite exploitée, en conjonction avec le paradigme de sac-de-mots, pour construire un descripteur d’image performant. Le descripteur résultant, est la combinaison de deux types d’informations, locale et contextuelle-sémantique. L’approche proposée peut être généralisée et adaptée à n’importe quel descripteur local d’image, pour améliorer fortement ses performances spécialement quand l’image est soumise à des conditions d’imagerie contraintes. La performance de l’approche proposée est évaluée avec des images réelles aussi bien dans les deux domaines, 2D que 3D. Nous avons abordé dans le domaine 2D, un problème lié à l’appariement des éléments caractéristiques dans des images. Dans le domaine 3D, nous avons résolu les problèmes d’appariement et alignement des vues partielles tridimensionnelles. Les résultats obtenus ont montré qu’avec notre approche, les performances sont nettement meilleures par rapport aux autres méthodes existantes.

Résumé / Abstract : This manuscript presents an extension of feature description and matching strategies by proposing an original approach to learn the semantic information of local features. This semantic is then exploited, in conjunction with the bag-of-words paradigm, to build a powerful feature descriptor. The approach, ended up by combining local and context information into a single descriptor, is also a generalized method for improving the performance of the local features, in terms of distinctiveness and robustness under geometric image transformations and imaging conditions. The performance of the proposed approach is evaluated on real world data sets as well as in both the 2D and 3D domains. The 2D domain application addresses the problem of image feature matching while in 3D domain, we resolve the issue of matching and alignment of multiple range images. The evaluation results showed our approach performs significantly better than expected results as well as in comparison with other methods.