Contributions à la description locale des contenus visuels / Bruno Lameyre ; directeur de thèse Michel Crucianu

Date : 2010

Editeur / Publisher : [S.l.] : [s.n.] , 2010

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Vidéo

Classification Dewey : 384.558

Lameyre, Bruno (1957-...) (Auteur / author)

Crucianu, Michel (19..-.... ; chercheur en informatique) (Directeur de thèse / thesis advisor)

Conservatoire national des arts et métiers (France ; 1794-....) (Organisme de soutenance / degree-grantor)

Relation : Contributions à la description locale des contenus visuels / Bruno Lameyre ; sous la direction de Michel Crucianu / Lille : Atelier national de reproduction des thèses , 2010

Résumé / Abstract : This thesis is dedicated to the study of methods of recognition and tracking of objects in still images and videos sequences. We relied on low-level description methods by extracting feature points, known for their robustness in heterogeneous visual scenes. The first part of this thesis, which is our first contribution, is dedicated to a synthesis of techniques of local description. The second part is dedicated to three propositions for developing local approaches used to describe visual content. In particular, the second contribution refers to the precise modeling of the variability of image descriptors. This model improves the quality of matches between image descriptors, whilst providing the opportunity to constrain the degree of invariance. The approach we developed in our third contribution significantly improves the recognition rate of objects in video sequences, whilst minimizing the rate of false. It exploits the combined use of local features and more global descriptors, without the necessity for a costly and uncertain preparatory step of segmentation of the image. Our final contribution is an intermediate description of the neighborhood of a point (bigger than local but smaller than global). The aim of these description is threefold: the first is to minimize ambiguity when matching descriptors and the two others are a direct consequence of its compactness: firstly, it allows us to implement a first-level adaptive filter in collaboration with a local descriptor more classic but more time-consuming and secondly, it allows us to load in, the main memory, up to 50 times more vectors than you could do with conventional local descriptors.

Résumé / Abstract : Cette thèse est consacrée à l'étude de méthodes de reconnaissance et de suivi d'objets dans les images fixes et animées. Nous nous sommes appuyés sur les techniques bas-niveau de description locale par extraction de points d'intérêt, connues pour leur robustesse aux contenus visuels hétérogènes. La première partie est consacrée à une synthèse des techniques de description locale. La seconde partie est dédiée à trois contributions visant l'enrichissement des approches de description locale des contenus visuels. En particulier, la deuxième contribution concerne la modélisation fine de la variabilité des descripteurs d'images. Cette modélisation permet d'améliorer la qualité de la mise en correspondances, tout en donnant la possibilité d'en contraindre le degré d'invariance. Notre troisième contribution améliore significativement le taux de reconnaissance des objets dans les séquences vidéo, tout en minimisant le taux de faux positifs. Elle exploite l'utilisation conjointe de descripteurs locaux classiques avec celle de descripteurs plus globaux, sans pour autant nécessiter une étape coûteuse et incertaine de segmentation préalable de l'image. Notre dernière contribution est une approche de description intermédiaire, dite semi-locale compacte, qui consiste à étudier l'environnement semi-local du point. Le caractère semi-local de cette description permet d'une part, de mettre en place un filtre adaptatif de premier niveau en collaboration avec un descripteur local plus efficace mais plus coûteux en temps de calcul et d'autre part, de charger, en mémoire centrale, jusqu'à 50 fois plus