Étude de lignes d'intérêt naturelles pour la représentation d'objets en vision par ordinateur / Thi Thanh Hai Tran ; sous la direction de Augustin Lux et Hoang Lan Nguyen Thi

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Structures de données (informatique)

Lux, Augustin (19..-.... ; informaticien) (Directeur de thèse / thesis advisor)

Nguyen Thi, Hoang Lan (Directeur de thèse / thesis advisor)

Institut national polytechnique (Grenoble ; 1900-....) (Organisme de soutenance / degree-grantor)

Relation : Etude de lignes d'intérêt naturelles pour la représentation d'objets en vision par ordinateur / Thi Thanh Hai Tran / Villeurbanne : [CCSD] , 2007

Relation : Etude de lignes d'intérêt naturelles pour la représentation d'objets en vision par ordinateur / Thi Thanh Hai Tran ; sous la direction de Augustin Lux et Hoang Lan Nguyen Thi / Grenoble : Atelier national de reproduction des thèses , 2006

Résumé / Abstract : Nous étudions les "crêtes" en tant que lignes d'intérêt naturelles pour leur utilité en vision artificielle, notamment pour la représentation d'objets pour la reconnaissance; comme le suggère le vocable "ligne d'intérêt", notre objectif est de généraliser ou de compléter le concept de point d'intérêt utilisé dans de très nombreux travaux actuels. Nous donnons d'abord notre définition. Les points de crêtes sont les extrema directionels, dans l'espace d'échelle, de l'image filtrée. Nous utilisons un filtre de type Laplacien. Ces points discrets sont connectés pour former des lignes de crêtes. Les lignes de crêtes ainsi obtenues correspondent à l'axe central des formes, avec une information de largeur. Les crêtes, de par leur nature "ligne", sont très utiles pour représenter des formes allongées comme par exemple la silhouette d'un être humain ou une ligne de texte. Nous montrons l'utilisation des crêtes dans deux applications : la modélisation de personnes et la détection de textes. La silhouette d'un être humain est représentée par des crêtes significatives correspondant au torse et aux jambes. Cette représentation permet de caractériser la configuration de la personne en mouvement à chaque instant donné. Dans l'application à l'identification de textes, un texte est modélisé par des crêtes à deux échelles différentes: une crête longue à une échelle grande modélise une ligne de texte, des crêtes nombreuses et courtes à une petite échelle correspondent aux traits des caractères. Cette modélisation structurelle du texte est efficace pour plusieurs types d'écriture et de texte, et indépendante de la forme de la ligne.

Résumé / Abstract : We study "ridges" with respect to their use as natural interest lines for computer vision, and for their use in object representation. As suggested by the term "interest lines", we want to generalise and to complete the concept of interest points, intensively studied and used in current research. We define a ridge point as a local directional extremum of the filtered image in scale space; we are essentailly using a Laplacian filter. Individual ridge points are connected to construct ridge lines. Such ridge lines characterise shape as a central axis, and width information. Seing lines, rides are particularly useful to represent elongated shapes, as found in a human silhouette, or a line of written text. We develop two applications to show the usefulness of ridge lines:modeling human shape, and text detection. A human silhouette is represented by "significant" ridges, corresponding to the body and the legs. This representation allows an interpretation of the body configuration at each instant in an image sequence. ln the application to text identification, a piece of text is modeled by ridges at two different scales: a long ridge at high scale corresponds to a line, and a large number of short ridges a lower scale for the individual characters. This structural model for text applies successfully to different types of text, and allows different line geometries. The final chapter presents initial work on the use of ridges for hierarchical modeling of structured objects, and the resulting kind of matching algorithms.