Contribution to study and implementation of a bio-inspired perception system based on visual and auditory attention / Jingyu Wang ; sous la direction de Kurosh Madani

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Apprentissage supervisé (intelligence artificielle)

Intelligence artificielle

Vision artificielle (robotique)

Saillance visuelle

Perception auditive

Madani, Kurosh (19..-....) (Directeur de thèse / thesis advisor)

Li, Xuelong (Président du jury de soutenance / praeses)

Rossi-Tison, Lucile (1970-....) (Rapporteur de la thèse / thesis reporter)

Gao, Xinbo (Rapporteur de la thèse / thesis reporter)

Zhang, Ke (Membre du jury / opponent)

Sabourin, Christophe (Membre du jury / opponent)

Université Paris-Est (2007-2015) (Organisme de soutenance / degree-grantor)

Northwestern Polytechnical University (Chine) (Organisme de cotutelle / degree co-grantor)

École doctorale Mathématiques, Sciences et Technologies de l'Information et de la Communication (Champs-sur-Marne, Seine-et-Marne ; 2010-2015) (Ecole doctorale associée à la thèse / doctoral school)

Laboratoire Images, Signaux et Systèmes Intelligents (Créteil) (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : L'objectif principal de cette thèse porte sur la conception d'un système de perception artificiel permettant d'identifier des scènes ou évènements pertinents dans des environnements complexes. Les travaux réalisés ont permis d'étudier et de mettre en œuvre d'un système de perception bio-inspiré basé sur l'attention visuelle et auditive. Les principales contributions de cette thèse concernent la saillance auditive associée à une identification des sons et bruits environnementaux ainsi que la saillance visuelle associée à une reconnaissance d'objets pertinents. La saillance du signal sonore est calculée en fusionnant des informations extraites des représentations temporelles et spectrales du signal acoustique avec une carte de saillance visuelle du spectrogramme du signal concerné. Le système de perception visuelle est quant à lui composé de deux mécanismes distincts. Le premier se base sur des méthodes de saillance visuelle et le deuxième permet d'identifier l'objet en premier plan. D'autre part, l'originalité de notre approche est qu'elle permet d'évaluer la cohérence des observations en fusionnant les informations extraites des signaux auditifs et visuels perçus. Les résultats expérimentaux ont permis de confirmer l'intérêt des méthodes utilisées dans le cadre de l'identification de scènes pertinentes dans un environnement complexe

Résumé / Abstract : The main goal of these researches is the design of one artificial perception system allowing to identify events or scenes in a complex environment. The work carried out during this thesis focused on the study and the conception of a bio-inspired perception system based on the both visual and auditory saliency. The main contributions of this thesis are auditory saliency with sound recognition and visual saliency with object recognition. The auditory saliency is computed by merging information from the both temporal and spectral signals with a saliency map of a spectrogram. The visual perception system is based on visual saliency and recognition of foreground object. In addition, the originality of the proposed approach is the possibility to do an evaluation of the coherence between visual and auditory observations using the obtained information from the features extracted from both visual and auditory patters. The experimental results have proven the interest of this method in the framework of scene identification in a complex environment