Détection de personnes pour des systèmes de videosurveillance multi-caméra intelligents / Muhammad Owais Mehmood ; sous la direction de Pierre Chainais et de Catherine Achard

Date : 2015

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Reconnaissance des formes (informatique)

Géométrie projective

Vision par ordinateur

Intelligence artificielle

Traitement d'images

Mehmood, Muhammad Owais (1988-....) (Auteur / author)

Chainais, Pierre (Directeur de thèse / thesis advisor)

Achard, Catherine (1970-.... ; chercheuse en informatique) (Directeur de thèse / thesis advisor)

Bouchafa, Samia (19..-.... ; chercheuse en informatique) (Président du jury de soutenance / praeses)

Chapuis, Roland (19..-....) (Rapporteur de la thèse / thesis reporter)

Brémond, François (1968-....) (Rapporteur de la thèse / thesis reporter)

Lecœuche, Stéphane (1970-....) (Membre du jury / opponent)

Sayd, Patrick (Membre du jury / opponent)

École centrale de Lille (1872-2019) (Organisme de soutenance / degree-grantor)

École doctorale Sciences pour l'ingénieur (Lille ; 1992-2021) (Ecole doctorale associée à la thèse / doctoral school)

Laboratoire Électronique Ondes et Signaux pour les Transports (LEOST) (Laboratoire associé à la thèse / thesis associated laboratory)

Accès en ligne / online access

Résumé / Abstract : La détection de personnes dans les vidéos est un défi bien connu du domaine de la vision par ordinateur avec un grand nombre d'applications telles que le développement de systèmes de surveillance visuels. Même si les détecteurs monoculaires sont plus simples à mettre en place, ils sont dans l’incapacité de gérer des scènes complexes avec des occultations, une grande densité de personnes ou des scènes avec beaucoup de profondeur de champ menant à une grande variabilité dans la taille des personnes. Dans cette thèse, nous étudions la détection de personnes multi-vues et notamment l'utilisation de cartes d'occupation probabilistes créées en fusionnant les différentes vues grâce à la connaissance de la géométrie du système. La détection à partir de ces cartes d'occupation amène cependant des fausses détections (appelées « fantômes ») dues aux différentes projections. Nous proposons deux nouvelles techniques afin de remédier à ce phénomène et améliorer la détection des personnes. La première utilise une déconvolution par un noyau dont la forme varie spatialement tandis que la seconde est basée sur un principe de validation d’hypothèse. Ces deux approches n'utilisent volontairement pas l'information temporelle qui pourra être réintroduite par la suite dans des algorithmes de suivi. Les deux approches ont été validées dans des conditions difficiles présentant des occultations, une densité de personnes plus ou moins élevée et de fortes variations dans les réponses colorimétriques des caméras. Une comparaison avec d'autres méthodes de l’état de l'art a également été menée sur trois bases de données publiques, validant les méthodes proposées pour la surveillance d'une gare et d'un aéroport

Résumé / Abstract : People detection is a well-studied open challenge in the field of Computer Vision with applications such as in the visual surveillance systems. Monocular detectors have limited ability to handle occlusion, clutter, scale, density. Ubiquitous presence of cameras and computational resources fuel the development of multi-camera detection systems. In this thesis, we study the multi-camera people detection; specifically, the use of multi-view probabilistic occupancy maps based on the camera calibration. Occupancy maps allow multi-view geometric fusion of several camera views. Detection with such maps create several false detections and we study this phenomenon: ghost pruning. Further, we propose two novel techniques in order to improve multi-view detection based on: (a) kernel deconvolution, and (b) occupancy shape modeling. We perform non-temporal, multi-view reasoning in occupancy maps to recover accurate positions of people in challenging conditions such as of occlusion, clutter, lighting, and camera variations. We show improvements in people detections across three challenging datasets for visual surveillance including comparison with state-of-the-art techniques. We show the application of this work in exigent transportation scenarios i.e. people detection for surveillance at a train station and at an airport