Forensic Source Camera Identification by Using Features in Machine Learning Approach / Amel Tuama Alhussainy ; sous la direction de Marc Chaumont

Date : 2016

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Médias numériques

JPEG (norme de codage d'images)

Identification

Alhussainy, Amel Tuama (1970-....) (Auteur / author)

Chaumont, Marc (1976-.... ; enseignant-chercheur en informatique) (Directeur de thèse / thesis advisor)

Azé, Jérôme (1973-....) (Président du jury de soutenance / praeses)

Bas, Patrick (19..-.... ; auteur en automatique) (Rapporteur de la thèse / thesis reporter)

Piva, Alessandro (Rapporteur de la thèse / thesis reporter)

Comby, Frédéric (1974-....) (Membre du jury / opponent)

Perez-Gonzalez, Fernando (19..-....) (Membre du jury / opponent)

Université de Montpellier (2015-2021) (Organisme de soutenance / degree-grantor)

École doctorale Information, Structures, Systèmes (Montpellier ; 2015-....) (Ecole doctorale associée à la thèse / doctoral school)

Laboratoire d'informatique, de robotique et de micro-électronique (Montpellier ; 1992-....) (Laboratoire associé à la thèse / thesis associated laboratory)

Accès en ligne / online access

Résumé / Abstract : L'identification d'appareils photos a récemment fait l'objet d'une grande attention en raison de son apport en terme sécurité et juridique. Établir l'origine d'un médias numériques, obtenus par un appareil d'imagerie est important à chaque fois que le contenu numériques est présente et utilise comme preuve devant un tribunal.L'identification d'appareils photos consiste à déterminer la marque, le modèle, ou le dispositif qui a été utilisé pour prendre une image.Notre première contribution pour l'identification du modèle d'appareil photo numérique est basée sur l'extraction de trois ensembles de caractéristiques puis l'utilisation d'apprentissage automatique. Ces caractéristiques sont la matrice de cooccurrences,des corrélations inter-canaux mesurant la trace laissée par l'interpolation CFA, et les probabilités conditionnelles calculées dans le domaine JPEG. Ces caractéristiques donnent des statistiques d'ordre élevées qui complètent et améliorent le taux d'identification. Les expériences prouvent la force de notre proposition, car la précision obtenue est supérieure à celle des méthodes basées sur la corrélation.La deuxième contribution est basée sur l'utilisation des CNNs. Contrairement aux méthodes traditionnelles, les CNNs apprennent simultanément les caractéristiques et la classification. Nous proposons d'ajouter une couche de pré-traitement (filtre passe-haut applique à l'image d’entrée) au CNN. Le CNN obtenu donne de très bonnes performances pour une faible complexité d'apprentissage. La méthode proposée donne des résultats équivalent à ceux obtenu par une approche en deux étapes (extraction de caractéristiques + SVM). Par ailleurs nous avons également examines les CNNs : AlexNet et GoogleNet. GoogleNet donne actuellement les meilleurs taux d'identification pour une complexité d'apprentissage plus grande

Résumé / Abstract : Source camera identification has recently received a wide attention due to its importantrole in security and legal issue. The problem of establishing the origin ofdigital media obtained through an imaging device is important whenever digitalcontent is presented and is used as evidence in the court. Source camera identification is the process of determining which camera device or model has been used to capture an image.Our first contribution for digital camera model identification is based on the extractionof three sets of features in a machine learning scheme. These featuresare the co-occurrences matrix, some features related to CFA interpolation arrangement,and conditional probability statistics computed in the JPEG domain.These features give high order statistics which supplement and enhance the identification rate. The experiments prove the strength of our proposition since it achieves higher accuracy than the correlation-based method.The second contribution is based on using the deep convolutional neural networks(CNNs). Unlike traditional methods, CNNs can automatically and simultaneouslyextract features and learn to classify during the learning process. A layer ofpreprocessing is added to the CNN model, and consists of a high pass filter which isapplied to the input image. The obtained CNN gives very good performance for avery small learning complexity. Experimental comparison with a classical two stepsmachine learning approach shows that the proposed method can achieve significantdetection performance. The well known object recognition CNN models, AlexNetand GoogleNet, are also examined.