Apprentissage dans les espaces structurés : application à l'étiquetage de séquences et à la transformation automatique de documents / Guillaume Wisniewski ; sous la direction de Patrick Gallinary

Date :

Editeur / Publisher : [s.l.] : [s.n.] , 2007

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Gallinari, Patrick (19..-....) (Directeur de thèse / thesis advisor)

Université Pierre et Marie Curie (Paris ; 1971-2017) (Organisme de soutenance / degree-grantor)

Relation : Apprentissage dans les espaces structurés : application à l'étiquetage de séquences et à la transformation automatique de documents / Guillaume Wisniewski ; sous la direction de Patrick Gallinary / Lille : Atelier national de reproduction des thèses , 2007

Résumé / Abstract : De nombreux problèmes d'apprentissage consiste à prédire des séquences, des arbres ou des graphes. Contrairement aux problèmes de classification usuels, ces sorties sont structurées et se décomposent en un ensemble d'éléments étiquetés interdépendants. L'apprentissage structuré est domaine de l'apprentissage statistique proposé récément pour développer des méthodes d'apprentissage capables de découvrir et d'exploiter ces dépendances entre étiquettes pour améliorer les performances en prédiction. L'étude des différents cadres et méthodes d'apprentissage structuré constitue la première partie de cette thèse. Nous y décrivons notamment l'application de ces méthodes sur une tâche d'étiquetage de séquences et sur une tâche de prédiction d'arbres. Cette dernière tâche est directement motivée par la problématique générale d'automatisation de la transformation de documents structurés qui est, aujourd'hui, au cœur de plusieurs problématiques d'accès à l'information. Dans une deuxième partie de ce travail, nous nous sommes intéressé à deux limites des modèles existants qui rendent ceux-ci inapplicables à de nombreux problèmes pratiques~: leur complexité élevée et leur expressivité limitée qui ne leur permet de ne considérer que des dépendances locales. Nous proposons d'aborder ce problème sous l'angle de la sélection de caractéristiques et décrivons une méthode d'étiquetage de séquences représentant les dépendances par des contraintes, ce qui lui permet d'extraire efficacement les dépendances non locales et de les utiliser en inférence tout en conservant une complexité faible.