adaptation thématique non supervisée d'un système de reconnaissance automatique de la parole / Gwénolé Lecorvé ; pascale Sébillot

Date :

Editeur / Publisher : (S.l.) : (s.n.) , 2010

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Communication -- Systèmes d'information -- Traitement automatique de la parole -- Télécommunications -- Linguistique -- Informatique

Sébillot, Pascale (1962-....) (Directeur de thèse / thesis advisor)

Institut national des sciences appliquées de Rennes (1961-....) (Organisme de soutenance / degree-grantor)

École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes) (Organisme de soutenance / degree-grantor)

Relation : adaptation thématique non supervisée d'un système de reconnaissance automatique de la parole / Gwénolé Lecorvé / Villeurbanne : [CCSD] , 2011

Relation : adaptation thématique non supervisée d'un système de reconnaissance automatique de la parole / Gwénolé Lecorvé ; pascale Sébillot / Lille : Atelier national de reproduction des thèses , 2010

Résumé / Abstract : Dans cette thèse, nous proposons un processus d'adaptation thématique non supervisée qui vise à spécialiser le modèle de langue (ML) et le vocabulaire d'un système de reconnaissance de la parole (RAP) en fonction du thème de chaque document à transcrire. Ce processus a comme singularité de ne nécessiter aucune connaissance a priori sur les éventuels thèmes rencontrés et d'intégrer des techniques de traitement automatique des langues. Il consiste à caractériser le thème d'un document audio par des mots-clés extraits automatiquement et à construire un corpus de pages Web du même thème. Nous ré-estimons alors le ML en fonction d'une terminologie issue de ce corpus, puis intégrons au système de nouveaux mots propres au thème en assimilant ceux-ci à d'autres avec lesquels il partagent des relations paradigmatiques. Nos expériences sur le corpus ESTER montrent que l'utilisation des ML et vocabulaire ainsi adaptés produit des améliorations du taux de reconnaissance d'un système de RAP.

Résumé / Abstract : In this work, we propose a new unsupervised process to adapt the language model (LM) and the vocabulary of an automatic speech recognition system to the topic of each spoken document to be transcribed. This process is particularly original since it firstly avoids the use of any a priori knowledge about potentially encountered topics and secondly integrates natural language processing techniques. In order to achieve these goals, we characterize the topic of a spoken document by automatically extracting keywords from a first-pass automatic transcription before building a topic-specific corpus of Web pages. Then, the LM is re-estimated thanks to a terminology acquired from this corpus, and new topic-specific words are added to the vocabulary and integrated to the LM by relying on paradigmatic relations with in-vocabulary words. Experiments done on French-speaking broadcast news show that using these topic-adapted vocabulary and LM lead to recognition accuracy improvements.