Analyse syntaxique automatique de l'oral : étude des disfluences / Rémi Bove ; sous la direction de Jean Véronis

Date :

Editeur / Publisher : [S.l.] : [s.n.] , 2008

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Morphologie (linguistique)

Analyse automatique (linguistique)

Français (langue) -- Langue parlée

Véronis, Jean (1955-2013) (Directeur de thèse / thesis advisor)

Université de Provence. Faculté des lettres et sciences humaines (1969-2011) (Autre partenaire associé à la thèse / thesis associated third party)

Université de Provence (1970-2011) (Organisme de soutenance / degree-grantor)

Relation : Analyse syntaxique automatique de l'oral : étude des disfluences / Rémi Bove / Villeurbanne : [CCSD] , 2011

Relation : Analyse syntaxique automatique de l'oral : étude des disfluences / Rémi Bove ; sous la direction de Jean Véronis / Lille : Atelier national de reproduction des thèses , 2008

Résumé / Abstract : Le but de cette thèse est d'étudier de façon détaillée l'impact des disfluences en français parlé (répétitions, auto-corrections, amorces, etc.) sur l'analyse syntaxique automatique de l'oral et de propose un modèle théorique permettant de les intégrer dans cette analyse. Notre axe de recherche se fonde sur l'hypothèse selon laquelle une analyse détaillée des énoncés oraux (principalement en termes morphosyntaxiques) peut permettre un traitement efficace pour ce type de données, et s'avère incontournable dans une optique de développement d'applications génériques dans le domaine des technologies de la parole. Dans le cadre de ce travail, nous proposons à la fois une étude linguistique détaillée et une stratégie d'analyse syntaxique automatique partielle des disfluences (en syntagmes minimaux non récursifs ou "chunks"). Le corpus final obtenu est ainsi segmenté en chunks non-disfluents d'une part, à côté des chunks disfluents d'autre part après prise en compte des régularités observées dans notre corpus. Les résultats de l'analyse automatique sont finalement évalués de façon quantitative sur le corpus permettant ainsi de valider le modèle théorique de façon empirique.