Robustesse en recherche d'information : application à l'accessibilité aux personnes handicapées / par Laurianne Sitbon ; [sous la direction de] Philippe Blache,... [et] Patrice Bellot,...

Date :

Editeur / Publisher : [S. l.] : [s. n.] , 2007

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Recherche de l'information -- Accessibilité aux handicapés

Questions et réponses, Systèmes de

Dyslexie

Commande robuste

Classification Dewey : 006.35

Blache, Philippe (19..-.... ; chercheur) (Directeur de thèse / thesis advisor)

Bellot, Patrice (19..-.... ; chercheur en informatique) (Directeur de thèse / thesis advisor)

Université d'Avignon et des Pays de Vaucluse (1973-....) (Organisme de soutenance / degree-grantor)

Relation : Robustesse en recherche d'information : application à l'accessibilité aux personnes handicapées / par Laurianne Sitbon ; [sous la direction de] Philippe Blache,... [et] Patrice Bellot,... / Lille : Atelier national de reproduction des thèses , 2007

Résumé / Abstract : L'ère de l'information numérique a creusé le fossé social pour les personnes atteintes de troubles de la communication. Nous étudions la prise en compte de besoins spécifiques de l'utilisateur au sein des systèmes de recherche d'information. Nous avons étudié plus particulièrement le cas de la dyslexie au sein de systèmes de questions réponses. L'élaboration d'un cadre théorique robuste pour la recherche d'information a pu être réalisé à l'aide d'une évaluation modulaire d'un système de questions réponses pour des questions posées par des utilisateurs présentant ou non des troubles de la communication. Le modèle que nous proposons est fondé sur le modèle probabiliste. Il s'agit d'un modèle unique qui s'applique à la fois aux systèmes de questions réponses et aux systèmes de recherche documentaire. Ce modèle permet de prendre en compte l'incertitude lors de l'analyse d'une requête de l'utilisateur, et de prendre en compte un besoin spécifique non thématique lors de la production de résultats. Lorsqu'un utilisateur dyslexique entre une requête, un système fondé sur une transcription automatique des phonèmes écrits permet d'obtenir des hypothèses d'interprétation pondérées, qui constituent un vecteur pondéré de mots clés. Les documents retournés à l'utilisateur dyslexique en situation de recherche d'information doivent être sélectionnés selon leur pertinence et leur lisibilité. Nous proposons d'évaluer la lisibilité en fonction du déficit phonologique spécifique aux utilisateurs dyslexiques. Nous avons montré qu'un système de recherche d'information peut prendre en compte une lisibilité à hauteur de 30 % sans entraver sévèrement la qualité de ses résultats. Dans le cas où l'utilisateur pose une question factuelle, la lisibilité n'entre pas en jeu. En revanche une information lui est transmise concernant la qualité de cette information, sous forme d'un score de confiance

Résumé / Abstract : The new era of digital information has increased the social gap for disabled people. We propose a way of taking into account users' special needs in information retrievial systems. We more specifically focused on dyslexic users interacting with question answering systems and documents retrievial systems. A sequential evaluation of a question answering system while answering to real users' questions leads us to a new model for question answering. This probabilistic model takes into account the uncertainty over the query and a non informational user need over the output. It applies to question answering as well as to most information retrievial tasks. An automatic speech recognition system based on phonemes written by dyslexics leads to a N-best list of transcriptions for one query. This provides a basis for hypothesised analysis and weighted term vectors computed with posterior probabilities. The documents provided by retrievial or summarization task can take dyslexia into account by selecting the most readable text units. The readability is estimated with a machine learning approach taking into account specific parameters related to phonologic awareness. We show that an information retrievial system can improve the average readability of its provided results while maintaining high accuracy. This is achieved by linearly including 30 % of readability in the relevance score. When the query is a factual question, the readability is no longer an issue. However, the user can benefit from a confidence score estimated with a measure specific to the question answering task