Coordination des tours de parole par le couplage sensorimoteur continu entre utilisateurs et agents / Mathieu Jégou ; sous la direction de Pierre Chevaillier

Date :

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : français / French

Systèmes conversationnels (informatique)

Interaction humain-machine

Classification Dewey : 004.19

Chevaillier, Pierre (19..-.... ; chercheur en informatique) (Directeur de thèse / thesis advisor)

Bailly, Gérard (19..-.... ; linguiste) (Président du jury de soutenance / praeses)

Pelachaud, Catherine (19..-....) (Rapporteur de la thèse / thesis reporter)

Pauchet, Alexandre (1977-.... ; chercheur en informatique) (Rapporteur de la thèse / thesis reporter)

Bevacqua, Elisabetta (1975-....) (Membre du jury / opponent)

Loor, Pierre de (19..-....) (Membre du jury / opponent)

Université de Bretagne Occidentale (1971-....) (Organisme de soutenance / degree-grantor)

École doctorale Santé, information-communication et mathématiques, matière (Brest, Finistère) (Ecole doctorale associée à la thèse / doctoral school)

Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance (Laboratoire associé à la thèse / thesis associated laboratory)

Résumé / Abstract : Nous présentons dans cette thèse un modèle pour la coordination de la parole dans des interactions dyadiques utilisateur-agent. Selon une approche courante, coordonner la parole reviendrait à éviter les recouvrements de parole et à minimiser les moments de silence entre deux tours, ceci pour rendre plus fluide l’interaction avec l’agent et améliorer l’expérience de l’utilisateur en interaction dialogique avec l’agent. Les interactions humaines montrent néanmoins une coordination plus complexe avec des recouvrements de parole compétitifs ou non compétitifs et des moments de silences longs. Selon notre approche, c’est en permettant cette diversité des situations que nous verrons émerger, entre l’utilisateur et l’agent, une interaction plus fluide et plus crédible, améliorant l’expérience de l’utilisateur avec l’agent. Les échanges de paroles sont néanmoins, par nature, complexes, la coordination se faisant par l’interaction entre locuteur et auditeur plus que par un participant en particulier. Pour capturer cette complexité, nous avons élaboré un modèle mettant l’accent sur une coordination de la parole basée sur un couplage sensorimoteur continu. Sur la base de ce couplage sensorimoteur, le comportement de l’agent n’est pas entièrement contrôlé par ce dernier, mais est émergent de l’interaction entre les participants. Nous montrons la capacité de notre modèle à faire émerger les différentes situations liées à la coordination de la parole humaine à la fois dans une interaction entre deux agents et dans une interaction utilisateur-agent.

Résumé / Abstract : In this thesis, we present a model for the coordination of speaking turns in dyadic interactions between users and agents. According to a common view, to coordinate turns means avoiding overlaps and reduces silences between turns. By optimizing turn transitions between users and agents, the user’s experience is expected to be improved. However, observations of human conversations show a more complex coordination of speaking turns between users and agents: awkward silences and overlaps, competitive or not, are common. In order to improve the credibility and the naturalness of the interaction, we must observe the same variability of situations in a user-agent interaction. Nevertheless, coordination of speaking turns is, by nature, complex, the coordination is managed by the interaction between participants more than controlled by one participant alone. To capture this complexity, we elaborated a model emphasizing the continuous sensory-motor coupling existing between the user and the agent. As a result of this sensory-motor coupling, the behavior of the agent is not entirely controlled by the agent but is an emergent property of the interaction between the user and the agent. We show the capacity of our model to make emerge the different situations linked to the coordination of speaking turns in interactions between two agents and between one user and one agent.