Towards a binaural model for predicting speech intelligibility among competing voices in rooms / Thibaud Leclère ; sous la direction de Dominique Dumortier et de Mathieu [nicolas Jacky] Lavandier

Date : 2015

Type : Livre / Book

Type : Thèse / Thesis

Langue / Language : anglais / English

Psychoacoustique

Acoustique architecturale

Leclère, Thibaud (1989-....) (Auteur / author)

Dumortier, Dominique (19..-....) (Directeur de thèse / thesis advisor)

Lavandier, Mathieu [Nicolas Jacky] (1977-....) (Directeur de thèse / thesis advisor)

Lorenzi, Christian (1968-....) (Président du jury de soutenance / praeses)

Dau, Torsten (Rapporteur de la thèse / thesis reporter)

Macherey, Olivier (19..-....) (Membre du jury / opponent)

Parizet, Etienne (Membre du jury / opponent)

Ecole nationale des travaux publics de l'Etat (Vaulx-en-Velin, Rhône ; 1975-....) (Organisme de soutenance / degree-grantor)

Ecole doctorale Mécanique, Energétique, Génie Civil, Acoustique (Villeurbanne ; 2011-....) (Ecole doctorale associée à la thèse / doctoral school)

Laboratoire génie civil et bâtiment (Vaulx-en-Velin, Rhône) (Laboratoire associé à la thèse / thesis associated laboratory)

Accès en ligne / online access

Résumé / Abstract : Ce travail de thèse vise à proposer un modèle pouvant prédire l’intelligibilité d’une voix cible masquée par des sources concurrentes dans les salles. Un modèle a déjà été développé par Lavandier et Culling (2010) et est capable de prédire l’intelligibilité d’une cible en champ proche perturbée par plusieurs sources de bruit. Le travail présenté ici traite des nouvelles implémentations et expérimentations nécessaires pour étendre le modèle au cas de cibles distantes et au cas de voix concurrentes, qui présentent des propriétés acoustiques différentes des bruits stationnaires (fluctuation d’enveloppe, fréquence fondamentale, modulations de fréquence fondamentale). L’effet nuisible de la réverbération sur la parole cible a été implémenté avec succès. Cette nouvelle version du modèle permet une interprétation unifiée de plusieurs effetsperceptifs observés dans la littérature mais il présente une dépendance de la salle, ce qui limite son aspect prédictif. Des travaux expérimentaux ont été menés pour déterminer comment le modèle pourrait prendre en compte le cas de sources cibles et masquantes avec des spectres différents ainsi que le cas où plusieurs mécanismes auditifs opèrent simultanément (ségrégation par F0, démasquage spatialet écoute dans les creux de modulation).

Résumé / Abstract : This PhD work aims to propose a model predicting the perceived intelligibility of a target speech masked by competing sources in rooms. An existing model developed by Lavandier and Culling (2010) is already able to predict speech intelligibility of a near-field target in the presence of multiple noise sources. The present work deals with new implementations and experimental work needed to extend the model tothe case of a distant target and to the case of masking voices, which present different acoustical properties than noises (envelope fluctuations, fundamental frequency, modulations of fundamental frequency). The detrimental effect of reverberation on the target speech has been successfully implemented. This new version of the model provides a unified interpretation of several perceptual effects previously observed in the literature but it presents a room dependency which limits its predictive power. Experimental work has been conducted to determine how the model could account for sources presenting different spectra, and to account for several auditory mechanisms operating simultaneously (F0 segregation, spatial unmasking and temporal dip listening).