ISCA - International Speech
Communication Association


ISCApad Archive  »  2024  »  ISCApad #310  »  Jobs  »  (2024-03-10) PhD position @ CEREMA, Strasbourg, France

ISCApad #310

Tuesday, April 09, 2024 by Chris Wellekens

6-42 (2024-03-10) PhD position @ CEREMA, Strasbourg, France
  

Proposition d'une thèse 2024-2027

 

Diagnostiquer l’acoustique d’une salle grâce au traitement du signal et à l’apprentissage automatique

 

mots clefs : Acoustique – Bâtiment – Apprentissage Automatisé – Méthodes inverses

Contexte : Les nuisances sonores sont citées comme première source de gêne par les populations et constituent un enjeu sanitaire et social important, contribuant notamment au stress, aux déficits d'attention en classe, ou aux acouphènes. La gêne est souvent liée à la mauvaise qualité acoustique de la salle due à une réverbération trop importante (cantine, piscine, crèche…). Dans le cadre de la réhabilitation acoustique des salles, la proposition d’une solution nécessite une bonne connaissance des caractéristiques géométriques et acoustiques de l’existant (dimension de la salle, absorption et diffusion de ses différents revêtements). Pour estimer ces paramètres inconnus, les acousticiens de terrain s’appuient sur des mesures du champ sonore combinées à des connaissances géométriques et acoustiques a priori du lieu et du dispositif utilisé (sources et microphones). L’estimation est typiquement effectuée par calage manuel et itératif des paramètres d’entrées de modèles acoustiques analytiques ou numériques sur les mesures. Le processus complet d’un diagnostic est donc long, coûteux et parfois imprécis selon les modèles utilisés. Face à ce constat, le développement de méthodes dites inverses permettant de remonter automatiquement aux paramètres acoustiques d’intérêt à partir de mesures audio seules constituerait une percée majeure pour l’acoustique du bâtiment, ouvrant la voie au développement d’outils plus simples, plus rapides et plus fiables à destination des acousticiens. Objectif : L’objectif de la thèse est le développement d’un système qui, à partir d’un nombre réduit de mesures acoustiques (ex : des réponses impulsionnelles « RI ») et de caractéristiques de salle connues (ex : ses dimensions approximatives), puisse automatiquement retrouver dans les mesures, les autres caractéristiques alors inconnues ayant induit le champ sonore (ex : absorption et diffusion des parois, puissance de la source …). Cette thèse vise à obtenir des percées méthodologiques sur ces problèmes inverses ouverts et difficiles, en combinant des approches novatrices issues des domaines du traitement du signal et de l’apprentissage automatique. Elle débloquera trois verrous clés.

Verrou 1 : Nos premiers travaux ont permis de développer des méthodes inverses d’optimisation permettant, pour des conditions idéalisées, d’estimer l’absorption des parois d’une salle de géométrie supposée connue [1] ou, à l’inverse, d’estimer la géométrie d’une pièce aux parois idéales [2]. Le verrou majeur reste la généralisation à des cas plus réalistes intégrant : une modélisation fine de la réponse des équipements et des propriétés des parois (dépendance de la fréquence et de l'angle d'incidence, diffusion acoustique...), et l'incertitude sur la géométrie.

Verrou 2 : Nos travaux actuels se scindent en deux approches : celles guidées par les données annotées simulées, consistant à apprendre un réseau de neurones (ex : [3]), et celles guidées par la physique, résolvant un problème inverse d’optimisation reposant sur un modèle acoustique idéalisé (ex : [1,2]). Un verrou important consiste à les hybrider. Cela passera par le renforcement du réalisme des simulateurs de RIs et des modèles acoustiques théoriques, l’utilisation possible de techniques auto-supervisées sur données nonannotées [4] et de techniques d’unrolling corrigeant les modèles physiques sous-jacents par apprentissage [5].

Verrou 3 : Le dernier reste celui du passage des RIs simulées au RIs réellement mesurées qui nécessitera d’adapter les méthodes d’apprentissage et d’optimisation issues des deux verrous précédents.

[1] S. Dilungana, A. Deleforge, C. Foy, S. Faisan, Geometry-Informed estimation of surface absorption profiles from impulses responses, Eusipco, 30th European Signal Processing Conference, Belgrade, Serbia, 2022.

[2] T. Sprunck, Y. Privat, C. Foy, A. Deleforge, Gridless 3D Recovery if Images Sources from Room Impulse Responses, preprint, 2022.

[3] S. Dilungana, A. Deleforge, C. Foy, and S. Faisan, Learning-based estimation of individual absorption profiles from a single room impulse response with known positions of source, sensor and surfaces. In INTER-NOISE and NOISE-CON Congress and Conference Proceedings, vol. 263, No. 1, pp. 5623-5630.

[4] A. Jaiswal, AR. Babu, MZ Zadeh, D. Banerjee, F. Makedon, A survey on contrastive self-supervised learning. Technologies. 2020, 28;9(1):2.

[5] V. Monga, Y. Li and YC. Eldar, Algorithm unrolling: Interpretable, efficient deep learning for signal and image processing. IEEE Signal Processing Magazine. 2021 Feb 25;38(2):18-44.

Apects pratiques : Le doctorant sera encadré par Antoine Deleforge (équipe TONUS*, Inria-Strasbourg), Sylvain Faisan (ICube**, Télécom-Physique Strasbourg) et Cédric Foy (UMRAE*** - Cerema de Strasbourg). Il sera physiquement au Cerema de Strasbourg (11 rue Jean Mentelin) mais pourra être amené à se déplacer ponctuellement pour se rendre aux deux autres laboratoires. * https://www.inria.fr/fr/tonus,** https://icube.unistra.fr/, *** https://www.umrae.fr/ Contacts : antoine.deleforge@inria.fr ou cedric.foy@cerema.fr


Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA