ISCA - International Speech
Communication Association


ISCApad Archive  »  2024  »  ISCApad #317  »  Jobs  »  (2024-10-22) Stage à l'Université du Mans, France

ISCApad #317

Sunday, November 10, 2024 by Chris Wellekens

6-27 (2024-10-22) Stage à l'Université du Mans, France
  

 Stage à 'lUniversité du Mans, France


Titre : Construction de Sound Zones par apprentissage automatique sur un large jeu de données 

Forme 

Laboratoires d’accueil : LIUM / LAUM 

Site : Le Mans 

Encadrant(s: Théo Mariotte (LIUM), Manuel Melon (LAUM), Marie Tahon (LIUM) 

Début du stageentre janvier et mars 2024 

Date limite de candidature : 15/12/2024 

 

Descriptif : Le stage vise à mettre en œuvre des systèmes d’apprentissage automatique pour la construction de zones d’écoute différenciées (Sound zones). 

 

Contexte 

 

La mise en place de zones d'écoute différenciées (Sound zones) [1] trouve des applications dans de nombreux contextes tels que la diffusion de contenu audio personnalisé dans les habitacles de véhiculesCes méthodes permettent de contrôler le niveau acoustique émis dans des zones définies de l'espace, dénommées claire et sombre.Dans la première, le niveau acoustique est rehaussé pour permettre à transmission du signal utile. Dans la seconde, le niveau est atténué afin de restreindre le signal acoustique transmis à la zone claire. La construction de ces zones est possible à l’aide d'un réseau de haut-parleurs et de microphones. 

  

Les méthodes de la littérature permettant la mise en œuvre de zones d'écoute différenciées exploitent l'optimisation sous contrainte (ex: Acoustic Contrast Control (ACC), Pressure Matching (PM). Plus récemment, les travaux de Pepe et al. [4] ont proposé une approche utilisant les réseaux de neurones profonds. D'autre part, des jeux de données ont été publiés pour la reconstruction de champ acoustique (ISOBEL [2]) et la reproduction de sound zones (Zhao et al. [3])Ces deux considérations ouvrent la voie à l’utilisation de méthodes neuronales pour la construction de sound zones.  


 

Objectifs 


Le stage proposé vise dans un premier temps à reproduire une méthode de la littérature et de l'appliquer sur des jeux de données publics. Dans un second temps, il sera envisagé d’améliorer cette approche et d’évaluer sa robustesse selon différents critères (environnement acoustique, position du sujet...). 

 

Phase 1 : 

  • Étude de la bibliographie et prise en main des approches classiques pour les sound zones.
  • Reproduire la méthode de l’article de Pepe et al. [4] 
  • Prendre en main les jeux de données publics ISOBEL [2] et Zhao et al. [3]
  • Évaluer la méthode sur ces jeux de données 
  • Comparer cette approche avec les méthodes classiques de construction de sound zones 

 

Phase 2 : 

  • Étudier la robustesse de la méthode neuronale selon différents critères (environnement acoustique, position du sujet)
  • Améliorer la robustesse de l’approche neuronale selon ces critères 

 

Il est également envisagé de concevoir un démonstrateur permettant à deux utilisateur·ices partageant le même espace d'écouter un texte lu dans deux langues différentes. Ce démonstrateur pourrait être présenté à la prochaine Biennale Le Mans Sonore en 2026. 



 

Laboratoires 

 

Le Laboratoire d’Acoustique de l’Université du Mans (LAUM) possède une grande expertise sur les méthodes de reproduction et de contrôle du champ acoustique. Manuel Melon a mené et encadré de nombreux travaux autour de la thématique des sound zones. 

 

Le Laboratoire d’Informatique de l’Université du Mans (LIUM) est historiquement orienté vers les thématiques de traitement automatique de la parole avec une forte dominante pour les approches d’apprentissage automatique profond. Marie Tahon travaille notamment sur des méthodes neuronales pour la reconnaissance des émotions et la synthèse parole avec un intérêt pour l’interprétabilité. Théo Mariotte travaille sur des méthodes de traitement audio à l’aide de réseaux de neurones, et développe notamment des méthodes utilisant des antennes de microphones. 

 

Le stagiaire bénéficiera de l’expertise des deux laboratoires tant sur la dimension acoustique (LAUM) que sur la dimension informatique et apprentissage automatique (LIUM). 

 

Profil du candidat Candidat·e motivé·e par l’intelligence artificielle et les méthodes de reproduction de champ acoustique, inscrit·e en master informatique ou acoustique. 

 

Pour candidater : Envoyer CV + lettre de motivation à : theo.mariotte@univ-lemans.fr 

 

Ressources : 

 

[1] T. Betlehem, W. Zhang, M. A. Poletti, et T. D. Abhayapala, « Personal Sound Zones: Delivering interface-free audio to multiple listeners », IEEE Signal Process. Mag., vol. 32, no 2, p. 81‑91, mars 2015, doi: 10.1109/MSP.2014.2360707. 

 

[2] M. S. Kristoffersen, M. B. Møller, P. Martínez-Nuevo, et J. Østergaard, « Deep Sound Field Reconstruction in Real RoomsIntroducing the ISOBEL Sound Field Dataset », 12 février 2021, arXivarXiv:2102.06455.  

 

[3] S. Zhao, Q. Zhu, E. Cheng, et I. S. Burnett, « A room impulse response database for multizone sound fieldreproduction (L) », The Journal of the Acoustical Society of America, vol. 152, no 4, p. 2505‑2512, oct. 2022, doi: 10.1121/10.0014958. 

 

[4] G. Pepe, L. Gabrielli, S. Squartini, L. Cattani, et C. Tripodi, « Deep Learning for Individual Listening Zone », in 2020 IEEE 22nd International Workshop on Multimedia Signal Processing (MMSP), Tampere, Finland: IEEE 




Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA