ISCA - International Speech
Communication Association


ISCApad Archive  »  2025  »  ISCApad #324  »  Jobs  »  (2025-05-23) PhD position, LABRI, Université de Bordeaux, France

ISCApad #324

Sunday, June 08, 2025 by Chris Wellekens

6-40 (2025-05-23) PhD position, LABRI, Université de Bordeaux, France
  

Sujet thèse: Analyse de parole pour l’estimation des symptômes chez des patients souffrant de troubles psychiatriques.

Contexte et atouts du poste

Cette thèse s’inscrit dans le cadre du projet AUTONOM-HEALTH du PEPR Santé Numérique, qui a pour objectif le développement de technologies numériques en santé avec une attention particulière à leur aspect écologique, préventif, personnalisé, longitudinal, interopérable et acceptable.

Le/la doctorant.e sera co-encadrée par Jean-Luc Rouas (Chargé de Recherche CNRS, Laboratoire Bordelais de Recherche en Informatique – LaBRI), Vincent P. Martin (Chargé de Recherche, INRIA Nancy) et Charles Brazier (Maître de Conférences, LaBRI).

Il/elle alternera des périodes de recherche au LaBRI, au Centre Hospitalier Charles Perrens et/ou au CHU de Bordeaux, et sera amené.e à se déplacer pour de courtes visites scientifiques à Nancy.

Salaire brut : minimum 2044 €/mois
Date de début : octobre 2025
Localisation : Bordeaux

Mission confiée

Le projet AUTONOM-HEALTH du PEPR Santé Numérique a pour objectif large le développement de technologies numériques en santé avec une attention particulière à leur aspect écologique, préventif, personnalisé, longitudinal, interopérable et acceptable.

Parmis les signaux prometteurs permettant de collecter de l’information clinique pertinente, l’analyse automatique de la voix et de la parole revêt des avantages importants : mesure non-invasive, prenant peu de temps, implémentée dans tous les smartphones, elle permet de détecter de nombreux symptômes et troubles [Low et al. 2020].

Cependant, malgré plus de 10 ans d’avencées techniques, l’analyse de la parole n’est toujours implémentée dans la pratique clinique. Cette thèse se propose d’avancer sur trois verrous identifiés :

  • Limite n°1: Les systèmes actuels se concentrent sur l’estimation des diagnostics (généralement de façon binaire, par ex. depression vs. sujet sain), ce qui n’est utile ni pour les cliniciens, ni pour les patients [Martin et al. 2024, LREC]. De plus, les systèmes déjà existants ne se concentrent que sur une seule dimension (trouble ou symptôme), là où les cliniciens raisonnent à partir de multiples signes et symptômes en même temps [Micoulaud-Franchi 2024, AMP].
  • Limite n°2: Les approches les plus récentes reposent sur des processus d’extractions de très nombreux descripteurs à partir des enregistrements audio, dont le sens est souvent difficilement interprétable (e.g. ceux extraits avec la boîte à outils openSMILE ou les vecteurs wav2vec).
  • Limite n°3: Enfin, la majorité des corpus étudiés contiennent de la parole lue ou enregistrée sur des tâches préparées (e.g. compter jusqu’à 20, voyelles soutenues, etc.), dont les résultats ne sont pas généralisables à la parole spontanée.

[Low et al. 2020] Low, D. M., Bentley, K. H., & Ghosh, S. S. (2020). Automated assessment of psychiatric disorders using speech: A systematic review. Laryngoscope Investigative Otolaryngology, 5(1), 96–116. https://doi.org/10.1002/lio2.354

[Martin et al. 2024, LREC] Martin, V. P., & Rouas, J.-L. (2024). Why Voice Biomarkers of Psychiatric Disorders are not used in Clinical Practice? Deconstructing the Myth of the Need for Objective Diagnosis. LREC 2024, 17603–17613. https://aclanthology.org/2024.lrec-main.1531

[Micoulaud-Franchi 2024, AMP] Micoulaud-Franchi, J.-A., Martin, V. P., Vialatte, F., Gauld, C., Gratreau, E., & Quiles, C. (2025). La domestication de la sémiologie: Proposition d’une organisation graphique du thesaurus semeioticus psychiatrique chez l’adulte. Annales Médico-psychologiques, revue psychiatrique, 183(1), 101–111. https://doi.org/10.1016/j.amp.2024.11.001

Principales activités

Afin de répondre à ces limites, les tâches confiées à la personne recrutée comprendront sans s’y limiter les activités suivantes :

  1. Conception d’un protocole d’enregistrement de la voix et collecte des données en milieu hospitalier d’un corpus contenant la parole et les symptômes de patients atteints de troubles psychiatriques.
    -> Cet axe de recherche se fera en collaboration avec les cliniciens-chercheurs du CHU/CH Charles Perrens, sous la tutelle de Vincent P. Martin [Martin et al. 2021, Frontiers in Digital Health].
  2. Développement de nouveaux descripteurs vocaux et paroliers interprétables et proposition de mécanismes explicatifs, sur de la parole spontanée. On se concentrera sur des descripteurs interprétables par design [Rudin 2019], dans la visée de pouvoir produire des explications du lien entre descripteurs, mécanismes de paroles, et troubles sous-jacents [Liss 2024].
    -> Cet axe nécessitera d’améliorer les systèmes de transcription existants pour le français spontané, notamment afin de pouvoir automatiquement reconnaître et segmenter les phonèmes de tels enregistrements [Martin et al. 2024, Speech Prosody]. Un challenge particulièrement interressant sera la prise en compte de l’altération de la parole dûe aux troubles ou traitements de ces patients. Cet axe se fera avec la collaboration renforcée de Charles Brazier.
  3. Conception d’algorithmes d’apprentissage automatique pour l’estimation conjointe de plusieurs symptômes. Cet axe pourra notamment d’appuyer sur des réseaux de symptômes [Borsboom 2017] pour appliquer des algorithmes de graph learning.

[Martin et al. 2021, Frontiers in Digital Health] Martin, V. P., Rouas, J.-L., Micoulaud-Franchi, J.-A., Philip, P., & Krajewski, J. (2021). How to Design a Relevant Corpus for Sleepiness Detection Through Voice? Frontiers in Digital Health, 3, 686068. https://doi.org/10.3389/fdgth.2021.686068

[Rudin 2019] Rudin, C. (2019). Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead. Nature Machine Intelligence, 1(5), 206–215. https://doi.org/10.1038/s42256-019-0048-x

[Liss 2024] Liss, J., & Berisha, V. (2024). Operationalizing Clinical Speech Analytics: Moving From Features to Measures for Real-World Clinical Impact. Journal of Speech, Language, and Hearing Research, 67(11), 4226–4232. https://doi.org/10.1044/2024_JSLHR-24-00039

[Martin et al. 2024, Speech Prosody] Martin, V. P., Beaumard, C., Rouas, J.-L., & Wu, Y. (2024). Is automatic phoneme recognition suitable for speech analysis? Temporal and performance evaluation of an Automatic Speech Recognition model in spontaneous French. Speech Prosody 2024, 1120–1124. https://doi.org/10.21437/SpeechProsody.2024-226

[Borsboom 2017] Borsboom, D. (2017). A network theory of mental disorders. World Psychiatry, 16(1), 5–13. https://doi.org/10.1002/wps.20375

Profil attendu

  • Qualifications requises : Master en traitement du signal / analyse de la parole / informatique
  • Compétences : Programmation Python, apprentissage statistique (apprentissage machine, apprentissage profond), traitement automatique des signaux/de la parole, excellente maîtrise du français (interactions avec des patients et des cliniciens français), bon niveau d’anglais scientifique.
  • Savoir-faire : Familiarité avec la boîte à outils ESPNET et/ou les outils d’apprentissage profond, connaissance de la conception de systèmes de traitement automatique de la parole.
  • Compétences sociales : Bonne capacité à s’intégrer dans des équipes multidisciplinaires, capacité à communiquer avec des non-experts.

Avantages du poste

Environnement véritablement interdisciplinaire.

Localisation:
Le poste sera hébergé au LaBRI, en collaboration étroite avec l’équipe “Sémagramme” du LORIA (contact : Vincent P. Martin vincent.p.martin@inria.fr).

Le Laboratoire Bordelais de Recherche en Informatique (LaBRI) est un centre de recherche réputé pour son excellence dans divers domaines de l’informatique, tels que l’algorithmique, l’intelligence artificielle, les réseaux et les interactions homme-machine. Il dispose d’équipements technologiques avancés et participe à de nombreux projets de recherche européens et internationaux. Les doctorants bénéficient d’un environnement académique stimulant et de collaborations interdisciplinaires enrichissantes. Situé à Bordeaux, le LaBRI offre un cadre de vie agréable et dynamique.

Candidatures :
Pour postuler, veuillez envoyer par e-mail à jean-luc.rouas@labri.fr un seul fichier PDF contenant un CV complet, une lettre de motivation (décrivant vos qualifications, vos intérêts de recherche et votre motivation pour postuler), les coordonnées de deux référents et des copies de diplômes et relevés de notes (Master, Licence).

 

 


Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2025 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA