ISCA Services

ISCA - International Speech
Communication Association

ISCApad Archive » 2020 » ISCApad #270 » Jobs » (2020-06-30) PhD at Université Grenoble Alpes, France

ISCApad #270

Friday, December 11, 2020 by Chris Wellekens

6-6 (2020-06-30) PhD at Université Grenoble Alpes, France

L'Université Grenoble Alpes recrute une doctorante ou un doctorant avec
un contrat de 3 ans entièrement financé à partir d'octobre 2020 dans le
cadre du projet THERADIA.

*Le projet THERADIA*

Le projet THERADIA consiste à mettre au point un assistant thérapeutique
virtuel qui constitue le relais et l?interface entre le patient et le
thérapeute mais aussi les aidants qui gravitent autour du patient. Par
un usage massif de différentes technologies d?intelligence artificielle,
cet assistant empathique sera chargé d?adapter le traitement aux besoins
du patient sous le contrôle du thérapeute, et de s?assurer de son suivi
en interagissant avec les différents acteurs (thérapeute, patient,
aidants) selon un mode conversationnel. Par rapport à un bot classique,
l?objectif est de doter l?assistant d?une intelligence artificielle
affective basée sur l?analyse des échanges verbaux et non verbaux
(parole, prosodie et expressions du visage). L?assistant devra également
être capable de synthétiser différents styles comportementaux pour
interagir efficacement, et de résumer le fil d?interactions avec le
patient pour restituer au thérapeute ou aux aidants un résumé des
échanges et progrès réalisés. Validé d?un point de vue médico-économique
dans le contexte de THERADIA, ces technologies pourront trouver de
nombreux autres débouchés pour assister des humains amenés à
sous-traiter à une intelligence artificielle les dimensions affectives
de leurs interactions.

*Sujet de thèse* : Apprentissage profond et hybride pour la génération
automatique de résumés multimédia d?observance de remédiation cognitive
pour les aidants et cliniciens.

L?objectif de cette thèse de doctorat est de concevoir des méthodes
permettant de générer un compte rendu pertinent pour les aidants et les
orthophonistes synthétisant la prise en charge de patients souffrants de
troubles cognitifs lors de séances de remédiations cognitives réalisées
à domicile. La tâche de génération est donc de concevoir un système
capable :
- d'identifier, d'agréger, de sélectionner et de structurer les
informations pertinentes à communiquer au destinataire
- de transformer ces informations structurées en un document multimédia
cohérent
- d'adapter la réalisation vis-à-vis des critères de génération (type de
destinataire, période à résumer, taille du texte)

Afin de gérer la grande complexité de la tâche deux approches
complémentaires seront étudiées. Une approche experte (génération guidée
par les experts médicaux) [Portet et al. 2009] et une approche neuronale
de bout-en-bout apprise par renforcement (génération guidée par les
lecteurs) [Brenon et al. 2018]. Une approche hybride sera également
étudiée [Li et al. 2019]. Ces approches sont dépendantes d'un ensemble
d'exemples disponibles pour induire le fonctionnement de ces différents
choix. Malheureusement, ces données ne sont pas disponibles aujourd'hui.
Basé sur nos derniers travaux, nous aborderons ce problème avec un
modèle neuronal dans un cadre d'apprentissage faiblement supervisé qui
est capable de tirer parti d'un faible nombre de données supervisées et
d'un grand nombre de données non-supervisées. Dans notre cas les données
supervisées seront celles acquises dans le projet et les données non
supervisées seront obtenues auprès des partenaires (rapport d?entretien)
et sur le web (textes comportant des émotions). L'état de l'art montre
que des avancées importantes ont été faites en génération automatique de
textes avec des modèles neuronaux. Cependant, ces avancées se sont
appuyées sur des corpus de grande taille et sur des tâches isolées et
bien définies. Dans notre cas, la difficulté porte principalement sur la
sélection des informations en fonction du profil du destinataire, le
manque de corpus adéquat et de mesure de performances. Un des objectifs
de cette thèse sera de mettre en ?uvre des méthodes efficaces
d'apprentissage faiblement supervisé [Qader et al. 2019], de
renforcement et de collecte de données auprès des utilisateurs cibles du
projet.

Enfin, l'évaluation de la génération automatique de textes est une tâche
complexe. En effet, plusieurs dimensions linguistiques, sémantiques et
applicatives doivent être prises en compte (grammaire, cohérence,
émotion, pertinence, utilité). La qualité des sorties textuelles pourra
être évaluée, d'une part, par des mesures automatiques sur corpus lors
du développement de l'approche et, d'autre part, par des évaluations
subjectives humaines (patients, aidants, experts) sur chaque itération
majeure du système de génération.

*Environnement scientifique*
La thèse sera menée au sein de l'équipe Getalp du laboratoire LIG
(https://lig-getalp.imag.fr/). La personne recrutée sera accueillie au
sein de l?équipe qui offre un cadre de travail stimulant, multinational
et agréable. Les moyens pour mener à bien le doctorat seront assurés
tant en ce qui concerne les missions en France et à l?étranger qu?en ce
qui concerne le matériel (ordinateur personnel, accès aux serveurs GPU
du LIG).
La personne sera également amenée à collaborer avec plusieurs équipes
impliquées dans le projet THERADIA, en particulier avec des chercheurs
du GIPSA-lab situé également à Grenoble et les collaborateurs de
l?entreprise SBT HumanMatter(s) basée à Lyon.

*Comment postuler ?*
Les candidats doivent être titulaires d'un Master en informatique ou en
traitement automatique du langage naturel (ou être sur le point d'en
obtenir un). Ils doivent avoir une bonne connaissance des méthodes
d?apprentissage automatique et idéalement une expérience en collecte et
en évaluation impliquant l?humain. Ils doivent également avoir une très
bonne connaissance des langues française et anglaise pour pouvoir
traiter les données textuelles dans ces deux langues et mener des
entretiens principalement en français. Une expérience dans le domaine de
la génération automatique de textes serait un plus.

Les candidatures sont attendues au fil de l?eau et le poste sera ouvert
jusqu?à ce qu?il soit pourvu. Elles doivent contenir : CV + lettre/message
de motivation + notes master + lettre(s) de recommandations; et être
adressées à François Portet (Francois.Portet@imag.fr) et Fabien Ringeval
(Fabien.Ringeval@imag.fr).

*References*
Brenon A., Portet F., Vacher M. (2018) Arcades : A deep model for
adaptive decision making in voice controlled smart-homes. Pervasive and
Mobile Computing, 49, pp.92-110
Li Y., Liang X., Hu Z. et al. (2018) Hybrid retrieval-generation
reinforced agent for medical image report generation. Advances in Neural
Information Processing Systems. p. 1530-1540.
Portet F., Reiter E., Gatt A., Hunter J., Sripada S., Freer Y., Sykes C.
(2009) Automatic generation of textual summaries from neonatal intensive
care data. Artificial Intelligence, 173 (7-8), pp.789-816.
Qader R., Portet F., Labbé C. (2019) Neural Text Generation from
Unannotated Data by Joint Learning of Natural Language Generation and
Natural Language Understanding Models, INLG2019

--
François PORTET
Maître de conférences - Grenoble Institute of Technology
Laboratoire d'Informatique de Grenoble - Équipe GETALP
Bâtiment IMAG - Office 331
700 avenue Centrale
Domaine Universitaire - 38401 St Martin d'Hères
FRANCE

Phone: +33 (0)4 57 42 15 44
Email: francois.portet@imag.fr
www: http://membres-liglab.imag.fr/portet/

Back

Top

Organisation	Events	Membership	Help
> Board	> Interspeech	> Join - renew	> Sitemap
> Legal documents	> Workshops	> Membership directory	> Contact
> Logos			> FAQ
			> Privacy policy