6-21 (2020-06-30) PhD at Université Grenoble Alpes, France
L'Université Grenoble Alpes recrute une doctorante ou un doctorant avec un contrat de 3 ans entièrement financé à partir d'octobre 2020 dans le cadre du projet THERADIA.
*Le projet THERADIA*
Le projet THERADIA consiste à mettre au point un assistant thérapeutique virtuel qui constitue le relais et l?interface entre le patient et le thérapeute mais aussi les aidants qui gravitent autour du patient. Par un usage massif de différentes technologies d?intelligence artificielle, cet assistant empathique sera chargé d?adapter le traitement aux besoins du patient sous le contrôle du thérapeute, et de s?assurer de son suivi en interagissant avec les différents acteurs (thérapeute, patient, aidants) selon un mode conversationnel. Par rapport à un bot classique, l?objectif est de doter l?assistant d?une intelligence artificielle affective basée sur l?analyse des échanges verbaux et non verbaux (parole, prosodie et expressions du visage). L?assistant devra également être capable de synthétiser différents styles comportementaux pour interagir efficacement, et de résumer le fil d?interactions avec le patient pour restituer au thérapeute ou aux aidants un résumé des échanges et progrès réalisés. Validé d?un point de vue médico-économique dans le contexte de THERADIA, ces technologies pourront trouver de nombreux autres débouchés pour assister des humains amenés à sous-traiter à une intelligence artificielle les dimensions affectives de leurs interactions.
*Sujet de thèse* : Apprentissage profond et hybride pour la génération automatique de résumés multimédia d?observance de remédiation cognitive pour les aidants et cliniciens.
L?objectif de cette thèse de doctorat est de concevoir des méthodes permettant de générer un compte rendu pertinent pour les aidants et les orthophonistes synthétisant la prise en charge de patients souffrants de troubles cognitifs lors de séances de remédiations cognitives réalisées à domicile. La tâche de génération est donc de concevoir un système capable : - d'identifier, d'agréger, de sélectionner et de structurer les informations pertinentes à communiquer au destinataire - de transformer ces informations structurées en un document multimédia cohérent - d'adapter la réalisation vis-à-vis des critères de génération (type de destinataire, période à résumer, taille du texte)
Afin de gérer la grande complexité de la tâche deux approches complémentaires seront étudiées. Une approche experte (génération guidée par les experts médicaux) [Portet et al. 2009] et une approche neuronale de bout-en-bout apprise par renforcement (génération guidée par les lecteurs) [Brenon et al. 2018]. Une approche hybride sera également étudiée [Li et al. 2019]. Ces approches sont dépendantes d'un ensemble d'exemples disponibles pour induire le fonctionnement de ces différents choix. Malheureusement, ces données ne sont pas disponibles aujourd'hui. Basé sur nos derniers travaux, nous aborderons ce problème avec un modèle neuronal dans un cadre d'apprentissage faiblement supervisé qui est capable de tirer parti d'un faible nombre de données supervisées et d'un grand nombre de données non-supervisées. Dans notre cas les données supervisées seront celles acquises dans le projet et les données non supervisées seront obtenues auprès des partenaires (rapport d?entretien) et sur le web (textes comportant des émotions). L'état de l'art montre que des avancées importantes ont été faites en génération automatique de textes avec des modèles neuronaux. Cependant, ces avancées se sont appuyées sur des corpus de grande taille et sur des tâches isolées et bien définies. Dans notre cas, la difficulté porte principalement sur la sélection des informations en fonction du profil du destinataire, le manque de corpus adéquat et de mesure de performances. Un des objectifs de cette thèse sera de mettre en ?uvre des méthodes efficaces d'apprentissage faiblement supervisé [Qader et al. 2019], de renforcement et de collecte de données auprès des utilisateurs cibles du projet.
Enfin, l'évaluation de la génération automatique de textes est une tâche complexe. En effet, plusieurs dimensions linguistiques, sémantiques et applicatives doivent être prises en compte (grammaire, cohérence, émotion, pertinence, utilité). La qualité des sorties textuelles pourra être évaluée, d'une part, par des mesures automatiques sur corpus lors du développement de l'approche et, d'autre part, par des évaluations subjectives humaines (patients, aidants, experts) sur chaque itération majeure du système de génération.
*Environnement scientifique* La thèse sera menée au sein de l'équipe Getalp du laboratoire LIG (https://lig-getalp.imag.fr/). La personne recrutée sera accueillie au sein de l?équipe qui offre un cadre de travail stimulant, multinational et agréable. Les moyens pour mener à bien le doctorat seront assurés tant en ce qui concerne les missions en France et à l?étranger qu?en ce qui concerne le matériel (ordinateur personnel, accès aux serveurs GPU du LIG). La personne sera également amenée à collaborer avec plusieurs équipes impliquées dans le projet THERADIA, en particulier avec des chercheurs du GIPSA-lab situé également à Grenoble et les collaborateurs de l?entreprise SBT HumanMatter(s) basée à Lyon.
*Comment postuler ?* Les candidats doivent être titulaires d'un Master en informatique ou en traitement automatique du langage naturel (ou être sur le point d'en obtenir un). Ils doivent avoir une bonne connaissance des méthodes d?apprentissage automatique et idéalement une expérience en collecte et en évaluation impliquant l?humain. Ils doivent également avoir une très bonne connaissance des langues française et anglaise pour pouvoir traiter les données textuelles dans ces deux langues et mener des entretiens principalement en français. Une expérience dans le domaine de la génération automatique de textes serait un plus.
Les candidatures sont attendues au fil de l?eau et le poste sera ouvert jusqu?à ce qu?il soit pourvu. Elles doivent contenir : CV + lettre/message de motivation + notes master + lettre(s) de recommandations; et être adressées à François Portet (Francois.Portet@imag.fr) et Fabien Ringeval (Fabien.Ringeval@imag.fr).
*References* Brenon A., Portet F., Vacher M. (2018) Arcades : A deep model for adaptive decision making in voice controlled smart-homes. Pervasive and Mobile Computing, 49, pp.92-110 Li Y., Liang X., Hu Z. et al. (2018) Hybrid retrieval-generation reinforced agent for medical image report generation. Advances in Neural Information Processing Systems. p. 1530-1540. Portet F., Reiter E., Gatt A., Hunter J., Sripada S., Freer Y., Sykes C. (2009) Automatic generation of textual summaries from neonatal intensive care data. Artificial Intelligence, 173 (7-8), pp.789-816. Qader R., Portet F., Labbé C. (2019) Neural Text Generation from Unannotated Data by Joint Learning of Natural Language Generation and Natural Language Understanding Models, INLG2019
-- François PORTET Maître de conférences - Grenoble Institute of Technology Laboratoire d'Informatique de Grenoble - Équipe GETALP Bâtiment IMAG - Office 331 700 avenue Centrale Domaine Universitaire - 38401 St Martin d'Hères FRANCE