6-1(2016-01-08) Software/research engineer at LIMSI, Orsay, France

LIMSI ( is looking for a software/research engineer to work on the
design and development of new features for the CAMOMILE platform.

The CAMOMILE platform provides a REST API backend to support collaborative
annotation of multimedia documents. It has been successfully used for the
organization in 2015 of the MediaEval 'Person Discovery' challenge [1].

Features that need to be improved or added to the CAMOMILE platform includes:
- user authentication (currently based on cookies)
- real-time collaboration (e.g. using
- metadata validation (e.g. using ValidateJS)
- interface between CAMOMILE and Amazon Mechanical Turk crowd-sourcing platform

This list is not exhaustive and the candidates is expected to be pro-active
in the choice of new features to implement and of the selected technology.

Applicants should be experienced in Node.js + MongoDB architecture. Python
proficiency is an asset as both Javascript and Python clients will need to be
kept synchronized with the CAMOMILE REST API.

The engineer will also support the organization of the 2016 edition of the
MediaEval 'Person Discovery' challenge, in particular through the design of
web front-end for registration, leaderboard, collaborative annotation of video
segments (see [1] for more details).

Candidates should send CV and motivation letter.
For more details on the position, please contact us.

Employer: Centre National de la Recherche Scientifique
Location: Orsay, France
Contract: 6 to 12 months contract (CDD), starting as soon as possible
Salary: between 24 k? and 35 k? gross yearly salary, depending on diplomas and experience
Contact: Hervé Bredin,


Hervé Bredin


6-2(2016-01-09) Ingénieur R&D en CDI pour le département de la recherche de l'Ina, Paris

 *Institut national de l?audiovisuel*

Département recherche

Groupe de recherches audiovisuelles

Contact : Jean Carrive ( <;)


*Ingénieur R&D en CDI pour le département de la recherche de l?Ina*

*Analyse de l?audio et de la parole//*


Dans le cadre des projets du Département de la recherche et dans le
cadre de projets transverses impliquant le Département, l?Ina recrute
un(e) ingénieur(e) Recherche et Développement chargé(e) de la mise en
?uvre, de l?intégration ou de l?adaptation de technologies d?analyse
automatique de contenus audiovisuels, et plus particulièrement de
technologies de traitement de la parole et d'analyse de l'audio.

Il/elle sera en particulier en charge de poursuivre les travaux déjà
initiés sur la reconnaissance et l'indexation des locuteurs (voir le
démonstrateur « SpeechTrax » en ligne sur l'Espace Recherche ainsi que les publications scientifiques
correspondantes). Ces travaux ont comme perspective applicative la
création d'un « Dictionnaire de voix » utile pour les tâches
d'indexation, de documentation, d'analyse et de fouille.

Il/elle sera amené(e) à collaborer avec l?ensemble des acteurs des
projets internes et externes du Département Recherche. Il aura la
responsabilité des développements informatiques liés à ces technologies
et participera à l?ensemble des tâches de spécification, conception et
rédaction de ces projets. Il sera également amené à participer à la
rédaction de réponses à des appels à projets de recherche et
développement, nationaux ou européens. Il/elle sera amené(e) à
participer à la rédaction de publications à caractère scientifique.

Il/elle contribuera avec les services opérationnels concernés et avec la
Direction des systèmes d'information à la mise en place à des fins
professionnelles d'un système de transcription automatique de la parole.
Il participera aux groupes de travail en charge de cette question.

  Activités principales

Dans ce cadre,  il/elle sera en charge de :

1/ Définir les axes de recherche et développement liés à l'analyse audio
et l'analyse de la parole :

  * Concevoir, implémenter, tester, évaluer des outils technologiques
    innovants dans le cadre des usages existants ou pressentis de
    l?Institut ;
  * Collaborer avec l?ensemble des acteurs internes et externes du
    département ;
  * Participer à la stratégie de recherche et développement du service.

2/ Assurer une R&D au service de l?Institut :

  * Proposer, préparer, coordonner et/ou participer à des projets de
    Recherche et Développement internes en lien avec les services
    opérationnels ;
  * Proposer, piloter et/ou participer à des actions de concertation et
    de réflexion internes dans le cadre de groupes de travail ;
  * Participer au déploiement de systèmes automatiques de la
    transcription de la parole en collaboration avec les services
    opérationnels de l?Ina et la Direction des systèmes d'information
    (DSI) : études des besoins, expertise technique, cahier des charges

3/ Réaliser des partenariats :

  * Proposer, préparer, coordonner, participer à des projets de
    Recherche et Développement collaboratifs, nationaux ou
    internationaux, à des instances de coopération scientifique et
    technologique (COMUE, Pôles de compétitivité, Groupes de recherche)
    en lien avec des partenaires académiques, institutionnels ou
    industriels ;

4/ Publier et diffuser des articles scientifiques :

  * Rédiger  des articles scientifiques et présenter ces articles dans
    des colloques ;
  * Démontrer les travaux de recherche lors de colloques, séminaire ou
    salons ;
  * Participer à la rédaction des documents liés à l?activité (rapports
    d?activité, livrables des projets en particulier).

5/ Assurer une veille technologique dans son domaine.

6/ Participer aux tâches de gestion des ressources informatiques et
techniques du service.

7/ Réaliser un reporting de son activité.

8/ Encadrer des stagiaires et à terme des doctorants.

  Qualifications, diplômes, expérience

  *   Justifier d'un diplôme supérieur (Doctorat)  dans le domaine de
    l'analyse automatique de la parole ou de l'analyse audio, ou d?un
    parcours professionnel admis en équivalence.


  * Maitrise des techniques d'analyse automatique de la parole,
    d'analyse audio, de traitement de signal, d'apprentissage
    automatique, de développement informatique ;
  * Connaissance de la recherche académique et/ou industrielle ;
  * Maîtrise des techniques de conduite de gestion de projets ;
  * Maitrise des techniques de reporting ;
  * Connaissance du paysage audiovisuel français et du monde académique ;
  * Maîtrise des outils bureautiques ;
  * Très bonne maîtrise de l?anglais écrit et parlé.


  * Rigueur, méthode et organisation ;
  * Capacité d?analyse et de synthèse ;
  * Qualités relationnelles ;
  * Qualité d?expression écrite et orale ;
  * Créativité et imagination ;
  * Gestion du temps et des priorités ;
  * Force de proposition ;

  * Sens du service clients et du résultat.

  Liaison hiérarchique

Rattachement hiérarchique au Chef de service Groupes de recherches


42-47 k? / an selon expérience


*Jean Carrive *

*Responsable adjoint du Département Recherche*

Direction déléguée à l'Enseignement, à la Recherche et à la Formation

Ligne directe : +33 1 49 83 *34 29* -

* *


6-3(2016-01-10) TTS research engineer at Nuance Shanghai, China

TTS Research Engineer – Nuance Shanghai, China

Reporting to TTS manager, the research engineer will conduct innovative research and development with focus on TTS Front-end or Back-end technologies.


-As part of the TTS R&D organization, you will be contributing to the development of text-to-speech technology for all types of markets and platforms with focus on Asian languages.

Representative tasks will include:

- Improve TTS front-end or back-end with algorithm innovations.

- Develop product and tools,

- Maintenance and support (PS / Bug fixes)

- Active contribution to the improvement of all QA processes


Native Mandarin, Good English, additional Asia languages is a plus

- Experience with TTS research and development

- Experience with NLP research and development

- Excellent scripting / programming skills

- Experience with SCM tools

- Self-starter, team player

- Passion for quality

- Innovative and curious - 'free thinker'

- Master degree in EE/CS/Comp. Ling (or similar)

Please send your resume application to



6-4(2016-01-11) Stage Master 2 de Recherche en Traitement automatique des langues/Extraction d'information, LIMSI Orsay, France

Stage Master 2 de Recherche en Traitement automatique des langues/Extraction d'information

Intitulé : Reconnaissance des Entités Nommées MÉDicales dans l'Oral (REMEDO)

Durée : 5 mois
Lieu : LIMSI-CNRS, Orsay, France
Rémunération : 554? par mois plus participation aux frais de transport en commun

Devant l'augmentation toujours croissante de la masse de documents produits dans le
domaine médical, il devient de plus en plus difficile d'accéder aux informations
nécessaires au traitement et à la prise en charge des patients. Le recours à des méthodes
automatiques pour accéder aux informations contenues dans les textes devient alors
inévitable. Les méthodes d'extraction d'information sont aujourd'hui largement utilisées
afin d'identifier des données médicales comme des noms de patients, de médicaments ou de
maladies : 'La patiente <nom>Anne Onyme</nom> a été admise pour une <symptome>réaction
allergique</symptome> à la <traitement>pénicilline</traitement> le <date>21 janvier

Cette tâche se révèle toutefois particulièrement ardue lorsqu'il s'agit de traiter des
textes transcrits par des systèmes de reconnaissance de la parole. La qualité variable
des transcriptions automatiques et la variation terminologique compliquent la
reconnaissance des entités.

*Description du stage*
Nous posons l'exploitation de la dimension multimodale comme une piste d'amélioration des
systèmes d'extraction. Une hypothèse est que des paramètres acoustiques comme le rythme
ou l'intensité de la parole peuvent constituer des indices permettant d'aider le repérage
des entités nommées. Le but du stage sera d'éprouver cette hypothèse.

Le travail du stagiaire s'appuiera principalement sur les données issues de la tâche 1a
du challenge CLEF eHealth 2015, soit 200 enregistrements de dossiers de soins lus par une
infirmière ainsi que leur transcription annotée. NB : ces données sont en anglais, une
bonne connaissance de la langue est donc attendue.

Les tâches dévolues au stagiaire sont les suivantes :
 - rédiger un état de l'art sur la reconnaissance des entités nommées dans la parole
 - corriger les annotations préexistantes
 - développer une chaîne d'extraction d'entités nommées multimodale (qui s'appuiera
notamment sur le logiciel Wapiti)
 - utiliser des outils TAL et de traitement du signal pour extraire des traits multimodaux
 - évaluer et analyser l'influence des traits implémentés

*Profil recherché*
M2 Informatique ou linguistique avec parcours TAL

Compétences attendues :
 - Connaissances en programmation (langages de script)
 - Expérience avec des outils de TAL courants (étiqueteurs morphosyntaxiques, analyseurs
syntaxiques, ...) et avec des outils de traitement du signal (Praat)
 - Expérience des méthodes d'apprentissage automatique
 - Intérêt pour le traitement de l'audio et du texte
 - Compétences en anglais
 - Familiarité avec l'environnement Linux
 - Créativité et autonomie

NB : Aucune expérience du domaine médical n'est attendue.

Eva D'hondt
François Morlane-Hondère
Sophie Rosset
Pierre Zweigenbaum

*Pour candidater*
Merci d'adresser votre candidature avec un CV, une lettre de motivation ainsi que vos
notes de l'année universitaire en cours et de l'année dernière à Eva D'hondt
( et François Morlane-Hondère (

Delete | Reply | Reply to List | Reply to All | Forward | Redirect | View Thread | Blacklist | Whitelist | Message Source | Save as | Print
Move | Copy
Move | Copy

6-5(2016-01-14) Technical Engineer / Scientist at ELDA

    ELDA (Evaluations and Language resources Distribution Agency), a company specialized in Human Language Technologies within an international context, is currently seeking to fill an immediate vacancy for Technical Engineer/Scientist (Project Manager) position.

Technical Engineer / Scientist

Under the supervision of the technical development manager, the responsibilities of the Technical Engineer/Scientist include specifying, designing and implementing tools and software components for language resources production frameworks and platforms, carrying out language resources quality control and assessment, as well as developing web services and applications.

This yields excellent opportunities for young, creative, and motivated candidates wishing to participate actively to the Language Technology field.

The task will mostly consist in participating in Web application development projects, language resources production projects, coordinating ELDA?s participation in R&D projects, while being also hands-on whenever required by the development team.


-    PhD in Computer Science
-    at least 2 years of  experience in Natural Language Processing (or Information retrieval) and / or Web application development
-    Good knowledge of Linux and open source software
-    Proficiency in Python or other high-level dynamically-typed programming language, such as Ruby
-    Hands-on experience in Django; proficiency in Django-CMS is a plus
-    Good knowledge of Javascript and CSS
-    Knowledge of SQL and of an RDBMS (PostgreSQL preferred)
-    Good knowledge of Natural Language Processing
-    Dynamic and communicative, flexible to combine and work on different tasks
-    Ability to work independently and as part of a multidisciplinary team
-    Proficiency in French and English
-    Citizenship (or residency papers) of a European Union country

Applications will be considered until the position is filled. The position is based in Paris.

Salary: Commensurate with qualifications and experience.

Applicants should email a cover letter addressing the points listed above together with a curriculum vitae to:

Khalid Choukri
9, rue des Cordelières
75013 Paris
Mail :

For further information about ELDA, visit:


6-6(2016-01-20) Language Engineer at the TTS team of Google

The TTS team at Google is looking for a Language Engineer to help improve synthesis in English and French.

Based in Google London offices, you will be helping with technical tasks involved in creating a speech synthesizer.  This includes:

1. Developing rules for a text normalization system;

2. Large scale data mining;

3. Customizing language building tools for English and French.

4. Text-to-Speech quality evaluation and testing


1. Recent Computer Science graduate or closely related discipline

2. Native-level speaker in French/English and fluent in English.

3. Proficiency in Unix/Version Control System and a modern programming language (Python/C++ preferred)

4. Ability to build and understand regular expressions

5. Interest in data mining and natural language processing a plus

This is an opportunity to work on cutting edge technology in a dynamic team of world-class experts.

Project duration: 6-11 months (with potential for extension)

**This is not a permanent position but a contract position through an employment agency. Applicants must be currently authorized to work in the UK.**

For immediate consideration, please email your CV and cover letter in English (PDF format preferred) with 'Language Engineer English or French' in the subject line. 

Application Deadline: (Open until filled)


Email Address for Applications:


6-7(2016-01-21) Researcher in machine learning at Reykjavik University, Iceland

Machine learning and language technology

Reykjavik University is looking for ambitious candidates to work on development and
implementation of speech recognition and other language technologies. The development of
speech recognizers applies machine learning on big data sets of text and speech
recordings. The machine learning that is used in the projects is mostly implemented and
available in open source software. The work typically includes gathering and preparing
data, setting up and configuring the machine learning procedures, run experiments and
design the interface for users and other software. The positions are for one year with
possibility of extensions.

Specialist in machine learning
The main focus of this job is to apply machine learning on big text and speech datasets
to develop and train automatic speech recognizers. The software that is used in the
project is called Kaldi, which demands a high skill in the use of Linux and associated
tools. The work is to set up and evaluate computational models (finite state transducers,
hidden Markov Models and deep neural networks) on large datasets.

? BSc/MSc degree in mathematics, statistics, engineering, computer science or similar.
? Knowledge of computational modeling is preferable (e.g. differential equations, neural
networks, linear models).
? Good knowledge of Linux is necessary.
? Good skills in writing and understanding shell scripts are preferable (bash, awk, sed).
? Good programming skills are necessary (e.g. C++, Java or Python).

Researcher in machine learning
The main focus of this job is to carry out research on speech recognition using deep
neural networks. The theoretical part of the work can either concentrate on parameter and
model optimization with respect to speech recognition performance or on learning setup
and model configuration with the aim to automate training of speech recognizers. The
group is already using open source speech recognition solutions of Kaldi, Tensorflow and
Theano. Some systems are already in operation while others are in the process of being
implemented. Design improvements and adaptation will continue in the coming months and
years, so the research will have a very direct practical impact.

? MSc/PhD degree in applied mathematic, statistics, computational engineering or computer
science is preferable.
? Knowledge of mathematical modeling is preferable (e.g. differential equations, neural
networks, linear systems).
? Good skills in applying and analyzing algorithms.
? Good knowledge of Linux is preferable.
? Ability to use shell scripts is preferable (bash, awk, sed).
? Good programming skills are necessary (e.g. C++, Java or Python).

For further information contact Jón Guðnason, ( Assistant Professor in School of
Science and Engineering.
Applications should be submitted before the end of 15th of April 2016 but strong
applications might be considered earlier.
Please submit your application through links provided at:


6-8(2016-01-25) Poste de MCF au LIG (équipe GETALP) pour la recherche et au département I3L (informatique pour les lettres, langues et langage) de l'Univ. Grenoble Alpes (France)
Poste de MCF au LIG (équipe GETALP) pour la recherche et au département I3L (informatique pour les lettres, langues et langage) de l'Univ. Grenoble Alpes (UGA= université grenobloise fusionnée depuis 1/1/2016 regroupant les 3 établissements U. Joseph Fourier, U. Pierre Mendes-France et U. Stendhal) pour l'enseignement.
Short description of the position in English
'The associate professor position concerns informatics and speech processing. The selected candidate will join the GETALP group of LIG laboratory and reinforce the speech / spoken language processing axis.
Teaching  will be given in student programs  covering human and social sciences.
Intitulé du poste pour la publication : Informatique et traitement de l?oral
Composante ou service : département I3L (informatique pour les lettres, langues et langage)

Numéro du poste* : 0209

Section CNU  : 27-07

Unité de recherche ou unité mixte de recherche de rattachement (nom et n°) : LIG UMR 5217

Localisation du poste : Grenoble

Mots-clés renseignés pour la recherche du poste dans Galaxie par les candidats 

Traitement automatique des langues
Traitement de la Parole
Interaction non-verbale
Communication homme-machine

Profil Enseignement 
Les objectifs pédagogiques sont de préparer l?ensemble des étudiants de Lettres-Langues-Langage à l?intégration du numérique dans leurs filières afin de faire face à la diversité, la synergie et l?évolution des services numériques et dispositifs d'interaction centrés-humains et des contextes d'usage. Les besoins en enseignement du département I3L se situent dans les domaines suivants : TAL, web dynamique, corpus électroniques, ingénierie linguistique, évaluation des outils du TAL, bureautique pour Lettres, Langues, Langage. Plus spécifiquement dans les masters, les enseignements devront être au plus près des activités de recherche et répondre aussi bien aux besoins de l?insertion professionnelle qu?à l?innovation en R&D.
Filières de formation concernées :
? Licence : Globalement dans le cadre des cours d'informatique (toutes les mentions sont concernées), plus spécifiquement dans le cadre du module « Métiers des humanités numériques »
? Master : Globalement dans les enseignements liés à l?informatique des masters des deux UFR LLASIC ET LE et plus spécifiquement dans le master Sciences du langage, spécialité Industries de la Langue (IDL) ;

La personne recrutée devra avoir une connaissance du tissu industriel du secteur et de son devenir, lui permettant de travailler à une bonne identification de compétences en adéquation avec les évolutions rapides des entreprises du domaine.

Profil Recherche

La personne recrutée intégrera l?équipe GETALP du LIG qui s'intéresse à tous les aspects théoriques, méthodologiques et pratiques de la communication et du traitement de l'information multilingue (écrite ou orale). GETALP porte par ailleurs un intérêt spécifique aux situations d?interactions et aux contextes atypiques (langues peu-dotées, locuteurs atypiques, relation sociale endommagée, etc.) en prenant en compte la diversité des langues, des locuteurs, des cultures et des relations socio-affectives. La pluridisciplinarité de GETALP (informaticiens, linguistes, phonéticiens, traducteurs, roboticiens, etc.) croise les approches expertes vs. empiriques et s?appuie sur des corpus langagiers de grande taille tout en développant des corpus annotés sur des hypothèses théoriques riches (« beautiful data »). Les aspects méthodologiques (évaluation, expérimentation écologique dans les plateformes Domus, le FabMSTIC ou in situ, éthique) sont centraux, en particulier dans le transfert vers les partenaires industriels. 
La personne recrutée devra permettre de renforcer les aspects interdisciplinaires de la recherche et participera à l?élaboration des méthodes d?évaluations dans une démarche éthique, concernant les processus d?expérimentation et les conséquences sociétales des innovations potentielles. Un point essentiel sera d?entretenir et développer les collaborations avec les autres équipes du LIG, autant sur les aspects informatiques et méthodologiques que sur les situations d?observation ou les applications. Plus largement la personne recrutée sera incitée à enrichir les collaborations avec les autres laboratoires impliqués dans le pôle de recherche ALLSHS de l?UGA.

Activités administratives
La personne recrutée pourra avoir en charge la responsabilité des enseignements I3L en licence, et participer aux responsabilités administratives dans l?UFR LLASIC.

Contact pour la recherche : 

Contact pour l?enseignement
AUBERGE, Véronique
dates audition: 23 Mai 2016

6-9(2016-01-30) PhD position in AVSR, Trinity College Dublin, Ireland

PhD position in AVSR at Trinity College Dublin, Ireland

With a link to this advert:


6-10(2016-02-06) 2 post-doc positions at the Italian Institute of Technology.

 1 post-doc in Brain- and biosignal-based speech recognition

- 1 post-doc in New techniques for vision-assisted speech processing with event-drive cameras (within the EU H2020 Ecomode project)



6-11(2016-02-27) Maître de Conférences en informatique au LIA , Avignon France

Un poste de Maître de Conférences en informatique (section 27) est mis au concours pour
la campagne 2016 au Centre d'Enseignement et de Recherche en Informatique de l'Université
d'Avignon (

La personne recrutée effectuera sa recherche au sein du LIA (

Le profil du poste est consultable sur rubrique Emplois et sur

- Informatique - Profil indexation audio/biométrie vocale  (Poste 088 / Galaxie 4080) -

Contacts :

Enseignement : Corinne Fredouille - Directrice des
Etudes du CERI et Fabrice Lefèvre - Directeur du CERI

Recherche : Fabrice Lefèvre - Directeur du CERI,
Directeur LIA par interim


6-12(2016-02-27) 3 Teaching and Research positions at Lium, Université du Maine, France

Trois postes d'enseignants-chercheurs en informatique sont à pourvoir à l'Université du Maine lors de la campagne de recrutement 2016 : un poste de Professeur et deux postes de Maîtres de conférences.

Les personnes recrutées sur chacun de ses postes effectueront leurs travaux de recherche au LIUM (Laboratoire d'Informatique de l'Université du Maine) :

- Le poste de Professeur est rattaché au Département d'informatique de  l'UFR Sciences de l'Université du Maine. Le profil recherche est spécialisé dans le domaine du traitement automatique du locuteur. Le profil enseignement  vise les matières fondamentales de l'informatique, incluant la capacité à enseigner la théorie des langages.
Plus d'info :

- Un poste de Maître de conférences est rattaché au Département d'informatique de l'UFR Sciences de l'Université du Maine. Le profil recherche est spécialisé dans le domaine de la reconnaissance automatique de la parole. Le profil enseignement  vise les matières fondamentales de l'informatique, incluant la capacité à enseigner la théorie des langages.
Plus d'info :

- L'autre poste de Maître de conférences est rattaché au Département Gestion des Entreprises et des Administrations de l'IUT du Mans. Le profil recherche est spécialisé dans le domaine de l'apprentissage automatique et de la fouille de données textuelles. Le profil enseignement concerne l'informatique de gestion, les bases de données et l'informatique appliquée à la gestion des entreprises.
Plus d'info :


6-13(2016-03-01) Professeur , Grenoble, France
Intitulé du poste pour la publication : Informatique et traitement de l?oral
Composante ou service : département I3L (informatique pour les lettres, langues et langage)

Numéro du poste* : 0209

Section CNU  : 27-07

Unité de recherche ou unité mixte de recherche de rattachement (nom et n°) : LIG UMR 5217

Localisation du poste : Grenoble

Mots-clés renseignés pour la recherche du poste dans Galaxie par les candidats 

Traitement automatique des langues
Traitement de la Parole
Interaction non-verbale
Communication homme-machine
Short description of the position in English
'The associate professor position concerns informatics and speech processing. The selected candidate will join the GETALP group of LIG laboratory and reinforce the speech / spoken language processing axis.
Teaching  will be given in student programs  covering human and social sciences.

Profil Enseignement 
Les objectifs pédagogiques sont de préparer l?ensemble des étudiants de Lettres-Langues-Langage à l?intégration du numérique dans leurs filières afin de faire face à la diversité, la synergie et l?évolution des services numériques et dispositifs d'interaction centrés-humains et des contextes d'usage. Les besoins en enseignement du département I3L se situent dans les domaines suivants : TAL, web dynamique, corpus électroniques, ingénierie linguistique, évaluation des outils du TAL, bureautique pour Lettres, Langues, Langage. Plus spécifiquement dans les masters, les enseignements devront être au plus près des activités de recherche et répondre aussi bien aux besoins de l?insertion professionnelle qu?à l?innovation en R&D.
Filières de formation concernées :
? Licence : Globalement dans le cadre des cours d'informatique (toutes les mentions sont concernées), plus spécifiquement dans le cadre du module « Métiers des humanités numériques »
? Master : Globalement dans les enseignements liés à l?informatique des masters des deux UFR LLASIC ET LE et plus spécifiquement dans le master Sciences du langage, spécialité Industries de la Langue (IDL) ;

La personne recrutée devra avoir une connaissance du tissu industriel du secteur et de son devenir, lui permettant de travailler à une bonne identification de compétences en adéquation avec les évolutions rapides des entreprises du domaine.

Profil Recherche

La personne recrutée intégrera l?équipe GETALP du LIG qui s'intéresse à tous les aspects théoriques, méthodologiques et pratiques de la communication et du traitement de l'information multilingue (écrite ou orale). GETALP porte par ailleurs un intérêt spécifique aux situations d?interactions et aux contextes atypiques (langues peu-dotées, locuteurs atypiques, relation sociale endommagée, etc.) en prenant en compte la diversité des langues, des locuteurs, des cultures et des relations socio-affectives. La pluridisciplinarité de GETALP (informaticiens, linguistes, phonéticiens, traducteurs, roboticiens, etc.) croise les approches expertes vs. empiriques et s?appuie sur des corpus langagiers de grande taille tout en développant des corpus annotés sur des hypothèses théoriques riches (« beautiful data »). Les aspects méthodologiques (évaluation, expérimentation écologique dans les plateformes Domus, le FabMSTIC ou in situ, éthique) sont centraux, en particulier dans le transfert vers les partenaires industriels. 
La personne recrutée devra permettre de renforcer les aspects interdisciplinaires de la recherche et participera à l?élaboration des méthodes d?évaluations dans une démarche éthique, concernant les processus d?expérimentation et les conséquences sociétales des innovations potentielles. Un point essentiel sera d?entretenir et développer les collaborations avec les autres équipes du LIG, autant sur les aspects informatiques et méthodologiques que sur les situations d?observation ou les applications. Plus largement la personne recrutée sera incitée à enrichir les collaborations avec les autres laboratoires impliqués dans le pôle de recherche ALLSHS de l?UGA.

Activités administratives
La personne recrutée pourra avoir en charge la responsabilité des enseignements I3L en licence, et participer aux responsabilités administratives dans l?UFR LLASIC.
a) la procédure pour candidater est désormais en ligne sur
b) le profil du poste concerné est accessible sur
(référence galaxie n°7 'informatique et traitement de l'oral')

Contact pour la recherche : 

Contact pour l?enseignement
AUBERGE, Véronique
dates audition: 23 Mai 2016

6-14(2016-03-15) Thèse ministérielle à l'IRISA intitulée 'Transformation de registres par extraction de motifs langagiers'

Vous trouverez à l'URL suivante et en pièce jointe une offre de thèse ministérielle à l'IRISA intitulée 'Transformation de registres par extraction de motifs langagiers' : . Merci de diffuser auprès de personnes éventuellement intéressées.


Pour plus de précisions ou pour postuler, merci de contacter :

- Pascale Sébillot :

- Nicolas Béchet :

- Gwénolé Lecorvé :


Date limite de candidature : 30 avril 2016.


6-15(2016-04-03) Post Doctoral Position in Machine Learning at Univ. Lille, France

We are happy to advertise for a Post Doctoral Position in Machine Learning at Univ. Lille, France


Machine Learning for Human-Robot Interaction

Job description
This position is off ered in the framework of the BabyRobot H2020 ( project involving 8 partners across Europe (including France, Sweden, UK, Greece, Germany and Denmark). The project focuses on interactive robotics and especially on interaction with children. 

Breakthroughs in core robotic technologies are needed to support this research mainly in the areas of motion planning and control in constrained spaces, gestural kinematics, sensorimotor learning and adaptation. In addition, new models of interaction need to be developed. Because of the human being in the loop, standard control theory can hardly be applied. For this reason, machine learning methods such as reinforcement and imitation learning have been identified as candidates to address these issues in a uni ed framework. Therefore, the applicant will be involved in research in core machine learning applied to control and interaction. Several directions of research are envisioned. First, recent works on stochastic games [3] applied to dialogue management [1] can be further investigated so as to be adapted to multimodal and multiparty interaction scenarios. Second, the 'learning from demonstration' (LfD) [4] paradigm can be adapted to the adversarial case so as to transfer interactional behaviours from actual human-human interactions to machines. Other  topics can be investigated such as inverse reinforcement learning [2] or transfer learning.

Profi le
The applicant should have completed a PhD in computer science, statistical learning or robotics. The ideal candidate will have a strong background in machine learning and especially in reinforcement learning or stochastic games. Experience in interactive systems (spoken dialogue systems, interactive robotics, human-machine interfaces) would be much appreciated. The recruited person will be involved in the management of the project, participate to consortium meetings and contribute to deliverables. Therefore, good communication skills and autonomy are mandatory. Preference will go to candidate with a strong publication record.

Work environment
The position is offered in the Sequential Learning (SequeL) research team (joint team between Inria, Univ. Lille and CNRS) located in Lille, France. SequeL is a world-leading group in reinforcement learning, bandit theory and recommendation systems involving 30 members (including 10 permanent staff members). The team's working language is English. The team is part of the French National Institute for Computer Science and Mathematics (Inria) as well as the Computer Science and Signal Processing laboratory of Lille (CRIStAL). Lille is the capital of the north of France, a metropolis with 1 million inhabitants, with excellent train connection to Brussels (30 min), Paris (1h) and London (1h30).

How to apply
The application should include a brief description of research interests and past experience, a CV, degrees and grades, motivation letter, relevant publications, letter(s) of recommendation and contact information to reference persons.

Application deadline: 30th of April 2016

Starting date: May or June 2016
Duration: 24 months (can be extended)
Salary (after taxes): 2100 euros

Olivier Pietquin:

Bilal Piot:

[1] Merwan Barlier, Julien Perolat, Romain Laroche, and Olivier Pietquin. Human-machine dialogue as a stochastic game. In Proceedings of the 16th Annual SIGdial Meeting on Discourse and Dialogue (SIGDIAL 2015), pages 2{11, Prague (Czech Republic), September 2015.

[2] Edouard Klein, Matthieu Geist, Bilal PIOT, and Olivier Pietquin. Inverse Reinforcement Learning through Structured Classi cation. In Advances in Neural Information Processing Systems (NIPS 2012), pages 1007{1015, Lake Tahoe (NV, USA), December 2012.
[3] Julien Perolat, Bruno Scherrer, Bilal Piot, and Olivier Pietquin. Approximate dynamic programming for two-player zero-sum markov games. In Proceedings of the International Conference on Machine Learning (ICML 2015), Lille (France), July 2015.
[4] Bilal Piot, Matthieu Geist, and Olivier Pietquin. Learning from demonstrations: Is it worth estimating a reward function? In Hendrik Blockeel, Kristian Kersting, Siegfried Nijssen, and Filip Zelezny, editors, Proceedings of the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML/PKDD 2013), volume 8188 of Lecture Notes in Computer Science, pages 17{32, Prague (Czech Republic), September 2013. Springer.


6-16(2016-04-11) Research Associate Position at York University, Toronto, Canada

Research Associate Position at York University, Toronto, Canada

The Lassonde School of Engineering, York University ( is sponsoring a fulltime
research associate position in deep learning for natural language processing (NLP). This position
is comparable with a research professorship (with annual salary up to $85k), an initial two-year
appointment but extendable. This research position is created to support the cutting-edge research
activities in NLP, particularly applying deep learning to the challenging NLP or AI problems, including
(not limited to) information extraction, language understanding and inference, and probabilistic
If you are interested, please email your CV to:
Prof. Hui Jiang ( (
iFLYTEK Laboratory for Neural Computing and Machine Learning (iNCML)
Department of Electrical Engineering and Computer Science
The Lassonde School of Engineering, York University
The deadline is May 15, 2016.


6-17(2016-04-20) PhD position at Idiap Research Institute, Martigny, Switzerland

A new PhD position is open in 'Multilingual Affective Speech Synthesis' at Idiap Research

Candidates with knowledge of French and English would be at an advantage.


6-18(2016-04-20) Speech Recognition Researcher position (full-time) at Sony, in Stuttgart, Germany.

Speech Recognition Researcher position (full-time) at Sony, in Stuttgart, Germany. For details, please check out We welcome your e-mail to


6-19(2016-04-21) RESEARCH SCIENTIST, EMR.AI Inc., San Francisco, CA, USA


EMR.AI Inc., San Francisco, CA


Headquartered in San Francisco, CA, EMR.AI Inc. is a leading provider of AI solutions to the medical sector. EMR.AI transforms unstructured information, in form of written, spoken, or typed reports, clinical test results, and radiographs into international standard codes saved in common EMR systems. The wealth of discrete medical data provided through this transformation in conjunction with EMR.AI's suite of medical analytics solutions enables stakeholders, practitioners, researchers, health providers, and policy makers to obtain a comprehensive picture of the available medical data in their organization.



EMR.AI Research & Development has openings for Research Scientists in the field of Natural Language Processing in our Downtown San Francisco offices. Scientists will work on projects spanning a variety of tasks including the semantic interpretation of written and spoken medical reports, the design of language models for a variety of NLP tasks and speech recognition, the summarization of written and spoken language in the medical domain, the incorporation of lexica, ontologies, relational databases, and other sources of structured and unstructured knowledge sources into EMR.AI’s medical NLP tool set, and others. This is a unique opportunity to be part of a cutting-edge R&D team in the epicenter of the world’s AI tech industry with true impact on medical research.



Process huge corpora of medical textual documents to perform syntactic and semantic analyses and train, tune, and test probabilistic and other data-driven models, using both existing tool benches, proprietary and open-source, as well as self-developed algorithms and techniques.

Produce high-quality programs and scripts to embed scientific algorithms into effective prototypes and demos to be shared with EMR.AI’s leadership team, its customers, partners, and vendors.

Create and document technological innovations by means of patent disclosures, scientific publications, media alerts, and other channels.


Work closely with EMR.AI’s speech processing team and its software engineering division to produce innovative and effective solutions for a range of AI products and services in the medical domain.

Represent the R&D division in communications with EMR.AI’s leadership team, its customers, partners, and vendors at meetings, conventions, and other venues as well as in written statements.




PhD in computer science, computational linguistics, electrical engineering, or a related field. Experience in the state of the art of NLP and its standard tools is required. Candidates must be very skilled in programming and must have a proven scientific track record. They must be excellent team players, including with distributed teams, and strong in oral and written English communication. Knowledge of the US medical sector is desirable, so are experience with start-ups and strong scientific connections throughout the Bay Area and beyond.



EMR.AI offers competitive salaries, an excellent benefit package, and a stimulating work environment in the heart of San Francisco with manifold local, domestic, and international commercial and academic partnerships.



Please send your application documents to



EMR.AI Inc. 90 New Montgomery St San Francisco, CA 94105,

USA phone: +1-415-200-8535

e-mail: www:


6-20(2016-04-28) 3-year postdoctoral research position in speech processing, Trinity College, Dublin, Ireland

A 3-year postdoctoral research position in speech processing is available in the Sigmedia Group in Trinity College Dublin, Ireland.


Full details of the position are given in the advert available at:


6-21(2016-05-02) Postdoctoral Position in Linguistics (Prosodic Phrasing and Discourse Comprehension), Université catholique de Louvain, Belgique

Postdoctoral Position in Linguistics (Prosodic Phrasing and Discourse Comprehension), Université catholique de Louvain

The Institute for Language & Communication of the Université catholique de Louvain (Belgium) is currently seeking a postdoctoral researcher to perform corpus analysis and experimental research on the role of prosody in discourse comprehension. The successful candidate will work under the supervision of Prof. Anne Catherine Simon and will join the project “PhraDiCo: Prosodic phrasing for discourse comprehension. Perception of prosodic boundaries and their contribution to the construal of discourse coherence”. He/she will be employed on a fixed-term contract for 24 months.

Project Description

[PhraDiCo] Prosodic phrasing for discourse comprehension. Perception of prosodic boundaries and their contribution to the construal of discourse coherence. Prosodic phrasing is central to language comprehension and discourse coherence. Spoken language is highly transitory and dynamic. Speech is processed in real-time, as the hearer allocates his attention to each incoming unit and integrates it into a coherent whole. Speech is chunked into prosodic units which are presumably used as basic units of discourse processing. During its first phase, this project aims to explore how ordinary listeners (as opposed to trained experts) perceive prosodic boundaries in spoken language. What is the relationship between the prosodic cues (pauses, lengthening, melodic discontinuity etc.) and the perceived strength of prosodic boundaries? To what extent does the syntactic structure contribute to the perception of prosodic boundaries? Are naïve listeners consistent in their appreciation of boundary strength on word boundaries? Once those questions have been sufficiently tackled, we will focus on analysing the contribution of prosodic boundaries to discourse coherence: relational coherence, which seeks to establish discourse relations between discourse “building blocks”, and referential coherence, i.e. the identification of large-scale discourse topics. Four perceptual experiments have been designed to investigate (i) the acoustic and linguistic factors involved in the perception of prosodic boundary strength; (ii) the influence of speaking styles variability (speech rate, pitch register) on prosodic boundary perception; (iii) the contribution of prosodic units to the construal of discourse relations and (iv) to the identification of large-scale discourse topics.

The project is undertaken by the research centre “Valibel – Discours & Variation” (Discourse & Variation, and is funded by F.S.R. – FNRS (

Job Description


  • Discursive and prosodic analysis of speech data (transcription, alignment and annotation).

  • Design of experimental procedures and preparation of speech samples for perceptual experiments.

  • Organisation of on-line and off-line speech perception experiments (recruitment of participants, technical and practical aspects of execution etc.).

  • (Statistical) Analysis of the experimental results using databases and specialised tools.


The appointed researcher will work in close collaboration with the project’s supervisor and another postdoctoral researcher. He/she will participate in research leading to scientific publications.



  • PhD in Linguistics (discourse analysis, experimental linguistics, cognitive approach to discourse comprehension, syntax-prosody interface) obtained not more than 6 years before the starting date.

  • Experience in discourse annotation (topic-focus, discourse relations), in experimental research (perceptual studies), and/or in prosodic analysis.

  • Expertise in statistical methods for analysing linguistic data is desirable.

  • Knowledge of the Praat software is an asset.

  • Native-like command of French and good command of academic English.


Place of employment: Louvain-la-Neuve, Belgium (30 km south of Brussels). With 21000 students and 5000-member staff, the University of Louvain is the largest university of the Brussels and Wallonia regions of Belgium.

Contract length: 24 months.

Contract term: Full-time

Starting date: July 2016

Deadline for applications: 5 June 2016


Applications (motivation letter, detailed CV, 1-3 recommendation letters and 3 relevant publications), should be sent in electronic format to Prof. Anne Catherine Simon (


6-22(2016-05-10) PhD positions at Inria, France

PhD positions are available in our group at Inria, in France, on deep learning for:
- speech enhancement
- robust speaker recognition
- robust speech recognition
- language model adaptation


Candidates must hold an MSc in computer science, machine learning, signal processing, or
applied mathematics, or be about to obtain one. Programming experience in Python or C/C++
is a must.

Working Environment:
Nancy is one of the top cities to study in France with 50,000 students, cheap
accomodation, a vibrant cultural scene, and good connections to Paris (1.5h), Luxemburg
(1.5h), Belgium, and Germany. Inria Nancy is a 500-people research institute dedicated to
computer science. The Multispeech team ( is a
30-people group covering various fields of speech science, with a strong emphasis on
statistical machine learning and signal processing.

To apply:
Click on 'candidater' at the bottom of the webpage. You will be asked for a detailed CV,
BSc and Msc transcripts and diplomas, publications, and recommendation letters. Please
apply as soon as possible. There will be a first cutoff date on May 31 and a second one
on June 30.

Emmanuel Vincent


6-23(2016-05-12) PhD Position at LORIA, Nancy, France

PhD Position: Merging acquisition and processing of cineMRI of the vocal tract



Tracking the position of speech articulators along time is crucial to understand speech production better. For a long time X-ray imaging was the only technology able to acquire images at a sufficiently high sampling frequency (around 50 images per second) for visualizing articulatory gestures. However, this technique has been abandoned at the end of the eighties because of the health hazard implied by ionizing radiations. Furthermore, since the whole vocal tract is projected on the image plane contours of organs (especially the mandible, teeth and tongue) overlap on the images making the processing of images very difficult.


The interest of Magnetic Resonance Imaging (MRI) is to provide an excellent contrast of soft tissues for a slice placed in any orientation and dynamic MRI is acknowledged as a powerful tool for imaging speech production [3].  However, current performance of cineMRI remains inadequate in terms of sampling rate and spatial resolution, and the objective of this thesis is to develop more efficient acquisition protocols and algorithms.


The objective is to develop protocols by exploiting the latest advances in MRI, particularly parallel imaging and reconstruction under parsimony constraints called ?compressed sensing? [1]. IADI laboratory developed MRI reconstruction techniques with movement compensation [2] and multi-slice dynamic reconstruction enabling super resolution. These techniques have been already applied to cardio-respiratory movements by using physiological signals (ECG and respiratory) as constraints for the reconstruction algorithms.


A first preliminary work consisting of applying these techniques to the domain of speech production  has been carried out [4]. A second work was dedicated to the development of an acquisition protocol based on ?compressed sensing?. The idea is to exploit the parsimony of the image Fourier transform coefficients in order to acquire only a small number of them, and then to reconstruct the image in an optimal manner.


However, it is possible to do better since the speech signal is acquired simultaneously then denoised before being segmented into speech sounds. Therefore, the contribution of each line acquired in the image Fourier space can be related to the speech sound it corresponds to, and one can take advantage of this information to improve the resolution of reconstructed images. This  idea will be exploited with the objective of realizing a proof of concept of automatic acquisition/reconstruction of MRI images of vocal tract during speech production. We would like to go further by utilizing the knowledge of the speech sound and the approximative vocal tract shape predicted for the sound by an articulatory model to pilot acquisition.


Keywords: MRI acquisition, compressed sensing, speech processing, articulatory modeling, vocal tract


Some references

[1]Michael Lustig, David Donoho, and John M. Pauly. Sparse MRI: The application of compressed sensing for rapid MR imaging. MAGNETIC RESONANCE IN MEDICINE, 58(6):1182?1195, December 2007.

[2]F. Odille, P. A. Vuissoz, P. Y. Marie, and J. Felblinger. Generalized reconstruction by inversion of coupled systems (GRICS) applied to free-breathing MRI. Magn Reson Med, 60(1):146?57, July 2008.

[3]Andrew D Scott, Marzena Wylezinska, Malcolm J Birch, and Marc E Miquel. Speech MRI: Morphology and function. Physica Medica, 30(6):604?618, 2014.

[4]P.A. Vuissoz, F. Odille, Y. Laprie, E. Vincent, G. Hossu, and J. Felblinger. Speech Cine SSFP with optical microphone synchronization and motion compensated reconstruction. In ISMRM Workshop on Motion Correction in MRI, Tromso, Norvège, May 2014.


Both laboratories IADI and LORIA have developed a narrow and fruitful collaboration for years which in particular resulted in the development of a ?compress sensing? acquisition algorithm and in a research contract on articulatory synthesis. A working environment covering articulatory modeling and MRI data acquisition domains is now available and will offer very favorable conditions for this work.


·       Pierre-André Vuissoz (IADI ? Imagerie Adaptative Diagnostique et Interventionnelle, unité INSERM U947)

·       Yves Laprie (MultiSpeech team at LORIA ? Laboratoire Lorrain de Recherche en Informatique et ses Applications, UMR 7503)


We are looking for a highly motivated person with a master degree in computer sciences, applied mathematics or computer sciences. The applicant should have a solid background in signal processing (and Matlab software) and computer sciences. Knowledge in speech processing will be also appreciated.

Interested applicants should send
their application file to and

a)     Motivation letter,

b)     CV,

c)     academic transcripts (with explanation of the grade scale adopted),

d)     2 references (letters or names)


Expected start date: 1st October 2016


6-24(2016-05-14) Senior Speech Analytics Engineer at SRI


Title: Senior Speech Analytics Engineer


Job Description

SRI’s Speech Technology and Research (STAR) Lab seeks a self-motivated, team-oriented, experienced leader and innovator to work in the area of speaker state analysis (for example, emotion and health states). The work will include advancing technology capabilities, determining client needs and understanding client data, winning new funding, interacting with clients, both government and commercial, and leading current or new projects in this area. The successful candidate must be proactive and entrepreneurial. This is an opportunity to have a significant impact in an emerging research area.

STAR Lab engages in leading-edge research in speech recognition, speaker characterization, speaker and language identification, machine translation, natural language processing and other areas of speech/language technology, offering opportunities from basic research to prototyping, productization, and widespread deployment. The multidisciplinary research team consists of excellent speech researchers, linguists and software engineers. Characteristics of STAR staff are enthusiasm, self-motivation, initiative, passion for learning, taking ownership, thriving in a flat organizational hierarchy, and a desire to control their own career paths.

SRI International is a premier nonprofit research organization based in Menlo Park, California with a mission to create world-changing solutions making people safer, healthier, and more productive.

Located in the heart of Silicon Valley, the world’s center for innovation and technology, SRI’s focus spans everything from basic research to delivered systems, government and commercial work and spinning off successful companies like SIRI. Flexible cross-laboratory teams often form dynamically to solve challenging problems spanning multiple disciplines.


A PhD degree or equivalent with at least 10 years of experience in speech or NLP technology. Prior interest in the area of speaker characterization is an advantage. Experience of leading teams of projects in either academia or industry along with a record of either successful proposals (government or industry) or managing a start-up in the speech area is required. Strong oral and written communication skills in English are expected. US citizenship is a plus but not required. Must be flexible to traveling.

Apply online at

Job ID: 1020BR

SRI is an Equal Employment Opportunity/Affirmative Action Employer


6-25(2016-05-14) Research Associate Position at York University, Toronto, Canada

Research Associate Position at York University, Toronto, Canada

The Lassonde School of Engineering, York University ( is
sponsoring a fulltime
research associate position in deep learning for natural language processing (NLP). This
is comparable with a research professorship (with annual salary up to $85k), an initial
appointment but extendable. This research position is created to support the cutting-edge
activities in NLP, particularly applying deep learning to the challenging NLP or AI
problems, including
(not limited to) information extraction, language understanding and inference, and
If you are interested, please email your CV to:
Prof. Hui Jiang ( (
iFLYTEK Laboratory for Neural Computing and Machine Learning (iNCML)
Department of Electrical Engineering and Computer Science
The Lassonde School of Engineering, York University


6-26(2016-05-14) Speech Technologist @ Voice Tech Startup!, Belmont, MA, USA

Speech Technologist @ Voice Tech Startup!

Location: Belmont, MA

Available: Immediately

VocaliD is a voice technology start-­up that is bringing speaking machines to life by creating

personalized digital voices. Our award-­winning technology is grounded in over a decade of

research at Northeastern University and has enabled us to attract Small Business Innovation

awards from the National Science Foundation and the National Institutes of Health. We

successfully delivered a set of beta voices in 2015 and have a waiting list of pre-­orders

though our oversubscribed crowdfunding campaign. We are now seeking an experienced

research-­based speech technologist to join our team as we launch our personalized voice

service in mid 2016.

Communications applications and devices are getting smarter and using more sophisticated

AI, yet the voices remain robotic and unnatural. Until now, the cost and time to build a custom

voice has been prohibitive. VocaliD creates personalized digital voices at scale for use on

any device that speaks. Our proprietary voice search and speech blending algorithms

leverage our “Human Voicebank”, a collection of 3.5 million of recordings crowdsourced from

around the world. Our breakthrough is that we only need 2-­3 seconds of someone’s voice to

(re)create a voice when combined with recordings of a matched speaker from the Voicebank.

Our initial market addresses the 10M+ people worldwide who use a machine to speak.

VocaliD enables these individuals to speak in their own voice instead of the familiar “Stephen

Hawking” voice. Join our dynamic team as we push the envelop on innovation while having

real social impact!


-­ Create tools for filtering and parsing recorded voices

-­ Implement machine learning algorithms to match donor and recipient voices

-­ Enhance source-­filter separation and voice conversion algorithms

-­ Design and implement novel algorithms for tracking and monitoring speech changes

-­ Create a framework for algorithmic synthesis of voices from donor samples

-­ Implement a SaaS framework for voice deployment

Required Qualifications:

-­ MS or PhD in Electrical or Computer Engineering, Computer Science or related field

-­ Experience programming in C/C++, Python, Java

-­ Experience productizing algorithms from prototypes in Matlab (or other)

-­ Experience with Digital Signal Processing and ideally speech/voice technologies

-­ Experience with AWS services EC2, S3, RDS (Postgres), Route 53

-­ Experience with Windows and Linux

If you are interested in joining a thriving and passionate team, please submit a cover letter

and resume to

Visit us at for more information about VocaliD.


6-27(2016-05-18) Researcher at laboratoire Parole et Langage, Aix-Marseille University, France




Call for Postdoctoral Positions in Cognitive Science/Psychology/Linguistics


Institution: Laboratoire Parole et Langage (CNRS, Aix-Marseille Université)


Location: Aix-en-Provence, France


No. of positions: 1


Duration: 2 years (see below)


Application deadline: July 20, 2016


The Laboratoire Parole et Langage (CNRS, Aix-Marseille Université, Aix-en-Provence, FR) invites applications for one postdoctoral fellowship supported by a grant from the French National Research Agency (ANR). The funded project aims at exploring the role of prosody in speech planning and how planning strategies are affected both by the pragmatic situation and by individual cognitive-emotional abilities. Cognitive-emotional constraints are investigated by comparing healthy adults and clinically impaired individuals (patients affected by multiple sclerosis). The project involves an interdisciplinary team from across the Laboratoire Parole et Langage (which includes experts in linguistics, speech analysis, psychology) including collaboration with the 'Pôle de Neurosciences Cliniques' of the Hospital la Timone (Marseille) and the Neurology Department of the Centre Hospitalier du Pays d'Aix (Aix-en-Provence).


Applicants must have a Ph.D. in a relevant field of study (e.g., Cognitive Science, Linguistics, Psychology), and a strong background in experimental design and statistics. Special attention will be given to candidates with expertise in cognitive aspects of social coordination and in emotion in spoken language. Experience with psychophysiological methodologies and conducting studies with neurological patients is also highly desirable.


The postdoctoral appointment is for a duration of up to two years depending on the starting date, and subject to review after the first year. Applicants should hold a PhD or expect to complete a PhD by the starting date. The starting date is flexible, though the position should be filled by the beginning of the fall of 2016.


Applications should include (i) a cover letter that relates the applicants’ experience and interests to the project, (ii) a comprehensive CV, (iii) the names and contact information of two references, and (iv) a PDF copy of all publications or a list of links where these can be accessed.


Applications in French or English may be sent by email to Elisa Sneed German at


For further inquiries regarding the position or the project, please contact Caterina Petrone (Principal Investigator) at



6-28(2016-05-25) PhD Positions in Signal Processing for Speech Communication, Graz University, Austria

PhD Positions in Signal Processing for Speech Communication

The Signal Processing and Speech Communication Lab (SPSC) of Graz University of
Technology is seeking to fill one PhD position in the area of signal processing for
speech communication.
The Ph.D. research will be embedded in the FWF project P 28070-N33 entiteld 'Phase-Aware
Signal Processing for Speech Communication' led by Dr. Pejman Mowlaee.

Required skills:
* M.Sc. degree in relevant field (Audio engineering, EE, CS, Telematics)
* Strong background in statistical signal processing and speech processing
* Independent and self-motivated working
* Excellent communication skills, fluency in English

The SPSC is a research and education center in focused on different aspects of signal
processing covering applications in speech/audio communication, telecommunications and
wireless communication. For more details on the ongoing research and publications carried
out in the project you are referred to PhaseLab webpage:

Please send your application (CV, motivation letter, list of grades, and names of
references) to Application deadline is August 1st, 2016.


6-29(2016-06-01) Ph.D. grant at IRISA, Rennes

Nous offrons un contrat doctoral de 3 ans portant sur la « Caractérisation et la génération de l'expressivité en fonction des styles de parole pour la construction de livres audio ». Des informations sur ce travail sont disponibles à : Cette thèse sera effectuée en co-direction entre l?IRISA et le LLF (plus précisément LABEX EFL). 

Merci de diffuser cette information auprès de personnes qui pourraient être intéressées.
Peuvent candidater à cette thèse des étudiants ayant un master recherche en linguistique (spécialité phonétique et phonologie, prosodie, discours), en linguistique informatique ou en informatique. Ils doivent être intéressés par un travail collaboratif et par le traitement automatique de la parole.
Pour plus de précisions ou pour postuler, merci de contacter :
- Elisabeth Delais-Roussarie :
- Damien Lolive :
Date limite de candidature : 4 juillet 2016

6-30(2016-06-12) Ingénieur de recherche, LPL, Aix-en-Provence, France


E : Informatique, statistique et calcul scientifique

Ingénieur de recherche

Concours N° 47


Emploi-type :

Chef de projet ou expert en calcul scientifique


Affectation :

Laboratoire Parole et Langage, AIX EN PROVENCE

Mission :


Le/la chef de projet exercera sa mission en traitant les données recueillies dans les expériences sur la production, la perception et la compréhension du langage oral et du langage écrit, en développant des programmes pour le pré-traitement et le traitement du signal et en effectuant des analyses statistiques à grande échelle.


 Activités :




Assurer le traitement de signaux de différentes natures (ex. : données vidéo, mesures de suivi des mouvements oculaires, signal acoustique, mesures articulatoires, posturales, données physiologiques sur la respiration, mesures EEG sur l'activité cérébrale) ;
Développer des outils de traitement (filtrage, édition du signal, extraction de paramètres, synchronisation entre signaux, segmentation/annotation à de multiples niveaux d'analyse, etc.) ;
Développer des outils pour la manipulation des signaux en temps réel / hors ligne (ex. : synthèse/resynthèse, modification de la courbe mélodique de la parole, dilatation/compression temporelle, etc.).


Contribuer aux traitements statistiques appliqués à des mesures physiques et physiologiques et des données symboliques (ex. : modèles linéaires à effets mixtes) ;
Développer des outils permettant des analyses à grande échelle sur de vastes bases de données.


Compétences :



Connaissances approfondies en mathématiques appliquées et traitement du signal ;
Bonne maîtrise des langages de calcul numérique (ex. : Matlab, Octave) ;
Bonne maîtrise des langages de programmation (ex. : python, C++, java, perl...) ;
Bonne maîtrise de logiciel de statistiques avancées (dont R) ;
Savoir intégrer dans ses activités les évolutions des méthodes mathématiques, des outils informatiques et des disciplines autour de la linguistique ;
Comprendre et analyser le problème scientifique posé. Évaluer et maîtriser le degré d'approximation des méthodes utilisées ;
Savoir travailler en interaction avec une équipe (personnel technique et chercheurs) dans le cadre d'un projet de recherche ;
Savoir mobiliser une équipe autour d'un projet commun ;
Maîtriser l'ensemble des méthodologies de la conduite de projet ;
Transmettre un certain nombre de savoir-faire techniques et méthodologique en adaptant ses explications au public concerné ;
Maîtriser les techniques de communication orales et écrites.
Anglais : expression et compréhension écrite et orale Niveau 2

 Contexte :


Le/la chef de projet travaillera en lien étroit avec les personnels affectés au Centre d'expérimentation sur la parole au sein du laboratoire, afin de nous permettre de renforcer davantage encore le dispositif que nous avons mis en place pour le recueil, le traitement et l'analyse des données expérimentales sur la production, la perception et la compréhension du langage oral et du langage écrit.
Des connexions étroites seront également établies entre les activités de ce personnel et le SLDR (Speech and Language Data Repository), un service numérique de qualité certifiée permettant aux laboratoires et aux chercheurs indépendants de partager librement leurs données orales tout en assurant leur archivage pérenne selon le modèle OAIS, dont le laboratoire est à l'origine et qui constitue aujourd'hui l'un des trois centres de compétence thématique de l'Équipex ORTOLANG. Cette organisation nouvelle nous permettra de mettre en place une voie d'un seul tenant entre le recueil des données sur notre plateforme expérimentale, et la libre diffusion de ces données et des méta-données qui leur sont associées à la communauté scientifique internationale.
La plateforme expérimentale du laboratoire est placée sous la coordination d¿un Ingénieur de recherche et elle fonctionne grâce à une équipe de trois personnes composée de deux ingénieurs de recherche et d¿un technicien. Le/La chef de projet sera aussi amené(e) à collaborer avec un Ingénieur de recherche pour la partie liée au traitement statistique.






6-31(2016-06-18) Postdoc à l'IRISA, Rennes, France

Proposition de travaux de these, IRISA, equipe Expression

Titre : Optimisation de scripts d'enregistrement pour la lecture expressive de livres audio

Mots-clefs : synthese de la parole expressive ; optimisation et apprentissage.

Contexte : Le projet vise a etudier la realisation automatique de livres audio a l'aide d'une

voix de synthese. La duree d'ecoute de l'integralite d'une uvre necessite une voix de haute

qualite a l'expressivite adaptee.

Un systeme de synthese vocale a partir du texte (TTS) produit un signal de parole

correspondant a une vocalisation d'un texte donne. Ces dernieres annees, la TTS a fait de

nombreux progres en termes de qualite acoustique et d'intelligibilite, mais la production

d'une voix expressive de tres bonne qualite reste un verrou scienti que (voir [1] et ses

references). Cette qualite vocale depend fortement du systeme TTS (parametrique, ou par

selection et concatenation d'unites sonores) et du corpus de parole utilise.

Frequemment, la creation d'un tel corpus de parole necessite l'enregistrement de la lecture

d'un script speci que avec des types d'expressivite donnes. Ce processus d'enregistrement

etant complexe et co^uteux, de nombreux travaux portent sur la creation d'un script

permettant de couvrir un maximun d'evenements souhaites tout en minimisant sa duree

(voir [2, 3, 4] et leurs references).

Proposition : La problematique etudiee dans ce projet de these est la creation de livres

audio sous une forme hybride : il s'agit d'enregistrer une partie minimale des livres vises

pour produire une voix de synthese la mieux adaptee au texte restant a vocaliser. Plus

generalement, le sujet porte sur l'etude des methodes de construction et d'enrichissement

automatique de scripts d'enregistrement a n de produire une voix de synthese de haute

qualite pour des textes pre-de nis d'expressivite variee. Cette approche se formalise en un

probleme d'optimisation d'un compromis entre qualite des messages acoustiques naux et

quantite de texte a enregistrer.

Un premier axe de travail concerne la problematique de l'evaluation subjective et objective.

Dans le cadre general de la synthese de la parole, l'evaluation de la qualite des signaux

produits est un probleme qui fait l'objet de nombreuses etudes (voir par exemple [5, 6, 7])

mais qui reste dicile. En quoi le fait de conna^tre a l'avance le texte a vocaliser ou de

disposer de signaux de parole naturelle realises dans le m^eme contexte permet de simpli er

ce probleme ? D'un autre cote, le livre audio produit sera un melange de signaux naturels

et de signaux de synthese. Il sera donc necessaire d'etudier et de proposer des approches

speci ques pour evaluer de tels objets et, en particulier, depasser l'evaluation subjective a

l'echelle de la phrase.

Un deuxieme axe de travail porte sur la construction automatique du script d'enregistrement

et la de nition d'un compromis entre la qualite des signaux et la taille de l'enregistrement

associe. Plusieurs verrous sont deja identi es. Comment les descripteurs textuels

inuencent-ils la qualite nale ? En particulier, quelles methodes d'apprentissage, guidees

par des mesures objectives de qualite, conduisent aux jeux de descripteurs optimaux ?

Un dernier axe de travail porte sur l'etude de la prise en compte des alterations entre le

resultat theorique attendu lie au script d'enregistrement et le signal acoustique reel issu de

la phase d'enregistrement. Comment detecter ces variations et adapter dynamiquement le

script a n de conserver la qualite acoustique nale initialement attendue ?

Environnement de travail : le projet sera realise au sein de l'equipe Expression de l'IRISA,

dans sa composante lannionnaise specialisee sur les problematiques de synthese de la parole

et de traitement automatique des langues. Il sera encadre conjointement par Damien Lolive


et Jonathan Chevelu (IRISA-ENSSAT Lannion, Universite de Rennes1) et bene ciera d'un

nancement sur trois ans ( nancement des conseils departemental et regional). L'equipe

dispose d'un moteur de synthese de la parole par corpus, d'un moteur statistique (HTS),

d'un studio d'enregistrement, d'une plate-forme de tests d'ecoute [8] et d'une collection de

livres audio annotes [9] qu'elle enrichit dans le cadre d'un projet ANR.

Pro l du candidat : Le candidat sera dipl^ome d'un master informatique ou de toute autre

formation equivalente. Compte-tenu du sujet, des competences avancees en algorithmique

et programmation seront requises. Le candidat disposera de la motivation et des facultes

necessaires pour aborder les domaines de recherche de la synthese de la parole, de l'apprentissage

arti ciel et du traitement automatique des langues.

Contacts :

Damien LOLIVE ( et Jonathan CHEVELU (


[1] D. Govind, S. R. Mahadeva Prasanna, Expressive speech synthesis : a review, Int. J. of

Speech Tech., p. 1-24, 2013.

[2] H. Francois, Synthese de la parole par concatenation d'unites acoustiques : construction

et exploitation d'une base de parole continue, these de l'Univ. de Rennes 1, 2002

[3] D. Cadic, Optimisation du procede de creation de voix en synthese par selection, these

de l'Univ. de Paris 11, 2011

[4] N. Barbot, O. Boe
ard, J. Chevelu, A. Delhay, Large linguistic corpus reduction with

SCP algorithms, Computational Linguistics 41(3) : 355-383, 2015

[5] N. Campbell, Evaluation of speech synthesis : from reading machines to talking machines,

Evaluation of Text and Speech Synthesis, (L. Dybjoer at al. Eds.) , Chapitre 2,


[6] J. Chevelu, D. Lolive, S. Le Maguer, D. Guennec, How to compare TTS systems : a

new subjective evaluation methodology focused on di
erences, Interspeech, 2015

[7] C.-T. Do, M. Evrard, A. Leman, C. d'Alessandro, A. Rilliard, J.-L. Crebouw, Objective

evaluation of HMM-based Speech synthesis system using Kullback-Liebler divergence,

Interspeech, 2015

[8] L. Blin, O. Boe
ard, V. Barreaud, WEB-based listening test system for speech synthesis

and speech conversion evaluation, LREC, 2008

[9] O. Boe
ard, L. Charonnat, S. Le Maguer, D. Lolive, Towards fully automatic annotation

of audio books for TTS, LREC, 2012



6-32(2016-06-20) Ingénieur d'études, Université de Grenoble, France

Ingénieur(e) d’études – CDD 6 mois

Contexte et environnement

Dans le Projet MANES (Médiation et Accessibilité Numérique pour les Etudiants Sourds) financé par

l’UNR-RA), l’université Grenoble-Alpes recrute un ingénieur d’études pour un CDD de 6 mois (ou 2 CDD

de 3 mois).

L’objectif général du projet est de développer un dispositif de sous-titrage en temps-réel pour rendre

accessible le discours oral de l’enseignant aux étudiants sourds, de façon à favoriser l’appropriation

individuelle des savoirs, par le biais de la prise de notes. La réalisation technologique et les capacités de

traitement de l’écrit par les publics sourds seront les deux axes de ce projet.

L’ingénieur(e) d’études recruté(e) participera à l’étape « expérimentation du dispositif » visant à tester

l’apport d’un dispositif de ce type pour favoriser la prise de notes des étudiants sourds.

Missions principales

L’ingénieur(e) d’études recruté(e) sera chargé(e), en lien avec les chercheurs participant au projet, de

l’élaboration, de la passation et de l’analyse des expérimentations auprès des étudiants sourds.

o Montage d’une pré-expérimentation vidéo en ligne (plateforme moodle)

o Quizz vidéo LSF en ligne à réaliser : élaboration des questions, élaboration des vidéos

questions en LSF, élaboration d’un module de questionnaire en ligne sur moodle

o Annotation des prises de notes (français écrit) et des restitutions (LSF)

o adaptation du système de sous-titrage au public sourd


- Expérience de recherche souhaitée dans le domaine de la surdité et/ou dans le domaine des TICE.

- Compétences en LSF et en français écrit

- Compétences linguistiques pour l’analyse du français écrit et de la LSF

- Compétences multimédia : outil de transcription (ELAN), de sous-titrage, de montage vidéo et

création de modules en ligne (MOODLE ou autre plateforme pédagogique).

- Une expérience en programmation web serait un plus.

Profil du candidat

- Issu(e) d’un master dans le domaine des Sciences du Langage ; Industrie de la Langue, Informatique,

Sciences de l’éducation, psychologie

Contexte de travail

L’ingénieur d’études travaillera au sein du laboratoire LIDILEM (Laboratoire de LInguistique et de

Didactique des Langues Etrangères et Maternelles) ou LIG (Laboratoire d’Informatique de Grenoble).

Modalités de candidatures

Les candidatures (CV détaillé et lettre de motivation) sont à adresser au porteur du projet MANES :

Isabelle Estève ( ) ; dès à présent et jusqu’au vendredi 24 juin.


6-33(2016-06-18) 4 PhD grants at KTH Stockholm, Sweden

up to 4 PhD students in conversational systems and social robots


6-34(2016-06-20) Research Group Leader in Intelligent Human-Robot Cooperation, University of Stuttgart, Germany

Research Group Leader in Intelligent Human-Robot Cooperation
< /a>
at University Stuttgart, Germany. Email Marc Toussaint


6-35(2016-06-21) PhD grant at IRIT, Toulouse, France
l'Institut de Recherche en Informatique de Toulouse propose une offre de thèse intitulée
'Prédiction de la qualité des sorties de systèmes de reconnaissance automatique de la parole et stratégies d'adaptation'.
Le candidat retenu devra être titulaire d'un master en Informatique avec une expérience souhaitée en Traitement de la Parole. Une expérience en Reconnaissance Automatique de la parole est un plus.
Pour de plus amples informations ou pour candidater, merci de contacter:
- Jérôme Farinas:
La date limite de candidature est le 15 Juillet 2016.

6-36(2016-07-07) 1 PhD position in bio-inspired ASR, 1 PhD position in brain-signal based ASR at the Italian Institute of Technology

Title: 1 PhD position in bio-inspired ASR, 1 PhD position in brain-signal based ASR


The Center for Translational Neurophysiology of Speech and Communication (CTNSC) at the Italian Institute of Technology is seeking for motivated PhD students who will work on bio-inspired automatic speech recognition (ASR) and brain-signal based ASR.

The successful candidates will have a Master degree in Computer Science, Engineering (or equivalent) and a background in machine learning and/or signal processing.


The candidates should apply by the 5th of August, 2016.

PhD courses will start on the 1st of November, 2016.




PhD page [ITA]:


PhD course summary [ITA]:


How to participate to the selection [ITA/ENG]:


