ISCA - International Speech
Communication Association


ISCApad Archive  »  2012  »  ISCApad #164  »  Jobs  »  (2012-01-04) Audio Indexing Researcher W/M position at IRCAM – 3DTV project

ISCApad #164

Saturday, February 11, 2012 by Chris Wellekens

6-28 (2012-01-04) Audio Indexing Researcher W/M position at IRCAM – 3DTV project
  

Audio Indexing Researcher W/M position at IRCAM – 3DTV project

Starting :  January - February , 2012

Duration : 18 months

 

Introduction to IRCAM

IRCAM is a leading non-profit organization associated to Centre Pompidou, dedicated to music production, R&D and education in acoustics and music. It hosts composers, researchers and students from many countries cooperating in contemporary music production, scientific and applied research. The main topics addressed in its R&D department include acoustics, audio signal processing, computer music, interaction technologies, musicology. Ircam is located in the centre of Paris near the Centre Pompidou, at 1, Place Igor Stravinsky 75004 Paris.

 

Introduction to 3DTVs project

The goal of the 3DTVS project is to devise scalable 3DTV AV content description, indexing, search and browsing methods across open platforms, by using mobile and desktop user interfaces and to incorporate such functionalities in 3D audiovisual content archives. 3D multichannel audio analysis targets audio event detection based on fusion techniques that combine the feature analysis performed in the individual channels as well as source localization and separation algorithms for the detection of moving audio sources. The results will be used in 3D audio/cross-modal indexing and retrieval. Multimodal 3D audiovisual content analysis will built on the results of 3D video and audio analysis. 3DTV content description and search mechanisms will be developed to enable fast reply to semantic queries.

 

Role of IRCAM in the 3DTV Project

In the 3DTVs project, IRCAM is in charge of the research and development of technologies related to

-        Audio event detection using multi-channel audio scenes

-        Speaker diarization

-        Segmentation into Movie scene from the audio signal

-        Sound source separation, localization and identification

 

Position description

Hired Researcher will be in charge of the development of technologies related to:

  • Audio event detection using multi-channel audio scenes
  • Speaker diarization
  • Segmentation into Movie scene from the audio signal

 

The Researchers will also collaborate with the development team and participate in the project activities (evaluation, meetings, specifications).

 

Required profiles

  • High skill in audio indexing and data mining (statistical modelling, automatic feature selection algorithm …); especially late-fusion algorithms
  • High skill in audio signal processing (spectral analysis, audio-feature extraction, parameter estimation)
  • High-skill in Matlab programming, skills in C/C++ programming

 

  • Good knowledge of Linux, Windows, MAC-OS environments
  • High productivity, methodical works, excellent programming style.

 

 

Salary

According to background and experience

 

Applications

Please send an application letter together with your resume and any suitable information addressing the above issues preferably by email to: peeters_a_t_ircam dot fr with cc to vinet_a_t_ircam dot fr, roebel_at_ircam_dot_fr

 

 


L’Ircam recrute un Chercheur  H/F – en CDD de 18 mois et à temps plein – Projet 3DTVs

Poste disponible à partir du 1er janvier 2012

 

Présentation de l’Ircam

L'Ircam est une association à but non lucratif, associée au Centre National d'Art et de Culture Georges Pompidou, dont les missions comprennent des activités de recherche, de création et de pédagogie autour de la musique du XXème siècle et de ses relations avec les sciences et technologies. Au sein de son département R&D, des équipes spécialisées mènent des travaux de recherche et de développement informatique dans les domaines de l'acoustique, du traitement des signaux sonores, des technologies d’interaction, de l’informatique musicale et de la musicologie. L'Ircam est situé au centre de Paris à proximité du Centre Georges Pompidou au 1, Place Stravinsky 75004 Paris.

 

Introduction au projet 3DTVs

L'objectif du projet 3DTVs est de concevoir des descriptions évolutives des contenus 3DTV, leur indexation, leur recherche ainsi que la conception de méthodes de navigation sur toutes des plateformes ouvertes, en utilisant des interfaces utilisateurs mobiles et fixes et d'intégrer de telles fonctionnalités 3D dans les archives de contenus audiovisuels. L’analyse multi canal audio 3D vise la détection d’événements audio basés sur des techniques de fusion combinant l'analyse audio effectuée dans les canaux individuels ainsi que des algorithmes de localisation et de séparation de source pour la détection des mouvements des sources audio. Les résultats seront utilisés pour l’indexation 3D audio et cross modale ainsi que pour la recherche. L’indexation audio/ video multimodale 3D des contenus audiovisuels s’appuiera sur les résultats de l’indexation vidéo 3D et audio 3D. Des méthodes de description de contenu et de recherche seront développées afin de permettre des réponses rapides aux recherches sémantiques.

 

Rôle de l’Ircam dans le projet Quaero

Dans le projet 3DTVs, l'Ircam est en charge de la recherche et du développement des technologies relatives à la

-        Détection des événements audio en utilisant les scènes audio multi canal

-        Segmentation en tours de parole

-        Segmentation de scène de films  partir de l’audio

-        Séparation, localisation et identification des sources sonores

 

Missions

Le Chercheur sera en charge du développement des technologies liées à:

-        Détection des événements audio en utilisant les scènes audio multi canal

Le chercheur collaborera également avec l'équipe de développement et participera aux activités du projet (évaluation, réunions, spécification).

 

Profil recherché

  • Grande expérience de recherche en indexation audio (modélisation statistique, sélection automatique de descripteurs …) ; grande connaissance en techniques de fusion tardives
  • Grande expérience de recherche en traitement du signal (analyse spectrale, extraction de descripteurs audio, estimation de paramètres) 
  • Très bonne connaissance du langage Matlab

 

  • Connaissance des environnements Linux, Windows et Mac OS-X.
  • Connaissance des langages C et C++
  • Haute productivité, travail méthodique, excellent style de programmation, bonne communication rigueur

 

Salaire

Selon formation et expérience professionnelle

 

Candidatures

Prière d'envoyer une lettre de motivation et un CV détaillant le niveau d'expérience/expertise dans les domaines mentionnés ci-dessus (ainsi que tout autre information pertinente) à peeters_a_t_ircam dot fr avec copie à

vinet_a_t_ircam dot fr, roebel_at_ircam_dot_fr


Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA