ISCA - International Speech
Communication Association


ISCApad Archive  »  2018  »  ISCApad #240  »  Resources  »  Database  »  Base de donnĂ©es LIBRE et GRATUITE pour la reconnaissance du locuteur

ISCApad #240

Tuesday, June 12, 2018 by Chris Wellekens

5-2-16 Base de données LIBRE et GRATUITE pour la reconnaissance du locuteur
  
Je me permet de vous solliciter pour contribuer à la création 
d?une base de données LIBRE et GRATUITE
pour la reconnaissance du locuteur.

Plus de détails et la marche à suivre ci-dessous.

Merci beaucoup,
Anthony Larcher
 
 
 
Récemment, un certain nombre de laboratoires spécialisés dans la reconnaissance du locuteur dépendante du texte ont initié le projet RedDots.

Il s?agit d?une initiative volontaire sur financement propre des laboratoires.
Ce projet encourage des discussions sur les thèmes de la reconnaissance du locuteur,
la collection de corpus et les cas d?usage propres à cette technologie à travers un Google Group.

Dans le cadre du projet RedDots, l?Institute for Infocomm Research (Singapour) a développé une application Android 
qui permet d?enregistrer des données sur un téléphone portable.

Cette base de données a pour but de pallier certaines lacunes des corpus existants:
- le coût (certaines bases standard sont vendues à plusieurs milliers d?euro)
- la taille limitée (le nombre limité de locuteurs ne permet plus d?évaluer les systèmes de reconnaissance de manière significative)
- la variabilité limitée (les données sont actuellement enregistrées dans plus de 5 pays dans le monde entier)

Afin de distributer une base de données, qui puisse bénéficier librement 
à l?ensemble de la communauté de recherche nous vous sollicitons.
 
 
Comment faire et en combien de temps?
- inscrivez vous en 2 minutes à l?adresse suivante
- installez l?application Android sur votre téléphone en 2 minutes, saisissez l'ID et mot de passe qui vous seront envoyé par email
- enregistrez une session  3 minutes sur votre téléphone
 
Tout se fait en moins de 10 minutes?
Une des limitations principale des corpus existant est le nombre limité de sessions 
enregistrée par locuteur et le court intervalle de temps au cours duquel ces sessions sont enregistrées.
Afin de combler ce manque nous espérons que chaque participant acceptera d?enregistrer
plusieurs sessions dans les mois à venir.
Idealement, chaque participant enregistrera 3 ou 4 minutes par semaine pendant un an.
 
Ou vont mes données et pour quoi sont elles utilisées?
Les données sont actuellement envoyées sur un serveur de l?Institute for Infocomm Research 
à Singapour. Un institut de recherche public.
En vous enregistrant, vous acceptez que ces données soient utilisées à des fins de recherche
uniquement. ces données seront mise à disposition en ligne gratuitement tout au long du projet.

Merci pour votre contribution, n?hésitez pas à faire circuler cet email.
Plus de détails seront données prochainement dans un article soumis à INTERSPEECH 2015.

Anthony Larcher

Back  Top


 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA