ISCA - International Speech
Communication Association


ISCApad Archive  »  2018  »  ISCApad #246  »  Resources  »  Books

ISCApad #246

Thursday, December 13, 2018 by Chris Wellekens

5-1 Books
5-1-1J.Li, L.Deng, R.Haeb-Umbach and Y.Gong, 'Robust Automatic Speech Recognition', Academic Press

 'Robust Automatic Speech Recognition'

  • The  first book that provides a comprehensive review on noise and reverberation robust speech recognition methods in the era of deep neural networks
  • Connects robust speech recognition techniques to machine learning paradigms with rigorous mathematical treatment
  • Provides elegant and structural ways to categorize and analyze noise-robust speech recognition techniques
  • Written by leading researchers who have been actively working on the subject matter in both industrial and academic organizations for many years

https://na01.safelinks.protection.outlook.com/?url=http%3a%2f%2fstore.elsevier.com%2fRobust-Automatic-Speech-Recognition%2fJinyu-Li%2fisbn-9780128023983%2f.&data=01%7c01%7cygong%40exchange.microsoft.com%7c3bd27ec380c8427e97e208d2975aca2a%7c72f988bf86f141af91ab2d7cd011db47%7c1&sdata=PRRo3i4DYNV1rNmVlhPMaHa0pUN4oi%2b1khyjctDXxjU%3d

Back  Top

5-1-2Barbosa, P. A. and Madureira, S. Manual de Fonética Acústica Experimental. Aplicações a dados do português. 591 p. São Paulo: Cortez, 2015. [In Portuguese]

Barbosa, P. A. and Madureira, S. Manual de Fonética Acústica Experimental. Aplicações a dados do português. 591 p. São Paulo: Cortez, 2015. [In Portuguese]     


http://www.cortezeditora.com.br/manual-de-fonetica-acustica-experimental-1599.aspx/p

This manual of Experimental Acoustic Phonetics is conceived for Undergraduate and Graduate classes on areas such as Acoustic Phonetics, Phonology, Communications Engineering, Music, Acoustic Physics, Speech Theraphy, among others.  Starting with a theoretical and methodological presentation of Acoustic Phonetics Theory and Techniques in five chapters,  including a chapter on experimental methods, the book follows with detailed acoustic analysis of all classes of sounds using audio files from both European and Brazilian Portuguese as data.
All analyses are explained step by step using Praat. The audiofiles are available on the book web site and can be downloaded.  All techniques can be applied to any language, of course. Proposed exercices at the end of each chapter allow the teacher o evaluate the student progress.

 

Delete | Reply | Reply to All | Forward | Redirect | View Thread | Blacklist | Whitelist | Message Source | Save as | Print
Move | Copy
Back  Top

5-1-3Damien Nouvel, Inalco, Maud Ehrmann, EPFL,Sophie Rosset, CNRS. Les entités nommées pour le traitement automatique des langues

Les entités nommées pour le traitement automatique des langues

Damien Nouvel, Inalco, Maud Ehrmann, EPFL
Sophie Rosset, CNRS  

Le livre est disponible en ebook au prix de 9,90 euros.
(prix réservé aux particuliers - PDF lisible sur tout support - uniquement disponible sur iste-editions.fr)
Le livre est disponible en version papier au prix de 40,00 euros.

Le monde numérisé et connecté produit de grandes quantités de données. Analyser automatiquement le langage naturel est un enjeu majeur pour les applications de recherches sur le Web, de suivi d'actualités, de fouille, de veille, d'opinion, etc.

Les recherches menées en extraction d'information ont montré l'importance de certaines unités, telles que les noms de personnes, de lieux et d’organisations, les dates ou les montants. Le traitement de ces éléments, les « entités nommées », a donné lieu au développement d'algorithmes et de ressources utilisées par les systèmes informatiques.

Théorique et pratique, cet ouvrage propose des outils pour définir ces entités, les identifier, les lier à des bases de connaissance ou pour procéder à l’évaluation des systèmes.
 
 
Sommaire

1. Les entités nommées pour l’accès à l’information
2. Les entités nommées, des unités référentielles
3. Ressources autour des entités nommées
4. Reconnaître les entités nommées
5. Lier les entités nommées aux référentiels
6. Évaluation de la reconnaissance des entités nommées

168 pages - Octobre 2015
Ouvrage papier - broché 
ISBN 978-1-78405-104-4
Back  Top

5-1-4R.Fuchs, 'Speech Rhythm in Varieties of English' , Springer

R.Fuchs,  'Speech Rhythm in Varieties of English' has appeared with Springer, in the 'Prosody, Phonology and Phonetics' series: https://www.springer.com/gp/book/9783662478172

Back  Top

5-1-5Pejman Mowlaee et al., 'Phase-Aware Signal Processing in Speech Communication: Theory and Practice', Wiley 2016

Phase-Aware Signal Processing in Speech Communication: Theory and Practice

Pejman Mowlaee, Johannes Stahl, Josef Kulmer, Florian Mayer

http://eu.wiley.com/WileyCDA/WileyTitle/productCd-1119238811.html

An overview on the challenging new topic of phase-aware signal processing

Speech communication technology is a key factor in human-machine interaction, digital hearing aids, mobile telephony, and automatic speech/speaker recognition. With the proliferation of these applications, there is a growing requirement for advanced methodologies that can push the limits of the conventional solutions relying on processing the signal magnitude spectrum.

Single-Channel Phase-Aware Signal Processing in Speech Communication provides a comprehensive guide to phase signal processing and reviews the history of phase importance in the literature, basic problems in phase processing, fundamentals of phase estimation together with several applications to demonstrate the usefulness of phase processing.

Key features:

  • Analysis of recent advances demonstrating the positive impact of phase-based processing in pushing the limits of conventional methods.
  • Offers unique coverage of the historical context, fundamentals of phase processing and provides several examples in speech communication.
  • Provides a detailed review of many references and discusses the existing signal processing techniques required to deal with phase information in different applications involved with speech.
  • The book supplies various examples and MATLAB® implementations delivered within the PhaseLab toolbox.

Single-Channel Phase-Aware Signal Processing in Speech Communication is a valuable single-source for students, non-expert DSP engineers, academics and graduate students.

ejman Mowlaee, Johannes Stahl, Josef Kulmer, Florian Mayer
Back  Top

5-1-6Jean Caelen, Anne Xuereb, 'Dialogue : altérité, interaction, énaction'

 

Jean Caelen,Anne Xuereb

Dialogue : altérité, interaction, énaction

Editions universitaires européennes

 

Back  Top

5-1-7Bäckström, Tom (with Guillaume Fuchs, Sascha Disch, Christian Uhle and Jeremie Lecomte), 'Speech Coding with Code-Excited Linear Prediction', Springer


 Speech Coding with Code-Excited Linear Prediction

Author: Bäckström, Tom

Invited chapters from: Guillaume Fuchs, Sascha Disch, Christian Uhle and Jeremie Lecomte

Publisher: Springer

http://www.springer.com/gp/book/9783319502021

Back  Top

5-1-8Shinji Watanabe, Marc Delcroix, Florian Metze, John R. Hershey (Eds), 'New Era for Robust Seech Recognition', Springer.

Shinji Watanabe, Marc Delcroix, Florian Metze, John R. Hershey (Eds), 'New Era for Robust Seech Recognition', Springer.

https://link.springer.com/book/10.1007%2F978-3-319-64680-0

Back  Top

5-1-9Fabrice Marsac, Rudolph Sock, CONSÉCUTIVITÉ ET SIMULTANÉITÉ en Linguistique, Langues et Parole, L'Harmattan,France

Nous avons le plaisir de vous annoncer la parution du volume thématique « CONSÉCUTIVITÉ ET SIMULTANÉITÉ en Linguistique, Langues et Parole » dans la Collection Dixit Grammatica (L’Harmattan, France) :
 
- CONSÉCUTIVITÉ ET SIMULTANÉITÉ en Linguistique, Langues et Parole – 1. Phonétique, Phonologie (Sous la direction de Camille Fauth, Jean-Paul Meyer, Fabrice Marsac & Rudolph Sock) • ISBN : 978-2-343-14277-7 • 5 mars 2018 • 172 pages http://www.editionsharmattan.fr/index.asp?navig=catalogue&obj=livre&no=59200&razSqlClone=1
 
- CONSÉCUTIVITÉ ET SIMULTANÉITÉ en Linguistique, Langues et Parole – 2. Syntaxe, Sémantique (Sous la direction de Angelina Aleksandrova, Céline Benninger, Anne Theissen, Fabrice Marsac & Jean-Paul Meyer) • ISBN : 978-2-343-14278-4 • 5 mars 2018 • 300 pages http://www.editionsharmattan.fr/index.asp?navig=catalogue&obj=livre&no=59201&razSqlClone=1
 
- CONSÉCUTIVITÉ ET SIMULTANÉITÉ en Linguistique, Langues et Parole – 3. Didactique, Traductologie-Interprétation (Sous la direction de Jean-Paul Meyer, Mária Pal'ová & Fabrice Marsac) • ISBN : 978-2-343-14279-1 • 5 mars 2018 • 200 pages http://www.editionsharmattan.fr/index.asp?navig=catalogue&obj=livre&no=59202&razSqlClone=1
 
Cet ouvrage collectif, qui comprend trois tomes complémentaires, rassemble des études constituant les traces écrites de communications prononcées lors du colloque international éponyme s’étant tenu à l’Université de Strasbourg (France) en juillet 2015. Les tomes renferment des travaux originaux et novateurs traitant de la dynamicité complexe du couple consécutivité-simultanéité saisi dans le domaine des Sciences du Langage. Le contenu, délibérément interdisciplinaire, concerne non seulement l’ensemble des disciplines relatives aux Sciences du langage mais aussi d’autres disciplines scientifiques, connexes mais préoccupées par des problématiques résolument linguistiques. Les éditeurs de ce volume thématique espèrent que les divers points de vue linguistiques ainsi adoptés livreront aux lecteurs un état des connaissances actualisé relativement aux différentes problématiques traitées. Il va sans dire, par ailleurs, que les auteurs comme les éditeurs apprécieront tout retour constructif de la part des lecteurs.
 
 
Fabrice Marsac et Rudolph Sock Directeurs de Dixit Grammatica


 

Back  Top

5-1-10Emmanuel Vincent (Editor), Tuomas Virtanen (Editor), Sharon Gannot (Editor), 'Audio Source Separation and Speech Enhancement', Wiley

 Emmanuel Vincent (Editor), Tuomas Virtanen (Editor), Sharon Gannot (Editor),

Audio Source Separation and Speech Enhancement:


https://www.wiley.com/en-us/Audio+Source+Separation+and+Speech+Enhancement-p-9781119279891

ISBN: 978-1-119-27989-1

October 2018

504 pages



This 500-page book provides a unifying view of source separation and enhancement,
including but not limited to array processing, matrix factorization, and deep learning
based methods, and speech and music applications, with consistent notation and
terminology across all chapters.

Back  Top

5-1-11Jen-Tzung Chien, 'Source Separation and Machine Learning', Academic Press

Jen-Tzung Chien, 'Source Separation and Machine Learning', Academic Press

Source Separation and Machine Learning presents the fundamentals in adaptive learning
algorithms for Blind Source Separation (BSS) and emphasizes the importance of machine
learning perspectives. It illustrates how BSS problems are tackled through adaptive
learning algorithms and model-based approaches using the latest information on mixture
signals to build a BSS model that is seen as a statistical model for a whole system.
Looking at different models, including independent component analysis (ICA), nonnegative
matrix factorization (NMF), nonnegative tensor factorization (NTF), and deep neural
network (DNN), the book addresses how they have evolved to deal with multichannel and
singlechannel source separation.

Key features:
? Emphasizes the modern model-based Blind Source Separation (BSS) which closely connects
the latest research topics of BSS and Machine Learning
? Includes coverage of Bayesian learning, sparse learning, online learning,
discriminative learning and deep learning
? Presents a number of case studies of model-based BSS, using a variety of learning
algorithms that provide solutions for the construction of BSS systems

https://www.elsevier.com/books/source-separation-and-machine-learning/chien/978-0-12-804566-4

Back  Top

5-1-12Ingo Feldhausen, « Methods in prosody: A Romance language perspective », Language Science Press (open access)

Nous sommes heureux de vous annoncer la parution d'un recueil validé par un comité de lecture et consacré aux méthodes de recherche en prosodie. Cet ouvrage est intitulé « Methods in prosody: A Romance language perspective ».

Il est publié par Language Science Press, une maison d’édition open access. Le livre peut-être téléchargé gratuitement en cliquant sur le lien suivant :

http://langsci-press.org/catalog/book/183

La table des matières est la suivante :

---------------------------------------------------------------------------------------------------------

Introduction
Ingo Feldhausen, Jan Fliessbach & Maria del Mar Vanrell                                                                   iii

Foreword
Pilar Prieto                                                                                                                                              vii

I Large corpora and spontaneous speech

1) Using large corpora and computational tools to describe prosody: An
exciting challenge for the future with some (important) pending problems to solve

Juan María Garrido Almiñana                                                                                                                  3

2) Intonation of pronominal subjects in Porteño Spanish: Analysis of 
spontaneous speech

Andrea Pešková                                                                                                                                     45

II Approaches to prosodic analysis

3) Multimodal analyses of audio-visual information: Some methods and
issues in prosody research

Barbara Gili Fivela                                                                                                                                 83

4) The realizational coefficient: Devising a method for empirically
determining prominent positions in Conchucos Quechua

Timo Buchholz & Uli Reich                                                                                                                 123

5) On the role of prosody in disambiguating wh-exclamatives and
wh-interrogatives in Cosenza Italian

Olga Kellert, Daniele Panizza & Caterina Petrone                                                                               165

III Elicitation methods

6) The Discourse Completion Task in Romance prosody research: Status
quo and outlook

Maria del Mar Vanrell, Ingo Feldhausen & Lluïsa Astruc                                                                    191

7) Describing the intonation of speech acts in Brazilian Portuguese:
Methodological aspects

João Antônio de Moraes & Albert Rilliard                                                                                           229

Indexes                                                                                                                                                  263

---------------------------------------------------------------------------------------------------------

N'hésitez pas à diffuser la parution de cet ouvrage auprès de vos collègues qui pourraient s'y intéresser.

Bien cordialement,

Ingo Feldhausen
(Co-coordinateur d'ouvrage)

Back  Top



 Organisation  Events   Membership   Help 
 > Board  > Interspeech  > Join - renew  > Sitemap
 > Legal documents  > Workshops  > Membership directory  > Contact
 > Logos      > FAQ
       > Privacy policy

© Copyright 2024 - ISCA International Speech Communication Association - All right reserved.

Powered by ISCA