Two-dimensional self-attention-based speech enhancement

Requirements

Tensorflow = 1.4.0

Datasets

The speech stored in this git is enhanced by our 2D-SA. We evaluate the performance on two datasets.
(1) An open-source dataset [1].
(2) A large-scale dataset (Designed and generated by ourselves).

In this Git, enhanced speech, models, and the enhanced edges are uploaded.
The details and scripts of training and testing are included in folder Scripts
In the folder appendix, more explanations about model structure and hyper-parameters will be added.

Contact

If you have questions please contact: Email: [email protected]

References:
[1] Cassia Valentini-Botinhao, Xin Wang, Shinji Takaki, and Junichi Yamagishi, “Investigating rnn-based speech enhancement methods for noise-robust text-to-speech,” in 9th ISCA Speech Synthesis Workshop, pp. 146–152.

More

A Pytorch implemention will be released soon.

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
Scripts		Scripts
appendix		appendix
enhancedEdge		enhancedEdge
enhanced_wav		enhanced_wav
models		models
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Two-dimensional self-attention-based speech enhancement

Requirements

Datasets

Contact

More

About

Releases

Packages

Languages

chenxinglili/Two-dimensional-Self-attention-based-Speech-Enhancement

Folders and files

Latest commit

History

Repository files navigation

Two-dimensional self-attention-based speech enhancement

Requirements

Datasets

Contact

More

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages