GitHub

ASL is a common diagram for audio splicing detection and localization and use a LCNN+LSTM model.

Data preprocessing

对两个audio数据集分别划分训练集和验证集，将音频数据分割成固定长度音频，两两随机拼接，设置分割长度为3s。再对切割好的音频和拼接生成的音频提取MFCC+LFCC特征，两个特征合并在一起，最终保存为npz文件。

    python utils.py
        --type audio_preprocessing \
        --drop_last 1 \
        --s_path path_to_dataset1 \
        --s_path2 path_to_dataset2 \
        --t_path path_to_save_produced_dataset \
        --s_sr 8000 \  
        --s_sr2 8000 \
        --t_sr 8000 \
        --cutting_time 3

生成的的文件目录形式如下：

    -dataset1              
        -split_audio
            -train      
                -original_1.wav #3s split audio file
                -original_2.wav
                 ...
            -val
                -original_1.wav
                -original_2.wav
                 ...
        -feature_data 
            -train_data_mfcc_lfcc0.npz   
            -train_data_mfcc_lfcc1.npz
             ...
            -test_data_mfcc_lfcc0.npz
             ...
    -concat_dataset1_dataset2          /拼接后的数据集
        -split_audio
        -feature_data

Train

进行少数据量训练：

    python trainer.py

直接使用asl_data进行训练时，只需传入数据集路径：

    python trainer.py -data_path path_to_asd_data

大数据集训练执行(后续补充)：

    python trainer2.py

Inference

配置测试文件位置和测试模型:

    "test":{
            "checkpoint_name":"/home/yangruixiong/ASL2/ASL10/ckpt/epoch60CNNLSTM-mfcc-lfcc.pth",
            "test_data":[
                "path_to_test_data1",
                "path_to_test_data2"       
            ]
    }

测试目录格式格式：

    -path_to_test_data1
        test1.wav   /3s音频
        test2.wav
        ...

运行测试程序：

    python test.py

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
__pycache__		__pycache__
ckpt		ckpt
log		log
model		model
MyDataloader.py		MyDataloader.py
README.md		README.md
WebDatasetTest.py		WebDatasetTest.py
config.json		config.json
requirements.txt		requirements.txt
test.py		test.py
trainer.py		trainer.py
trainer_large_dataset.py		trainer_large_dataset.py
trainer_multi_process.py		trainer_multi_process.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Data preprocessing

Train

Inference

About

Releases

Packages

Languages

LittleYoung1017/ASL2.0

Folders and files

Latest commit

History

Repository files navigation

Data preprocessing

Train

Inference

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages