ASR_Syllable

=======================基于卷积神经网络的语音识别声学模型的研究========================

此项目是对自己研一与研二上之间对于DCNN-CTC学习总结，提出了MCNN-CTC以及Densenet-CTC声学模型，最终实验结果如下所示：

1) Thchs30_TrainingResults

2) Thchs30_Results

3) Stcmds_Results

声学模型介绍

1) DCNN-CTC声学模型介绍

该模型主要是在speech_model-05上进行修改，上述模型主要使用DCNN-CTC构建语音识别声学模型，STcmds 数据集也是仿照该模型进行修改，最后实验结果如上图所示；

2) MCNN-CTC声学模型介绍

该模型主要是在speech_model_10 脚本上进行实验，最终实验结果可在上图2）所示结果，最终MCNN-CTC总体实验结果相较于DCNN-CTC较好；

3) DenseNet-CTC声学模型介绍

上述模型主要是在 DenseNet上进行实验，最终实验在Thchs30数据集结果可以达到接近30%左右的CER，具体实验可以自己付尝试一下;

4) Attention-CTC声学模型

此模型主要在DCNN-CTC基础上，在全连接层进行注意力操作，最终结果相较于其他结果相较于DCNN-CTC可能有提升，具体可以参看speech_model_06脚本；主要算法实验如下所示：
NN(Attention)-CTC:
# dense1 = Dense(units=512, activation='relu', use_bias=True, kernel_initializer='he_normal')(reshape)
# attention_prob = Dense(units=512, activation='softmax', name='attention_vec')(dense1)
# attention_mul = multiply([dense1, attention_prob])
#
# dense1 = BatchNormalization(epsilon=0.0002)(attention_mul)
# dense1 = Dropout(0.3)(dense1)

迁移学习

Retraining(重新训练)主要对初始模型进行进一步微调，可进一步提升初始模型的准确率，具体训练脚本可参看 train_modelSpeech 脚本，本文主要针对全部网路层进行微调，实验结果相较于初始模型可进一步提升，具体实验结果可参看图1)

论文引用

W Zhang, M H Zhai, Z L Huang, et al. Towards End-to-End Speech Recognition with Deep Multipath Convolutional Neural Networks[C]. https://doi.org/10.1007/978-3-030-27529-7_29

参考项目连接

个人博客包含自己近期的学习总结
参考链接
 ASR_WORD以字为建模单元构建语音识别声学模型

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
__pycache__		__pycache__
data_list		data_list
general_function		general_function
model_language		model_language
paper		paper
training_results		training_results
DenseNet.py		DenseNet.py
LanguageModel.py		LanguageModel.py
LanguageModel2.py		LanguageModel2.py
README.md		README.md
asrserver.py		asrserver.py
data_preprocess.py		data_preprocess.py
dict.txt		dict.txt
get_language_model.py		get_language_model.py
get_pinyin.py		get_pinyin.py
load_dataset.py		load_dataset.py
model_language.py		model_language.py
model_language_test.py		model_language_test.py
open_train.py		open_train.py
readdata_01.py		readdata_01.py
readdata_02.py		readdata_02.py
readdata_02.pyc		readdata_02.pyc
readdata_03.py		readdata_03.py
readdata_03.pyc		readdata_03.pyc
readdata_04.py		readdata_04.py
readdata_05.py		readdata_05.py
readdata_06.py		readdata_06.py
readdata_07.py		readdata_07.py
readdata_08.py		readdata_08.py
readdata_09.py		readdata_09.py
readdata_10.py		readdata_10.py
readdata_11.py		readdata_11.py
readdata_12.py		readdata_12.py
readdata_13.py		readdata_13.py
readdata_14.py		readdata_14.py
readdata_15.py		readdata_15.py
readdata_17.py		readdata_17.py
readdata_20.py		readdata_20.py
readdata_densenet_01.py		readdata_densenet_01.py
speech_model_01.py		speech_model_01.py
speech_model_02.py		speech_model_02.py
speech_model_03.py		speech_model_03.py
speech_model_04.py		speech_model_04.py
speech_model_05.py		speech_model_05.py
speech_model_06.py		speech_model_06.py
speech_model_07.py		speech_model_07.py
speech_model_08.py		speech_model_08.py
speech_model_09.py		speech_model_09.py
speech_model_10.py		speech_model_10.py
speech_model_11.py		speech_model_11.py
speech_model_12.py		speech_model_12.py
speech_model_13.py		speech_model_13.py
speech_model_14.py		speech_model_14.py
speech_model_15.py		speech_model_15.py
speech_model_16.py		speech_model_16.py
speech_model_17.py		speech_model_17.py
speech_model_18.py		speech_model_18.py
speech_model_20.py		speech_model_20.py
speechmodel_05_01.py		speechmodel_05_01.py
speechmodel_densenet_01.py		speechmodel_densenet_01.py
speechmodel_densenet_02.py		speechmodel_densenet_02.py
steps24.txt		steps24.txt
test.py		test.py
testClient.py		testClient.py
train_modelSpeech.py		train_modelSpeech.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ASR_Syllable

此项目是对自己研一与研二上之间对于DCNN-CTC学习总结，提出了MCNN-CTC以及Densenet-CTC声学模型，最终实验结果如下所示：

1) Thchs30_TrainingResults

2) Thchs30_Results

3) Stcmds_Results

声学模型介绍

1) DCNN-CTC声学模型介绍

2) MCNN-CTC声学模型介绍

3) DenseNet-CTC声学模型介绍

4) Attention-CTC声学模型

迁移学习

论文引用

参考项目连接

About

Releases

Packages

Languages

zw76859420/ASR_Syllable

Folders and files

Latest commit

History

Repository files navigation

ASR_Syllable

此项目是对自己研一与研二上之间对于DCNN-CTC学习总结，提出了MCNN-CTC以及Densenet-CTC声学模型，最终实验结果如下所示：

1) Thchs30_TrainingResults

2) Thchs30_Results

3) Stcmds_Results

声学模型介绍

1) DCNN-CTC声学模型介绍

2) MCNN-CTC声学模型介绍

3) DenseNet-CTC声学模型介绍

4) Attention-CTC声学模型

迁移学习

论文引用

参考项目连接

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages