vad_asr

使用说明

0. 环境搭建

如果是linux平台，先创建一个python环境，运行

git clone http://git.xmov.ai/dujing/vad-asr.git
cd vad-asr
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

如果是windows平台，可以先点击 https://git.xmov.ai/dujing/vad-asr/-/releases 下载最新版压缩包，直接解压后进入到压缩包文件夹，键盘shift+鼠标右键，打开linux shell(需要先安装wsl(https://learn.microsoft.com/zh-cn/windows/wsl/install))

然后创建一个python环境，运行

conda create -n asr python==3.9
conda activate asr
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

已经创建好了环境，只激活环境即可

conda activate asr

1. 数据准备

创建data/input文件夹(默认输入音频路径)，将原始需要切分的长音频放置到此文件夹下

根据音频内容修改热词列表文件hotwords.txt，可以略微改善热词识别效果

2. 切句和解码

运行

./run_vad_asr.sh

即可进行切句和解码。

可根据需要修改run_vad_asr.sh的参数，默认是添加标点，不使用GPU解码。

其他高级参数需要到vad_cut(4asr).py和infer.sh(py)里面去修改。使用CPU时默认的最大线程数是32，使用GPU时解码的默认batch_size是64。

3. 输出数据

在data/output下可以得到切分后音频路径wav.scp，以及对应的转写结果asr.txt

Name	Name	Last commit message	Last commit date
Latest commit dujing 调整一些参数，支持中英文。目前是直接把切分后的音频存储成24k采样率。修复最后一个chunk太短切分退出的问题。 Jun 4, 2024 5ecf94d · Jun 4, 2024 History 9 Commits
utils	utils	支持添加标点，可选是否使用GPU解码。	Jun 25, 2023
vad	vad	调整一些参数，支持中英文。目前是直接把切分后的音频存储成24k采样率。修复最后一个chunk太短切分退出的问题。	Jun 4, 2024
.gitignore	.gitignore	支持添加标点，可选是否使用GPU解码。	Jun 25, 2023
README.md	README.md	调整一些参数，支持中英文。目前是直接把切分后的音频存储成24k采样率。修复最后一个chunk太短切分退出的问题。	Jun 4, 2024
hotwords.txt	hotwords.txt	支持添加标点，可选是否使用GPU解码。	Jun 25, 2023
img.png	img.png	支持添加标点，可选是否使用GPU解码。	Jun 25, 2023
img_1.png	img_1.png	支持添加标点，可选是否使用GPU解码。	Jun 25, 2023
infer.py	infer.py	调整一些参数，支持中英文。目前是直接把切分后的音频存储成24k采样率。修复最后一个chunk太短切分退出的问题。	Jun 4, 2024
infer.sh	infer.sh	调整一些参数，支持中英文。目前是直接把切分后的音频存储成24k采样率。修复最后一个chunk太短切分退出的问题。	Jun 4, 2024
requirements.txt	requirements.txt	调整一些参数，支持中英文。目前是直接把切分后的音频存储成24k采样率。修复最后一个chunk太短切分退出的问题。	Jun 4, 2024
run_vad_asr.sh	run_vad_asr.sh	调整一些参数，支持中英文。目前是直接把切分后的音频存储成24k采样率。修复最后一个chunk太短切分退出的问题。	Jun 4, 2024
vad_cut.py	vad_cut.py	支持添加标点，可选是否使用GPU解码。	Jun 25, 2023
vad_cut4asr.py	vad_cut4asr.py	调整一些参数，支持中英文。目前是直接把切分后的音频存储成24k采样率。修复最后一个chunk太短切分退出的问题。	Jun 4, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

vad_asr

使用说明

0. 环境搭建

1. 数据准备

2. 切句和解码

3. 输出数据

About

Releases

Packages

Languages

duj12/vad_asr

Folders and files

Latest commit

History

Repository files navigation

vad_asr

使用说明

0. 环境搭建

1. 数据准备

2. 切句和解码

3. 输出数据

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages