Skip to content

Anime audio speaker recognize and classify. A easy python script for vits data set make.

License

Notifications You must be signed in to change notification settings

ADKcodeXD/Anime-Audio-Dataset-Maker

Repository files navigation

Anime Audio DataSet Maker

Introduce

此项目旨在为番剧提供一个快速高效提取角色音频的解决方案。

WEBUI下载链接: Anime-Audio-Dataset-Maker-WEBUI Release

安装&使用

  • 第一个方法 整合包一键下载使用方法: 链接: https://pan.baidu.com/s/1T9GbDo6enrV__G0j7pXbwQ?pwd=s556 提取码: s556 下载后使用 整合包使用这个.bat 即可

  • 安装使用 首先先安装pytorch, 这个需要根据系统的cuda版本来进行安装 以我的Cuda11.8为例

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

在这里pytorch 选择你对应的版本并运行相对应的命令即可~

  • 然后安装该仓库需要的依赖
pip3 install -r requirement.txt

项目会运行在7896端口

How it work

  • 通过pyannote.audio对原音频进行说话人的识别和切割
  • 通过字幕时间线对原音频进行切割
  • 通过匹配检测最佳匹配的说话人
  • 分类到各个说话人的文件夹中

WebUI操作流程

  • 开始预处理音频 Alt text

...

Feature

  • Support automaticly split long audio by each speaker
  • Support sub upload and slice by sub timeline.
  • Support edit the sub text and export it by bert-vits config
  • Support split ever single audio (WebUI)
  • Support merge audio with interval (WebUI)
  • Support management folders or files (WebUI)
  • Support use Arrow key to handle data (WebUI)
  • Support batch rename (WebUI)
  • Support batch move or remove (WebUI)

About

Anime audio speaker recognize and classify. A easy python script for vits data set make.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published