|
21 | 21 |
|
22 | 22 | - 【无 泄漏】支持多发音人
|
23 | 23 |
|
| 24 | +- 【捏 音色】创造独有发音人 |
| 25 | + |
24 | 26 | - 【带 伴奏】也能进行转换,轻度伴奏
|
25 | 27 |
|
26 | 28 | - 【用 Excel】进行原始调教,纯手工
|
|
29 | 31 |
|
30 | 32 | 本项目将继续完成基于BIGVGAN的模型(32K),在此之后,有成果再更新项目
|
31 | 33 |
|
32 |
| -## 模型和日志:https://github.com/PlayVoice/so-vits-svc-5.0/releases/tag/v5.3 |
| 34 | +## 模型和日志:https://github.com/PlayVoice/so-vits-svc-5.0/releases/tag/base_release_hifigan |
33 | 35 |
|
34 |
| -- [5.0.epoch1200.full.pth](https://github.com/PlayVoice/so-vits-svc-5.0/releases/download/v5.3/5.0.epoch1200.full.pth)模型包括:生成器+判别器=176M,可用作预训练模型 |
| 36 | +- [5.0.epoch1200.full.pth](https://github.com/PlayVoice/so-vits-svc-5.0/releases/download/base_release_hifigan/5.0.epoch1200.full.pth)模型包括:生成器+判别器=176M,可用作预训练模型 |
35 | 37 | - 发音人(56个)文件在configs/singers目录中,可进行推理测试,尤其测试音色泄露
|
36 | 38 | - 发音人22,30,47,51辨识度较高,音频样本在configs/singers_sample目录中
|
37 | 39 |
|
|
42 | 44 | | natural speech | Microsoft | ✅ | 减少发音错误 | - |
|
43 | 45 | | neural source-filter | NII | ✅ | 解决断音问题 | 参数优化 |
|
44 | 46 | | speaker encoder | Google | ✅ | 音色编码与聚类 | - |
|
45 |
| -| GRL for speaker | Ubisoft |✅ | 防止编码器泄露音色 | 原理类似判别器的对抗训练 | |
| 47 | +| GRL for speaker | Ubisoft |✅ | 防止编码器泄漏音色 | 原理类似判别器的对抗训练 | |
46 | 48 | | one shot vits | Samsung | ✅ | VITS 一句话克隆 | - |
|
47 | 49 | | SCLN | Microsoft | ✅ | 改善克隆 | - |
|
48 | 50 | | band extention | Adobe | ✅ | 16K升48K采样 | 数据处理 |
|
|
60 | 62 | 💗必要的前处理:
|
61 | 63 | - 1 降噪&去伴奏
|
62 | 64 | - 2 频率提升
|
63 |
| -- 3 音质提升,基于https://github.com/openvpi/vocoders ,待整合 |
| 65 | +- 3 音质提升 |
64 | 66 | - 4 将音频剪裁为小于30秒的音频段,whisper的要求
|
65 | 67 |
|
66 | 68 | 然后以下面文件结构将数据集放入dataset_raw目录
|
@@ -255,6 +257,24 @@ data_svc/
|
255 | 257 | | --- | --- | --- | --- | --- | --- | --- | --- |
|
256 | 258 | | name | 配置文件 | 模型文件 | 音色文件 | 音频文件 | 音频内容 | 音高内容 | 升降调 |
|
257 | 259 |
|
| 260 | +## 捏音色 |
| 261 | +纯属巧合的取名:average -> ave -> eva,夏娃代表者孕育和繁衍 |
| 262 | + |
| 263 | +> python svc_eva.py |
| 264 | +
|
| 265 | +```python |
| 266 | +eva_conf = { |
| 267 | + './configs/singers/singer0022.npy': 0, |
| 268 | + './configs/singers/singer0030.npy': 0, |
| 269 | + './configs/singers/singer0047.npy': 0.5, |
| 270 | + './configs/singers/singer0051.npy': 0.5, |
| 271 | +} |
| 272 | +``` |
| 273 | + |
| 274 | +生成的音色文件为:eva.spk.npy |
| 275 | + |
| 276 | +💗Flow和Decoder均需要输入,您甚至可以给两个模块输入不同的音色参数,捏出更独特的音色。 |
| 277 | + |
258 | 278 | ## 数据集
|
259 | 279 |
|
260 | 280 | | Name | URL |
|
|
0 commit comments