请问有在wsj0-mix， wham 和 WHAMR 这样标准实验集上做过实验吗？ #5

zuowanbushiwo · 2024-04-10T01:38:39Z

非常感谢大佬的开源这么棒的项目，挺好奇这个算法在这几个标准的语音分离的效果怎么样？有没有这样大的提升？
谢谢

JusperLee · 2024-04-10T03:57:07Z

正在训练和测试中。

zuowanbushiwo · 2024-04-12T01:00:39Z

非常期待，目前在这几个数据集上看到效果最好的是 MossFormer2

JusperLee · 2024-04-18T03:27:27Z

zuowanbushiwo · 2024-04-19T01:10:26Z

在wsj0上效果还差一点？tf-gridnet 在wsj0上有23.4db？

JusperLee · 2024-04-19T09:09:30Z

这个你要参考espnet的复现结果，他们是22左右。图中的结果是sisnr不是sisnri，一般来说sisnri会更高一些。而且这个还没有训练完成。

JusperLee · 2024-05-09T13:16:26Z

SPMamba WHAM! Result: SI-SNRi=17.4 dB, SDRi=17.6 dB
SPMamba WSJ0-2Mix Result: SI-SNRi=22.5 dB, SDRi=22.7 dB

Provide feedback