SVoice 因为SenseVoice当前暂时不能输出时间戳,不能直接生成字幕文件;所以我用了VAD分段的时间戳来模拟文本时间戳,然后输出字幕文件。 相关项目 语音工具包 FunASR 模型 SenseVoice