Releases: Huanshere/VideoLingo
Releases · Huanshere/VideoLingo
v1.5
Major Updates:
- Added batch processing functionality
- Simplified JSON key structure in prompts
Minor Improvements:
- Support for running in 6GB gpu memory environments
- Improved empty line detection in NLP step
- Fixed font issues in Linux environments
- Handled phrase alignment errors and prompted to retry UVR
- Limited file upload size to 500MB in Streamlit
- Made video compression a separate optional step
- Restructured README documentation
主要更新:
- 新增批量处理功能
- 简化promot中的JSON key结构
小改进:
- 改善了6G显存环境下的运行速度
- 改进了NLP步骤中的空行检测
- 修复Linux环境下的字体问题
- 处理短语对齐错误并提示重试UVR
- 在Streamlit中限制文件上传大小为500MB
- 是否压制视频单独作为可选项
- 重构了README文档
v1.4.1
v1.4
主要更新
- 官网 videolingo.io 上线,右下角有安装和运行 AI 小助手可以免费使用~
- 转录前是否进行UVR作为可选项可以设置,并且会切割成15min进行处理,避免大内存占用。
- 压缩了发送给replicate前的音频大小,不会报错了。
- trim过程如果遇到claude因敏感而拒绝回答时自动跳过
bug修复
- 修复了在 Mac 平台上的一些 bug
- 修复了标点符号和空格未被正确识别为空行的 bug
v1.3
主要更新:
- 加入中文输入支持!需要手动下载模型放在model中
- 增加了一步骤的UVR人声分离,效果更好
- 在WhisperX转录之前进行人声分离,保证转录质量(仅WhisperX本地版)
- 改进配音流程,修复了音频时间比视频长的问题
- 大幅修复了phrase错误!!!
- 补充了trim后的检查
详细更新:
-
新增功能:
- 增加中文语言支持
- 新增 UVR 模型,提高音频质量
-
性能优化:
- 设置访问 GPT 超时
- 使用 pip 安装 torch,取代 conda
- WhisperX 本地版会在转录前进行 UVR 处理,保证质量
- 根据显存自动调整 WhisperX 本地运行的 batch size
-
用户体验改进:
- 缩减 prompt,备选方案从 3 个变成 2 个
- 最大长度更新至 70
- 字号更大,每行更短
- 侧边栏加入输入语言选项
- 上传时检查视频名
-
配音优化:
- 修复了中文转英文配音时的一些问题
-
依赖优化:
- 移除了大部分的 ffmpeg 依赖
- 不再需要 ffprobe
- Mac 用户无需手动安装 ffmpeg
-
文档更新:
- 更新 README.md
- 更新 config.example.py
小细节:
- 取消了大部分 ffmpeg 依赖,简化安装流程
- 完善了配置文档
v1.2
v1.1.0
v1.0 !!!!!
- 终于把配音功能加上了,支持Azure,Openai,Edge,GPT-SoVITS-v2(beta)
- 修复了若干bug,翻译错误率更低了
- 移除了whisper_timestamped