Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

【工具自荐】Whisper Notes - 离线音频文本转录(iOS) #3037

Open
mazzzystar opened this issue Apr 5, 2023 · 7 comments
Open

【工具自荐】Whisper Notes - 离线音频文本转录(iOS) #3037

mazzzystar opened this issue Apr 5, 2023 · 7 comments

Comments

@mazzzystar
Copy link

mazzzystar commented Apr 5, 2023

简介

Whisper Notes 是一个离线OpenAI Whisper模型,可以将语音输入以极高的准确率转成文字、支持多语言夹杂。

它是免费的:无内购、无广告、不联网。

补充信息

市场上已经有一些Whisper工具了,为什么我还要做一个呢?需求主要是:

  • 记录梦境:有时我做了个奇特的梦,醒来想记录,但睡眼朦胧很难打字,希望有个工具能快速录入语音并文本化。
  • 回复长消息:有时我需要回复很长的微信,但此时我在街上或在吃饭,在不回复语音消息的情况下,快速回信息。
  • 捕捉灵感:和2类似,有时不方便打字的场合突然有了新念头,想记录下来。

因此,Whisper Notes在准确率和速度之间做了折衷:尽可能使用最大的模型,但速度不至于慢到等几分钟才完成转录。正常情况下,你录入一段语音,等待几秒钟就可以完成。市场上的工具,要么太大(速度慢)、要么太小(准确率低)、要么会上传你的音频。

因为目的是「速记」,所以Whisper Notes的"日记"属性很弱。转录完,文字就会自动复制到剪贴板,你可以粘贴到微信、或真正的日记/Memo软件来整理。

截图

image

@freepoint-jsj
Copy link

没有安卓的吗

@dengshenkk
Copy link

用到了啥16.1+的特性吗? 考虑支持一下15吗?

@mazzzystar
Copy link
Author

没有安卓的吗

应该有人也实现了安卓版离线Whisper,我之前是做算法,很抱歉我只会写一点SwiftUI🤥

@mazzzystar
Copy link
Author

mazzzystar commented Apr 6, 2023

用到了啥16.1+的特性吗? 考虑支持一下15吗?

image

一些实现是不支持15的,不过也许可以换另一种实现来绕过,但最核心的问题是16的Core ML框架相比15.0性能提升很多,支持15.0可能会导致很多人的使用体验不佳。

@dengshenkk
Copy link

了解了~ 暂时不会升级ios版本

@fastfading
Copy link

fastfading commented May 7, 2024

@mazzzystar
你能不能做成输入法, 这样用还是不方便。
Whisper.CPP 是开源的 , 我在想为什么大公司不引入。

@mikedillion
Copy link

我在想为什么大公司不引入

Not all OpenSource licensing is the same.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

6 participants