Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

设置热词替换之后再次调整中英文之间的空格,避免中英相互替换后空格异常。 #25

Open
wants to merge 1 commit into
base: master
Choose a base branch
from

Conversation

shandianchengzi
Copy link

@shandianchengzi shandianchengzi commented Dec 17, 2023

修改方式

中英文替换之后,没有再次调整空格,这个问题影响还挺大的。比如邮箱输入的时候,艾特改成@,导致后面的总是多一个空格出来很麻烦。
我的修改方式是追加两行代码,让它再次调整
经过我的测试,这样的修改是可行的。

备注

为了不重写代码或者设置两遍变量,我增加了一个全局变量文件,用来共享 client 和 server 的信息。
不过,实际上,全局变量文件应该只存储变量,而不存储代码。所以按照开发时的规范重复的函数应该放在 utils 的那个文件夹下。
但是我看了一下你的程序会将 utils 下面的代码都打包一遍,我不清楚你的程序是如何打包的,所以我没有在这个模块下贸然添加任何代码,就全写在全局变量的文件里面了。
总之,这是一个修改示意~如果你采纳的话,有不符合你的代码逻辑的部分,请直接修改

修改测试结果

我的测试结果如下,123@qq.com,一 Hz,180Hz,123@edu.hust.cn
image

为了准确识别邮箱和网址,我新增的热词(在 hot-rule.txt 下)如下:

艾特 QQ 点 com = @qq.com
艾特 = @
一六三点 com = 163.com
edu 点 = edu.
点 com = .com
点 cn = .cn

对于识别邮箱这个功能点,我认为应该是工具的特性,所以我没有交到这个解决 bug 的 PR 里面,如果你希望加上该特性的话,你可以直接加到热词里。

@HaujetZhao
Copy link
Owner

我试了下把自定义规则替换改为正则表达式替换,更新到最新代码了,你可以试下。

image

@shandianchengzi
Copy link
Author

我试了下把自定义规则替换改为正则表达式替换,更新到最新代码了,你可以试下。

image

感谢,我这两天尝试编译一下,如果没有其他问题我就关掉这个PR

@shandianchengzi
Copy link
Author

shandianchengzi commented Apr 6, 2024

.com和.cn的支持还不太好,其他的都没有问题了

image

我在你的基础上加了两行正则匹配,感觉效果很好:

\s*点\s*cn = .cn
\s*点\s*com = .com

image

@shadowascetic
Copy link

@HaujetZhao 你好,有个类似的点子,不知道该咋发起投票,在这里说了。
输出可不可以弄个只有时间戳和文字的样式?不需要srt里面单句的序号以及空行,只要时间戳和文字,这样方便放到笔记本里后搜索查阅。
类似如下,左边是识别出的srt,右边绿色是建议增加的新样式文本格式。
对照

@shandianchengzi
Copy link
Author

@HaujetZhao 你好,有个类似的点子,不知道该咋发起投票,在这里说了。 输出可不可以弄个只有时间戳和文字的样式?不需要srt里面单句的序号以及空行,只要时间戳和文字,这样方便放到笔记本里后搜索查阅。 类似如下,左边是识别出的srt,右边绿色是建议增加的新样式文本格式。 对照

奇怪,这个srt文件是在哪里导出的?我看到的日志文件就是你说的方便查阅的格式呀?日志文件的路径是client.exe所在文件夹下的assert文件夹。

image

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

3 participants