Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

词库贡献 #457

Closed
hoofcushion opened this issue Aug 29, 2023 · 23 comments
Closed

词库贡献 #457

hoofcushion opened this issue Aug 29, 2023 · 23 comments
Labels
dict 词库相关

Comments

@hoofcushion
Copy link
Contributor

hoofcushion commented Aug 29, 2023

没这个词 11
↪有这个词
好念 10
↪不好念
卵鞘 14 #蟑螂卵
注魔 6
射弹 23 #projectile 的翻译
训读 10 #用其他语言的习惯读一种文字
蜚蠊目 6
副翻译器 8 #rime 的一种配置形式
汉字化 22
帧伤 2
这翻译 3
反广告 2
西式汉语 2 #近代出现的一种大量使用虚词的语言习惯
跳杀 5 #恐怖游戏中的突然袭击
霜华满天 2 #流行词
↪爽滑慢舔
我不想用 2 #目前首选是 "我不享用" 不宜
曲折化 4 #语言演变出词形变化的过程
低创 5 #低级创作
单字优先 2
伪娘
↪小伪娘
药娘 2
↪小药娘
苗文 3 #苗族文字
顶功 5
灶马 4 #一类昆虫的俗称
拉丁词

以上词来自于我的输入记录,我写了一个脚本和雾凇词库去重,最后由我人工挑选

附件:
recorder.zip
20230917004117 更新 recorder.zip
用 lua_translator@recorder 调用他
user目录下 新建 recorder 文件夹
上屏纯汉字候选后,会自动记录在
user/recorder/recorder.txt
user/recorder/char.txt
并且会记录上屏次数

@iDvel
Copy link
Owner

iDvel commented Aug 30, 2023

这个 Lua 好像让调频失效了。
💖 感谢还写上了词汇解释。

@iDvel iDvel added the dict 词库相关 label Aug 30, 2023
@Anber55
Copy link

Anber55 commented Sep 1, 2023

请问去重的脚本能分享一下吗,谢谢

@hoofcushion
Copy link
Contributor Author

hoofcushion commented Sep 1, 2023

@Anber55
词库去重脚本.zip
(IMTXEPH)O)`49AV9PG5K{X

  1. 在 dicts.txt 文件中填写原始词库的位置
  2. 将需要去重的词库放入 input.txt
  3. 运行 run.bat
  4. 结果生成在 output.txt 中

@hoofcushion
Copy link
Contributor Author

hoofcushion commented Sep 1, 2023

词库的少量贡献和修正,或许可以在一个 issue 内投稿完成,就不用像我一样几十个词就要开一个 issue 了。
另外,也可以附带一个记录日常输入脚本,用户可以打开这个功能并贡献 recorder.txt 文件,毕竟有心思同时有能力贡献词库的用户还是少数。

@hoofcushion
Copy link
Contributor Author

hoofcushion commented Sep 3, 2023

又筛选了一部分

当量图 5 #当量的图表
乱序 4
相等性 3
↪不相等性
耗蓝 3 #消耗魔法值
拼运 3 #rime 中的 speller/algebra 拼写运算的缩写
遍黑体 3
解除安装	4 #uninstall 的翻译
盗视频	2
表音 #表音文字 中的 表音
↪表意
选窗 5#选择窗口 的缩写
↪候选窗
苦弱 1 #首选为库弱 不宜
异或取反 1 #NOT XOR 的翻译
音游	1 #节奏游戏的简称
蝌蚪啃蜡	1 #coca cola 的翻译
狠捞一笔	1
现代汉语拼音方案	1
生造词	1
秒伤	1 #damage per sec 的翻译
秒全场	1 #首选为 妙全场 不宜
美式概念	1 #American idea

@hoofcushion
Copy link
Contributor Author

hoofcushion commented Sep 6, 2023

三码拼音	11
用户词	11
你又要	6 #首选是 你有药
有什么病	6
哪那么简单	6 #首选是 那那么简单
你还可以用	6
这你也要	6
转一遍	5
但不完全	4
音近	4
非得知道	4
要点之一	4
希腊词	4
希腊字	4
拉丁字	4
自然能懂	4
自然会懂	4
是形容词	4
飞键	3
宇宙万法的源头	3
↪万法
这样排	3 #首选是 这样派
套皮	3 #首选是 逃皮
嫌高	3
反选	3 #反向选择
编码范围	2 # Unicode 的「编码范围」是 0-1114111

@hoofcushion
Copy link
Contributor Author

recorder.lua 真的会导致用户词失效吗,我最近也总是失效,不知道写的有什么问题

@iDvel
Copy link
Owner

iDvel commented Sep 8, 2023

那天试了一下就关了,今天又试了一下发现没什么问题 😮 可以正常调频和记录

patch:
  engine/processors/@before 0: lua_processor@*recorder

@hoofcushion
Copy link
Contributor Author

hoofcushion commented Sep 26, 2023

加一大堆
塞着东西
呼应了	#首选是 户赢了
移除了
提到的
惜墨	#「惜墨」如金
在哪啊
方案集
全码对应
这串代码
↪这串
私发	#私聊发送
处理不了
括住
整数比
导入了
喝冰红茶
夜魇	#克苏鲁虚构生物,也可以理解为 nightmare 的直译
好几百集	#首选是  好几百己
所以其实
鲁镇 #虚构地点,出自小说:《孔乙己》
热能射线 #科幻的武器方式
理解是 #我的「理解是」 
没有改变吗
呼读音	#《现汉》规定的字母直接念法 a bê cê dê
名称音	#《现汉》规定的字母名称念法 a bo ci de
屯了	#屯的过去时态
囤了	#囤的过去时态
哈皮	#四川话詈语|happy音译
两种磁性
两种词性
单书名号	#这个〈〉符号的名字

不妥的首选:

你菜	#改为 你猜

纠错:我之前提出的 蝌蚪啃蜡,其实应该是 蝌蝌啃蜡,另外,这个译名应该是近代捏造的,不过既然已有流传,也可以保留,毕竟也没有重码。

iDvel added a commit that referenced this issue Sep 27, 2023
@jioyla
Copy link

jioyla commented Oct 8, 2023

那天试了一下就关了,今天又试了一下发现没什么问题 😮 可以正常调频和记录

patch:
  engine/processors/@before 0: lua_processor@*recorder

请问下,这个patch应该放在具体哪个文件里呢?

@iDvel
Copy link
Owner

iDvel commented Oct 9, 2023

请问下,这个patch应该放在具体哪个文件里呢?

放到你的方案的补丁文件,比如全拼就是 rime_ice.custom.yaml,双拼就是 double*.custom.yaml

@pencilheart
Copy link

希望加一条:微米设置为µm。

@hoofcushion
Copy link
Contributor Author

hoofcushion commented Oct 13, 2023

最近诺贝尔物理学奖颁给了三位对「阿秒光脉冲」作出杰出贡献的三位科学家,以下是我整理的几个关键词。
词库

阿秒
阿秒光脉冲
阿秒激光
阿秒激光脉冲
RABBITT
通过双光子跃迁干涉重建阿秒光脉冲
双光子跃迁干涉

滤镜

阿秒:
 - as
 - attosecond
RABBITT:
 - Reconstruction of Attosecond Beating by Interference of Two-Photon Transitions

@xtmu
Copy link
Contributor

xtmu commented Oct 28, 2023

猪肘 打不出来

sangjeedondrub added a commit to sangjeedondrub/rime-configuration that referenced this issue Nov 2, 2023
* github/main: (24 commits)
  dict: 完成同义多音字注音 close iDvel#353
  dict: 添加 "明不明显" (iDvel#529)
  feat: reduce_english_filter.lua 增加一键全降低
  fix: 完善所有双拼 i?ong 键位的正则
  dict: 日常更新
  fix: reduce_english_filter.lua 处理有空格的单词 iDvel#524
  conf: 双拼默认不启用简拼 iDvel#508
  dict: 日常更新 close iDvel#522
  feat: 英文方案增加 `#` jing 和 `+` jia 的派生
  dict: 日常更新 close iDvel#520
  fix: reduce_english_filter.lua 可识别含单引号的单词 close iDvel#519
  dict: 「皮妙」→「皮秒」 close iDvel#517
  dict: 日常更新 iDvel#457 close iDvel#516 添加一些英文缩写 close iDvel#512
  fix: en_spacer.lua 处理含单引号的单词 close iDvel#513
  conf: 双拼默认不启用简拼 iDvel#508
  fix: reduce_english_filter.lua 不处理非英文单词  fix iDvel#505
  dict: 日常更新; close iDvel#502
  feat: 完善九宫格
  dict: 日常更新; close iDvel#493
  feat: en_spacer.lua 英文词条上屏自动添加空格 (iDvel#496)
  ...
@CrotchBurnt
Copy link

需要加上

量子隧穿

@hoofcushion
Copy link
Contributor Author

hoofcushion commented Dec 5, 2023

去重排序后的词库

频率 注解
元方法 3 metamethod 译名
文泉驿 3 文泉驿字体系列
高亮组 3 highlight group 译名
插件市场 3
可视模式 1 visual mode 译名
可选依赖 1 optional dependencies
高维生物 1 空间维度更多的生物

网络热梗

注解
畜生里的畜生 网络热梗
狗军阀
曹瑛
曹少璘
弄一碗面给你
铁牛牛肉面

@mirtlecn
Copy link
Collaborator

mirtlecn commented Feb 3, 2024

有一个错词:

豆腐房 (查不到这种说法)

iDvel added a commit that referenced this issue Feb 3, 2024
@Mintimate
Copy link
Contributor

41448字库中没有贠yun这个字,只有yuan这个音。不知道是否需要添加上。

iDvel added a commit that referenced this issue Feb 4, 2024
@dos7lo
Copy link

dos7lo commented Feb 5, 2024

你好,龙行龘龘 前程朤朤 无法打出
朤 lang,可以用 四个月 打出来,但是lang的发音打不出来
自行添加额外词库mydict,加入后重新部署也没有作用。

@iDvel
Copy link
Owner

iDvel commented Feb 5, 2024

「龙行龘 da 龘 da」有了,「前程朤朤」等会加上。
添加词汇时,字表没有的字不会被自动注音,得加上注音:

前程朤朤	qian cheng lang lang

iDvel added a commit that referenced this issue Feb 5, 2024
@dos7lo
Copy link

dos7lo commented Feb 5, 2024

「龙行龘 da 龘 da」有了,「前程朤朤」等会加上。 添加词汇时,字表没有的字不会被自动注音,得加上注音:

前程朤朤	qian cheng lang lang

加了 但是也不行 难道中间要是空格不能是tab?前程朤朤 朤 朤朤 都加了 rime_ice.dict也启用了

@iDvel
Copy link
Owner

iDvel commented Feb 5, 2024

问题可能什么都有,是否正确引用词库,Tab空格分割是否正确,词条前面的词有错的也会导致后面的不生效。

@iDvel
Copy link
Owner

iDvel commented Feb 5, 2024

关闭了,换到 #666 这个数字好。

@iDvel iDvel closed this as completed Feb 5, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
dict 词库相关
Projects
None yet
Development

No branches or pull requests

10 participants