这是一个 86 版五笔输入法的改进版码表,仅含《通用规范汉字表》8105字范围内的字和词语。
本项目旨在打造一个更好的、面向大众的通用码表,并且会持续更新,逐步完善词库。
《通用规范汉字表》之外的新增汉字:
adwd 碁
cccu 叒
damw 磺
efqn 朊
nkmh 屌
npwi 屄
yctd 诶
本码表相对原版做了很多改进(详情点这里),目标是做到:
- 更合理的拆字
- 更均衡的按键
- 更少的重码
- 更易学易用
对于拆字规则,原版的规则是:
- 能散不连
- 能连不交
- 取大优先
- 兼顾直观
我认为“取大优先”是不必要的,有其他三条规则就已经足够了,因此在对码表改进的过程中不再遵守此条规则。
之前这个项目是基于新世纪五笔的改进版,但是用了一段时间后我觉得新世纪版并不好用,其缺点如下:
- 整体采用小字根设计,拆字繁琐(主要指体验)
- 由于小字根设计,重码也变多了,尤其是常用字词
- 号称编码更规范合理,但依然存在诸多不合理及错误编码(网上可以找到很多例子)
- 网传其改进了各手指使用的均衡度,但根据实测及程序分析,其相对于 86 版几乎没有改变
由于以上问题的存在,如果我基于新世纪版进行改进,就需要大量的改动及重新设计,工作量之大几乎相当于重新设计一套编码方案了,这就是我放弃新世纪版的原因。
不过平心而论,新世纪版也有一些优点,比如字根设计及拆字方案总体上确实更加合理了,对于新手来说也更易学易用了,本项目对 86 版五笔的一些改进也参考了新世纪版的设计。
原始码表来源于CNMan/rime-data,以下是码表介绍:
- 仅含《通用规范汉字表》8105字范围内的字和词语。
- 修正、统一了王码大一统新世纪版五笔字型错误编码
- 以大陆商务印书馆《现代汉语词典》(第7版)(约5.9万词)、上海辞书出版社《现代汉语大词典》(约10万词)及《现代汉语新词语词典》(第2版)(约1万词)和台湾教育部《重編國語辭典修訂本》(约15.1万词)、《成語典》(约0.75万词)(以下简称“五词典”)为基准
- 完整包括《现代汉语词典》(第7版)、《现代汉语大词典》、《现代汉语新词语词典》(第2版)词头
- 整合了9种五笔码表(王码大一统、QQ五笔、极点五笔、孤狐世纪词库、至善词库、冰凌五笔、黄狗五笔、精灵五笔、花儿五笔)的公共词语
- 原则上不含5字以上词语(“五词典”词头除外)
- 原则上不含外国人名、地名、品牌名等(“五词典”词头除外)
- 完整包括民政部县以上行政区划简称(即只有“北京”,没有“北京市”等),并清理了地域词(即没有“北京动物园”等)
- 完整包括教育部76所直属大学名称
- 完整包括各届中国大陆及港澳台地区领导人姓名,其他国内人名仅含“五词典”词头中的历史人物姓名
- 词语总数拟控制在15万左右,其中“五词典”以外词语总数约1.5万
- 旨在打造整体偏“学术”的字词码表,欢迎大家提出意见和建议,谢谢!
在原始码表的基础上,我做了如下更改:
- 字根更改:
- 将
W
键上的癸
字头移至O
键 - 将
Y
键上的隹
右边的字根移至O
键 - 将
Y
键上的方
字根移至O
键 - 将
D
键上的套
下面的字根移至K
键 - 将
F
键上的革
下面的字根移至K
键 - 将
F
键上的雨
字根移至K
键 - 将
V
键上的臼
字根移至E
键 - 将
N
键上的⺗
字根移至I
键 - 删除
Q
键上的荒
下面的字根,编码改为k
- 删除
Q
键上的类犭
字根 - 删除
Q
键上的鱼
字头 - 删除
E
键上的用
字根,编码改为eh
- 删除
U
键上的辛
字根,编码改为uf
- 删除
D
键上的类犬
字根 - 删除
G
键上的戋
字根,编码改为fxy
- 增加
𦥑
字根至E
键 - 增加
犭
字根至E
键 - 增加
告
字头至R
键 - 增加
鱼
字根至P
键 - 增加
于
字根至S
键 - 增加
者
字头至F
键 - 增加
足
字根至L
键
- 将
- 编码更改:
- 将
力
字的编码从ltn
改为lnt
,二级简码ln
- 将
兆
字的编码从iqv
改为qii
- 将
舆
字的编码从wflw
改为elgw
- 将
盥
字的编码从qgil
改为eilf
- 将
非
字的编码从djdd
改为jddd
- 将
瓦
字的编码从gnyn
改为gnny
- 将
官
字的编码从pnhn
改为phnn
- 将
予
字的编码从cbj
改为cnhj
- 将
特
字的编码从trff
改为rhff
- 将
囊
字的编码从gkhe
改为fkpe
- 将
兰
字的编码从uff
改为udf
- 将
养
字的编码从udyj
改为udwj
- 将
平
字的编码从guhk
改为gufk
- 将
乎
字的编码从tuhk
改为tufk
- 将
夹
字的编码从guwi
改为gudi
- 将
戊
字的编码从dnyt
改为dxyi
- 将
我
字的编码从trnt
改为trxy
- 将
凸
字的编码从hgmg
改为hghg
- 将
凹
字的编码从mmgd
改为hnmg
- 将
伞
字的编码从wuhj
改为wufj
- 将
幽
字的编码从xxmk
改为mxxi
- 将
辨
字的编码从udyf
改为udjf
- 将
君
字的编码从vtkd
改为vtkf
- 将
燕
字的编码从auko
改为akuo
- 将
兜
字的编码从qrnq
改为rqnq
- 将
燮
字的编码从oyoc
改为yooc
- 将
夔
字的编码从uhtt
改为utht
- 将
不
字的编码从gii
改为dhi
,二级简码dh
- 将
还
字的编码改为跳过第二码,即dpi
,二级简码dp
- 将
乃刀方
等字的末笔从乙
改为丿
- 将
尤龙
等字的末笔从乙
改为丶
- 将
戈戋
等字的末笔从丿
改为丶
- 将
- 简码更改:
- 将一级简码
Q
从我
改为年
- 将一级简码
Y
从主
改为为
- 将一级简码
U
从产
改为你
- 将一级简码
O
从为
改为我
- 将一级简码
X
从经
改为给
- 将一级简码
V
从发
改为好
- 将一级简码
N
从民
改为已
,键名汉字改为己
- 将一级简码
M
从同
改为发
- 若干二级简码和三级简码更改,略
- 将一级简码
本项目会持续改进,如果还有明显不合理或错误的地方,欢迎提出改进建议。
本项目只是一个码表,理论上可用于任何支持自定义码表的输入法。
注意:由于WubiLex
只接受特定扩展名的码表文件,你可能需要将码表重命名为better-wubi.txt
才能添加。
# requires
# fcitx: sudo apt install fcitx fcitx-table-wubi fcitx-tools
# fcitx5: sudo apt install fcitx5 fcitx5-chinese-addons libime-bin
git clone --depth=1 https://github.com/beavailable/better-wubi.git
cd better-wubi
./install-for-fcitx.sh
然后在fcitx
设置面板添加better-wubi
输入法即可。
点击这里查看教程。
注意:不可使用better-wubi.dict
作为导入的码表,而应该使用如下命令生成码表文件:
./convert.py fcitx >better-wubi.txt
convert.py
可以将码表转换为你需要的格式。
regenerate.py
可以重新生成(根据单字编码)并排序码表。
statistics.py
可以查看相关的统计信息。
版权归王码公司所有,禁止商用。