本项目收集各个编码与 UCS 的对应关系,以及关于 UCS 的那些事儿。
仓库很大,谨慎 Clone。(正论)
正由于仓库过大,网页分化到 IshisashiEncoding-Website,以便于进行部署。
在 ISO/IEC 10646 中,字符集部分称作为「UCS」。
但是在 Unicode 中,字符集部分被称为「Unicode」。
本项目为了保持中立,称字符集部分为「UCS」。
部分 GB 强制标准在现在已经降级为了 GB/T,因此本项目内称为 GB/T。如 GB/T 2312。
在 JIS X 0208 等标准中,区位的表示在一个标准内都显得不够统一。
本项目采取 GB/T 2312 的表示,将区位表示成「(X)X-XX」格式。
对于面区位,由于是区位扩展而来,因此表示成「(X)X-(X)X-XX」格式。
对于编码映射来说,尊重编码规范原文的映射,可能映射至兼容字。
但对于区位表等明确字符的文本来说,使用 SVS 表示,并在注释里附上惯用的兼容字。