- fix "苹果" pinyin error. #11
- 精简 phrases_dict
- fix 重复 import jieba 的问题
- 更新文档
- fix phrases_dict error
- 修复无法正确处理由分词模块产生的中英文混合词组(比如:B超,维生素C)的问题. #8
- 更新拼音库
- 载入拼音库时,改为载入其副本。防止内置的拼音库被破坏
- 修复
胜败乃兵家常事
的音标问题
新增参数
errors
用来控制如何处理没有拼音的字符:'default'
: 保留原始字符'ignore'
: 忽略该字符'replace'
: 替换为去掉\u
的 unicode 编码字符串(u'\u90aa'
=>u'90aa'
)
只处理
[^a-zA-Z0-9_]
字符。
使用新的单字拼音库内容和格式
新的格式:{0x963F: u"ā,ē"}
旧的格式:{u'啊': u"ā,ē"}
- 清理命令行命令的输出结果,去除无关信息
- 修复“ImportError: No module named runner”
- 修复命令行工具在 Python 3 下的兼容性问题
- 去除拼音风格前的
STYLE_
前缀(兼容包含STYLE_
前缀的拼音风格) - 增加命令行工具,具体用法请见:
pypinyin -h
- 支持自定义拼音库,方便用户修正程序结果
- 将
jieba
模块改为可选安装,用户可以选择使用自己喜爱的分词模块对汉字进行分词处理 - 支持 Python 3
增加
lazy_pinyin
>>> lazy_pinyin(u'中心') ['zhong', 'xin']
- 修复首字母风格无法正确处理只有韵母的汉字
- 新增三个拼音风格:
pypinyin.STYLE_FINALS
: 韵母风格1,只返回各个拼音的韵母部分,不带声调。如:ong uo
pypinyin.STYLE_FINALS_TONE
: 韵母风格2,带声调,声调在韵母第一个字母上。如:ōng uó
pypinyin.STYLE_FINALS_TONE2
: 韵母风格2,带声调,声调在各个拼音之后,用数字 [0-4] 进行表示。如:o1ng uo2
完善对中英文混合字符串的支持:
>> pypinyin.pinyin(u'你好abc') [[u'n\u01d0'], [u'h\u01ceo'], [u'abc']]
- Initial Release