- 不兼容 将拼音词典库里的国际音标字母替换为 ASCII 字母. Thanks @MingStar :
ɑ -> a
ɡ -> g
- bugfix 修复 zh, ch, sh, z, c, s 顺序问题导致获取声母有误
y
,w
也不是声母. (hotoo/pinyin#57)
- 上传到 PyPI 出了点问题,但是又 没法重新上传 ,只好新增一个版本
- bugfix 重构内置的分词功能,修复“无法正确处理包含空格的字符串的问题”
新增 内置简单的分词功能,完善处理没有拼音的字符 (如果不需要处理多音字问题, 现在可以不用安装
jieba
或其他分词模块了):# 之前, 安装了结巴分词模块 lazy_pinyin(u'你好abc☆☆') [u'ni', u'hao', 'a', 'b', 'c', u'\u2606', u'\u2606'] # 现在, 无论是否安装结巴分词模块 lazy_pinyin(u'你好abc☆☆') [u'ni', u'hao', u'abc\u2606\u2606']
- [变更] 当
errors
参数是回调函数时,函数的参数由单个字符
变更为单个字符或词组
。即: 对于abc
字符串, 之前将调用三次errors
回调函数:func('a') ... func('b') ... func('abc')
现在只调用一次:func('abc')
。 [变更] 将英文字符也纳入
errors
参数的处理范围:# 之前 lazy_pinyin(u'abc', errors='ignore') [u'abc'] # 现在 lazy_pinyin(u'abc', errors='ignore') []
- 修复 Python 2 下无法使用
from pypinyin import *
的问题 - 新增 支持以下环境变量:
PYPINYIN_NO_JIEBA=true
: 禁用“自动调用结巴分词模块”PYPINYIN_NO_PHRASES=true
: 禁用内置的“词组拼音库”
新增
errors
参数支持回调函数(#17):def foobar(char): return 'a' pinyin(u'あ', errors=foobar)
- 纠正包含 "便宜" 的一些词组的读音
- fix "苹果" pinyin error. #11
- 精简 phrases_dict
- fix 重复 import jieba 的问题
- 更新文档
- fix phrases_dict error
- 修复 无法正确处理由分词模块产生的中英文混合词组(比如:B超,维生素C)的问题. #8
- 更新拼音库
- 载入拼音库时,改为载入其副本。防止内置的拼音库被破坏
- 修复
胜败乃兵家常事
的音标问题
新增 参数
errors
用来控制如何处理没有拼音的字符:'default'
: 保留原始字符'ignore'
: 忽略该字符'replace'
: 替换为去掉\u
的 unicode 编码字符串(u'\u90aa'
=>u'90aa'
)
只处理
[^a-zA-Z0-9_]
字符。
使用新的单字拼音库内容和格式
新的格式:{0x963F: u"ā,ē"}
旧的格式:{u'啊': u"ā,ē"}
- 清理命令行命令的输出结果,去除无关信息
- 修复 “ImportError: No module named runner”
- 修复 命令行工具在 Python 3 下的兼容性问题
- 去除 拼音风格前的
STYLE_
前缀(兼容包含STYLE_
前缀的拼音风格) - 增加 命令行工具,具体用法请见:
pypinyin -h
- 新增 支持自定义拼音库,方便用户修正程序结果
- 变更 将
jieba
模块改为可选安装,用户可以选择使用自己喜爱的分词模块对汉字进行分词处理 - 新增 支持 Python 3
增加
lazy_pinyin
>>> lazy_pinyin(u'中心') ['zhong', 'xin']
- 修复 首字母风格无法正确处理只有韵母的汉字
- 新增 三个拼音风格:
pypinyin.STYLE_FINALS
: 韵母风格1,只返回各个拼音的韵母部分,不带声调。如:ong uo
pypinyin.STYLE_FINALS_TONE
: 韵母风格2,带声调,声调在韵母第一个字母上。如:ōng uó
pypinyin.STYLE_FINALS_TONE2
: 韵母风格2,带声调,声调在各个拼音之后,用数字 [0-4] 进行表示。如:o1ng uo2
完善对中英文混合字符串的支持:
>> pypinyin.pinyin(u'你好abc') [[u'n\u01d0'], [u'h\u01ceo'], [u'abc']]
- Initial Release