Skip to content

将汉字转为拼音。基于 luna_pinyin\pypinyin\clover-pinyin 数据。(共提供50W左右拼音数据)。基于 百度汉语数据(共抓取35W词组拼音数据) 。基于 jieba分词工具。

License

Notifications You must be signed in to change notification settings

SivanLaai/exact-pinyin-mark

Repository files navigation

精准拼音转换(Python 版)

将汉字转为拼音。

基于 luna_pinyin\pypinyin\clover-pinyin 数据。(共提供50W左右拼音数据)

基于 百度汉语数据(共抓取35W词组拼音数据) 。

基于 jieba分词工具。

特性

  • 从百度汉语字典中抓取汉字的最新拼音数据。
  • 根据词组智能匹配最正确的拼音。
  • 简单使用。

安装

$ git clone https://github.com/SivanLaai/exact-pinyin-mark.git
$ cd exact-pinyin-mark
$ pip install -r requirements.txt

使用示例

Python 3(Python 2 下把 '中心' 替换为 u'中心' 即可):

>>> from PinyinDataBuild import PinyinDataBuild
>>> pdb = PinyinDataBuild(loadJieba=False)
>>> pdb.getPinyin('从百度汉语字典中抓取汉字的最新拼音数据。')
['cong', 'bai', 'du', 'han', 'yu', 'zi', 'dian', 'zhong', 'zhua', 'qu', 'han', 'zi', 'de', 'zui', 'xin', 'pin', 'yin', 'shu', 'ju']

拼音数据

  • 单个汉字的拼音使用 luna-pinyin_ 的数据
  • 词组的拼音使用 phrase-pinyin-data_ 的数据
  • 词组的拼音使用 baidu-hanyu-pinyin_ 的数据

About

将汉字转为拼音。基于 luna_pinyin\pypinyin\clover-pinyin 数据。(共提供50W左右拼音数据)。基于 百度汉语数据(共抓取35W词组拼音数据) 。基于 jieba分词工具。

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages