Skip to content

汉字数据集,包括汉字的相关信息,例如笔画数、部首、拼音、英文释义/同义词等。

License

Notifications You must be signed in to change notification settings

secsilm/zi-dataset

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 

Repository files navigation

zi

汉字数据集,包括约 20000 个汉字的相关信息,具体字段包括:

字段 说明 举例
zi 汉字本身
stroke_count 笔画数 7画
stroke_count_decomposed 笔画数拆解 木 + 3
mandarin_pinyin 普通话拼音
cantonese_pinyin 粤语拼音 lei5
english 英文 plum; judge; surname
radical 部首
radical_stroke_count 部首笔画数 4
radical_pinyin 部首拼音
radical_english 部首英文 tree
variant 变体,通常为对应繁体 NaN
fc_code 四角码 4040.7
cj_code 仓颉码 DND
zis_with_this_component 包含该字的字,即以该字为部件的字,以英文逗号分隔,不包含本身 NaN
leaf_component 叶子部件,即将该字拆分构成一个树后,其叶子节点便是叶子部件,用 / 拼接 木/子

WIP

  • 添加笔画顺序

About

汉字数据集,包括汉字的相关信息,例如笔画数、部首、拼音、英文释义/同义词等。

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published