![[发呆]](http://lf-web-assets.juejin.cn/obj/juejin-web/xitu_juejin_web/img/jj_emoji_4.28b310a.png)
中文人名语料库(Chinese-Names-Corpus):
业余项目“萌名(一个基于语料库技术的取名工具)”的副产品,可用于中文分词、人名识别。
语料库包含120万个中文常见人名、25万个中文古代人名、18万个日本汉字名、48万个翻译人名、1千个中文姓氏、5千个中文称呼和5万个成语词典。
GitHub地址:
github.com
项目作者:wainshine
业余项目“萌名(一个基于语料库技术的取名工具)”的副产品,可用于中文分词、人名识别。
语料库包含120万个中文常见人名、25万个中文古代人名、18万个日本汉字名、48万个翻译人名、1千个中文姓氏、5千个中文称呼和5万个成语词典。
GitHub地址:
项目作者:wainshine
展开
评论
点赞