首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
nlp
订阅
FGYEason
更多收藏集
微信扫码分享
微信
新浪微博
QQ
2篇文章 · 0订阅
北大开源全新中文分词工具包:准确率远超THULAC、结巴分词
选自GitHub,作者:罗睿轩、许晶晶、孙栩,机器之心编辑。 pkuseg 是由北京大学语言计算与机器学习研究组研制推出的一套全新的中文分词工具包。它简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率。 高分词准确率:相比于其他的分词工具包,该工具包在不同领域…
如何将Python自然语言处理速度提升100倍:用spaCy/Cython加速NLP
AI前线导读:去年我们发布了基于 Python 的共指解析包之后,社区反馈非常热烈,大家开始在各式应用中使用它,有些应用场景与我们原来的对话用例非常不一样。 之后我们发现,虽然这个解析包的性能对于对话消息来说是足够的,但涉及到大篇幅新闻文章时就远远不够了。 所以我决定好好处理这…