首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
NorthTree72300
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
13
文章 11
沸点 2
赞
13
返回
|
搜索文章
最新
热门
基于词频统计的未登录词识别设想
通过逐级识别用户输入的词的长度是否等于1或大于4、是否为预设的分词词典或用户词典中存在的词、是否包含于所述分词词典或用户词典的某个词中,筛选出可能的未登录词加入用户输入词词典中做临时记录,当进一步识别出所述用户输入的词为网络词条中的词时,将所述用户输入的词加入所述用户词典中,同…
未登录词(Out Of Vocabulary)识别
因为看到一个标语——南京市长江大桥欢迎您。 例如“高东镇高东二路”,需要把“高东二路”这样不在词典中的路名识别出来。可以先把输入串抽象成待识别的标注序列,然后根据词类识别。例如: 定义特征的类别:例如未登录词的上文,下文等。 根据特征词库对输入串做全切分:可以采用AdjList…
个人成就
文章被点赞
1
文章被阅读
2,135
掘力值
40
关注了
0
关注者
0
收藏集
1
关注标签
8
加入于
2019-03-21