获得徽章 4
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
赞了这篇沸点
【分享一些开源文本标注工具】

自然语言处理的大部分任务是监督学习问题。序列标注问题如语句分词、命名实体识别,分类问题如关系识别、情感分析、意图分析等,均需要标注数据进行模型训练。而人工标注数据的过程往往繁琐低效,因此借助一些智能文本标注工具可大大减轻开发人员的工作量。

下面分享一些开源文本标注工具(注:绝大部分面向英文文本):

1.IEPY

地址:github.com


2.DeepDive (Mindtagger)
地址: github.com

将DeepDive的corenlp部分转为支持中文的代码尝试:

github.com

github.com

github.com

3.BRAT
代码 github.com

4.SUTDAnnotator
代码 github.com

5.Snorkel

地址:github.com

6.Slate
代码:bitbucket.org

7.Prodigy
地址:
prodi.gy

资源来自GitHub项目Chinese-Annotator:
github.com
展开
景略集智于2018-08-20 17:35发布的图片
景略集智于2018-08-20 17:35发布的图片
景略集智于2018-08-20 17:35发布的图片
景略集智于2018-08-20 17:35发布的图片
评论
前端开发 @智慧芽
前端开发 @智慧芽
前端开发 @智慧芽
下一页