获得徽章 4
赞了这篇文章
赞了这篇沸点
【分享一些开源文本标注工具】
自然语言处理的大部分任务是监督学习问题。序列标注问题如语句分词、命名实体识别,分类问题如关系识别、情感分析、意图分析等,均需要标注数据进行模型训练。而人工标注数据的过程往往繁琐低效,因此借助一些智能文本标注工具可大大减轻开发人员的工作量。
下面分享一些开源文本标注工具(注:绝大部分面向英文文本):
1.IEPY
地址:
github.com
2.DeepDive (Mindtagger)
地址:
github.com
将DeepDive的corenlp部分转为支持中文的代码尝试:
github.com
github.com
github.com
3.BRAT
代码
github.com
4.SUTDAnnotator
代码
github.com
5.Snorkel
地址:
github.com
6.Slate
代码:
bitbucket.org
7.Prodigy
地址:
prodi.gy
资源来自GitHub项目Chinese-Annotator:
github.com
自然语言处理的大部分任务是监督学习问题。序列标注问题如语句分词、命名实体识别,分类问题如关系识别、情感分析、意图分析等,均需要标注数据进行模型训练。而人工标注数据的过程往往繁琐低效,因此借助一些智能文本标注工具可大大减轻开发人员的工作量。
下面分享一些开源文本标注工具(注:绝大部分面向英文文本):
1.IEPY
地址:
2.DeepDive (Mindtagger)
地址:
将DeepDive的corenlp部分转为支持中文的代码尝试:
3.BRAT
代码
4.SUTDAnnotator
代码
5.Snorkel
地址:
6.Slate
代码:
7.Prodigy
地址:
资源来自GitHub项目Chinese-Annotator:
展开
评论
18
赞了这篇文章
赞了这篇文章