获得徽章 0
- 143
- 【分享一些开源文本标注工具】
自然语言处理的大部分任务是监督学习问题。序列标注问题如语句分词、命名实体识别,分类问题如关系识别、情感分析、意图分析等,均需要标注数据进行模型训练。而人工标注数据的过程往往繁琐低效,因此借助一些智能文本标注工具可大大减轻开发人员的工作量。
下面分享一些开源文本标注工具(注:绝大部分面向英文文本):
1.IEPY
地址:github.com
2.DeepDive (Mindtagger)
地址:github.com
将DeepDive的corenlp部分转为支持中文的代码尝试:
github.com
github.com
github.com
3.BRAT
代码github.com
4.SUTDAnnotator
代码github.com
5.Snorkel
地址:github.com
6.Slate
代码:bitbucket.org
7.Prodigy
地址:prodi.gy
资源来自GitHub项目Chinese-Annotator:github.com
展开评论18