Ceres: 从半结构化网页中收割知识
在某机构对2020年信息与知识管理国际会议(CIKM)的赞助活动中,资深首席科学家Xin Luna Dong发表了关于从半结构化网页中收割知识的主题演讲。该会议为信息与知识管理研究,以及数据和知识库的进展提供了国际论坛。
Dong解释说,其使命是构建一个产品知识图谱,以“回答世界上关于产品及相关知识的任何问题”。知识图谱已被广泛用于支持各类应用,并提升搜索和问答系统的性能,但演讲指出,常常会遗漏长尾知识,包括不流行的实体、不常见的关系以及非主流的垂直领域。
Dong介绍了某机构的AutoCeres ClosedIE系统,该系统在半结构化数据上,将全自动知识抽取的准确率从当前最先进方法的60%以上提升到了90%以上。她还介绍了OpenCeres,这是首个能够在半结构化数据上识别新关系的开放信息抽取(OpenIE)系统,能够发现现有本体中尚未包含的新关系。
最后,Dong的主题演讲还阐述了某机构在本体对齐、实体链接、图挖掘和问答系统方面的其他努力,这些工作使得能够利用抽取的知识来改进搜索和问答服务。
研究领域
- 信息与知识管理
标签
- 知识图谱
- 数据抽取FINISHED