某机构是2020年信息与知识管理国际会议(CIKM)的白银赞助商。在10月19日至23日举行的会议期间,资深首席科学家Xin Luna Dong发表了关于从半结构化网页中挖掘知识的主题演讲。Dong解释说,这项使命是构建一个产品图谱,“以解答关于世界上任何产品和相关知识的任何问题”。
知识图谱已被广泛用于支持各类应用,并增强搜索和问答(QA)的能力,但许多长尾知识,包括不流行的实体、关系和垂直领域,常常被遗漏。Dong介绍了某机构的AutoCeres ClosedIE系统。该系统将最先进的全自动知识抽取技术从60%+的准确率提升至90%+,尤其擅长处理半结构化数据。
她还介绍了OpenCeres,这是首个面向半结构化数据的开源信息抽取(OpenIE)系统,能够识别出现有本体中尚未包含的新关系。最后,Dong的主题演讲还概述了某机构在本体对齐、实体链接、图挖掘和QA方面的其他工作,这些工作使得能够利用抽取的知识来增强搜索和问答功能。
研究领域
信息与知识管理
标签
知识图谱 | 数据抽取FINISHED