重启知识图谱与机器学习(1)

1,996 阅读4分钟

「这是我参与11月更文挑战的第4天,活动详情查看:2021最后一次更文挑战

知识图谱

这个概念是 google 在 2012年提出的,当时主要是为了将传统的基于关键字搜索模型向基于语义的搜索升级。知识图谱可以用来更好的查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。

知识表示

知识表示法 是认知科学和人工智能两个领域共同存在的问题。

  • 在认知科学里,知识表示关系到人类如何储存和处理资料。
  • 在人工智能里,其主要目标为储存知识,让程式能够处理,达到人类的智慧。目前这个领域仍然没有一个完美的答案,不过最近随着深度学习,特别是循环神经网络发展

在知识表示中,知识图谱是一种知识库,其中的数据通过图结构的数据模型或拓扑整合而成。知识图谱通常被用来存储彼此之间具有相互联系的实体。

知识图谱的应用

  • 搜索领域的Google搜索、百度搜索,
  • 社交 facebook 领域的领英经济图谱
  • 企业信息领域的天眼查企业图谱等
  • 机器翻译
  • 金融
  • 医疗
  • 很小创业公司将投入精力开放知识图谱
  • 推荐系统

知识图谱与机器学习

knowledge_graph_018.jpeg

知识图谱的相关领域

知识图谱涉及许多领域,例如在自然语言处理,

  • 数据库
    • RDF 数据库系统
    • 数据集成、知识融合
  • 机器学习
    • 知识图谱数据的知识表示(Graph Embedding)
  • 知识工程
    • 知识库构建
    • 基于规则的推理

知识图谱中相关技术

  • 关系型数据库
  • 领域本体的构建
  • 自然语言处理: 自然语言处理和知识图谱是相辅相成的关系,因为有了今天自然语言处理出现推动知识图谱的发展、RDF 很早以前就出现了,因为人工提取信息的限制。也就是限制了知识库大小。反过来知识图谱也推动自然语言处理的发展
    • 面向知识图谱的自然语言问答
    • 聊天机器人
  • 语义 web: 通过给万维网上的文档(如: HTML文档)添加能够被计算机所理解的语义(元数据),从而使整个互联网成为一个通用的信息交换媒介。
  • 数据挖掘:是一个跨学科的计算机科学分支它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算
  • 机器学习:知识图谱机器学习,这两个看似不相关的事物,放在一起会发生什么样的化学反应
  • 知识表示与推理
  • 认知计算:是人工智能的重要组成部分,是模拟人脑认知过程的计算机系统。 认知计算 代表一种全新的计算模式,它包含信息分析,自然语言处理和机器学习领域的大量技术创新,能够助力决策者从大量非结构化数据中揭示非凡的洞察。
  • 信息检索与抽取
    • 语义解析
  • 知识抽取: 从海量的数据中通过信息(结构化数据)抽取的方式获取知识
  • 知识融合: 通过对多个相关知识图谱的对齐、关联和合并,使其称为一个有机的整体,以及提供更全面知识

知识图谱和知识工程

知识图谱是 web 和大数据时代的知识工程新的发展形态。 知识工程的核心

  • 知识库:
  • 推理引擎
领域本体的构建

面向特定领域的形式化地对于共享概念体系的明确而又详细的说明

知识抽取

从数据中通过信息抽取的方式获取知识

知识融合

通过对多个相关知识图谱的对齐、联合和合并,使其称为一个有机的整体,以提供更全面知识

knowledge_graph_010.jpeg

基本术语

  • 本体: 来自哲学,也就是哲学对自然事物研究,本体是概念描述,形式化约束,大家可以共同理解,金融、会设计资本、高管、资本,定义这些概念以及这些概念之间关联,金融领域本体。

knowledge_graph_020.png

  • 实体
  • 关系
  • 属性
  • RDF 基于三元组(object,predicate,Object),主谓宾 鸣人是火影, RDF 有许多序列化方式可以是 json xml json-LD

RDFS_002.png