2024CCKS总结

198 阅读14分钟

特邀报告 :What is next for Knowledge Graphs: Relevating the semantic Web vision

报告题目:What is next for Knowledge Graphs: Relevating the semantic Web vision

报告人:James Hendler(美国伦斯勒理工学院)

报告摘要: Knowledge Graphs have become a cornerstone in organizing and interpreting vast amounts of data, offering unprecedented insights and fostering innovation across various industries. As we stand on the cusp of the next evolution, this talk will explore the future directions and potential breakthroughs in Knowledge Graphs. We will delve into emerging trends such as the integration of machine learning with semantic technologies, enhancing interoperability, and scaling knowledge graphs for real-time applications. Additionally, we will discuss the role of advanced reasoning capabilities and the importance of contextual understanding in enriching the semantic vision. In this talk, we explore some of the original goals of the semantic web and knowledge graph technologies, some of their current uses, and some issues to consider for the future.

知识图谱已经成为组织和解释海量数据的基石,并在各行各业中推动了创新。本次演讲将探讨知识图谱的未来方向和潜在突破。我们将深入研究诸如机器学习与语义技术的集成、将知识图谱扩展到实时应用中的新兴趋势。此外,讨论了高级推理能力的作用,以及上下文理解在丰富语义愿景中的重要性。在这次演讲中,探讨了Semantic Web和知识图谱技术的一些初衷、它们当前的一些应用以及未来需要考虑的一些问题。

专家介绍: James Hendler is the Director of the Future of Computing Institute and the Tetherless World Professor of Computer, Web and Cognitive Sciences at RPI. Hendler is a data scientist with specific interests in open government and scientific data, AI and machine learning, semantic data integration and the data policy in government. One of the originators of the Semantic Web, he has authored over 450 books, technical papers, and articles in the areas of Open Data, the Semantic Web, AI, and data policy and governance. Hendler is a Fellow of the AAAI, AAIA, AAAS, ACM, BCS, IEEE and the US National Academy of Public Administration.

詹姆斯·亨德勒(James Hendler)是计算未来研究所所长,同时是伦斯勒理工学院(RPI)教授。亨德勒是一位数据科学家,具体研究方向包括开放政府和科学数据、人工智能和机器学习、语义数据集成等。他是Semantic Web的创始人之一,已经撰写了超过450本书籍、技术论文和文章,覆盖开放数据、语义网、人工智能和数据政策与治理等领域。亨德勒是美国人工智能学会(AAAI)、亚太人工智能协会(AAIA)、美国科学促进会(AAAS)、计算机协会(ACM)、英国计算机学会(BCS)、电气电子工程师协会(IEEE)以及美国国家公共行政学院(US National Academy of Public Administration)的会士。

特邀报告:地学知识图谱

**报告题目:**地学知识图谱

**报告人:**王新兵(上海交通大学)

报告摘要: 地球科学与信息科学的深度交叉融合,为人工智能助力的地学研究、深时空数据驱动的知识图谱构建带来了机遇和挑战。一方面,信息科学的人工智能、大数据、网络信息等领域的飞速发展,为地学研究的科学发现提供了新手段;另一方面,地学大数据的深时空(深时、深空、深地、深海)特性,拓展了知识图谱演化必需的数据多样性。地学知识图谱已成为地球科学与信息科学的国际前沿交叉研究热点。围绕深时空数据与知识图谱之间的表征同构映射、互促作用机理等科学问题,开展地学数据的结构化表示重建、知识图谱的深时空进化生长、图谱驱动的知识计算及发现等基础研究,能有效助力大数据时代的地学科学发现。

专家介绍: 王新兵,上海交通大学特聘教授,国家自然科学基金委杰出青年基金获得者,国家万人计划科技创新领军人才。现任ACM中国理事会主席(2021-),中国地质学会“数据驱动与地学发展专业委员会”副主任委员(2023-)。曾任上海交通大学电子信息与电气工程学院副院长,上海交通大学John Hopcroft计算机科学中心执行主任。担任多个CCF-A类国际期刊资深编委,包括IEEE Transactions on Information Theory, IEEE/ACM Transactions on Networking。发表领域A类期刊与会议论文100余篇,谷歌学术引用1万余次,连续六年入选爱思唯尔(Elsevier)中国高被引学者。2012年获中国计算机学会青年科学家奖,2018年获高等教育国家级教学成果奖二等奖(排2)。累计培养57位学生(其中优博3位)在高校任教职,包括C9高校17位、985高校26位、8位担任院长/系主任职务。

前沿趋势:基于大模型的多智能体协作框架

传统多智能体的泛化性不足、沟通薄弱、适应性差,近2年在大模型的加持下,理解泛化力、ICL理解和决策力、反思学习等有显著提升,未来主要放在提升Multi Agent System MAS解决问题的能力上,兼顾成本和响应时效。

  • **提升泛化性:**借助大模型加持,指令遵循能力,上下文学习few shot和工具调用能力有力解决泛化性问题

  • 提升沟通能力:

    • 不同任务需要有不同的沟通框架及通信方式以满足其复杂性、规模和信息流需求,从而实现高效的协作和决策。

      1. 合作(Cooperative)
        • 智能体共同努力实现共享目标,通过交换信息来增强集体解决方案。
      2. 辩论(Debate)
        • 智能体通过争论式的互动,提出和捍卫自己的观点或解决方案,并批评其他人的观点。这有助于达成共识或更精细的解决方案。
      3. 竞争(Competitive)
        • 智能体为自己的目标工作,这些目标可能与其他智能体的目标相冲突。
    • 通信结构

image-20250111232210056.png

- **分层(Layered)**:智能体在多层级结构中通信,每一层的智能体都有独特的角色,并且主要在层内或与相邻层进行交互。
- **去中心化(Decentralized)**:智能体在对等网络中直接通信,这种结构通常用于世界模拟应用。
- **集中化**点对点网络**(Centralized)**:通过一个中央智能体或一组中央智能体来协调系统的通信,其他智能体主要通过这个中心节点进行交互。
- **共享消息池**发布与订阅**(Shared Message Pool)**:智能体在共享的消息池中发布消息并根据它们的配置订阅相关消息,从而提高通信效率。

示例:LLM MAS[合作式框架AgentVerse](https://zhuanlan.zhihu.com/p/657018851)、辩论式框架Multi-Agent Debate(MAD),去中心化沟通范式AutoGen等等。



Agent Verse:



AutoGen:

image-20250111232341873.png

image-20250111232304714.png

  • 效果优化:

    • 通用能力
      • **幻觉问题:**实施事实核查和错误更正机制,以减少错误信息的传播、练智能体以识别和质疑不准确的信息。
      • 评估和基准测试:开发和使用标准化的评估工具和基准测试来衡量通信优化的效果。定期测试和分析智能体通信的性能,以识别改进的领域。
      • 安全性和隐私:确保通信过程中的数据安全和隐私保护,防止敏感信息泄露。
  • 通信效率及结构

    • 通信效率
      • 精简通信内容,确保智能体之间的交流是简洁且信息丰富的。
      • 采用有效的编码和压缩技术减少通信负载。
    • 通信结构优化
      • 根据任务需求选择最合适的通信结构(分层、去中心化、集中化或共享消息池)。
      • 设计智能体的通信网络拓扑,以减少信息传递的延迟和冲突。
    • 智能体配置
      • 为智能体定义明确的角色和职责,以减少不必要的通信
      • 根据智能体的专长和任务需求动态调整其通信策略。
  • 记忆和经验反馈

    • 利用智能体的记忆能力来存储和检索过去的成功策略,以指导当前的通信行为。
    • 从环境和其他智能体的反馈中学习,以优化未来的通信。
  • 自我进化和动态生成

    • 允许智能体根据收到的反馈自我调整其行为和目标。
    • 提升适应性:使Agent能够在数据驱动的基础上自助学习和进化,使MAS能够自动优化自己的表现,即大模型具备反思学习能力,示例:Symbolic Learning Enables Self-Evolving Agents
  • 可扩展性

    • 优化算法和架构以支持智能体数量的增加,同时保持系统的效率和效果。
    • 实施有效的资源管理和分配策略,以应对计算和存储需求的增加。
  • 其他:

    • 多模态通信:探索超越文本的多模态通信方式,如图像、音频或视频,以丰富智能体的交互方式。
    • 集体智能:促进智能体之间的协作学习,使它们能够从彼此的经验中学习、设计激励机制,鼓励智能体分享有用的信息和策略。

前沿趋势:从基准测试到模型进化-大语言模型的自动化评估

报告题目:从基准测试到模型进化:大语言模型的自动化评估

**报告人:**曹艺馨(复旦大学)

报告摘要: 近年来,人工智能(AI)领域目睹了大规模语言模型(LLMs)所取得的非凡成就。这些模型凭借其巨大的训练语料库,在多种任务上展现出了卓越的能力。尽管如此,模型评估方法的发展却相对滞后。一方面,尽管不断有新的评估数据集被创建,但由于LLMs遵循扩展法则(scaling laws),它们往往能够迅速超越现有的基准,这使得新数据集的构建成为一项耗时且繁重的任务。另一方面,数据泄露的风险也在威胁当前的评估方法,因为模型在预训练阶段可能已经接触到了部分测试数据。为应对这些挑战,本次演讲将介绍并深入探讨一种创新性解决方案:建立一个专为LLMs设计的自动化评估框架。该框架包含数据集自动生成及基于多智能体系统的自动化测量机制。此外,还将分析此自动化评估框架的稳健性和可靠性。最终,我们将展示如何依据自动化评估的结果来促进模型训练的持续优化(即模型进化)。不仅如此,我们还将超越单纯依赖评估分数的做法,致力于揭示大模型内部的工作机理,从而进一步推动这一领域的透明度和理解深度。

专家介绍: 曹艺馨,男,复旦大学青年研究员、博士生导师。于清华大学获得博士学位,曾先后在新加坡国立大学、南洋理工大学和新加坡管理大学担任博士后、研究助理教授和助理教授职位。国家级青年人才计划入选者、上海市青年领军人才计划入选者。研究领域为自然语言处理、知识工程和多模态信息处理,在国际知名会议和期刊发表论文60余篇,谷歌学术引用6000余次,并多次被领域内国际顶级会议评为口头报告。研究成果获得两项国际会议的最佳论文及提名,曾获Lee Kong Chian Fellowship、Google South Asia & Southeast Asia Awards和AI2000最具影响力学者奖的荣誉提名。担任多个国际会议演示程序主席、领域主席和国际期刊审稿人。

青年论坛:面向可解释复杂问答的神经符号编程

**概要:**展示如何通过神经符号编程的方法,将复杂的问答任务分解为可管理的子问题,并利用自动化工具和多样化的知识来源来提高问答系统的可解释性、效率和准确性

  • 复杂问答(CQA):CQA任务要求系统能够处理超出简单信息检索范畴的问题,需要系统具备多跳推理、计数和基础推理的能力。
  • 神经符号编程:结合神经网络的数据处理能力和符号编程的逻辑推理能力,以提高复杂问答系统的可解释性和效率。
  • 分解与自动化:受到John McCarthy的启发,将复杂任务分解为子问题,并利用自动化工具(如调度器和求解器)来处理这些子问题,以简化复杂问答的处理流程。

**技术实现:**①知识管理KG manager--》②知识操作Manipulate-》③流程编排Scheduler-》④流程执行Solver,重点介绍了以下模块能力:

② 知识操作Manipulate

  • KoPL框架:基于知识的编程框架,允许系统通过知识参数、原子函数和编程逻辑来处理复杂问题。

③流程编排Scheduler,自动化编码,通过自动化工具(如调度器)来生成和优化程序代码,减少人工干预。

  • KQA Pro: 使用KoPL实现复杂的KBQA数据
  • Visual KoP:流程组件化,拖拽组件实现流程
  • Dialog KoP:通过对话系统,结合对话策略和历史追踪,提高问答系统的交互性和准确性

④流程执行Solver,利用程序归纳本体、多样化知识插件、问题概率树等,提升复杂问答的准确率和泛化性。

青年论坛:大模型时代下的知识图谱推理

**报告题目:**大模型时代下的知识图谱推理

**报告人:**吴天星(东南大学)

报告摘要: 现有的主流知识图谱推理方法为面向归纳的统计推理,其从数据出发,依据统计模型预测知识图谱中的潜在关系,主要分为端到端统计推理与可解释统计推理。在大模型时代,如何利用富含文本语义的外部参数化知识支撑端到端统计推理与可解释统计推理是值得探索的研究方向,因此本报告将介绍大模型时代下的知识图谱推理前沿工作,从确定性知识图谱与不确定性知识图谱出发讨论相关难点及挑战。

专家简介: 吴天星,东南大学计算机科学与工程学院长聘副教授、江苏省“双创博士”、江苏省“科技副总”、南京市择优留学人才,曾任新加坡南洋理工大学博士后研究员,2021年入选东南大学“至善青年学者”支持计划。主要研究方向:知识图谱、大语言模型、人工智能应用。曾获江苏省计算机学会优秀博士学位论文奖,CCKS 2022、WISA 2024最佳论文奖。主持国家自然科学基金面上项目、青年项目,江苏省“双创博士”项目等纵横向课题多项。在人工智能领域内国际期刊及会议发表论文50余篇,6项国家发明专利获得授权。担任中国中文信息学会语言与知识计算专委会委员,中国计算机学会信息系统专委会执行委员,CCF YOCSEF南京24-25年度主席,国际著名期刊IJSWIS、Data Intelligence编委及多个国际著名会议的(高级)程序委员会成员,包括AAAI、IJCAI、ACL、TheWebConf、SIGKDD、EMNLP、ISWC、ECAI等。

mp.weixin.qq.com/s/YsM0V2tsz… 大模型评测相关