跟着coze学习大模型基座SDK协议设计、应用

304 阅读3分钟

楔子

  • 同上一篇文章跟着coze学习几种OAuth鉴权方式的原理、设计、适用场景一样,最近在研究和使用coze,业务需要我成为coze的开发者,彻底拥抱字节,放弃openai。
  • 看了国内各厂的大模型基座,蛮多厂的绯闻不断,对比后就只有字节的文档比较简单、清晰、连贯。我预测2025年coze会进一步与第二名拉大距离,基于coze实现应用性价比会比较高。

领域设计

  • 这篇文章看,coze的设计把大模型领域模块划分为以下几个模块:

  • 空间workspaces:想象成一个虚拟的房间,所有的活动和交互都发生在这个空间里。它是其他模块的基础,提供了一个容器来组织信息和交互。

  • 智能体bot:可以看作是这个空间里的“角色”或“机器人”,它负责执行任务、做决策和与用户互动。智能体根据环境变化做出反应,类似于游戏中的角色。

  • 会话conversation:就像朋友之间的对话,智能体通过会话模块与用户进行交流。这种交流可以是文字、语音或其他形式,旨在理解用户的意图并提供相应的反馈。

  • 消息conversation/message:这是会话中的信息传递,就像朋友之间发送的短信或邮件。消息可以包含问题、指令或任何需要传达的信息。

  • 对话chat:与会话类似,但更注重于多轮互动。就像一场深入的讨论,智能体和用户可以进行多次问答,逐步深入主题。

  • 文件files:这是存储和管理信息的地方,可以看作是一个数字档案柜。文件模块允许用户上传、下载或共享各种类型的信息,如文档、图片等。

  • 工作流workflow:想象成一个项目管理工具,它帮助协调不同任务和步骤。工作流模块确保各个环节有序进行,就像一条流水线,确保每个环节都能顺利完成。

  • 知识库datasets:这是一个大型的信息库,类似于图书馆。知识库存储了大量的信息和知识,可以供智能体查询,以便更好地回答用户的问题。

  • 语音audio:这一模块使得智能体能够通过语音与用户互动,就像电话通话一样。语音技术让交流更加自然和直观。

模块之间的关系

这些模块之间的关系可以用以下方式理解:

  • 空间是所有活动的基础,它容纳了其他所有模块。

  • 智能体在空间中工作,通过会话与用户互动,而会话中的信息则通过消息传递。

  • 在多轮交互中,智能体利用对话模块来深入了解用户需求,并结合知识库提供准确的信息。

  • 用户可以通过上传或下载文件来丰富交流内容,而这些文件可能在工作流中被使用,以确保信息处理的高效性。

  • 最后,智能体还可以使用语音模块,使得与用户的交流更加生动和人性化。

应用场景

  1. 客户支持:智能体在空间中通过会话与客户沟通,利用知识库回答常见问题,同时记录对话以便后续分析。

  2. 项目管理:在工作流中,团队成员可以通过消息传递进度更新,智能体帮助协调任务,并存储相关文件以便随时访问。

  3. 教育培训:学生通过对话与智能体互动,获取知识库中的学习资料,同时使用语音进行更自然的交流。