一个DeepSeek就够了吗,聊聊大模型工作流

323 阅读8分钟

假设你最近有出游计划,询问了DeepSeek相关攻略,并得到的满意的回答,但是如果还想让DeepSeek去订一张出游的机票或是根据行程预定酒店,那肯定是办不到的,所以这里就要有工作流来实现。

在人工智能飞速发展的当下,AI大模型已经成为众多领域的核心驱动力。从内容创作到数据分析,从客户服务到智能决策,大模型的应用无处不在。然而,如何高效地利用大模型,充分发挥其潜力,成为了许多从业者和爱好者关注的焦点。AI大模型工作流应运而生,它为大模型的应用提供了一种系统化、流程化的解决方案。

本文将从大模型基本概念,模块组成,解决的核心问题,有哪些应用场景,最终目标来帮助你了解大模型工作流。

大模型工作流概述

大模型工作流(Large Model Workflow) 是指利用大语言模型(LLM)或大模型(如GPT、DeepSeek、通义千问等)的能力,结合自动化任务编排技术,构建端到端的AI应用流程。它通过可视化或代码方式连接多个AI模型、数据处理模块、逻辑判断节点等,实现复杂任务的自动化执行。

总结一句话就是单个大模型的解决问题能力是是有限的,必须借助工作流通过将复杂任务拆分为多个有序步骤,结合多模型协同和外部工具调用,才能显著提升解决问题的能力。

如下图所示,coze平台的工作流编辑界面:

模块组成

大模型工作流通常包含以下三大模块:

  • 输入处理层:负责对原始数据进行清洗、整理和特征提取,确保数据符合大模型的输入要求。例如,在内容创作中,它会从互联网或企业内部文档中收集文本素材,并进行去噪处理。

  • 模型执行层:这是工作流的“智慧大脑”,负责调用大模型(如GPT-4)进行任务处理,如文本生成、图像分析等。它支持单次或批量处理,并能根据需求调整模型参数,确保任务高效完成。

  • 输出优化层:涉及结果验证、格式转换和自动化反馈机制。这一模块确保模型输出的准确性和可用性,同时通过反馈机制不断优化模型性能对,例如,在内容创作中,生成的内容会经过人工审核和调整,以确保质量。

这些模块共同协作,通过系统化流程将大语言模型与业务场景深度集成,提升任务处理的效率、准确性和可控性。

解决单一大模型的弊端

大模型工作流的出现是为了解决大语言模型(LLM)在实际应用中的局限性,并提升其效率和效果:

  • 单次请求的局限性:大模型在单次请求中受限于上下文窗口长度和输出长度,无法处理复杂任务或依赖时序信息的任务。工作流通过将任务拆分为多个节点,逐步处理,从而克服了这一限制。例如,在智能客服中,用户可能提出一个复杂问题,如“帮我订一张从北京到上海的机票,并推荐附近的酒店”。工作流可以将任务分解为“机票预订”和“酒店推荐”两个子任务,分别处理后再整合结果。

  • 任务编排与优化:工作流允许将复杂任务分解为多个子任务,并通过灵活的编排和优化,确保每个步骤的准确性和效率。例如:在内容生成中,工作流可以先将用户输入的主题分解为大纲,然后逐步生成段落,最后进行润色和格式调整,确保内容质量。

  • 数据传递与反馈机制:工作流支持在节点之间传递数据,并通过反馈机制不断优化模型性能。在数据分析中,工作流可以先将原始数据清洗,然后调用大模型进行趋势分析,最后生成报告。如果分析结果不准确,系统可以通过反馈机制调整模型参数。

  • 降低系统复杂度:工作流将复杂任务拆分为有序步骤,简化了系统设计和维护。例如:在邮件自动化处理中,工作流可以先将用户输入的关键词生成草稿,然后调用大模型进行润色,最后自动发送邮件,整个过程无需人工干预。

  • 提升可控性与可解释性:工作流通过可视化编辑和模块化设计,使业务流程更加透明和可控。例如:在客户服务中,工作流可以清晰地展示每个步骤的处理逻辑,如“意图识别→知识库检索→生成回答”,便于管理员监控和优化。

通过这些机制,大模型工作流显著提升了LLM在实际应用中的性能和效率,使其能够更好地服务于复杂业务场景。

如下图所示的简历筛选->岗位匹配->邀约面试一整套流程的工作流示意图:

上图中的绿色节点,表示使用了大模型的能力,这是单一大模型所不能实现的。

常见的工作流应用场景

现在很多的互联网厂商都在自己的大模型应用平台上支持创建工作流的能力,例如字节的Coze、阿里的百炼平台,还有开源的Dify等等。

Coze平台工作流操作界面:

百炼平台工作流操作界面:

通过提供可视化的画布和丰富的节点类型,这些平台帮助用户将复杂任务拆分为多个有序步骤,从而降低系统复杂度,提升任务处理的效率和准确性。例如,用户可以通过拖拽节点的方式,轻松编排智能客服、内容生成、数据分析等业务流程,无需编写复杂代码即可实现自动化处理。此外,这些平台还支持多模型协同、参数微调、错误处理等功能,确保工作流的稳定性和可控性,满足企业多样化的业务需求,这些需求可以包括但不限于以下应用场景:

  • 内容创作:通过大模型自动生成文章、文案、标题等内容,并优化输出质量。例如,用户只需输入主题和要求,系统即可生成符合需求的文稿。

  • 客户服务:构建智能客服工作流,实现自动回复、知识库检索、意图识别等功能,提高客服响应速度和准确性。

  • 数据分析:利用大模型对复杂数据集进行处理、分析和可视化,生成结构化的分析报告,支持业务决策。

  • 旅行规划:通过工作流自动生成旅行计划,包括航班、住宿、景点推荐等,用户只需选择目的地等参数即可。

  • 教育培训:设计个性化学习方案,包括学习进度跟踪、测评等,实现学生的自主学习。

  • 医疗问诊:根据患者输入的症状,通过组合多种分析工具生成初步诊断或推荐相关检查,辅助医生进行判断。

  • 开发票场景:收集用户开票信息,通过大模型和工具进行信息归一化、校验,并生成发票。

  • 案件办理:基于案件关键信息进行逻辑判断和处理,最终录入案件办理结果。

这些应用通过将复杂任务拆分为有序步骤,结合大模型的能力,显著提升了效率和准确性。

最终形态AI Agent

AI Agent(人工智能代理) 是一种能够自主感知环境、做出决策并执行任务的智能系统。它结合了人工智能(AI)技术,如机器学习、自然语言处理(NLP)、计算机视觉等,能够模拟人类的行为或完成特定任务,寄出一张老图:

AI Agent是基于大模型工作流的封装,是智能任务执行的核心引擎,是复杂业务场景的自动化解决方案。

在了解的大模型工作流之后,AI Agent将是他最终的目标,它将大语言模型(LLM)与其他技术、工具和流程相结合,形成一个能够自主理解、规划、执行复杂任务的智能系统,最终满足我们多种多样的个性化需求。

在人类信息技术变革的不同历史时期,应用出现的样貌也不一样:在PC时期,它是一个个的软件和网站;在移动时期,它是一个个的APP和可被关注的账号;在AI时代,应用主要的形态就是智能体AI Agent,让我们一起搭乘AI Agent这艘大船。

本文先写到这里,后续详细介绍AI Agent。

image.png