斩获国家级铜奖！揭秘巧文书AI背后的多智能体（Multi-Agent）架构与信创实践在2026第三届全国先进计算技术创新

大家好，我是巧文书AI的技术团队负责人。

在刚刚落幕的2026第三届全国先进计算技术创新大赛总决赛上，我们的项目 “A2-大模型驱动的产业招标智能解析” 从数千支队伍中脱颖而出，斩获铜奖。

比赛1.png

在通用大模型（LLM）百花齐放的今天，为什么一个垂直领域的招投标工具能拿下国家级计算赛事的奖项？今天，我们就从技术架构、核心难点突破、以及信创落地三个维度，和大家硬核复盘一下这次获奖背后的技术逻辑。

赛场直击：评委最关心的三个技术拷问

在比赛答辩环节，评委专家们没有纠结于业务概念，而是直击了长文档处理与垂直模型落地的三个核心技术痛点：

1. OCR与版面分析：如何应对非结构化数据的“噪音”？
招投标文件（PDF/扫描件）通常包含大量复杂的嵌套表格、印章遮挡和非标准排版。通用OCR极易出现逻辑断裂。

我们的解法： 我们并没有单纯依赖通用OCR，而是引入了多模态版面分析模型。系统不仅能识别文字，更能理解文档的“视觉结构”，精准区分正文、页眉页脚、表格单元格以及签字盖章区域。通过逻辑重构算法，我们将非结构化数据转化为带有层级关系的结构化数据，确保了下游模型输入的纯净度。

2. 知识库切分（Chunking）：RAG在超长文档中的精准度优化
一份标书动辄几百页，传统的固定字符切分（Fixed-size Chunking）会导致语义截断，造成“张冠李戴”。

我们的解法： 我们摒弃了简单的切片策略，采用了基于语义与业务逻辑的分层解析技术。系统将文档按“章-节-条款”进行逻辑树构建，并结合招投标特有的“资质库、评分项、废标红线”等实体进行向量化存储。这种策略让RAG（检索增强生成）在召回关键条款时，准确率（Recall）突破了95%。

3. 语义摘要与决策辅助：从“读懂”到“提炼”

我们的解法： 基于LLM + RAG架构，我们训练了专属的摘要生成Agent。它不仅能总结全文，更能根据预设的决策因子（如：控标点、排他性条款、评分权重），自动输出结构化的决策报告，极大地缩短了用户的阅读链路。

微信图片_20260509094507_655_65.png

为什么这个课题非巧文书AI莫属？技术护城河解析

在“人工智能+”的浪潮下，巧文书AI之所以能成为行业标杆，主要得益于我们在以下三个层面的技术深耕：

1. 架构升级：从“单一大模型”到“多智能体协同（Multi-Agent）”
传统的标书制作是线性的，而巧文书AI本质上是一个虚拟的顶尖投标团队。我们采用了多智能体协作架构：

解析Agent： 毫秒级拆解招标文件，提取废标项与评分点。
写作Agent： 激活企业私有知识库，将历史中标方案的精髓进行重组与创新。
合规Agent： 内置法规知识图谱，对生成的文档进行全自动扫描与红线预警。
多智能体的分工协作，将原本需要数天的方案编制周期缩短了50%以上。

图纸解析gif.gif 2. 垂直领域的深度微调（SFT）与数据壁垒
通用大模型不懂“行规”。我们基于通义千问Qwen等国产基座模型，利用数10万份招投标行业脱敏数据进行了深度微调（SFT）。
这让我们拥有了行业内独有的招投标知识图谱。无论是复杂的工程参数，还是隐晦的商务条款，模型都能精准理解其背后的业务逻辑，这是通用模型无法通过Prompt Engineering（提示词工程）实现的。

3. 全栈信创适配：算力底座的安全与自主
对于政企和国央企客户，数据安全是红线。巧文书AI全面适配昇腾910 AI处理器，实现了从底层算力芯片、操作系统到上层AI应用的全栈国产化。
我们支持私有化部署与AI一体机交付，确保模型、数据、知识库全量驻留企业内网，真正做到了“数据不出域，可用不可见”，完美契合了等保三级及信创合规的高标准要求。

写在最后

此次获奖，是对巧文书AI技术路线的一次国家级验证。我们证明了，在垂直行业， “通用大模型 + 行业私有数据 + 多智能体架构 + 信创底座” 是一条行之有效的落地路径。

未来，我们将继续探索AI在复杂文档处理与企业知识库构建上的更多可能。如果你对招投标领域的AI落地、RAG优化或私有化大模型部署感兴趣，欢迎在评论区交流！

关于巧文书AI
巧文书AI是湖南天河国云科技有限公司打造的“企业级投标全流程数字管家”。我们致力于通过人工智能技术重构企业标书编制流程，提供招标解析、标书编写、标书检查及查重一站式服务。