办公室里最常见的一个矛盾,是写作工具已经很好用,但智能能力却总在另一个窗口里。人要在浏览器和文档之间来回切,选区上下文丢了,格式也容易被破坏。察元 AI 文档助手是面向 WPS 文字的加载项,也是开源项目,本质上是在回答一个问题,能不能把大模型的能力嵌进你最熟悉的那块屏幕里,也就是 WPS 软件的编辑界面本身。
从使用方式上看,它不是又一个独立聊天网站,而是装进 WPS 的插件形态。你在写稿、改合同、整理材料时,对话、审查、翻译、批量处理,大多可以在不离开正文的前提下完成。生成内容也不是只能复制粘贴,而是可以按你的习惯写回文档,例如插入、替换、追加,或者用批注和链接批注把意见落在具体段落上。对机关单位、企业内网和重视留痕的团队来说,这种写回方式比纯对话框更接近真实编审流程。
技术选型上,项目用 Vue 3 搭界面,用 Vite 做构建与开发服务,本地开发时通过固定端口起一个页面,再与 WPS 宿主联调。与文档打交道的那一层,走的是 WPS 提供的 JSAPI,把 Ribbon 功能区、右键菜单、任务窗格这些入口接到 Vue 路由和各个业务页面上。网络请求侧常见的是 axios,模型侧则围绕 OpenAI 兼容的接口形态组织,这样同一个客户端可以对接很多家供应商,而不必为每家单独造一套完全不同的协议。
架构上可以把代码理解成几条清晰的分工线。入口负责创建应用、挂路由和全局桥接,壳层管理多路由对话框与页面切换,宿主集成层把 WPS 的菜单事件和窗口能力接进来,业务能力层再拆成模型请求、文档写回、助手任务、设置与存储等模块,静态资源单独放。对用户来说这是无感的,对维护者来说这意味着改模型配置不必动 Ribbon,改写回策略不必动界面皮肤,边界相对干净。
大模型这一侧,项目的取向很鲜明,离线或内网优先。你可以在本机或机房跑 Ollama,也可以用 LM Studio、Xinference、OneAPI、New API、FastChat 这类网关,只要它们对外呈现的是常见的 OpenAI 风格端点,察元就能像连公网云一样连上去。这样做的直接好处是数据路径可控,密钥不必出单位网络,审计口径也更容易和现有制度对齐。与此同时,云端路线并没有被否定,设置里仍然可以并行配置多家供应商,在成本和效果之间做取舍。
从支持的系统与生态看,它首先是 WPS 文字场景下的生产力工具,而不是泛操作系统级应用。构建脚本里能看到针对 WPS 加载项的打包流程,也有在线包与离线包的分支,说明发布形态会考虑不同部署与分发约束。依赖里除了 Vue 与路由,还能看到处理文档与数据的常见库,例如表格与结构化数据的读写、压缩包与版式相关能力,以及用于复杂流程编排或可视化的前端组件,这些组合起来支撑的是表单、模板规则、任务清单、报告模式这类偏工程化的功能,而不是只做一句漂亮话生成。
先进性不必用夸张词去堆,更实在的是把几件事同时做对。第一,上下文感知,选区与全文如何进入模型提示词,决定了回答是不是贴文档。第二,可配置的数据路径与模型提供方清单,让同一套界面既能服务个人创作者,也能服务有合规要求的组织。第三,内置助手加自定义助手,系统提示、用户模板、默认写回方式、显示位置都能调,等于在不动核心代码的情况下扩展业务场景。第四,任务编排与任务清单,把多步操作组织成可执行流程,适合摘要、审计、批量检查这类需要分阶段推进的工作。
如果站在信息系统的角度评价,它更像 WPS 办公套件里的智能插件层,而不是又一个孤立的 AI 网站。大模型在这里是引擎,WPS 是驾驶舱,察元负责把油门刹车和路线规划接到一起。对已经深度使用 WPS 的单位来说,学习成本主要发生在模型配置与助手习惯上,而不是重新学一套编辑器。对技术团队来说,Vue 与 Vite 的组合在社区里成熟,招聘与二次开发都相对顺滑,OpenAI 兼容接口又降低了对接成本。
当然,任何这类产品都要面对现实约束。模型能力有上限,幻觉问题要靠流程和人审兜底,多模态能力也取决于具体供应商是否开放对应接口。察元的价值在于把这些变量尽量挡在设置与助手配置这一侧,让一线同事在正文里专注写作与修订,把技术复杂度留在后台。
回头看,从纯浏览器聊天走向宿主内嵌,从单一云厂商走向兼容网关加本地推理,从复制粘贴走向批注与替换联动,这是一条很自然的进化路径。察元以开源许可发布,代码与构建流程对外可见,适合把它当作 WPS 上的一块免费开源插件能力,按自己的网络环境与模型策略慢慢补齐,而不是一次性押在某个封闭平台上。