前端集成 AI 对话的三种方式，我都试了一遍公司今年要给好几个产品塞 AI 助手。我作为前端，前后试了三套集成方式，踩了

公司今年要给好几个产品塞 AI 助手。我作为前端，前后试了三套集成方式，踩了一圈坑，干脆做个横向对比，给团队定型，也顺手发出来。

三种方式简单说

方式 A：前端直连大模型 API。浏览器里直接拿 key 调模型。
方式 B：自建一层 BFF 网关。前端 → 自己的 Node 服务 → 模型。
方式 C：用一个能零代码搭智能体的平台，把对话能力配好直接发成接口。我在上面拖拖拽拽配出一个客服小助手，挂上知识库，平台直接给我一个对话接口，前端只管渲染。

维度	A 前端直连	B 自建 BFF	C 平台搭好发接口
key 安全	差，暴露在浏览器	好，藏服务端	好，平台托管
前端工作量	小	中（要写转发+流式）	小
后端工作量	无	大	几乎无
加知识库	自己搞 RAG	自己搞 RAG	配一下就行
换模型	改前端	改后端	后台切一下
灵活度	高	最高	中
上线速度	快但不安全	慢	最快

方式 A 第一天就被安全同学打回来了，key 写在前端等于裸奔，pass。

方式 B 是最"正统"的，灵活度也最高，但我一个人既写前端又得维护那层 Node 转发、还要自己接 RAG 切片、处理流式，做了快两周才稳。适合长期重投入的核心产品。

方式 C 最省事。我没写一行后端，在那个能拖拽搭智能体的工具里把提示词、知识库、回复格式都配好，它吐给我一个对话接口，前端两小时接完。缺点也实在：回复格式和某些边界行为是平台定的，我想深度定制流式分块的颗粒度就够不着，得迁就它的协议。

最后那套接口我用的是[讯飞](公司今年要给好几个产品塞 AI 助手。我作为前端，前后试了三套集成方式，踩了一圈坑，干脆做个横向对比，给团队定型，也顺手发出来。

方式 A：前端直连大模型 API。浏览器里直接拿 key 调模型。
方式 B：自建一层 BFF 网关。前端 → 自己的 Node 服务 → 模型。
方式 C：用一个能零代码搭智能体的平台，把对话能力配好直接发成接口。我在上面拖拖拽拽配出一个客服小助手，挂上知识库，平台直接给我一个对话接口，前端只管渲染。

维度	A 前端直连	B 自建 BFF	C 平台搭好发接口
key 安全	差，暴露在浏览器	好，藏服务端	好，平台托管
前端工作量	小	中（要写转发+流式）	小
后端工作量	无	大	几乎无
加知识库	自己搞 RAG	自己搞 RAG	配一下就行
换模型	改前端	改后端	后台切一下
灵活度	高	最高	中
上线速度	快但不安全	慢	最快

方式 A 第一天就被安全同学打回来了，key 写在前端等于裸奔，pass。

方式 A：前端直连大模型 API。浏览器里直接拿 key 调模型。
方式 B：自建一层 BFF 网关。前端 → 自己的 Node 服务 → 模型。
方式 C：用一个能零代码搭智能体的平台，把对话能力配好直接发成接口。我在上面拖拖拽拽配出一个客服小助手，挂上知识库，平台直接给我一个对话接口，前端只管渲染。

维度	A 前端直连	B 自建 BFF	C 平台搭好发接口
key 安全	差，暴露在浏览器	好，藏服务端	好，平台托管
前端工作量	小	中（要写转发+流式）	小
后端工作量	无	大	几乎无
加知识库	自己搞 RAG	自己搞 RAG	配一下就行
换模型	改前端	改后端	后台切一下
灵活度	高	最高	中
上线速度	快但不安全	慢	最快

方式 A 第一天就被安全同学打回来了，key 写在前端等于裸奔，pass。

最后那套接口我用的是讯飞 MaaS 的现成模型，不用自己养算力。你们团队最后选了哪种？评论区报个型。) MaaS 的现成模型，不用自己养算力。你们团队最后选了哪种？评论区报个型。) MaaS 的现成模型，不用自己养算力。你们团队最后选了哪种？评论区报个型。