无穹玩法 | 打造个人AI网页助手，在Page Assist中使用无问芯穹推理加速API服务

2025-07-01 165 阅读2分钟

Page Assist 允许同时使用本地运行的 AI 模型（Ollama）和第三方 API 服务，在浏览网页时进行交互。在本地模型能力不足时，可充分利用无问芯穹大模型服务平台使用更强大的模型服务。

当前功能：

浏览网页时，可在在侧边栏提供模型服务
支持全屏聊天窗口
支持本地 Ollama 服务，或第三方 API 服务
网络搜索功能
支持本地文件（支持 pdf、csv、txt、md、docx格式）
支持视觉模型

无问芯穹大模型服务平台提供大模型高性能推理加速API，资源充足，确保 Deep Research 应用的稳定性。涵盖DeepSeek V3/R1、Qwen3、QWQ32B、Qwen2.5-VL等最新模型，支持文本、图像、视频等多种模态，以及Jina/bge等sota嵌入重排模型等。在 cloud.infini-ai.com 完成注册后，可无门槛使用基础免费版（含API调用）。

01

获取API Key

可以复制已有 API Key 或创建新的 Key。

cloud.infini-ai.com/genstudio/m…

02

添加无问芯穹 API 服务

请在 Chrome Web Store 中安装 Page Assist 扩展，按以下步骤配置。

1.添加 Chat 模型

点击 Page Assist 扩展图标，点击进入设置页，找到 OpenAI Compatible API。Infinigence AI为内置服务提供商，只需要填写在上一步获取的 API Key。

保存后，Page Assist 将自动从无问芯穹大模型服务平台获取模型列表。由于无问芯穹大模型服务平台模型列表中同时包含了 Chat 和 Embedding 模型，因此建议在此处筛选后添加。

（PS：Page Assist 的单次 Save 操作只能添加 Chat 模型或 Embedding 模型。）

如需再次添加模型，再次打开弹窗即可。

2. RAG 与 Embedding 模型

Page Assist 支持基于网页的 RAG 问答。

添加无问芯穹大模型服务平台提供的 Embedding 模型。

配置 RAG 使用的 Embedding 模型。

在网页上右键使用 Page Assist，需要勾选 Chat with current page。

无问芯穹大模型服务现已支持在多个AI应用、开发平台中使用。可在网页或本地安装以下应用，接入无问芯穹的 API 后（可自定义添加这两款模型），即可体验 DeepSeek V3/R1、QWQ32B、Qwen2.5-VL等最新模型高性能推理加速版API。

AI应用：Cherry Studio、LobeChat、NextChat
代码应用：Cursor、Cline
AI应用开发平台：Dify
AI 笔记：Obsidian AI
翻译插件：沉浸式翻译
浏览器插件：Sider、Page Assist

更多场景与应用案例接入教程可参考：docs.infini-ai.com/posts/#tag=…

欢迎更多AI应用合作伙伴加入我们，一起为开发者、企业提供更高效的智能应用。如果你还想无问芯穹大模型服务接入其他AI应用，也可以在评论区告诉我们。