无穹玩法 | 打造个人AI网页助手,在Page Assist中使用无问芯穹推理加速API服务

0 阅读2分钟

Page Assist 允许同时使用本地运行的 AI 模型(Ollama)和第三方 API 服务,在浏览网页时进行交互。在本地模型能力不足时,可充分利用无问芯穹大模型服务平台使用更强大的模型服务。

当前功能:

  • 浏览网页时,可在在侧边栏提供模型服务

  • 支持全屏聊天窗口

  • 支持本地 Ollama 服务,或第三方 API 服务

  • 网络搜索功能

  • 支持本地文件(支持 pdf、csv、txt、md、docx格式)

  • 支持视觉模型

无问芯穹大模型服务平台提供大模型高性能推理加速API,资源充足,确保 Deep Research 应用的稳定性。涵盖DeepSeek V3/R1、Qwen3、QWQ32B、Qwen2.5-VL等最新模型,支持文本、图像、视频等多种模态,以及Jina/bge等sota嵌入重排模型等。在 cloud.infini-ai.com 完成注册后,可无门槛使用基础免费版(含API调用)。

01

获取API Key

可以复制已有 API Key 或创建新的 Key。

图片

cloud.infini-ai.com/genstudio/m…

02

添加无问芯穹 API 服务

请在 Chrome Web Store 中安装 Page Assist 扩展,按以下步骤配置。

1.添加 Chat 模型

点击 Page Assist 扩展图标,点击进入设置页,找到 OpenAI Compatible API。Infinigence AI为内置服务提供商,只需要填写在上一步获取的 API Key。

图片

保存后,Page Assist 将自动从 无问芯穹大模型服务平台 获取模型列表。由于 无问芯穹大模型服务平台 模型列表中同时包含了 Chat 和 Embedding 模型,因此建议在此处筛选后添加。

图片

(PS:Page Assist 的单次 Save 操作只能添加 Chat 模型或 Embedding 模型。)

如需再次添加模型,再次打开弹窗即可。

图片

2. RAG 与 Embedding 模型

Page Assist 支持基于网页的 RAG 问答。

添加 无问芯穹大模型服务平台 提供的 Embedding 模型。

配置 RAG 使用的 Embedding 模型。

图片

在网页上右键使用 Page Assist,需要勾选 Chat with current page。

图片

无问芯穹大模型服务现已支持在多个AI应用、开发平台中使用。可在网页或本地安装以下应用,接入无问芯穹的 API 后(可自定义添加这两款模型),即可体验 DeepSeek V3/R1、QWQ32B、Qwen2.5-VL等最新模型高性能推理加速版API

  • AI应用:Cherry Studio、LobeChat、NextChat

  • 代码应用:Cursor、Cline

  • AI应用开发平台:Dify

  • AI 笔记:Obsidian AI

  • 翻译插件:沉浸式翻译

  • 浏览器插件:Sider、Page Assist

更多场景与应用案例接入教程可参考:docs.infini-ai.com/posts/#tag=…

欢迎更多AI应用合作伙伴加入我们,一起为开发者、企业提供更高效的智能应用。如果你还想无问芯穹大模型服务接入其他AI应用,也可以在评论区告诉我们。