GPUStack × MaxKB:打造强大易用的开源企业级智能体平台(中)

0 阅读1分钟

在 GPUStack 中部署模型

点击侧边栏 Deployments 打开模型部署页面。

如果当前没有部署模型,页面中间会出现 Deploy Now 按钮。

点击该按钮进入 Model Catalog 页面,选择所需模型并按照提示部署即可。

​编辑

本文示例部署以下三个模型:

Qwen3-Reranker-4B

 Qwen3-Embedding-4B

 Qwen3.5-35B-A3B

部署 Qwen3-Reranker-4B

​编辑

​编辑

部署完成后,可以在 Playground 中进行测试。

​编辑

部署 Qwen3-Embedding-4B

​编辑

​编辑

部署完成后可在 Playground 中测试。

​编辑

部署 Qwen3.5-35B-A3B

这里额外设置 PYPI_PACKAGES_INSTALL 环境变量,用于升级 transformers 库。

​编辑

​编辑

部署完成后在 Playground 中测试。

​编辑

获取 GPUStack 模型接入信息

打开侧边栏 Routes 页面。

点击 Route 右侧三个点菜单,选择:

API Access Info

​编辑

记录以下信息:

Base URL
Model Name
API Key

示例:

Base URL: http://192.168.50.14/v1

Model Name:
qwen3.5-35b-a3b
qwen3-reranker-4b
qwen3-embedding-4b

API Key:
gpustack_xxxxxxxxxxxxxxxxx

API Key 可以按照界面提示自行创建。

部署 MaxKB

MaxKB 支持 Docker 一键部署:

默认账号密码:docker run -d --name=maxkb --restart=always -p 8080:8080 -v ~/.maxkb:/opt/maxkb 1panel/maxkb

默认账号密码:admin / MaxKB@123..

​编辑

首次登录会提示修改密码,按照提示修改即可。