在 GPUStack 中部署模型
点击侧边栏 Deployments 打开模型部署页面。
如果当前没有部署模型,页面中间会出现 Deploy Now 按钮。
点击该按钮进入 Model Catalog 页面,选择所需模型并按照提示部署即可。
编辑
本文示例部署以下三个模型:
Qwen3-Reranker-4B
Qwen3-Embedding-4B
Qwen3.5-35B-A3B
部署 Qwen3-Reranker-4B
编辑
编辑
部署完成后,可以在 Playground 中进行测试。
编辑
部署 Qwen3-Embedding-4B
编辑
编辑
部署完成后可在 Playground 中测试。
编辑
部署 Qwen3.5-35B-A3B
这里额外设置 PYPI_PACKAGES_INSTALL 环境变量,用于升级 transformers 库。
编辑
编辑
部署完成后在 Playground 中测试。
编辑
获取 GPUStack 模型接入信息
打开侧边栏 Routes 页面。
点击 Route 右侧三个点菜单,选择:
API Access Info
编辑
记录以下信息:
Base URL
Model Name
API Key
示例:
Base URL: http://192.168.50.14/v1
Model Name:
qwen3.5-35b-a3b
qwen3-reranker-4b
qwen3-embedding-4b
API Key:
gpustack_xxxxxxxxxxxxxxxxx
API Key 可以按照界面提示自行创建。
部署 MaxKB
MaxKB 支持 Docker 一键部署:
默认账号密码:docker run -d --name=maxkb --restart=always -p 8080:8080 -v ~/.maxkb:/opt/maxkb 1panel/maxkb
默认账号密码:admin / MaxKB@123..
编辑
首次登录会提示修改密码,按照提示修改即可。