随着AIGC时代的到来,大语言模型的能力在自然语言处理、多轮对话和意图识别等方面的语言理解与生成能力越来越强大。然而,在复杂交互任务中,模型有时会生成与用户需求不匹配的答案或凭空捏造事实(即幻觉问题),这直接影响了实际应用的准确性和可靠性。因此,提升模型的任务完成质量、减少幻觉现象,成为开发者持续关注的重点。
为此,AI 原生数据应用开发框架 DB-GPT 应运而生,旨在让围绕数据库的大模型应用构建更简单,更方便。近期 DB-GPT 与 Gitee AI 正式达成合作,在 DB-GPT 平台中开发者能够更便捷地使用 Gitee AI 提供的丰富模型资源,加速从模型选择到应用落地的开发流程。
作为一款上线时间不足两年的开源「新秀」,AI 原生数据应用开发框架 DB-GPT 在正式开源后快速成长,在 GitHub 上收获了超过 1.4 万颗 Star,并拥有了超过 120 名社区贡献者。
DB-GPT产品架构图
DB-GPT 通过开发多模型管理(SMMF)、Text2SQL 效果优化、RAG 框架以及优化、Multi-Agents 框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
Gitee AI 是开源中国在 2023 年推出的针对 AI 应用场景的开源平台。为用户提供了快速、稳定的模型托管服务,让开发者轻松地分享和下载开源模型、数据集和 AI 应用。在此基础上平台构建了三个核心功能:Serverless API、模型引擎、应用,帮助企业和开发者更容易地开发 AI 应用。
这次 DB-GPT 与 GiteeAI 的合作,不仅能够让用户体验到强大的多模型管理能力,加速AI应用的开发效率,同时让从模型选择到应用落地的开发流程更高效。
在 DB-GPT 中调用 Gitee AI
仅需简单几步,开发者就可以轻松调用 Gitee AI 中的模型创建应用。
1. 获取 API Key
注册 Gitee AI 后进入个人工作台,创建新的 API Key,点击密钥进行复制,以备后续使用。
2.1 克隆DB-GPT源码
git clone https://github.com/eosphoros-ai/DB-GPT.git
2.2 创建虚拟环境并安装依赖
# cd 到 DB-GPT 源码根目录
cd DB-GPT
# DB-GPT 要求python >= 3.10
conda create -n dbgpt_env python=3.10
conda activate dbgpt_env
# 这里选择代理模型类依赖安装
pip install -e ".[proxy]"
2.3 配置基础的环境变量
# 复制模板 env 文件为 .env
cp .env.template .env
2.4 修改环境变量文件.env,配置 Gitee 模型
# .env
LLM_MODEL=gitee_proxyllm
GITEE_MODEL_VERSION=Qwen2.5-72B-Instruct
GITEE_API_BASE=https://ai.gitee.com/v1
GITEE_API_KEY={your-gitee-api-key}
# 配置使用 Gitee 的 Embedding 模型
EMBEDDING_MODEL=proxy_http_openapi
PROXY_HTTP_OPENAPI_PROXY_SERVER_URL=https://ai.gitee.com/v1/embeddings
# 记得填写您在步骤2中获取的 API Key
PROXY_HTTP_OPENAPI_PROXY_API_KEY={your-gitee-api-key}
# 配置具体的 Embedding 模型名称
PROXY_HTTP_OPENAPI_PROXY_BACKEND=bge-large-zh-v1.5
2.5 启动 DB-GPT 服务
dbgpt start webserver --port 5670
在浏览器打开地址 http://127.0.0.1:5670/ 即可访问部署好的 DB-GPT
3. 在 DB-GPT 中调用 Gitee AI
3.1 调用 Gitee AI 的 Servelrss API
import asyncio
from dbgpt.core import ModelRequest
from dbgpt.model.proxy import GiteeLLMClient
client = GiteeLLMClient(
model_alias="Qwen2.5-72B-Instruct"
)
print(
asyncio.run(
client.generate(
ModelRequest._build("Qwen2.5-72B-Instruct", "Hi!")
)
)
)
3.2 使用 Gitee 的 Embedding 模型
import os
from dbgpt.rag.embedding import OpenAPIEmbeddings
openai_embeddings = OpenAPIEmbeddings(
api_url="https://ai.gitee.com/v1/embeddings",
api_key=os.getenv("GITEE_API_KEY"),
model_name="bge-large-zh-v1.5",
)
texts = ["Hello, world!", "How are you?"]
res = openai_embeddings.embed_documents(texts)
print(res)
获取 API、部署、调用,仅需简单三步,开发者就可以使用本土算力及本土平台,以更低的成本进行数据智能应用的开发。
Gitee AI 与 DB-GPT 在未来也将继续深入合作,挖掘 AI 创新应用的更多潜能,访问 DB-GPT 开源仓库(github.com/eosphoros-a… Gitee AI (ai.gitee.com/serverless-…