深度学习基础（部署篇）深度学习基础（部署篇） [toc] Flask部署+gunicorn onnx部署 chatglm

深度学习基础（部署篇）

[toc]

onnx部署

TODO：

从 hugging face 下的话需要特殊网络环境，没有条件的可以从魔塔社区下载：

!pip install modelscope

from modelscope import snapshot_download
model_dir = snapshot_download("ZhipuAI/chatglm3-6b", revision = "v1.0.0", cache_dir='path/to/save/dir')

pip install requirements.txt即可，其中虚拟环境的Python版本建议大于等于3.10

将你的法律知识库文本切分后使用bge/openai等embedding模型获取到文本块的embedding(向量)，然后存入faiss/milvus等向量数据库；
用户输入查询语句后，调用embdding模型获取到句子的embedding，在向量数据库里查询出前top N最相关的文本块；
基于这些文本块作为context, 构造提示词，然后调用chatgpt/本地chatglm模型来获取回复数据即可。