大模型

大模型

大模型

大模型学习

暂无订阅共5篇文章创建于2025-11-19

Dify+Xinference+简单Rag知识库

云服务器准备网络加速安装驱动与CUDA 删除现有的CUDA包删除之前的CUDA目录清理apt源重新安装CUDA 12.4 设置环境变量重启系统验证安装安装Docker 更新系统包安装

2月前
51
点赞
评论

autoDL安装Open-WebUi+Rag本地知识库问答+Function Calling

基础环境搭建 open-webui安装 ollama在线安装 2.1. 将模型下载地址改到数据盘 2.2. 启动ollama 3. 安装deepseek-r1:14b模型 Embedding模型下载

2月前
83
点赞
评论

vllm部署优化策略+在线推理应用

vllm离线部署-离线推理服务的大模型生命周期 vllm在线部署-服务器参数 vllm在线部署-服务启动参数只需要关注--host 指定服务器的主机地址和 --port 指定服务器的端口号在au

2月前
123
点赞
评论

autoDL安装vllm+deepseek推理模型+Qwen+调用离线推理api

部署vllm的要求仅支持在linuxc操作系统 pyhon版本要求在3.8～3.12之间部署操作流程检查conda版本，若出现conda not found ,需要先安装conda环境 2. 创

3月前
146
点赞
评论

autoDL安装ollama+deepseek-r1:1.5b+ollama多GPU部署

AutoDL服务器选择根据gpu服务器显存大小，对比下方图中。目前租用3080，显存10GB,可以选择1.5b，7b，8b；为了节省gpu服务器资源，以最小模型安装1.5b； AutoDL安装oll

3月前
130
点赞
评论