首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
模型部署教程
算家计算
创建于2025-05-29
订阅专栏
分享各类热门开源大模型、镜像部署教程,助力广大AI爱好者!
等 1 人订阅
共19篇文章
创建于2025-05-29
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
4 位量化 + FP8 混合精度:ERNIE-4.5-0.3B-Paddle本地部署,重新定义端侧推理效率
ERNIE-4.5-0.3B-Paddle 是百度文心大模型 4.5 系列中的轻量级成员,采用稠密参数设计,总参数量仅 3 亿,基于飞桨框架深度优化。专为边缘计算、移动端和资源受限环境设计。
5 秒预览物理世界,2 行代码启动生成——ComfyUI-Cosmos-Predict2 本地部署教程,重塑机器人训练范式!
Cosmos-Predict2 是 Cosmos 世界基金会模型 (WFM) 物理 AI 生态系统的一个关键分支,专门通过高级世界建模进行未来状态预测。
“开源双轨架构+40亿参数扩散Transformer——ComfyUI-OmniGen2本地部署教程:重塑多模态生成的效率边界!
OmniGen2 是由北京智源研究院最新推出的一个强大、高效的开源多模态生成模型,具有两种不同的文本和图像模态解码路径,利用非共享参数和解耦的图像分词器。
图像编辑新变革 !ComfyUI-Kontext-fp8本地部署教程,120B参数对标闭源巨头
FLUX.1 Kontext 是 Black Forest Labs 最新推出的突破性多模态图像编辑模型,支持文本和图像同步输入,智能理解图像上下文并执行精确编辑。
AI初学者如何对大模型进行微调?——零基础保姆级实战指南
大模型微调(Fine-Tuning)是让通用AI适配垂直场景的核心技术。通过特定领域的小规模标注数据调整预训练模型参数,可快速实现医疗诊断、法律咨询、编程助手等专业能力。
RAGFlow 从入门到实践:开发者快速上手指南
RAGFlow 是一个基于对文档深入理解的开源 RAG(检索增强生成)引擎。当与 LLM 集成时,它能够提供真实的问答功能,并以来自各种复杂格式数据的有根据的引用为后盾。
Dify v1.4.3保姆级使用指南!低代码构建AI Agent全流程
Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务(Backend as Service)和 LLMOps 的理念,使开发者可以快速搭建生产级的生成式 AI 应用。
开源代码修复新标杆——月之暗面最新开源编程模型Kimi-Dev-72B本地部署教程,自博弈修复 Bug
Kimi-Dev-72B是由月之暗面(Moonshot AI)最新开源的AI编程模型,专为软件工程任务设计,并登顶 SWE-bench Verified 基准测试榜首,超越 DeepSeek-R1等。
开源新王MiniMax -M1 vLLM本地部署教程:百万级上下文支持成大模型领域新标杆!
MiniMax-M1 是由中国 AI 公司 MiniMax 于 2025 年 6 月 17 日推出的 全球首个开源大规模混合架构推理模型。
Dify 推出全新版本!Dify-v1.4.3本地部署教程:开发效率飙升,快速打造 AI 应用!
Dify v1.4.3 于 2025 年 6 月 16 日发布,是一个以 **稳定性增强、功能完善和体验优化** 为核心的迭代版本。
Qwen3-Embedding-Reranker本地部署教程:8B 参数登顶 MTEB 多语言榜首,100 + 语言跨模态检索无压力!
Qwen3-Embedding与Qwen3-Reranker是阿里巴巴通义实验室于今年6月开源的双模型系列,专为文本表征、检索与排序任务设计。
告别复杂文档解析噩梦!MonkeyOCR 本地部署教程:支持公式/表格多元素结构化
MonkeyOCR 是华中科技大学联合金山办公(Kingsoft Office)推出的文档解析模型,模型支持高效地将非结构化文档内容转换为结构化信息。
端侧推理新标杆——MiniCPM 4:5%稀疏度实现128K长文本7倍加速,低成本训练开销匹敌Qwen3-8B
MiniCPM 4 是一个极致高效的端侧大模型,从模型架构、学习算法、训练数据与推理系统四个层面进行了高效优化,实现了极致的效率提升。
RAGFlow全新升级!RAGFlow v0.19.0 本地部署教程:开源RAG平台迈向智能新纪元!
5月26日,开源RAG流程管理平台RAGFlow正式发布v0.19.0版本,以跨语言搜索、Agent代码组件、图像直显功能为核心,带来了一场智能交互领域的革新。
DeepSeek-R1-0528-Qwen3-8B 本地部署教程:DeepSeek 开源高质量推理链,实力媲美巨头
团队将DeepSeek-R1-0528的思维链蒸馏出来用于后训练Qwen3 8B Base,从而获得了DeepSeek-R1-0528-Qwen3-8B。该模型在AIME 2024上的表现达到了开源模
字节开源代码模型——Seed-Coder 本地部署教程,模型自驱动数据筛选,让每行代码都精准落位!
Seed-Coder 由字节跳动 Seed 团队于 2025 年 5 月开源,是一款专注于代码生成、补全与推理的 8B 参数大模型(基于 Llama 3 架构)。
6GB显存玩转SD微调!LoRA-scripts本地部署教程,一键炼出专属AI画师
LoRA-scripts(又名 SD-Trainer)是LoRA & Dreambooth 训练 GUI & 脚本预设 & kohya-ss/sd-scripts 的一键训练环境
碾压 Qwen2.5-VL,图像生成媲美 SD3!字节跳动开源 BAGEL本地部署教程
BAGEL 是一个开源的多模态基础模型,具有 70 亿个激活参数(总共 140 亿个),并在大规模交错多模态数据上进行训练。
可视化工作流引擎——FlowGram 本地部署教程:让百万级节点工作流流畅如丝!
FlowGram 是一套基于节点编辑的流程搭建引擎,通过自研 Canvas 渲染引擎,可支持 **200+ 节点流畅操作**(60FPS)。