首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
模型部署教程
算家计算
创建于2025-05-29
订阅专栏
分享各类热门开源大模型、镜像部署教程,助力广大AI爱好者!
等 5 人订阅
共53篇文章
创建于2025-05-29
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
一站式高质量数字人动画框架——EchoMimic-V3本地部署教程: 13 亿参数实现统一多模态、多任务人体动画生成
EchoMimicV3 是蚂蚁集团在8月底开源的一款高效、多模态、多任务的13亿参数数字人视频生成框架。
腾讯最新开源HunyuanVideo-Foley本地部署教程:端到端TV2A框架,REPA策略+MMDiT架构,重新定义视频音效新SOTA!
HunyuanVideo-Foley 是腾讯混元团队在2025年8月底开源的一款端到端视频音效生成模型。
新一代实时检测工具——YOLOv13本地部署教程,复杂场景,一目了然!
YOLOv13 隆重推出 ——新一代实时检测器,拥有尖端的性能和效率。YOLOv13 系列包含四个版本:Nano、Small、Large 和 X-Large。
阿里开源首个图像生成基础模型——Qwen-Image本地部署教程,中文渲染能力刷新SOTA
Qwen-Image 是阿里巴巴通义千问团队于 2025 年 8 月开源的首个图像生成基础模型,也是目前在复杂文本(尤其是中文)渲染方面表现最好的开源文生图大模型之一。
70亿参数媲美闭源巨头!Seed-X-PPO-7B本地部署教程:触手可及的顶级翻译模型
Seed-X-PPO-7B 是强大的开源多语言翻译语言模型,表现出业界领先的翻译能力,它以其 70 亿(7B)参数的“轻量级”设计,实现了支持 28 种语言双向互译的强大能力。
多模态融合新纪元:Ovis2.5 本地部署教程,实现文本、图像与代码的深度协同推理
Ovis2.5 旨在实现原生分辨率的视觉感知和增强的多模态推理。它集成了一个原生分辨率的视觉变换器(NaViT),可以处理原始、可变分辨率的图像。
“下一代”图像模型——ComfyUI-Flux-Krea本地部署教程,体验划时代的图像质量
FLUX.1-Krea-dev是一个具有 120 亿参数的修正流变换器,能够根据文本描述生成图像,具有优质的输出质量,专注于美学摄影。
360智脑开源优化排序模型——360Zhinao-1.8B-Reranking本地部署教程,提升检索质量,减少大模型“幻觉”现象
360Zhinao-1.8B-Reranking 模型以自主研发的 360Zhinao_1.8B_base 模型为基础
使用指南 | Coze Studio 一站式AI智能体开发平台:低代码+多模型+RAG,快速打造你的专业级 AI Agent!
扣子利用大语言模型极大地简化了智能体的搭建过程。 在充分利用大语言模型优势的同时,扣子还支持用户通过知识库、工作流等功能来配置智能体如何响应用户查询,以保证智能体的回复符合预期。
一句话,AI帮你P图!Qwen-Image-Edit本地部署教程:能转能改能加字
Qwen-Image-Edit基于 20B Qwen-Image 模型,成功地将 Qwen-Image 独特的文本渲染能力扩展到了图像编辑任务中,实现了精确的文本编辑。
3秒搞定产品换装换背景!【ComfyUI-万物迁移工作流】本地部署教程:基于FLUX.1 Kontext上下文感知图像编辑
本工作流使用FLUX.1 Kontext智能地将一张图像中的物体迁移至另一张目标场景图中,并保持原物特征与目标场景的和谐融合。
32K上下文开源语音理解、40分钟深度交互——Voxtral-Small-24B-2507本地部署教程
Voxtral-Small-24B-2507 是一款由 Mistral 团队发布的大规模多模态语言模型,具备强大的自然语言理解与生成能力。
一行命令,玩转所有主流音视频格式!一站式音视频处理工具——FFmpeg本地部署教程
FFmpeg 是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用 LGPL 或 GPL 许可证。它提供了录制、转换以及流化音视频的完整解决方案。
130亿参数开源之巅!HunyuanVideo本地部署教程:导演级运镜 × 物理级流畅
HunyuanVideo 是腾讯推出的一款开源视频生成基础模型,拥有超过 130 亿个参数,是当前规模最大的开源视频生成模型。
开源即用,3 行代码合成自然语音——OuteTTS 本地部署教程,一键接入全场景语音能力
OutsTTS是基于Qwen3 0.6B 构建的基础模型,经过持续的预训练和微调,主要用于克隆和合成语音。
阿里开源首个图像生成基础模型——Qwen-Image本地部署教程,超强中文渲染能力刷新SOTA!
Qwen-Image 是阿里巴巴通义千问团队于 2025 年 8 月开源的首个图像生成基础模型,也是目前在复杂文本(尤其是中文)渲染方面表现最好的开源文生图大模型之一。
OpenAI 全新开源模型 GPT-OSS-20B本地部署教程:16GB显存跑透128K上下文
8 月 5 日,OpenAI 重磅发布了自 GPT-2 以来的首批开源权重语言模型 gpt-oss-120b 和 gpt-oss-20b,标志着 OpenAI 在开源领域迈出了重要一步。
5B 参数,消费级显卡可部署:Wan2.2-TI2V-5B 本地部署教程,9分钟跑出电影级大片!
Wan2.2-TI2V-5B 是阿里巴巴通义万相团队于 2025 年 7 月开源的一款轻量级统一视频生成模型,属于 Wan2.2 系列中的核心成员。
Wan2.1-14B-T2V-FusionX-VACE本地部署教程:融合前沿技术,轻松掌握逼真物理模拟!
本次合并模型整合了 Wan-AI/Wan2.1-VACE-14B 的作用域(scopes)与 vrgamedevgirl84/Wan14BT2VFusionX 的模型架构。
拖拽即用·10秒生成矢量艺术字,多种字体风格自由切换——Calligrapher 2025本地部署教程
Calligrapher 是蚂蚁集团与香港科技大学的研究团队共同开发的一个创新的基于扩散模型的框架,主要用于数字书法和设计应用中的文本图像定制与风格转换。
下一页