首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
模型部署教程
算家计算
创建于2025-05-29
订阅专栏
分享各类热门开源大模型、镜像部署教程,助力广大AI爱好者!
等 7 人订阅
共63篇文章
创建于2025-05-29
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Wan2.2-Animate-14B 使用指南:从图片到动画的完整教程
本镜像基于 ComfyUI 进行部署,已经下载了Wan2.2-Animate-14B动作模仿和人物替换模型,下面将带您快速了解本模型的基本使用
化学专业大型语言模型——SparkChemistry-X1-13B本地部署教程:洞察分子特性,精准预测化学行为
iFLYTEK Spark Chemistry-X1-13B 是由 iFLYTEK 团队开发的化学专业大型语言模型。
阿里最新开源Wan2.2-Animate-14B 本地部署教程:统一双模态框架,MoE架构赋能电影级角色动画与替换
阿里巴巴旗下 Wan 团队在9月19日正式开源 Wan2.2-Animate-14B(简称 Wan-Animate)模型,这一高保真角色动画生成框架迅速成为 AI 视频领域的焦点。
PDF解析神器——MinerU本地部署教程,一键去除页眉页脚,精准提取公式表格,支持84种语言,让文档转换更简单!
MinerU 是由上海人工智能实验室(OpenDataLab)团队开发的一款开源智能文档解析工具,专注于将复杂的PDF文档、网页和电子书内容,高效、精准地提取并转换为机器可读的结构化格式。
模糊高清修复真王炸!ComfyUI-SeedVR2-Kontext(画质修复+P图)本地部署教程
SeedVR2_comfyUI 是由字节跳动 Seed 实验室与南洋理工大学 S-Lab 联合开源的 一步式图像高清修复模型 ,专为 ComfyUI 用户开发的插件版本。
7B参数拿下30个世界第一!Hunyuan-MT-7B本地部署教程:腾讯混元开源业界首个翻译集成模型
Hunyuan-MT-7B 是腾讯混元团队发布的轻量级翻译模型,参数量仅 70 亿,支持 33 个语种及 5 种民汉语言/方言互译。
AI配音革命!B站最新开源IndexTTS2本地部署教程:精准对口型,情感随心换
哔哩哔哩(B 站)Index 团队近日开源了一款情感可控、时长可调的工业级自回归零样本文本转语音(TTS)系统 —— IndexTTS2。
一张图+一段音频=电影级视频!阿里Wan2.2-S2V-14B本地部署教程:实现丝滑口型同步
Wan2.2-S2V-14B 是阿里巴巴通义万相团队在8月底开源的一款音频驱动的多模态视频生成模型。 为了解决实现电影级角色动画这一长期挑战,团队提出了一种基于 Wan 的音频驱动模型。
面壁智能开源多模态大模型——MiniCPM-V 4.5本地部署教程:8B参数开启多模态“高刷”时代!
MiniCPM-V 4.5 是 OpenBMB 最新 8B 多模态大模型,基于 Qwen3-8B + SigLIP2-400M,在 OpenCompass 平均 77.0 分。
ComfyUI-MultiTalk本地部署教程:创新L-RoPE机制破解多音频流绑定难题,定义多人对话视频生成新SOTA!
MultiTalk 是由中山大学、美团和香港科技大学联合研发的一款音频驱动的多人对话视频生成框架。它能够根据多路音频输入、参考图像和文本提示,生成包含多个角色互动且唇形与语音高度同步的视频。
一站式高质量数字人动画框架——EchoMimic-V3本地部署教程: 13 亿参数实现统一多模态、多任务人体动画生成
EchoMimicV3 是蚂蚁集团在8月底开源的一款高效、多模态、多任务的13亿参数数字人视频生成框架。
腾讯最新开源HunyuanVideo-Foley本地部署教程:端到端TV2A框架,REPA策略+MMDiT架构,重新定义视频音效新SOTA!
HunyuanVideo-Foley 是腾讯混元团队在2025年8月底开源的一款端到端视频音效生成模型。
新一代实时检测工具——YOLOv13本地部署教程,复杂场景,一目了然!
YOLOv13 隆重推出 ——新一代实时检测器,拥有尖端的性能和效率。YOLOv13 系列包含四个版本:Nano、Small、Large 和 X-Large。
阿里开源首个图像生成基础模型——Qwen-Image本地部署教程,中文渲染能力刷新SOTA
Qwen-Image 是阿里巴巴通义千问团队于 2025 年 8 月开源的首个图像生成基础模型,也是目前在复杂文本(尤其是中文)渲染方面表现最好的开源文生图大模型之一。
70亿参数媲美闭源巨头!Seed-X-PPO-7B本地部署教程:触手可及的顶级翻译模型
Seed-X-PPO-7B 是强大的开源多语言翻译语言模型,表现出业界领先的翻译能力,它以其 70 亿(7B)参数的“轻量级”设计,实现了支持 28 种语言双向互译的强大能力。
多模态融合新纪元:Ovis2.5 本地部署教程,实现文本、图像与代码的深度协同推理
Ovis2.5 旨在实现原生分辨率的视觉感知和增强的多模态推理。它集成了一个原生分辨率的视觉变换器(NaViT),可以处理原始、可变分辨率的图像。
“下一代”图像模型——ComfyUI-Flux-Krea本地部署教程,体验划时代的图像质量
FLUX.1-Krea-dev是一个具有 120 亿参数的修正流变换器,能够根据文本描述生成图像,具有优质的输出质量,专注于美学摄影。
360智脑开源优化排序模型——360Zhinao-1.8B-Reranking本地部署教程,提升检索质量,减少大模型“幻觉”现象
360Zhinao-1.8B-Reranking 模型以自主研发的 360Zhinao_1.8B_base 模型为基础
使用指南 | Coze Studio 一站式AI智能体开发平台:低代码+多模型+RAG,快速打造你的专业级 AI Agent!
扣子利用大语言模型极大地简化了智能体的搭建过程。 在充分利用大语言模型优势的同时,扣子还支持用户通过知识库、工作流等功能来配置智能体如何响应用户查询,以保证智能体的回复符合预期。
一句话,AI帮你P图!Qwen-Image-Edit本地部署教程:能转能改能加字
Qwen-Image-Edit基于 20B Qwen-Image 模型,成功地将 Qwen-Image 独特的文本渲染能力扩展到了图像编辑任务中,实现了精确的文本编辑。
下一页