
获得徽章 0
#挑战每日一条沸点# 【一键解构,万物可分!腾讯混元 Hunyuan3D-Part 首创「组件思维」3D 生成范式,自动拆分出高质量部件】
近期,腾讯混元团队推出 3D 生成模型 Hunyuan3D-Part,模型由 P3–SAM 和 X–Part 组成,首次实现高精度、可控的组件式 3D 生成,支持 50 + 组件自动生成。
用户可先用混元 3D 2.5 或 3.0 生成整体 Mesh,再由 P3–SAM 进行自动、精确的组件分割,X–Part 将其分解为独立部件,输出高保真、结构一致的部件几何体,同时保持灵活可控性。在游戏建模、3D 打印等领域有广泛应用,如将汽车模型拆分车身和轮子,便于游戏绑定滚动逻辑或 3D 打印分步制作。
目前,「Hunyuan3D-Part:组件式 3D 生成模型」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验!
在线教程:
go.hyper.ai
近期,腾讯混元团队推出 3D 生成模型 Hunyuan3D-Part,模型由 P3–SAM 和 X–Part 组成,首次实现高精度、可控的组件式 3D 生成,支持 50 + 组件自动生成。
用户可先用混元 3D 2.5 或 3.0 生成整体 Mesh,再由 P3–SAM 进行自动、精确的组件分割,X–Part 将其分解为独立部件,输出高保真、结构一致的部件几何体,同时保持灵活可控性。在游戏建模、3D 打印等领域有广泛应用,如将汽车模型拆分车身和轮子,便于游戏绑定滚动逻辑或 3D 打印分步制作。
目前,「Hunyuan3D-Part:组件式 3D 生成模型」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验!
在线教程:
展开
1
6
#挑战每日一条沸点# 【OCR 能力不止于文字!IBM 开源多模态文档处理模型 Granite-Docling-258M,实现公式/表格/图片等结构化文档理解】
近期,IBM 开源轻量级多模态文档处理模型 Granite-Docling-258M,不仅能提取文字,更能清晰理解出表格、公式、图文排版布局等深层结构信息,为高效文档转换设计。
Granite-Docling-258M 在保持轻量参数的同时拥有卓越性能,支持多语言(包括阿拉伯语、中文和日语)处理,使用 DocTags 格式精准描述文档结构,避免信息丢失。该模型能与 Docling 库无缝集成,提供强大的定制化和错误处理能力,适用企业级文档处理,是文档处理领域的强大工具。
目前,「Granite-docling-258M:轻量多模态文档处理模型」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验!
在线教程:
go.hyper.ai
近期,IBM 开源轻量级多模态文档处理模型 Granite-Docling-258M,不仅能提取文字,更能清晰理解出表格、公式、图文排版布局等深层结构信息,为高效文档转换设计。
Granite-Docling-258M 在保持轻量参数的同时拥有卓越性能,支持多语言(包括阿拉伯语、中文和日语)处理,使用 DocTags 格式精准描述文档结构,避免信息丢失。该模型能与 Docling 库无缝集成,提供强大的定制化和错误处理能力,适用企业级文档处理,是文档处理领域的强大工具。
目前,「Granite-docling-258M:轻量多模态文档处理模型」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验!
在线教程:
展开
评论
点赞
#挑战每日一条沸点# 【多图合一、精准编辑!通义千问图像编辑模型新版本 Qwen-Image-Edit-2509 发布,拓宽图像合成能力新边界】
近期,阿里通义千问团队开源图像编辑模型的月度新版本 Qwen-Image-Edit-2509,重点更新了例如「人物+人物」的多图合一能力,在复杂视觉任务的精准度与创造性上树立了新标杆。
Qwen-Image-Edit-2509 是在强大视觉基础模型上迭代的深度编辑模型,支持人物合影、广告合成、场景替换等多元场景。新版本模型相比 8 月份开源的 Qwen-Image-Edit,单图编辑的一致性有所提升,同时新支持多图编辑功能,支持深度图、边缘图、关键点图,可控性更强,出图更自由。
目前,「Qwen-Image-Edit-2509:多图像编辑器」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验多图像智能融合!
在线教程:
go.hyper.ai
近期,阿里通义千问团队开源图像编辑模型的月度新版本 Qwen-Image-Edit-2509,重点更新了例如「人物+人物」的多图合一能力,在复杂视觉任务的精准度与创造性上树立了新标杆。
Qwen-Image-Edit-2509 是在强大视觉基础模型上迭代的深度编辑模型,支持人物合影、广告合成、场景替换等多元场景。新版本模型相比 8 月份开源的 Qwen-Image-Edit,单图编辑的一致性有所提升,同时新支持多图编辑功能,支持深度图、边缘图、关键点图,可控性更强,出图更自由。
目前,「Qwen-Image-Edit-2509:多图像编辑器」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验多图像智能融合!
在线教程:
展开
评论
4
#挑战每日一条沸点# 【全模态能力新突破!通义千问 Qwen3-Omni 模型多版本齐开源,原生融合文本、图像、音频与视频理解等能力】
近期,阿里通义千问团队开源全模态模型 Qwen3-Omni,包含 Qwen3-Omni-30B-A3B-Instruct(指令跟随)、Qwen3-Omni-30B-A3B-Thinking(推理)和通用音频字幕器 Qwen3-Omni-30B-A3B-Captioner。
Qwen3-Omni 是原生端到端的跨语言多模态基础模型。它处理文本、图像、音频和视频,并以文本和自然语音两种形式提供实时流式响应,在取得强大的音频和音视频结果的同时,单模态文本和图像性能不会下降,解决了长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。
目前,「Qwen3-Omni:突破模态边界的全能选手」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验!
在线教程:
go.hyper.ai
go.hyper.ai
近期,阿里通义千问团队开源全模态模型 Qwen3-Omni,包含 Qwen3-Omni-30B-A3B-Instruct(指令跟随)、Qwen3-Omni-30B-A3B-Thinking(推理)和通用音频字幕器 Qwen3-Omni-30B-A3B-Captioner。
Qwen3-Omni 是原生端到端的跨语言多模态基础模型。它处理文本、图像、音频和视频,并以文本和自然语音两种形式提供实时流式响应,在取得强大的音频和音视频结果的同时,单模态文本和图像性能不会下降,解决了长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。
目前,「Qwen3-Omni:突破模态边界的全能选手」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验!
在线教程:
展开
评论
2