
获得徽章 0
- #挑战每日一条沸点# 【真正懂人类的审美!最新文生图模型 SRPO 让 AI 图像脱离「塑料感」,实现更自然的美学表达】
近期,腾讯混元团队联合香港中文大学、清华大学共同发布了新一代文生图模型 SRPO,实验表明该模型能显著提升生成图像的人类评估真实感和审美质量,且训练效率极高,仅需 10 分钟即可完成优化。
SRPO 通过将奖励信号设计为文本条件信号,实现对奖励的在线调整,减少对离线奖励微调的依赖。SRPO 引入 Direct-Align 技术,通过预定义噪声先验直接从任何时间步恢复原始图像,避免在后期时间步的过度优化问题。与基线 FLUX.1.dev 模型相比,SRPO 在感知真实感上提升了约 3.7 倍,在美学质量上提升了 3.1 倍。
目前,「SRPO:图像生成告别 AI 味!」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验 demo!
在线教程:go.hyper.ai
展开等人赞过17 - 【轻量化、高性能、强思考!文心思考模型 ERNIE-4.5-21B-A3B-Thinking 发布,轻量级规模接近 SOTA 表现】
近期,百度正式开源发布了思考模型 ERNIE-4.5-21B-A3B-Thinking,以总参数 21B、激活仅 3B 的轻量化高效推理,在效率与性能的平衡上树立了新标杆。
ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型采用混合专家(MoE)架构,不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。
目前,「ERNIE-4.5-21B-A3B-Thinkingt:轻量化模型推理能力再升级」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验 demo!
在线教程:go.hyper.ai
展开赞过评论1 - #挑战每日一条沸点# 【哪里不对改哪里!全能图像编辑模型 Qwen-Image-Edit 兼具语义与外观的双重编辑能力,刷新图像编辑 SOTA】
昨天凌晨,阿里通义千问团队发布了全能图像编辑模型 Qwen-Image-Edit,在多个公开基准测试中的评估表明在图像编辑任务上具备 SOTA 性能。
Qwen-Image-Edit 兼具语义与外观双重编辑能力,不仅能准确理解编辑指令的语义意图,还能保持图像视觉风格的一致性。该模型将 Qwen-Image 卓越的中文文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。作为 Qwen-Image 的全新版本,此次更新构建了从图像生成、链式编辑到最终效果呈现的闭环,大大提高了图像的可用性。
目前,「Qwen-Image-Edit:全能图像编辑模型 Demo」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验 demo!
在线教程:go.hyper.ai
展开1点赞 - #挑战每日一条沸点# 【一键部署 Qwen-Image:首个图像生成基础模型,文字渲染与图像编辑能力获得SOTA】
阿里通义千问团队再开源!今天凌晨,通义千问团队开源了首个图像生成基础模型 Qwen-Image,一个 20B 的 MMDiT 模型。
从中英文双语渲染到长段落生成,从海报设计到 PPT 页面排版,Qwen-Image 均能生成高质量视觉效果。凭借精准的文本渲染能力与稳定的图像编辑性能,Qwen-Image 在多个主流 Benchmark 中达到 SOTA 水平。值得一提的是,Qwen-Image 在中文渲染上的强大性能为开源视觉模型的中文能力建设提供了有益补充,中文从被「翻译」的附加项,正在逐渐转向 AI 视觉认知的「母语」之一。
目前,「Qwen-Image:具有高级文本渲染能力的图像模型」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验 demo。快来体验多元视觉风格!
在线教程:go.hyper.ai
展开评论点赞 - 【一键部署 Qwen3-Coder-Flash:「甜品级」编程模型,轻量高性能领跑开闭源模型生态】
Qwen3-Coder-30B-A3B-Instruct 是由阿里巴巴旗下通义万相实验室推出的大语言模型,在代理编码、代理浏览器使用和其他基础编码任务上的开源模型中具有优越性能。该模型能够高效地处理多种编程语言的编码任务,显著提高编程效率,同时其强大的上下文理解和逻辑推理能力使其在复杂项目开发和代码优化中表现出色。
目前,「一键部署 Qwen3-Coder-30B-A3B-Instruct」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验 demo。立即部署,解锁高效编程新范式!
在线教程:go.hyper.ai
展开评论点赞 - #挑战每日一条沸点# 【一键部署 Qwen3-30B-A3B-Instruct-2507 全量版:Qwen3 深夜更新,思维能力全面跃升,仅激活 3B 参数也可媲美 GPT-4o】
今日凌晨,Qwen 团队再度公布重磅更新——此前已经广受好评的 Qwen3-30B-A3B 模型迎来了新版本:Qwen3-30B-A3B-Instruct-2507。这个非思考模式(non-thinking mode)的新模型,将长文本理解能力提升至 256K,仅激活 3B 参数,性能全面比肩 GPT-4o 与 Gemini 2.5-Flash 等顶尖闭源模型。同时,其在指令跟随、逻辑推理、文本理解、数学、科学、编程及工具使用等方面能力均有显著提升,能够更好成为用户的「思维协作者」。
我已经为大家进行了实测,询问北京多地区的暴雨和台风登陆上海这两个极端天气现象之间是否有关联,测试了这个非思考模式的模型,其迅速从多个角度给出了回答。
目前,「一键部署 Qwen3-30B-A3B-Instruct-2507」已上线至 HyperAI 官网的「教程」板块,一键克隆即可快速体验 demo。一起来开启和 AI 的默契对话!
在线教程:go.hyper.ai
展开评论点赞 - #挑战每日一条沸点# 【当医学影像「会说话」:HealthGPT 重新定义智能医疗】
听说了吗,AI 圈子里又有大活了,现在都能看 CT 了。
它就是 HealthGPT !作为医疗界的「AI 小能手」,它最突出的功能是实现医学影像与文本的深度融合。举个例子,你把 CT 等医学影像发给它,它可以「看图说话」,并给出专业分析与建议。相关研究论文已被 ICML 2025 收录并评选为 Spotlight
「HealthGPT:AI 医疗助手」一键部署教程已经上线至 HyperAI超神经教程版块,快来体验吧~go.hyper.ai
展开赞过评论2 - #挑战每日一条沸点# 【参数仅 12B,性能媲美 GPT-4o!FLUX.1-Kontext-dev 实现高效文本图像编辑】
12B 参数撬动高性能,说的就是 FLUX.1-Kontext-dev。作为一款开源 AI 图像编辑模型,FLUX.1-Kontext-dev 具备强大的上下文感知能力,能够精准理解文本指令,实现高质量的图像编辑与生成,同时保持角色一致性。在运行速度上表现出色,在 1024×1024 分辨率下,图像生成时间仅需 3 到 5 秒!
「FLUX.1-Kontext-dev:文本驱动的一键图像编辑」一键部署教程已经上线至 HyperAI超神经教程版块,快来试试吧~go.hyper.ai
展开赞过评论1 - 【Meet AI Compiler 技术沙龙 · 北京站,我们来啦!】AI 编译器这块,最近真的不太平。HyperAI超神经搞了场 AI 编译器技术沙龙,嘉宾阵容超超超硬核!汇聚 AMD、沐曦集成电路、字节跳动、北京大学等多位专家,从底层编译到落地实践,TVM、Triton、TileLang 各展所长,小伙伴们直呼:「感觉有点太猛了!」。此外,Apache TVM PMC、上海创智学院助理教授冯思远将围绕「跨硬件的统一编译生态」这一主题,与众位讲师展开深入的讨论,为我们带来一场思维盛宴!
7 月 5 日,北京,来聊点实在的。报名链接→
hdxu.cn;更多详情→
mp.weixin.qq.com
展开评论点赞