Qwen 2.5-Omni-7B: 语音聊天 + 视频聊天

140 阅读1分钟

Qwen 2.5-Omni-7B: 语音聊天 + 视频聊天

1.gif

阿里通义团队发布了 Qwen 2.5-Omni-7B 模型,OpenAI 高级语音模式的开源平替。 这个模型能够无缝处理文本、图像、音频和视频等多种输入形式。

不用客户端,佬们可以在 qwen.ai 上直接语音或视频聊天。该模型同样基于 Apache 2.0 许可开源

Ideogram 3.0 升级:真实感与创意表现提升

2.gif

AI 图像生成平台 Ideogram 正式发布了 3.0 版本模型,在真实感、创意表现和图像一致性方面都有提升。

新版本现已在其官网开放使用,所用用户都可以使用,每次消耗 4 个积分。

不过目前官方尚未公布 API 接口和具体定价方案,根据我的经验,这种级别的模型服务估计不会太便宜。