Qwen 2.5-Omni-7B: 语音聊天 + 视频聊天
阿里通义团队发布了 Qwen 2.5-Omni-7B 模型,OpenAI 高级语音模式的开源平替。 这个模型能够无缝处理文本、图像、音频和视频等多种输入形式。
不用客户端,佬们可以在 qwen.ai 上直接语音或视频聊天。该模型同样基于 Apache 2.0 许可开源
Ideogram 3.0 升级:真实感与创意表现提升
AI 图像生成平台 Ideogram 正式发布了 3.0 版本模型,在真实感、创意表现和图像一致性方面都有提升。
新版本现已在其官网开放使用,所用用户都可以使用,每次消耗 4 个积分。
不过目前官方尚未公布 API 接口和具体定价方案,根据我的经验,这种级别的模型服务估计不会太便宜。