Thera:首个内置物理观测模型的任意尺度超分辨率技术

82 阅读2分钟

Thera:首个内置物理观测模型的任意尺度超分辨率技术

Thera 是第一个具有内置物理观测模型的任意尺度超分辨率技术,从基准测试来看,性能非常的好。

佬们可以在官方演示[1]上玩一下,提供的几个 demo 效果看起来非常不错

Cohere 开源 Command A:企业级大模型,成本效益超越 GPT-4o 和 DeepSeek-V3

Command A[2] 是 Cohere 开源的一款专为企业需求优化的大模型,显著降低了硬件成本。

官方宣称,在与 GPT-4o 和 DeepSeek-V3 的对比中,Command A 在企业级任务中表现同样出色,效率更高。更重要的是,相较于使用 API,自部署访问成本降低了 50%。

完整细节可以查看Command A[3] 的官方博客。

LBM:单步实现多功能图片风格转换

LBM[4](Latent Bridge Matching)是一种图片风格转换技术,它能够在单一步骤中实现多种图生图任务,如对象移除、法线和深度调整以及重新照明等。

目前,LBM 技术已经开源,感兴趣的朋友可以在线体验[5]感受下

百度发布文心大模型 4.5 及 X1

百度昨天发布了新的文心大模型[6],其中包括基础模型 4.5 和推理模型 X1。百度宣称 X1 的能力接近 DeepSeek R1,价格便宜了一半。

网友们对实际效果的评价一般,CEO 李彦宏表示后续会开源,正如今年 2 月份的宣布[7],4 月 1 日后文心也会全面免费。

怎么说呢,难用归难用,能开源总是好的。

米哈游创始人蔡浩宇推出 AI 驱动的互动叙事游戏《群星低语》

“Whispers from the Star”(群星低语)是一款由米哈游(miHoYo)的创始人蔡浩宇创立的游戏开发公司 Anuttacon 打造的科幻题材互动叙事游戏。这款游戏以 AI 技术为核心,旨在重新定义互动叙事的体验。

官方的目标是突破传统对话树的限制,提供开放式、个性化和沉浸式的实时交互体验。

已经开启封闭内测阶段,仅支持苹果 iOS 12 以上设备,有兴趣的可以去官网[8]申请体验。

腾讯混元即将开源全新 3D 模型

腾讯混元[9]宣布即将发布一款全新的 3D 模型[10],大概率会开源,大家可以期待一下。

WeShopAI:一个闭源的虚拟试穿

WeShopAI[11] 是又一个虚拟试穿的在线演示,类似于可灵的虚拟试穿。同样,它只是调用了其 API,并没有开源。

效果还行,佬们可以玩玩看,感觉大概率是给其引流用的?