基础模型具有强大的生成、泛化和推理能力,适用于产业界中最具商业价值的任务,如精准预测和控制、高效优化决策,以及智能化、可交互的工业模拟。
//社区生态//
- 清华系智谱AI推出GLM-4。 清华系的初创公司智谱AI推出新一代基座模型GLM-4,在中文能力上全面超越竞争对手,同时对标OpenAI,智谱AI开放个人大模型和GLM Stores。
- 微软Copilot大会员。 微软发布覆盖全体用户的Copilot Pro,月付费20刀,可使用Office全家桶中的大模型能力,同时有限访问最新的OpenAI大模型。
- Nous-Hermes-2 Mixtral 8x7B大模型发布。 基于Mixtral 8x7B大模型,Nous Research公司利用GPT-4生成的数据和开源数据集训练得到Nous-Hermes-2 Mixtral 8x7B大模型,据称在很多基准达到SOTA水平。
//多模态大模型//
-
腾讯公开PhotoMaker人像照片生成工具。 腾讯公开PhotoMaker,用户可上传人像照片,辅以文字描述以自动生成各种风格的逼真图片。
-
基于文生图学习生成无限图片。 南加大和哈佛大学研究提出方法,可以让文生图的模型借助参考图片,学习对应的视觉属性共性和不同的文本描述分布,基于此无限生成类似且多元的图片。
-
文生图模型用于视觉感知。 字节跳动和复旦大学提出,引入可学习的元提示到文生图扩散模型当中,开发其视觉感知能力。
//智能体//
- 微软开源智能体框架TaskWeaver。 TaskWeaver能将用户需求从自然语言处理为可执行代码,并支持丰富的数据结构和插件选择,以及垂直领域适应的规划流程。