20240122 大模型快讯

179 阅读2分钟

基础模型拥有强大的生成、推理和泛化能力,适用于产业界中最具商业价值的任务,例如精准预测和控制、高效优化决策,以及智能化、可交互的工业应用。

//社区生态//

  1. 零一万物多模态大模型开源。 基于Yi语言模型开发的零一万物Yi-VL多模态大模型正式向全球开源,包括34B和6B两个版本,在中英文数据集CMMMU/MMMU均取得领先成绩。

  2. Galaxy S24集成Google Gemini。 三星新款旗舰手机Galaxy S24植入了Gemini大模型,主推智能搜索、翻译、笔记助手、消息撰写以及照片编辑和处理。

//行业落地//

  1. OpenAI改变大模型军事应用指导方针。 OpenAI将大模型军事化的指导方针由“禁止用于军事或战争”改为“禁止用于伤害自身或他人”,或为与五角大楼进行军事合作扫平障碍。

//多模态大模型//

  1. 可感知冷热的具身智能大模型发布。 UCLA等研究机构发布具身智能多模态大模型MultiPLY,通过智能体与3D环境交互,在对象检索、工具使用、多感官标注和任务分解的具体任务实验中,性能刷新SOTA。

  2. 视觉基础模型VMamba发布。 由中科院、华为和鹏城实验室,兼备全局感受野、动态权重和线性计算复杂度,在主流视觉模型评估集上表现优异。

//基础技术//

  1. OpenAI筹建半导体晶圆厂网络。 为训练GPT-5,奥特曼计划花费数百亿美元,与中东AI企业G42和台积电合作,打造AI芯片晶圆厂网络。