以下内容包括「人工智能生成内容」
👏在昨天(2025.8.16),AI领域有这些内容可能值得你关注:
Meta 第四次重组人工智能部门
据 The Information 报道,Meta 正在对人工智能部门进行半年内的第四次重组。消息人士透露,新成立的超级智能实验室将被拆分为四个团队:待命名的“TBD 实验室”、包含 Meta AI 助手的产品团队、基础设施团队以及专注于长期研究的基础 AI 研究实验室(FAIR)。 “CEO 马克·扎克伯格正全力推进通用人工智能研发,试图打造超越人类思维的机器。” 此次重组发生在 Meta 最新开源模型 Llama 4 市场反响平平、多名高管离职之后。公司近期还宣布将斥资数百亿美元建设多个大型 AI 数据中心,并上调了年度资本支出预期至 660-720 亿美元。
大语言模型在信息不完备场景下的推理能力研究
在日常生活中,我们常常会遇到信息不完整的情况。比如医生需要通过问诊来收集患者的症状,侦探需要通过调查来获取案件线索。这种需要主动获取信息的推理过程,被研究者称为 主动推理 (Active Reasoning)。最近,来自 TMLR 课题组和斯坦福大学的研究人员针对这一领域展开研究,并在 ICML 2025 会议上发表了相关论文。
与传统的 被动推理 (Passive Reasoning)不同,主动推理要求人工智能模型在信息不完整的情况下,能够主动提出关键问题来获取必要信息。为了评估大语言模型在这方面的能力,研究团队构建了一个名为 AR-Bench 的基准测试。这个测试包含三种不同类型的任务:模拟刑事案件调查的 侦探案件 (Detective Cases)、考验逻辑推理能力的 情景谜题 (Situation Puzzles),以及测试符号推理能力的 数字猜谜 (Guessing Numbers)。
研究结果显示,即使是目前最先进的 GPT-4o 模型,在数字猜谜任务上也仅能达到 35%的准确率。更令人意外的是,专门设计的主动推理方法不仅没能提升模型表现,有时甚至会导致性能下降。相比之下,人类在这些任务上的表现要显著优于现有的大语言模型。
研究人员还发现了一些有趣的细节:模型在交互过程中提出的问题质量会逐渐下降;规模较大的模型能够更好地利用多轮对话机会;而简单地延长对话轮数并不能有效提升推理表现。这些发现表明,当前的大语言模型在主动推理方面还存在明显不足。
Meta TRIBE 模型获 Algonauts 大脑建模竞赛冠军
Meta FAIR 团队开发的 TRIBE(Trimodal Brain Encoder)模型在 Algonauts 2025 大脑建模竞赛中获得冠军。这个 10 亿参数的模型首次实现了对跨模态、跨皮层区域、跨个体大脑反应的预测,成功模拟了由 Courtois NeuroMod 项目采集的大规模 fMRI 数据。 “TRIBE 是首个能够预测跨模态、跨皮层区域、跨个体大脑反应的深度神经网络” ,这一成果标志着大脑建模技术的重要进展。
传统神经科学研究多聚焦于特定皮层区域及其关联功能,导致学科知识碎片化。TRIBE 创新性地整合了文本(Llama 3.2)、音频(Wav2Vec2-BERT)和视频(V-JEPA 2)三种模态的预训练表征,通过端到端方式学习全脑多模态动态整合。模型以视频片段及对应的音频、文字作为输入,预测受试者观看时的 fMRI 脑响应。 “消融实验表明,各模态之间存在互补作用” ,三模态联合训练显著提升了模型性能。
在 263 支参赛队伍中,TRIBE 以显著优势胜出。实验显示,该模型在高级联合皮层区域表现尤为突出,且性能随数据量增加呈现系统性提升。这一突破为理解大脑认知机制提供了新工具,未来有望扩展到行为、记忆与决策等其他认知组件的研究。模型的成功也验证了多模态方法在大脑建模中的重要性,为相关领域发展指明了方向。
👏大家好,这里是 Memene 摸鱼日报,致力于为您带来每日AI领域的资讯八卦,让你在上班摸鱼的同时只需多花那么几分钟便可以快速了解 AI 领域的资讯新闻。
我们是一家位于杭州的AI创业团队。以上是我们还在测试的产品的 Memene 的生成效果内容。因为希望得到社区朋友们的反馈,于是我们来掘金社区发布了我们的 Memene 摸鱼日报专栏。
🥳如果您有什么意见,还请在评论区与我们反馈。我们非常期望能够得到大家的真实反馈。