神经信息处理系统大会:因果表征学习为何可能成为AI的未来
在2021年神经信息处理系统大会(NeurIPS)前夕,某中心副总裁兼杰出科学家伯恩哈德·舒尔科夫指出,人工智能研究的下一前沿将是因果表征学习。作为因果推断领域被引用最多的研究者,舒尔科夫强调:"这类因果表征将推动推理能力的发展,如果我们想摆脱纯粹的智能模式识别观点,这将是最终所需的方向。"
某中心网络服务部高级应用科学家弗朗切斯科·洛卡泰洛领导着该机构在因果表征学习方面的研究,他在今年NeurIPS上联合发表了四篇论文。
分布外泛化评估
《迁移学习中的分布外泛化评估》涉及因果推断在机器学习中最引人注目的应用之一:将训练于特定概率分布数据的模型泛化到具有不同分布的真实世界数据。
"传统机器学习是从某个概率分布中抽取独立样本,然后训练能够泛化到相同分布的模型,"洛卡泰洛解释道,"这相当于用单一概率分布描述物理系统。而因果模型则通过干预来模拟物理系统可能呈现的所有状态,因此不是单一分布,而是一组分布。"
该研究收集了大量针对分布外泛化场景构建的数据集,系统评估了文献中的不同方法。"虽然现有方法未明确考虑因果关系,但因果方法最终应能在此基准测试中表现更优,这将帮助我们评估研究进展。"
神经注意力电路
在《神经注意力电路》研究中,团队尝试通过训练神经网络模拟因果网络结构,使架构行为更接近因果模型。"这是去年NeurIPS论文的后续工作,新方法通过预定义函数组合路径,证明这种稀疏连接模式能显著提升分布外泛化能力。"
成功案例应用
另外两篇论文展示了因果表征学习在传统机器学习任务中的成功应用:
《自监督非模态视频对象分割》针对机器人视觉中的关键问题,通过视频时序信息重建被遮挡物体的轮廓。"利用历史帧中已观察到的物体信息,可以随时间累积构建更完整的分割掩码。"
《公平神经网络中的差异处理识别》发现,为减少偏差而设计的模型会自发形成双头结构。研究表明,采用明确的双头架构既能提升性能又符合公平标准,尽管这涉及对不同群体的差异处理。
技术前景展望
洛卡泰洛总结道:"因果表征学习是非常年轻的领域,我们正在寻找成功案例。因果关系未来必将在机器学习中扮演重要角色,因为许多开放性问题至少能通过因果模型得到部分解决。最终目标是将因果模型的优势融入主流机器学习应用。"