CVPR 2019 最佳论文重磅出炉！李飞飞 ImageNet 获计算机视觉基础贡献奖【新智元导读】刚刚，CVPR 20

【新智元导读】 刚刚，CVPR 2019 最佳论文公布了：来自 CMU 的辛书冕等人合作的论文获得最佳论文奖，最佳学生论文也由加州大学圣巴巴拉分校 Xin Wang 等人摘得。此外，经典论文奖授予了李飞飞等人的杰出工作 ImageNet。

备受瞩目的 CVPR 2019 正在美国加州长滩举行。作为计算机视觉和模式识别的顶级学术会议，每年的 CVPR 都汇聚了领域技术发展的前沿。而 CVPR 的最佳论文则更是备受关注，多有经典。

CVPR 2019 大会现场

而就在刚刚，CVPR 2019 揭晓了最佳论文奖以及其他奖项。

最佳论文奖授予了卡内基梅隆大学、多伦多大学、伦敦大学学院的辛书冕 (Shumian Xin), Sotiris Nousias 等人合作的论文 A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction

最佳学生论文授予了加州大学圣巴巴拉分校、微软研究院、杜克大学的 Xin Wang, Qiuyuan Huang 等人合作的论文 Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation。

此外，经典论文奖 Longuet-Higgins 奖被授予了李飞飞、李佳等人的 ImageNet 工作。

根据 CVPR 官网的介绍，今年 CVPR 一共收到创纪录的 5165 篇有效投稿，比去年的 3309 篇多出近 2000 篇。

经过 132 位领域主席和 2887 位审稿人三个月的辛勤工作，最终有 1294 篇论文被接收，最终录取率为 25.2% 。1294 篇录取论文中，有 288 篇被录用为 Oral 论文。参会人数上，本届 CVPR 也是盛况空前，超过 9000 人注册。

CVPR 2019 相关数据

本届 CVPR 大会主席是马里兰大学 Larry Davis 教授、牛津大学 Philip Torr 教授，以及加州大学洛杉矶分校 (UCLA) 朱松纯教授。本届 CVPR 组织者中也不乏华人学者面孔，除 UCLA 朱松纯教授担任大会主席外，便利蜂 AI 研究院的华刚博士、加州大学圣地亚哥分校的屠卓文担任程序主席。

会议的 132 位领域主席中，也有多位华人面孔，比如白翔、程明明、孙剑、贾佳亚、林达华、吕乐、马毅、苏昊 \ 颜水成、虞晶怡、张正友等等（不完全统计）。

接下来，新智元带来 CVPR 2019 最佳论文奖及其他奖项的介绍：

最佳论文

最佳论文：

A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction

作者：Shumian Xin, Sotiris Nousias, Kiriakos N. Kutulakos, Aswin C. Sankaranarayanan, Srinivasa G. Narasimhan and Ioannis Gkioulekas

作者机构：卡内基梅隆大学、多伦多大学、伦敦大学学院

论文地址：www.ri.cmu.edu/publication…

摘要：

我们提出了一个新的理论，即在一个已知的可见场景和一个不在瞬态相机视线范围内的未知物体之间的 Fermat path。这些光路要么遵守镜面反射，要么被物体的边界反射，从而编码隐藏物体的形状。

我们证明费马路径对应于瞬态测量中的不连续性。然后，我们推导出一种新的约束，它将这些不连续处的路径长度的空间导数与表面法线相关联。

基于这一理论，我们提出了一种名为 Fermat Flow 的算法来估计非视距物体的形状。我们的方法首次允许复杂对象的精确形状恢复，范围从隐藏在拐角处以及隐藏在漫射器后面的漫反射到镜面反射。

最后，我们的方法与用于瞬态成像的特定技术无关。因此，我们展示了使用 SPAD 和超快激光从皮秒级瞬态恢复的毫米级形状，以及使用干涉测量法从飞秒级瞬态微米级重建。我们相信我们的工作是非视距成像技术的重大进步。

最佳论文提名

获得最佳论文提名奖的是：

Learning the Depths of Moving People by Watching Frozen People

作者：Zhengqi Li, Tali Dekel, Forrester Cole, Richard Tucker, Noah Snavely, Ce Liu, William T. Freeman

作者机构：Google Research

论文链接：arxiv.org/abs/1904.11…

A Style-Based Generator Architecture for Generative Adversarial Networks

作者：Tero Karras, Samuli Laine, Timo Aila

作者机构：NVIDIA

论文链接：arxiv.org/abs/1812.04…

最佳学生论文

最佳学生论文：

Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation

题目： 面向语言视觉导航（VLN）的强化交叉模型匹配和半监督模仿学习

作者： Xin Wang，Qiuyuan Huang，AsliCelikyilmaz，Jianfeng Gao，Dinghan Shen，Yuan-Fang Wang，William Yang Wang，Lei Zhang

Xin Wang，Yuan-FangWang，William Yang Wang 加州大学圣芭芭拉分校

Qiuyuan Huang，Asli Celikyilmaz，Jianfeng Gao，Lei Zhang 微软研究院

Dinghan Shen 杜克大学

摘要：

视觉语言导航（VLN）是对真实智能体在真实 3D 环境内执行自然语言指令的任务。本文研究了如何解决这项任务的三个关键挑战：跨模态基础、不适定反馈和泛化问题。

首先，我们提出了一种基于强化学习的新的强化交叉模型匹配（RCM）方法。我们特别将匹配的批评内容作为内在奖励，以促进指令和智能体运动轨迹之间的全局性匹配，并利用推理导航器在本地视觉场景中执行跨模态 grounding。对 VLN 基准数据集的评估表明，我们的 RCM 模型在 SPL 上显着优于以前的方法，优化幅度高达 10％，并达到了最先进的性能。

为了提高学习政策的可泛化性，文章进一步引入了自我监督模仿学习（SIL）方法，通过模仿自己过去的高质量决策来探索未见过的环境。结果表明，SIL 方法可以近似地获得更好、更有效的策略，极大地降低了已见过和未见过的环境之间的成功率上的性能差距（由 30.7％降低至 11.7％）。

经典论文：Longuest-Higgins 奖

Longuet-Higgins 奖是 IEEE 计算机协会模式分析与机器智能（PAMI）技术委员会在每年的 CVPR 颁发的 “计算机视觉基础贡献奖”，表彰十年前对计算机视觉研究产生了重大影响的 CVPR 论文。奖项以理论化学家和认知科学家 H. Christopher Longuet-Higgins 命名。

2019 年的 Longuet-Higgins 奖授予邓嘉、李飞飞、李佳等人的 ImageNet 工作：ImageNet: A Large-Scale Hierarchical Image Database。ImageNet 可以说是计算机视觉领域最负盛名的工作，这篇论文发表于 2009 年 CVPR，目前已有 11508 次引用。

（本文照片来自Twitter @JaredHeinly ，特此感谢！）

新智元 · AI_era

每日推送 AI 领域前沿学术解读、AI 产业最新资讯

戳右上角【+ 关注】↗↗

喜欢请分享、点赞吧