2021年不可错过的40篇AI论文,你都读过吗?

194 阅读5分钟

大家好,我是对白。

2021即将结束了,你今年读了多少论文?

图片

虽然世界仍在从新冠疫情的破坏中复苏,人们无法向从前那样时常线下相聚、共同探讨交流关于学术领域的最新问题,但AI研究也没有停下跃进的步伐。

转眼就是2021年底了,一年就这么就过去了,时光好像被偷走一样。细细数来,你今年读了多少论文?

一名加拿大博主Louis Bouchard以发布时间为顺序,整理出了近40篇2021年不可错过的优秀论文。整体来看,合集中的论文偏重计算机视觉方向。

在这个15分钟左右的视频中,你可以快速浏览这些论文:

已关注

关注

重播 分享 赞

切换到竖屏全屏 退出全屏

对白的算法屋 已关注

分享 点赞 在看

已同步到看一看写下你的评论

分享视频

,时长 16:08

0 / 0

00:00 / 16:08

切换到横屏模式

继续播放

转载

,

2021年不可错过的40篇AI论文,你都读过吗?

对白的算法屋 已关注

分享 点赞 在看

已同步到看一看写下你的评论

进度条,百分之0

播放

00:00

/

16:08

16:08

全屏

倍速播放中

0.5倍 0.75倍 1.0倍 1.5倍 2.0倍

超清 高清 流畅

您的浏览器不支持 video 标签

继续观看

2021年不可错过的40篇AI论文,你都读过吗?

视频详情

以下是每篇论文的详细信息:

**1、DALL·E: Zero-Shot Text-to-Image Generation from OpenAI
**
图片

论文链接:arxiv.org/pdf/2102.12…

代码地址:github.com/openai/DALL…

视频解读:youtu.be/DJToDLBPovg

2、VOGUE: Try-On by StyleGAN Interpolation Optimization

图片

论文链接:vogue-try-on.github.io/static\_fil…

视频解读:youtu.be/i4MnLJGZbaM

**3、Taming Transformers for High-Resolution Image Synthesis
**图片

论文链接:compvis.github.io/taming-tran…

代码地址:github.com/CompVis/tam…

视频解读:youtu.be/JfUTd8fjtX8

4、Thinking Fast And Slow in AI

图片

论文链接:arxiv.org/abs/2010.06…

视频解读:youtu.be/3nvAaVSQxs4

5、Automatic detection and quantification of floating marine macro-litter in aerial images

图片

论文链接:doi.org/10.1016/j.e…
代码地址:github.com/amonleong/M…
视频解读:youtu.be/2dTSsdW0WYI

6、ShaRF: Shape-conditioned Radiance Fields from a Single View

图片

论文链接:arxiv.org/abs/2102.08…
代码地址:www.krematas.com/sharf/index…
视频解读:youtu.be/gHkkrNMlGNg

7、Generative Adversarial Transformers

图片

论文链接:arxiv.org/pdf/2103.01…
代码地址:github.com/dorarad/gan…
视频解读:youtu.be/HO-\_t0UArd…

8、We Asked Artificial Intelligence to Create Dating Profiles. Would You Swipe Right?

论文链接:studyonline.unsw.edu.au/blog/ai-gen…
代码地址:colab.research.google.com/drive/1VLG8…
视频解读:youtu.be/IoRH5u13P-4

9、Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

图片

论文链接:arxiv.org/abs/2103.14…
代码地址:github.com/microsoft/S…
视频解读:youtu.be/QcCJJOLCeJQ

10、IMAGE GANS MEET DIFFERENTIABLE RENDERING FOR INVERSE GRAPHICS AND INTERPRETABLE 3D NEURAL RENDERING

图片

论文链接:arxiv.org/pdf/2010.09…
视频解读:youtu.be/dvjwRBZ3Hnw

11、Deep nets: What have they ever done for vision?

图片

论文链接:arxiv.org/abs/1805.04…
视频解读:youtu.be/GhPDNzAVNDk

12、Infinite Nature: Perpetual View Generation of Natural Scenes from a Single Image
图片

论文链接:arxiv.org/pdf/2012.09…
代码地址:github.com/google-rese…
视频解读:youtu.be/NIOt1HLV\_M…
在线试用:colab.research.google.com/github/goog…

13、Portable, Self-Contained Neuroprosthetic Hand with Deep Learning-Based Finger Control

图片

论文链接:arxiv.org/abs/2103.13…
视频解读:youtu.be/wNBrCRzlbVw

14、Total Relighting: Learning to Relight Portraits for Background Replacement

图片

论文链接:augmentedperception.github.io/total\_reli…
视频解读:youtu.be/rVP2tcF\_yR…

15、LASR: Learning Articulated Shape Reconstruction from a Monocular Video

图片

论文链接:openaccess.thecvf.com/content/CVP…
代码地址:github.com/google/lasr
视频解读:youtu.be/lac7wqjS-8E

16、Enhancing Photorealism Enhancement

图片

论文链接:vladlen.info/papers/EPE.…
代码地址:github.com/isl-org/Pho…
视频解读:youtu.be/3rYosbwXm1w

17、DefakeHop: A Light-Weight High-Performance Deepfake Detector

图片

论文链接:arxiv.org/abs/2103.06…
视频解读:youtu.be/YMir8sRWRos

18、High-Resolution Photorealistic Image Translation in Real-Time: A Laplacian Pyramid Translation Network

图片

论文链接:arxiv.org/pdf/2105.09…
代码地址:github.com/csjliang/LP…
视频解读:youtu.be/X7WzlAyUGPo

**19、Barbershop: GAN-based Image Compositing using Segmentation Masks
**

图片

论文链接:arxiv.org/pdf/2106.01…
代码地址:github.com/ZPdesu/Barb…
视频解读:youtu.be/HtqYMvBVJD8

**20、TextStyleBrush: Transfer of text aesthetics from a single example
**

图片

论文链接:arxiv.org/abs/2106.08…
代码地址:github.com/facebookres…
视频解读:youtu.be/hhAri5fl-XI

**21、Animating Pictures with Eulerian Motion Fields
**

图片

论文链接:arxiv.org/abs/2011.15…
代码地址:eulerian.cs.washington.edu/
视频解读:youtu.be/KgTa2r7d0I0

**22、CVPR 2021 Best Paper Award: GIRAFFE - Controllable Image Generation
**

图片

论文链接:www.cvlibs.net/publication…
代码地址:github.com/autonomousv…
视频解读:youtu.be/JIJkURAkCxM

**23、GitHub Copilot & Codex: Evaluating Large Language Models Trained on Code
**

图片

论文链接:arxiv.org/pdf/2107.03…
代码地址:copilot.github.com/
视频解读:youtu.be/az3oVVkTFB8

24、Apple: Recognizing People in Photos Through Private On-Device Machine Learning

图片

论文链接:machinelearning.apple.com/research/re…
视频解读:youtu.be/LIV-M-gFRFA

25、Image Synthesis and Editing with Stochastic Differential Equations

图片

论文链接:arxiv.org/pdf/2108.01…
代码地址:github.com/ermongroup/…
视频解读:youtu.be/xoEkSWJSm1k
colab.research.google.com/drive/1KkLS…

26、Sketch Your Own GAN

图片

论文链接:arxiv.org/abs/2108.02…
代码地址:github.com/PeterWang51…
视频解读:youtu.be/vz\_wEQkTLk…

**27、Tesla's Autopilot Explained
**
在今年8月的特斯拉AI日上,特斯拉AI总监Andrej Karpathy和其他人展示了特斯拉是如何通过八个摄像头采集图像,打造了基于视觉的自动驾驶系统。

图片

视频解读:youtu.be/DTHqgDqkIRw

28、Styleclip: Text-driven manipulation of StyleGAN imagery

图片

论文链接:arxiv.org/abs/2103.17…
代码地址:github.com/orpatashnik…
视频解读:youtu.be/RAXrwPskNso
colab.research.google.com/github/orpa…

29、TimeLens: Event-based Video Frame Interpolation

图片

论文链接:rpg.ifi.uzh.ch/docs/CVPR21…
代码地址:github.com/uzh-rpg/rpg…
视频解读:youtu.be/HWA0yVXYRlk

30、Diverse Generation from a Single Video Made Possible

图片

论文链接:arxiv.org/abs/2109.08…
代码地址:nivha.github.io/vgpnn/
视频解读:youtu.be/Uy8yKPEi1dg

31、Skillful Precipitation Nowcasting using Deep Generative Models of Radar

图片

论文链接:www.nature.com/articles/s4…
代码地址:github.com/deepmind/de…
视频解读:youtu.be/dlSIq64psEY

32、The Cocktail Fork Problem: Three-Stem Audio Separation for Real-World Soundtracks

图片

论文链接:arxiv.org/pdf/2110.09…
代码地址:cocktail-fork.github.io/
视频解读:youtu.be/Rpxufqt5r6I

33、ADOP: Approximate Differentiable One-Pixel Point Rendering

图片

论文链接:arxiv.org/pdf/2110.06…
代码地址:github.com/darglein/AD…
视频解读:youtu.be/Jfph7Vld\_N…

34、(Style)CLIPDraw: Coupling Content and Style in Text-to-Drawing Synthesis 图片

CLIPDraw论文链接:arxiv.org/abs/2106.14…
在线试用:colab.research.google.com/github/kvfr…

图片

StyleCLIPDraw论文链接:arxiv.org/abs/2111.03…
在线试用:colab.research.google.com/github/psch…

视频解读:youtu.be/5xzcIzHm8Wo

35、SwinIR: Image restoration using swin transformer

图片

论文链接:arxiv.org/abs/2108.10…
代码地址:github.com/JingyunLian…
视频解读:youtu.be/GFm3RfrtDoU
replicate.ai/jingyunlian…

36、EditGAN: High-Precision Semantic Image Editing

图片

论文链接:arxiv.org/abs/2111.03…
代码地址:nv-tlabs.github.io/editGAN/
视频解读:youtu.be/bus4OGyMQec

37、CityNeRF: Building NeRF at City Scale

图片

论文链接:arxiv.org/pdf/2112.05…
代码地址:city-super.github.io/citynerf/
视频解读:youtu.be/swfx0bJMIlY

38、ClipCap: CLIP Prefix for Image Captioning

图片

论文链接:arxiv.org/abs/2111.09…
代码地址:github.com/rmokady/CLI…
视频解读:youtu.be/VQDrmuccWDo
在线试用:colab.research.google.com/drive/1tuoA…

当然,博主在整理的过程中也不能保证完美。经网友提醒,这里可以手动添加一项突破性研究:「AlphaFold」。

图片

去年,谷歌旗下人工智能技术公司 DeepMind 宣布深度学习算法「Alphafold」破解了出现五十年之久的蛋白质分子折叠问题。2021年7月,AlphaFold 的论文正式发表在《Nature》杂志上。

图片

论文链接:www.nature.com/articles/s4…

这项研究被评为Nature年度技术突破,Alphafold 的缔造者之一 John Jumper 也被评为《Nature》2021 年度十大科学人物。DeepMind也已经将他们的预测结果免费开放给公众。

对于你来说,2021年最令人印象深刻的论文又是哪篇呢?

如果觉得有用,就请分享到朋友圈吧!

最后欢迎大家关注我的微信公众号: 对白的算法屋duibainotes),跟踪NLP、推荐系统和对比学习等机器学习领域前沿,日常还会分享我的创业心得和人生感悟。想进一步交流的同学也可以通过公众号加我的微信,和我一同探讨技术问题,谢谢!