携手创作，共同成长！这是我参与「掘金日新计划 · 8 月更文挑战」的第30天，点击查看活动详情

ShowMeAI日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点击查看 历史文章列表，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。

📢 太过分！虾皮Shopee新加坡被曝大范围毁约，马上入职被收回offer，猝不及防

Shopee 是新加坡互联网集团SEA旗下的明星公司，在东南亚的电商业务领域大杀四方，能在多个市场压制阿里旗下的 Lazada，承担着『东南亚最像中国互联网大厂的超级公司』期待，也成为中国互联网人才涌入新加坡最热门的目的地。

然而，不少求职者在脉脉爆出，自己临近入职却被 Shopee 通知收回 Offer。签了合同，拿了签证，租了房子，买了机票，甚至已经落地新加披，工作却没了。签证、工作、回国成本等问题都很棘手，完全措手不及。

工具&框架

🚧 『lm-debugger』用于检查和调整基于transformer语言模型的交互式工具

github.com/mega002/lm-…

LM-Debugger 是一个开源的交互式工具，用于检查和调整基于 transformer 的语言模型。GitHub 上的资源库包括在 GPT2 Large 和 GPT2 Medium 上运行 LM-Debugger 所需的代码和数据文件的链接，它可以快速适应于其他模型，只需要改变后台的 API。

🚧 『camviz』单目深度估计结果可视化库

github.com/TRI-ML/camv…

www.tri.global/

CamViz 是一个由TRI-ML团队开发的可视化库，目的是为单目深度估计结果的可视化提供一个接口，包括深度图和重建的点云。它使用PyGame进行窗口显示和输入管理，并使用OpenGL进行二维和三维绘图和渲染。它提供了一种简单而直观的方式将信息存储为纹理和数据缓冲区，以便高效显示，也能快速创建用于图像显示的2D环境和用于点云可视化的3D环境。

🚧 『surgeon-pytorch』检视PyTorch模型中间层的工具库

github.com/archinetai/…

surgeon-pytorch 是一个辅助工具库，可以在不修改代码的情况下检查 PyTorch 模型的中间层。这对于获取语言模型的注意矩阵、可视化层嵌入或对中间层应用损失函数都是很有用的。它还支持提取模型的子部分，并独立运行、调试或者训练它们。借助 Surgeon 可以快速完成上述任务，无需改变原始模型的任何一行。

🚧 『xh』Rust写的用来发送HTTP请求的友好快速的工具

github.com/ducaale/xh

xh是一个友好和快速发送HTTP请求的工具。它重新实现了HTTPie的优秀设计，重点是提高性能。

🚧 『FerretDB』类似MongoDB的开源数据服务 · 4.7k Stars

github.com/FerretDB/Fe…

www.ferretdb.io/

MongoDB 是一项改变许多开发者生活的技术，使他们能够比使用关系型数据库更快地构建应用程序。然而 MongoDB 放弃了它的开源根基，将许可证改为 SSPL，使其无法用于许多开源和商业项目。对于那些习惯使用 MongoDB 的开发者来说，FerretDB 是一个完美的解决方案，可视作可替代 MongoDB 的开源软件。

博文&分享

👍 『Sketching Algorithms for Big Data』大数据算法基础课·笔记集锦

www.sketchingbigdata.org/fall17/lec/

👍 『剑指 Offer』Python/Java/C++解题代码，『LeetBook 图解算法数据结构』配套代码

github.com/krahets/Lee…

LeetBook《图解算法数据结构》面向算法初学者、互联网求职者设计，主要内容包括：剑指 Offer 图文题解、数据结构与算法专栏。作者将内容整理成『剑指 Offer 一个月刷题计划』，核心理念为从易到难、从基础类题目到综合类题目，可以按照知识点类型顺序刷题，一个月搞定！

数据&资源

🔥 『MedMCQA』大规模多项选择题问答数据集，旨在解决现实世界的医学入学考试问题

github.com/medmcqa/med…

medmcqa.github.io/

MedMCQA 拥有超过 19.4万个高质量的 AIIMS 和 NEET PG入学考试题，每个样本都包含一个问题、正确答案和其他需要更深入的语言理解的选项，为自然语言处理社区提供了一个开源数据集。

数据集涵盖 2.4k 个医疗保健主题，收集了麻醉、解剖学、生物化学、牙科、耳鼻喉科、眼科、骨科、儿科、精神病学、放射学等 21 个医学主题，主题多样性很高。

🔥 『Efficient Deep Learning』高效深度学习：深度学习过程加速技巧集

github.com/Mountchicke…

深度学习飞速发展，吸引着越来越多的学习者和从业者涌向了这个领域。作者整理汇总了自己在深度学习的过程中遇到了各种各样的问题和解决方案，让你获取高效深度学习的技巧。

Repo 包含高效编码的策略、高效数据处理的策略、加快训练过程的策略、提高 GPU 利用率的策略、有用工具的列表等6个部分，每个部分包含几篇文章，详细讲解各主题的技巧细节。

研究&论文

公众号回复关键字日报，免费获取整理好的论文合辑。

科研进展

2022.07.25 『图像超分辨率变换』 Reference-based Image Super-Resolution with Deformable Attention Transformer

2022.07.30 『数据提炼』Delving into Effective Gradient Matching for Dataset Condensation

2022.07.20 『联邦学习』FedDM: Iterative Distribution Matching for Communication-Efficient Federated Learning

2022.07.28 『目标检测』HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

⚡ 论文：Reference-based Image Super-Resolution with Deformable Attention Transformer

论文时间：25 Jul 2022

领域任务：Image Super-Resolution，图像超分辨率变换

论文地址：arxiv.org/abs/2207.11…

代码实现：github.com/caojiezhang…

论文作者：JieZhang Cao, Jingyun Liang, Kai Zhang, Yawei Li, Yulun Zhang, Wenguan Wang, Luc van Gool

论文简介：Reference-based image super-resolution (RefSR) aims to exploit auxiliary reference (Ref) images to super-resolve low-resolution (LR) images./基于参考的图像超分辨率（RefSR）旨在利用辅助参考（Ref）图像来超解低分辨率（LR）图像。

论文摘要：基于参考的图像超分辨率（RefSR）旨在利用辅助参考（Ref）图像来超解低分辨率（LR）图像。最近，RefSR已经引起了极大的关注，因为它提供了一种超越单幅图像SR的替代方法。然而，解决RefSR问题有两个关键的挑战：（i）当LR图像和参考图像有明显的不同时，很难匹配它们之间的对应关系；（ii）如何从参考图像中转移相关纹理以补偿LR图像的细节是非常具有挑战性的。为了解决RefSR的这些问题，本文提出了一种具有多个尺度的可变形注意力Transformer，即DATSR，每个Transformer由纹理特征编码器（TFE）模块、基于参考的可变形注意力（RDA）模块和残余特征聚合（RFA）模块组成。具体来说，TFE首先为LR和Ref图像提取对图像变换（如亮度）不敏感的特征，然后RDA可以利用多种相关纹理来补偿LR特征的更多信息，最后RFA将LR特征和相关纹理聚合起来，得到视觉上更愉悦的结果。广泛的实验表明，我们的DATSR在数量和质量上都达到了基准数据集的最先进性能。

⚡ 论文：Delving into Effective Gradient Matching for Dataset Condensation

论文时间：30 Jul 2022

领域任务：Dataset Condensation，数据提炼

论文地址：arxiv.org/abs/2208.00…

代码实现：github.com/Guang000/Aw…

论文作者：Zixuan Jiang, Jiaqi Gu, Mingjie Liu, David Z. Pan

论文简介：In this work, we delve into the gradient matching method from a comprehensive perspective and answer the critical questions of what, how, and where to match./在这项工作中，我们从一个全面的角度深入研究了梯度匹配方法，并回答了什么、如何以及在哪里匹配等关键问题。

论文摘要：随着深度学习模型和数据集的迅速扩大，网络训练是非常耗时和资源成本的。与其在整个数据集上进行训练，用一个小的合成数据集进行学习成为一个有效的解决方案。在数据集提炼的方向上已经进行了广泛的研究探索，其中梯度匹配取得了最先进的性能。梯度匹配方法通过在原始数据集和合成数据集上训练时的梯度匹配直接针对训练动态。然而，对这种方法的原理和效果的深入研究是有限的。在这项工作中，我们从全面的角度深入研究梯度匹配方法，并回答了匹配什么、如何匹配、在哪里匹配等关键问题。我们提出，多级梯度的匹配要同时涉及类内和类间的梯度信息。我们证明了距离函数应该集中在角度上，同时考虑幅度以延迟过拟合。我们还提出了一个过拟合感知的自适应学习步骤策略，以修剪不必要的优化步骤，提高算法效率。消融和比较实验表明，与先前的工作相比，我们提出的方法显示出更高的准确性、效率和通用性。

⚡ 论文：FedDM: Iterative Distribution Matching for Communication-Efficient Federated Learning

论文时间：20 Jul 2022

领域任务：Federated Learning, Image Classification，联邦学习，图像分类

论文地址：arxiv.org/abs/2207.09…

代码实现：github.com/Guang000/Aw…

论文作者：Yuanhao Xiong, Ruochen Wang, Minhao Cheng, Felix Yu, Cho-Jui Hsieh

论文简介：Federated learning~(FL) has recently attracted increasing attention from academia and industry, with the ultimate goal of achieving collaborative training under privacy and communication constraints./联邦学习~(FL)最近引起了学术界和工业界越来越多的关注，其最终目标是在隐私和通信约束下实现协作训练。

论文摘要：联邦学习~(FL)最近吸引了学术界和工业界越来越多的关注，其最终目标是在隐私和通信约束下实现协作训练。现有的基于迭代模型平均化的FL算法需要大量的通信回合来获得一个表现良好的模型，这是因为不同client之间的数据划分极不平衡且非i.i.d。因此，我们提出了FedDM，从多个本地代理函数中建立全局训练目标，这使得服务器能够获得一个更全局的损失景观。详细来说，我们在每个client上构建合成的数据集，通过分布匹配与原始数据的损失景观进行局部匹配。与笨重的模型权重相比，FedDM通过传输更多信息和更小的合成数据，减少了通信回合，提高了模型质量。我们在三个图像分类数据集上进行了广泛的实验，结果表明，我们的方法在效率和模型性能方面可以超过其他FL对应的方法。此外，我们证明FedDM可以适应高斯机制，以保护差异化的隐私，并在相同的隐私预算下训练一个更好的模型。

⚡ 论文：HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

论文时间：28 Jul 2022

领域任务：Image Classification, object-detection, 图像分类，目标检测

论文地址：arxiv.org/abs/2207.14…

代码实现：github.com/raoyongming…

论文作者：Yongming Rao, Wenliang Zhao, Yansong Tang, Jie zhou, Ser-Nam Lim, Jiwen Lu

论文简介：In this paper, we show that the key ingredients behind the vision Transformers, namely input-adaptive, long-range and high-order spatial interactions, can also be efficiently implemented with a convolution-based framework./在本文中，我们展示了视觉Transformers背后的关键成分，即输入自适应、长距离和高阶空间互动，也可以通过基于卷积的框架有效实现。

论文摘要：最近在视觉Transformers方面取得的进展显示，在基于点积自我注意的新空间建模机制的驱动下，在各种任务中取得了巨大的成功。在本文中，我们展示了视觉Transformers背后的关键成分，即输入自适应、长距离和高阶空间互动，也可以通过基于卷积的框架有效地实现。我们提出了递归门控卷积（gnConv），用门控卷积和递归设计来执行高阶空间互动。新的操作是高度灵活和可定制的，它与卷积的各种变体兼容，并将自我注意中的两阶互动扩展到任意的阶数，而不引入大量的额外计算。gnConv可以作为一个即插即用的模块来改进各种视觉Transformers和基于卷积的模型。基于该操作，我们构建了一个新的通用视觉骨干系列，名为HorNet。在ImageNet分类、COCO物体检测和ADE20K语义分割上的大量实验表明，HorNet在整体架构和训练配置相似的情况下，比Swin Transformers和ConvNeXt要好得多。HorNet还显示了对更多训练数据和更大模型规模的有利可扩展性。除了在视觉编码器中的有效性外，我们还表明gnConv可以应用于特定任务的解码器，并以较少的计算量持续提高密集预测性能。我们的结果表明，gnConv可以成为一个新的视觉建模的基本模块，有效地结合了视觉变形器和CNN的优点。代码可在 github.com/raoyongming… 获取。

我们是 ShowMeAI，致力于传播AI优质内容，分享行业解决方案，用知识加速每一次技术成长！点击查看 历史文章列表，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。

作者：韩信子@ShowMeAI
历史文章列表
专题合辑&电子月刊
欢迎回复，拜托点赞，留言推荐中有价值的文章、工具或建议，我们都会尽快回复哒~

过分！虾皮被曝大范围毁约；深度学习技巧全辑；MongoDB开源替代 4.7K★；剑指Offer解题代码；大数据算法笔记汇总；前沿论文 |ShowMeAI资讯日报