论文笔记(7)NeuLens

326 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第7天,点击查看活动详情

本文是NeuLens: Spatial-based Dynamic Acceleration of Convolutional Neural Networks on Edge的学习笔记。

问题

spatial redundancy,即图片上的冗余信息限制了 CNN 运算速度

解决方案

ARAC supernet,被分割出的每块图像采用压缩程度不同的子网进行处理

our work proposes a novel computing flow, ARAC supernet, to tackle spatial redundancy. By splitting the input images into tiles, we select different sub-networks in supernet based on their contents.

our ARAC supernet implements a dynamic mechanism by breaking inputs into tiles and processes them with different compressed sub-networks based on spatial redundancy.

our work also addresses adaptability to platforms and SLOs.

image.png

输入图片分割为多个 tiles,每个 tile 采用压缩程度不同的 CNN 进行处理,最终都得到了正确的识别结果。

image.png

N 层的 CNN 模型,前 P 层改为 ARAC Supernet,剩下 N - P 层保留。

前 P - 1 层使用通道剪枝等方式压缩到不同的 compression levels

image.png

Supernet generation

N 层的 CNN 离线训练出 R 个压缩模型 通过 channel slicing 进行 ensemble

超网的训练类似于 IEB 中的方式 -

CGG

目的:为了给图片上分割出来的每个小区域贴上压缩等级标签,即在不影响目标检测结果的基础上,每个 tile 最大的允许压缩程度。

方法:如下图,初始压缩度全部设为最小值,这里 c1<c2<...c_1 < c_2 < ...,如果某个 tile 压缩后不影响结果准确率,则尝试增加压缩度(下图向下流动),否则锁定该 tile 压缩度(下图向右流动),直到所有 tile 被锁定。

image.png

CLG

目的:CGG 在选择压缩等级的时候不考虑时间和内存的限制,CLG 能够在线调整压缩等级以满足限制

方法:confidence-based stepping (CS)

DEMUX

image.png

DEMUX 由 CGG、CLG、Latency Predictor、Memory Predictor 和 Accuracy Comparator 组成。

Latency Predictor、Memory Predictor:训练的轻量线性回归模型

补充知识

通道剪枝

image.png