模型量化 - 悠悠同学的收藏集 - 掘金

模型量化

更多收藏集

4篇文章 · 0订阅

综述论文：当前深度神经网络模型压缩和加速方法速览

大型神经网络具有大量的层级与结点，因此考虑如何减少它们所需要的内存与计算量就显得极为重要，特别是对于在线学习和增量学习等实时应用。此外，近来智能可穿戴设备的流行也为研究员提供了在资源（内存、CPU、能耗和带宽等）有限的便携式设备上部署深度学习应用提供了机会。高效的深度学习方法可…

机器之心
8年前
904
6
评论

Pytorch实现量化感知训练QAT(一)

很久没更新文章了,小伙伴是不是有点想我呢? 小林最近在搞训练感知量化的东西, 这玩意比那些后处理量化方案靠谱多了, 比你把float32的模型转到tensorrt,再在tensorrt上做量化靠谱. 有人可能会问了, 你说的靠谱到底体现在哪儿? 简单来说有这么几点: 众所周知,…

vsdfzgnb
5年前
3.2k
1
3

工程之道，深度学习的工业级模型量化实战

MegEngine提供从训练到部署完整的量化支持，包括量化感知训练以及训练后量化，凭借“训练推理一体”的特性，MegEngine更能保证量化之后的模型与部署之后的效果一致。本文将简要介绍神经网络量化的

MegEngine
5年前
325
点赞
评论

量化感知训练实践：实现精度无损的模型压缩和推理加速

简介：本文以近期流行的YOLOX[8]目标检测模型为例，介绍量化感知训练的原理流程，讨论如何实现精度无损的实践经验，并展示了量化后的模型能够做到精度不低于原始浮点模型，模型压缩4X、推理加速最高2.3

阿里云云栖号
4年前
2.5k
2
评论

量化感知训练实践：实现精度无损的模型压缩和推理加速