首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
MegEngine
掘友等级
适合工业级研发的开源深度学习框架-旷视天元MegEngine
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
MegEngine Inference 卷积优化之 Im2col 和 winograd 优化
在 CV 领域中,卷积计算是扩充像素的感受野的有效方法,模型大多数的计算量都是卷积操作贡献的。因此在 CV 模型的推理性能优化中,最重要的一项工作是对卷积的优化。
MegPeak——让你更懂你的处理器
在这个算力需求爆炸的大背景下,如何评估我们程序发挥了处理器几成的算力,以及进一步优化空间和优化方向? MegEngine 团队开发了一个工具 MegPeak,可以帮助开发人员进行性能评估,开发指导等。
ARM 算子性能优化上手指南
做 arm 侧算子开发时,不能不关心的就是性能。本文主要就是介绍 arm 算子性能优化的常用思路,做为一个入门级的参考。
实录 | MegEngine 大 Kernel 卷积工程优化实践
本篇整理自 3.19 日 “Large Kernel Makes CNN Great Again” 专题 Meetup 中《MegEngine 大 Kernel 卷积工程优化实践》分享。
全局图优化:提升 MegEngine 模型推理性能的又一神器
深度学习模型的推理性能通常是大家关注的重要指标,这其中 Tensor 的 Layout Format 又是一个高度影响性能的因素。
圆桌实录 | 为什么不约而同选择了大 Kernel
在 3.19 日的 “Large Kernel Makes CNN Great Again” 专题 Meetup 中,我们组织了一次圆桌讨论,希望能通过讨论一些比较有共性的问题,碰撞出新想法。
凭什么 31x31 大小卷积核的耗时可以和 9x9 卷积差不多?| 文末附 meetup 回顾
有学者提出超大 kernel 卷积的网络结构,并证明在目标检测和语义分割等任务上超过 Swin Transformer 而且远超传统小卷积模型。
MegEngine Windows Python wheel 包减肥之路
本文将讲述在支持 MegEngine Windows Python wheel 过程中遇到的问题以及解决问题的流程。此文最后的解决方法可能不是最优,欢迎留言指正。
MegEngine 端上训练:让 AI 懂你,更能保护你
如何让 AI 算法更精准地理解用户喜好又能保证用户数据安全呢?一个直观的想法就是直接在手机上进行模型训练,这样既避免了数据传输可能带来的泄露风险,又能不断提升模型性能。
深入理解混合精度训练:从 Tensor Core 到 CUDA 编程
本文以混合精度训练为切入点,深入挖掘了其背后的 Tensor Core 的原理,并从 CUDA 接口和深度学习框架开发两个层面介绍如何利用 Tensor Core 进行计算加速,最终回归到混合精度训练
下一页
个人成就
文章被点赞
114
文章被阅读
108,552
掘力值
2,546
关注了
2
关注者
57
收藏集
0
关注标签
6
加入于
2020-12-28