首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
重庆黑敬亭
掘友等级
架构建模
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
算子融合
在专栏CUDNN中,可以看到CUDNN库提供了许多算子,并且有着大量的优化,这里面主要的方法就是算子融合。本文讨论一下算子融合的原理与一些开源实现方式。
CUDNN 9 (5) Backend Descriptor Types & Frontend v1.0 API Examples
FE 和backend APIs 都是同一组功能(Graph API)的入口点。本文介绍使用backend API、FE v1.0 API的用例。
CUDNN 9 (4) Graph API Engines
cuDNN Graph API 支持一组图形模式(graph patterns),这些模式由大量引擎支持。
CUDNN 9 (3) Frontend API example
cuDNN FrontEnd(FE) API 是一个包含 cuDNN C 后端 API 的 C++ header-only library。
CUDNN 9 (2) Graph API
cuDNN 库提供了一个声明性编程模型,用于将计算描述为操作图。Graph API 是在 cuDNN 8.0 中引入的,以提供更灵活的 API
CUDNN 9 (1)核心概念介绍
本系列主要介绍CUDNN 8之后版本推出的Graph模式,包括核心概念、Graph API的介绍、Op Fusion的介绍与代码示例等。 主要参考了cudnn的官方文档
CUDNN例程解析 mnistCUDNN
本文介绍了cudnn的官方例程中mnistCUDNN的代码解读,主要是熟悉一下使用cudnn库的基本流程。
OS、HAL、Driver的关系
OS、HAL、Driver的关系介绍,以及应用程序在计算机的执行流程。 硬件抽象层(HAL)、驱动程序(Driver)、和操作系统(OS)之间的关系构成了软件与硬件交互的基础框架。
OpenVX介绍与Build on Linux
OpenVX™ 是一种开放、免版税的计算机视觉应用跨平台加速标准。 OpenVX 可实现性能和功耗优化的计算机视觉处理,这在嵌入式和实时用例中尤其重要。
Quantization and Training of Neural Networks for Efficient Integer Inference
模型量化论文 Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference
下一页
个人成就
文章被点赞
2
文章被阅读
6,029
掘力值
205
关注了
2
关注者
3
收藏集
1
关注标签
14
加入于
2023-12-20