首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Albert_Liyan
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
OCR-推理优化
Nsight Systems nsys status -e #示例,产生的nsight_validate3下载到本地用nsight工具查看 nsys profile -o nsight_validat
LLM系列-大模型加速库
ModelLink:端到端的大语言模型方案, 包含模型,算法,以及下游任务 https://gitee.com/ascend/ModelLink 大模型加速库(多张计算卡进行计算)第三方大模型加速库:
vLLM系列-框架介绍
vLLM代码及逻辑介绍 参考: https://zhuanlan.zhihu.com/p/675322419
量化框架对比
BMCook(面向大模型NLP) TingHua 量化、剪枝、知识蒸馏 (只实现1个基本功能) 知识蒸馏: Hidden states MSE(业内通用机制) DeepSpeed 框架重点关注大模型在
算子-单算子ScatterElements
``` import onnx from onnx import helper from onnx import TensorProto # 创建一个空的ONNX图 graph = helper.ma
Triton架构和工作流程
Target: 理解triton的架构和工作过程 overview design basic,并非软件库,偏应用型的软件 辅助功能 上手材料 ** 大厂自研推理框架 vs Triton 1 快速认识t
深度学习-路线
deeplearning AI路线 理论基础 1 【暂时不看】吴恩达《Machine Learning》 课程视频+中文笔记 https://github.com/fengdu78/Coursera-
node.js开发介绍
概念 Node.js, 简称Node,可以使js运行在服务器端的平台 1 Addons 插件、扩展,本质是C++动态链接库,提供js和C++ libs间的接口 2 动态链接库,运行时动态加载的库,例如
模型压缩-神经网络基础
zero-shot vs few-shot zero-shot: 给出简单的任务描述,模型推理结果,没有微调。 few-shot:任务描述+示例 SpAtten: Efficient Sparse A
模型压缩-pruning
Introduction Pruning 1 什么是pruning 移除神经网络的突触、神经元,以使得神经网络更小。 在CV领域,AlexNet、VGG、GoogleNet等网络上可以达到模型大小减小
下一页
个人成就
文章被点赞
4
文章被阅读
15,443
掘力值
706
关注了
1
关注者
1
收藏集
0
关注标签
0
加入于
2024-03-03