首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
AI布道Mr_Jin
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
AI布道Mr_Jin
2月前
关注
MindIE-LLM ATB模型推理全流程解析
最近,有很多小伙伴问我,如果他们想自己基于MindIE镜像中的文件适配新模型,可以怎么做? 为了实现这个目标,首先需要了解MindIE-LLM模型在推理过程中的代码调用流程...
0
评论
分享
AI布道Mr_Jin
2月前
关注
MindIE DeepSeek MTP特性定位策略
最近MindIE开始支持DeepSeek MTP(multi token prediction)特性了,用于推理加速。但是有些开发者打开MTP开关后,没有发现明显的性能提升...
0
评论
分享
AI布道Mr_Jin
2月前
关注
DeepSeek-R1源码解读
最近和开发者做了很多DeepSeek-R1模型相关的推理项目,这两天抽时间把hugging face上面的源码拉下来仔细看了一遍,在这里做一个分享。主要是解析MOE部分的代...
0
评论
分享
AI布道Mr_Jin
2月前
关注
昇腾训练建链超时定位策略
使用torch+mindspeed训练时,可能出现类似“wait socket establish timeout, role[0] rank[1] timeout[120...
0
评论
分享
AI布道Mr_Jin
3月前
关注
《Mooncake: A KVCache-centric Disaggregated Architecture for LLM Serving》阅读笔记
最近昇腾提供的大EP PD分离推理解决方案非常火,很多开发者都开始使用了。正好这两天也看了一篇PD分离的经典论文,就是Kimi采用的PD分离架构:Mooncake。 ## ...
0
评论
分享
AI布道Mr_Jin
3月前
关注
MindIE PD分离部署Q&A
PD分离是一种近年来兴起的推理加速部署方案,kimi、deepseek都进行了工程落地。昇腾MindIE组件也支持了PD分离部署能力,参考链接为 https://www.h...
0
评论
分享
AI布道Mr_Jin
3月前
关注
attention计算过程的一些细节
最近,有粉丝问我,attention结构中计算qkv的时候,为什么要做kvcache呢?他看了一些文章,没看懂。 ### 为什么要做kvcache? 假设模型的输入序列长度...
0
评论
分享
AI布道Mr_Jin
4月前
关注
qwen模型 MindIE PD分离部署问题定位
## 背景 使用MindIE提供的PD分离特性部署qwen2-7B模型,使用k8s拉起容器,参考这个文档进行部署:https://www.hiascend.com/docu...
0
评论
分享
AI布道Mr_Jin
4月前
关注
DeepSeek模型MOE结构代码详解
其实在DeepSeek-R1爆火之前,DeepSeek V2在我们行业就已经妇孺皆知了,它独特的MOE结构值得研究一下。这篇文章是基于 ZOMI酱 的2个视频写的,这2个视...
0
1
分享
AI布道Mr_Jin
5月前
关注
MindIE LLM场景快速上手实验
MindIE是昇腾自研推理框架,本实验手册可指导小白用户快速掌握MindIE在LLM(large language model)场景的基本功能,包括:大模型推理功能测试、大...
0
评论
分享
AI布道Mr_Jin
5月前
关注
昇腾 msmodelslim w8a8量化代码解析
最近有很多朋友都在部署deepseek模型,而且都用到了模型量化这个功能,目的是减少显存占用、提升推理速度。 :基于 Conformer 和 Transformer 模型的中文语音识别
欢迎学习《基于 Conformer 和 Transformer 模型的中文语音识别》实验。本案例旨在帮助你深入了解如何运用深度学习模型搭建一个高效精准的语音识别系统,将中文...
0
评论
分享
AI布道Mr_Jin
7月前
关注
mindspeed-llm源码解析(一)preprocess_data
mindspeed-llm是[昇腾模型套件代码仓](https://link.zhihu.com/?target=https%3A//gitee.com/ascend/Mi...
0
评论
分享
AI布道Mr_Jin
7月前
关注
昇腾集群PFC现象分析
# 一、PFC产生原因 负责集群运维的同学可能都遇到过PFC现象,那么PFC到底是啥?产生原因是什么?这篇文章提供了一些分析。 首先,参考[官网文档](https://li...
0
评论
分享
AI布道Mr_Jin
7月前
关注
Torch-npu报错定位技巧
使用torch-npu的报错定位思路。一共介绍了10个左右的案例,通过这些案例讲解技巧具体怎么使用。...
0
评论
分享
AI布道Mr_Jin
7月前
关注
昇腾AI行业案例(六):基于 PraNet 的医疗影像分割
 ## 00 - 前言 #...
0
评论
分享
下一页
个人成就
文章被阅读
1,704
掘力值
254
关注了
0
关注者
2
收藏集
0
关注标签
0
加入于
2024-12-16