首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
用户867573478982
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
MindSpore从入门到精通:梯度截断、Stop Gradient 与辅助数据梯度处理最佳实践
本文将讲解 MindSpore 中两个高频核心知识点: Stop Gradient 梯度截断:屏蔽指定张量的梯度回传,消除无关张量对梯度计算的影响; has_aux 辅助数据参数:自动处理多输出函数
MindSpore 大模型高效微调进阶:LoRA/QLoRA 分层适配 + 增量预训练的低显存实践
本次分享基于 MindSpore 的参数高效微调(PEFT)能力,构建 “分层 LoRA/QLoRA 微调 + EWC 遗忘抑制 + 增量预训练协同优化” 的工业级方案,实现单卡(A10 24G)完
昇思MindSpore实战经验:从模型训练到边缘部署全流程解析
1 引言:为什么选择昇思MindSpore? 昇腾AI处理器采用达芬奇架构,与MindSpore框架深度协同,提供了软硬件一体化的高性能计算体验。特别是在当前GPU资源紧张的大环境下,昇腾平台凭借其
基于 MindSpore 的高效分布式训练:自动并行技术深度解析
随着深度学习模型参数量的指数级增长,单卡显存已无法满足大模型的训练需求。在昇腾(Ascend)AI 处理器上,MindSpore 框架凭借其独特的 自动并行(Auto Parallelism)能力,极
MindSpore 进阶:在 Ascend NPU 上构建高效的自定义训练步 (TrainOneStep)
在深度学习的实际工程落地中,这时候往往发现官方封装好的 Model.train接口虽然方便,但在处理一些复杂的算法逻辑(如 GAN、强化学习或这就需要我们在 Ascend NPU 上进行自定义训练循环
MindSpore 长文本开发全景入门
大模型进入“长上下文”时代:32 k、128 k 乃至 1 M token 的模型陆续开源。华为全场景 AI 框架 MindSpore 在 2.3 LTS 版本后,对长文本场景做了三点关键升级: A
MindSpore 大模型训练进阶:高效显存管理 + 增量式断点续训的实践
在千亿参数大模型(如 LLaMA-7B/13B)的训练场景中,显存瓶颈与训练中断恢复是两大核心痛点 —— 前者直接限制模型规模,后者会导致工业级训练的时间与算力成本翻倍。本次分享基于 MindSpo
MindSpore 可信 AI 进阶:区块链 + 零知识证明的模型溯源与隐私验证实践
在金融风控、政务数据共享等强监管场景下,AI 模型的训练过程可追溯、推理结果可验证是落地核心要求。本次分享基于 MindSpore 与区块链技术栈,构建 “模型全生命周期上链存证 + 零知识证明(Z
MindSpore实战:昇腾NPU上的深度学习模型优化全记录
1 引言:为何选择MindSpore与昇腾生态 作为一名长期从事计算机视觉应用的开发者,我最近全面转向华为的MindSpore深度学习框架与昇腾NPU硬件平台。这一选择不仅源于对国产AI生态的支持,
MindSpore网络构建实用训练:提升训练速度
1.1数据集下沉:MindSpore 专属提速方案,大幅提升训练速度 在实际的深度学习项目落地中,完成基础的模型训练流程只是第一步,我们还需要针对训练效率和模型效果做针对性优化:训练速度过慢会增加开
下一页
个人成就
文章被点赞
1
文章被阅读
11,665
掘力值
269
关注了
0
关注者
0
收藏集
0
关注标签
7
加入于
2022-01-21