首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
猛猿
掘友等级
🏆掘金签约作者|人工智能方向
填坑工程师。 分享技术笔记,也分享转行故事。希望朋友们在学习和写码的道路上不孤单。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
41
文章 41
沸点 0
赞
41
返回
|
搜索文章
猛猿
🏆掘金签约作者|人工智能方向
·
9月前
关注
图解大模型训练之:数据并行下篇( DeepSpeed ZeRO,零冗余优化)
在上篇介绍中,通讯负载不均的优化我们解释过了,但还遗留了一个显存开销问题:数据并行中,每个GPU上都复制了一份完整模型,当模型变大时,很容易打爆GPU的显存,那要怎么办呢?...
0
评论
分享
猛猿
🏆掘金签约作者|人工智能方向
·
9月前
关注
图解大模型训练之:数据并行上篇(DP, DDP与ZeRO)
今天我们来介绍一种应用最广泛,最易于理解的并行范式:数据并行。 数据并行的核心思想是:在各个GPU上都拷贝一份完整模型,各自吃一份数据,算一份梯度,最后对梯度进行累加来更新...
0
评论
分享
猛猿
🏆掘金签约作者|人工智能方向
·
9月前
关注
图解大模型训练之:流水线并行(Pipeline Parallelism),以Gpipe为例
本篇文章将探索流水线并行,经典的流水线并行范式有Google推出的Gpipe,和微软推出的PipeDream。两者的推出时间都在2019年左右,大体设计框架一致。主要差别为...
0
评论
分享
猛猿
赞了这篇文章
月球背面
1年前
关注
一文详解轻量化卷积神经网络ShuffleNet V1
今天给小伙伴介绍一个轻量化的卷积神经网络——ShuffleNet V1,它特别设计用于在资源受限的设备上进行高效的图像分类任务,采用了一些创新设计来减少模型计算量和参数量,...
8
2
分享
猛猿
赞了这篇文章
秃头小苏
🏆掘金签约作者 3D视觉开发者社区优质内容博主 阿里云博客专家
·
1年前
关注
CVer从0入门NLP(三)———GPT、BERT模型
Hello,大家好,祝JYM中秋快乐,阖家团圆。节前最后一篇,陪你走到最后一刻。🥗🥗🥗本节将为大家介绍GPT和BERT的原理,一起来学学叭。🍚🍚🍚...
13
8
分享
猛猿
🏆掘金签约作者|人工智能方向
·
1年前
关注
CV大模型系列之:打败VIT?Swin Transformer是怎么做到的
一文详细图解Swin Transformer架构,探索移动窗口attention、patch merging、patch partition等技术细节...
6
评论
分享
猛猿
赞了这篇文章
吃果冻不吐果冻皮
🏆掘金签约作者|人工智能方向
·
1年前
关注
大模型分布式训练并行技术(六)-多维混合并行
近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单卡...
10
2
分享
猛猿
赞了这篇文章
月球背面
1年前
关注
AI精炼术:利用PyTorch实现MNIST数据集上的知识蒸馏
上期介绍了知识蒸馏的核心原理,一句话概括——将教师模型的知识通过soft targets传递给学生模型。今天就来实战一下,看看教师模型、学生模型是怎样用代码构建的,学习如何...
23
13
分享
猛猿
赞了这篇文章
秃头小苏
🏆掘金签约作者 3D视觉开发者社区优质内容博主 阿里云博客专家
·
1年前
关注
CVer从0入门NLP(一)———词向量与RNN模型
NLP的内容很多,你如果在网上搜NLP学习路线的话你会看的眼花缭乱,本系列主要会介绍一些重要的知识点,一些老模型就不介绍了,感觉用处不大,我们的目标是向经典模型看齐,如GP...
39
21
分享
猛猿
🏆掘金签约作者|人工智能方向
·
1年前
关注
CV大模型系列之:GAN,博弈论下的一个实例
对比扩散模型DDPM,配合详细的图例,具象化地数学原理解读,带大家从博弈论双人游戏的视角,重新了解一次GAN...
58
16
分享
猛猿
赞了这篇文章
月球背面
1年前
关注
训练自己的多目标跟踪特征提取网络——DeepSort代码篇
上期给小伙伴讲解了多目标追踪DeepSort算法的基本原理与工作流程。但读万卷书也要走万里路,只懂书本上的原理是万万不够滴,所以本期就带来了DeepSort的代码讲解,包括...
7
5
分享
猛猿
🏆掘金签约作者|人工智能方向
·
1年前
关注
CV大模型系列之:DALLE2,OpenAI文生图代表作解读
在CV大模型系列中,我们介绍了扩散模型的运作原理介绍了Transformer架构下做CV任务的方法,也介绍了多模态大模型CLIP。有了这么多的前置知识,今天,我们终于可以来...
6
评论
分享
猛猿
赞了这篇文章
秃头小苏
🏆掘金签约作者 3D视觉开发者社区优质内容博主 阿里云博客专家
·
1年前
关注
深度学习模型部署篇——利用Flask实现深度学习模型部署(三)
在前面两节,我为大家介绍了如何将pytocrh模型转换成ONNX格式,进而提高深度学习模型部署速度, 在评论区有小伙伴们问,如何进行服务化,那么今天就为大家介绍介绍通过Fl...
24
11
分享
猛猿
赞了这篇文章
秃头小苏
🏆掘金签约作者 3D视觉开发者社区优质内容博主 阿里云博客专家
·
1年前
关注
深度学习模型部署篇——从0部署深度学习分类模型(二)
七夕来了,让我看看不发文章的都在干嘛🎀🎀🎀🎀🎀🎀🎀🎀🎀我猜.......不可能是...... 今天继续为大家带来深度学习模型部署篇——从0部署深度学习分类...
20
14
分享
猛猿
🏆掘金签约作者|人工智能方向
·
1年前
关注
CV大模型系列之:MoCo v1,利用对比学习在CV任务上做无监督训练
MoCo v1(Momentum Contrast,v1版),一种在CV任务上,通过对比学习(contrast learning)做无监督(unsupervised)训练的...
11
2
分享
猛猿
赞了这篇文章
月球背面
1年前
关注
详解pix2pix图像转译模型——原理+效果图
上次给大家介绍了CycleGAN,那么必提起的就是pix2pix,作为图像生成和图像转译领域的必学经典,同时也是让人拍案叫绝的两个算法。pix2pix在语义标签图转真实图片...
7
2
分享
猛猿
赞了这篇文章
秃头小苏
🏆掘金签约作者 3D视觉开发者社区优质内容博主 阿里云博客专家
·
1年前
关注
深度学习模型部署篇——从0部署深度学习分类模型(一)
深度学习模型部署篇——从0部署深度学习分类模型🥗🥗🥗今天准备来给大家介绍介绍我们如何来部署我们训练的深度学习分类模型。...
25
4
分享
猛猿
🏆掘金签约作者|人工智能方向
·
1年前
关注
CV大模型系列之:MAE,实现像素级图像重建
本文将介绍,如何基于Transformer架构,借鉴Bert的基本思想,做基于像素级别的图像重建任务。...
12
6
分享
猛猿
赞了这篇文章
秃头小苏
🏆掘金签约作者 3D视觉开发者社区优质内容博主 阿里云博客专家
·
1年前
关注
深度学习语义分割篇——LR-ASPP原理详解+源码实战
这篇文章给大家带来语义分割系列文章LR-ASPP的原理详解和源码实战,大家快来玩玩叭~~~🌸🌸🌸...
10
5
分享
猛猿
赞了这篇文章
吃果冻不吐果冻皮
🏆掘金签约作者|人工智能方向
·
1年前
关注
大模型分布式训练并行技术(三)-流水线并行
近年来,随着Transformer、MOE 架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单...
8
评论
分享
下一页
个人成就
文章被点赞
264
文章被阅读
77,065
掘力值
1,628
关注了
10
关注者
280
收藏集
0
关注标签
12
加入于
2023-03-28