首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
深度学习基础原理
Big_Yellow_J
创建于2025-05-02
订阅专栏
主要介绍深度学习中的基础原理以及代码实战,是入门深度学习的不二之选
等 1 人订阅
共8篇文章
创建于2025-05-02
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
深度学习学习率优化方法——pytorch中各类warm up策略
warm-up具体原理以及为什么这么做在之前的博客有介绍,这里直接介绍如何直接使用pytorch中的warm-up策略,在pytorch中对于warm-up所有支持的方法都有描述
深入探讨Attention变种与内存优化:从MHA到Flash/Page Attention
本文主要介绍常用的Attention操作(多头注意力等)以及在KV-cahce中如何节约内容的操作包括:flash-attention、vLLM等原理
深度学习基础理论:常见评价指标以及Loss Function
本文盛入浅出的介绍常见的评价指标(准确率等计算方式)以及Loss function(交叉熵损失等)的基本原理以及计算方法
深度学习基础理论:混合专家模型以及KV-cache基本原理
本文图文并茂的方式介绍深度学习中的混合专家模型以及KV-cache基本原理以及代码操作,让你快速了解其背后原理以及代码操作
深度学习基础理论:混合精度训练以及gradient-checkpoint原理
本文图文并茂的方式主要介绍深度学习中的混合精度训练方式以及gradient-checkpoint的基本原理。
CV中常用Backbone-2:ConvNeXt模型详解
这里介绍新的一个Backbone:ConvNeXt,均来自Meta的论文,卷积审计网络又一春?本论文证明Vit效果好并不是attention本身而是因为transform的超大感受野和各种trick
CV中常用Backbone-1:Resnet/Unet/Vit系列/多模态系列等以及代码
本文主要介绍CV-Backbone:Resnet/Vit/MAE/Unet等网络结构原理以及其具体的代码。
多模态系列-1:Qwen多模态系列论文
本文主要介绍多模态系列-1:Qwen多模态系列论文,并且对Qwen多模态的代码进行解析。将两个模型进行详细对比