首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Big_Yellow_J
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
7
文章 7
沸点 0
赞
7
返回
|
搜索文章
赞
文章( 7 )
沸点( 0 )
深入探讨Attention变种与内存优化:从MHA到Flash/Page Attention
本文主要介绍常用的Attention操作(多头注意力等)以及在KV-cahce中如何节约内容的操作包括:flash-attention、vLLM等原理
深入浅出了解生成模型-1:GAN模型原理以及代码实战
日常使用比较多的生成模型比如GPT/Qwen等这些大多都是“文生文”模型(当然GPT有自己的大一统模型可以“文生图”)本文主要介绍GAN
深入浅出了解生成模型-2:VAE模型原理以及代码实战
From:https://www.big-yellow-j.top/posts/2025/05/11/VAE.html 前文已经介绍了GAN的基本原理以及代码操作,本文主要介绍VAE其基本原理以及代码
深度学习学习率优化方法——pytorch中各类warm up策略
warm-up具体原理以及为什么这么做在之前的博客有介绍,这里直接介绍如何直接使用pytorch中的warm-up策略,在pytorch中对于warm-up所有支持的方法都有描述
图像擦除论文-2:SmartEraser、Erase Diffusion、OmniEraser
图像擦除是图像生成模型重要应用,本文介绍CVPR-2025相关的SmartEraser、Erase Diffusion、OmniEraser模型,涵盖数据集构建(实体过滤、混合高斯算法MOG)
深入浅出了解生成模型-3:Diffusion模型原理以及代码
前文已经介绍了VAE以及GAN这里介绍另外一个模型:Diffusion Model,除此之外介绍Conditional diffusion model、Latent diffusion model
CV中常用Backbone-2:ConvNeXt模型详解
这里介绍新的一个Backbone:ConvNeXt,均来自Meta的论文,卷积审计网络又一春?本论文证明Vit效果好并不是attention本身而是因为transform的超大感受野和各种trick
个人成就
文章被点赞
8
文章被阅读
2,304
掘力值
269
关注了
0
关注者
3
收藏集
0
关注标签
0
加入于
2025-03-03