首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Big_Yellow_J
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
最新
热门
图像擦除论文-2:SmartEraser、Erase Diffusion、OmniEraser
图像擦除是图像生成模型重要应用,本文介绍CVPR-2025相关的SmartEraser、Erase Diffusion、OmniEraser模型,涵盖数据集构建(实体过滤、混合高斯算法MOG)
深入浅出了解生成模型-3:Diffusion模型原理以及代码
前文已经介绍了VAE以及GAN这里介绍另外一个模型:Diffusion Model,除此之外介绍Conditional diffusion model、Latent diffusion model
深度学习学习率优化方法——pytorch中各类warm up策略
warm-up具体原理以及为什么这么做在之前的博客有介绍,这里直接介绍如何直接使用pytorch中的warm-up策略,在pytorch中对于warm-up所有支持的方法都有描述
CV中常用Backbone-3:Clip/SAM原理以及代码操作
这里主要介绍多模态中使用比较多的两种backbone:1、Clip;2、SAM。对于这两个backbone简单介绍基本原理,主要是讨论使用这个backbone
深入浅出了解生成模型-2:VAE模型原理以及代码实战
From:https://www.big-yellow-j.top/posts/2025/05/11/VAE.html 前文已经介绍了GAN的基本原理以及代码操作,本文主要介绍VAE其基本原理以及代码
深入浅出了解生成模型-1:GAN模型原理以及代码实战
日常使用比较多的生成模型比如GPT/Qwen等这些大多都是“文生文”模型(当然GPT有自己的大一统模型可以“文生图”)本文主要介绍GAN
深入探讨Attention变种与内存优化:从MHA到Flash/Page Attention
本文主要介绍常用的Attention操作(多头注意力等)以及在KV-cahce中如何节约内容的操作包括:flash-attention、vLLM等原理
稀疏注意力:Kimi & DeepSeek 论文中的系数注意力详解
主要分析Kimi和DeepSeek最新的关于稀疏注意力的计算范式,这几篇文章都是针对长上下文的压缩方法,长上下文带来的平方级别的运算或存储复杂度给推理优化带来非常大的影响。
深度学习基础理论:常见评价指标以及Loss Function
本文盛入浅出的介绍常见的评价指标(准确率等计算方式)以及Loss function(交叉熵损失等)的基本原理以及计算方法
深度学习基础理论:混合专家模型以及KV-cache基本原理
本文图文并茂的方式介绍深度学习中的混合专家模型以及KV-cache基本原理以及代码操作,让你快速了解其背后原理以及代码操作
下一页
个人成就
文章被点赞
3
文章被阅读
931
掘力值
251
关注了
0
关注者
3
收藏集
0
关注标签
0
加入于
2025-03-03