首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
深度学习进阶理论
Big_Yellow_J
创建于2025-05-03
订阅专栏
这部分主要介绍深度学习中进阶操作,比如说:多模态等
暂无订阅
共6篇文章
创建于2025-05-03
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
深入浅出了解生成模型-2:VAE模型原理以及代码实战
From:https://www.big-yellow-j.top/posts/2025/05/11/VAE.html 前文已经介绍了GAN的基本原理以及代码操作,本文主要介绍VAE其基本原理以及代码
深入浅出了解生成模型-1:GAN模型原理以及代码实战
日常使用比较多的生成模型比如GPT/Qwen等这些大多都是“文生文”模型(当然GPT有自己的大一统模型可以“文生图”)本文主要介绍GAN
深入探讨Attention变种与内存优化:从MHA到Flash/Page Attention
本文主要介绍常用的Attention操作(多头注意力等)以及在KV-cahce中如何节约内容的操作包括:flash-attention、vLLM等原理
稀疏注意力:Kimi & DeepSeek 论文中的系数注意力详解
主要分析Kimi和DeepSeek最新的关于稀疏注意力的计算范式,这几篇文章都是针对长上下文的压缩方法,长上下文带来的平方级别的运算或存储复杂度给推理优化带来非常大的影响。
多模态系列-1:Qwen多模态系列论文
本文主要介绍多模态系列-1:Qwen多模态系列论文,并且对Qwen多模态的代码进行解析。将两个模型进行详细对比
多模态系列-2:多视觉编码器协同与高低分辨率特征融合技术综述
本文主要介绍(论文发表时间:24.03-25.01)在多模态中使用**多个视觉编码器如何进行特征融合操作**