深度学习进阶理论

深度学习进阶理论

深度学习进阶理论

这部分主要介绍深度学习中进阶操作，比如说：多模态等

暂无订阅共9篇文章创建于2025-05-03

深入浅出了解生成模型-6：常用基础模型与 Adapters等解析

本文介绍基座扩散模型，涵盖基于Unet的SD1.5、SDXL、Imagen及基于DiT框架的Hunyuan-DiT等。

7月前
348
点赞
评论

图像擦除论文-2：SmartEraser、Erase Diffusion、OmniEraser

图像擦除是图像生成模型重要应用，本文介绍CVPR-2025相关的SmartEraser、Erase Diffusion、OmniEraser模型，涵盖数据集构建（实体过滤、混合高斯算法MOG）

8月前
319
1
评论

深入浅出了解生成模型-3：Diffusion模型原理以及代码

前文已经介绍了VAE以及GAN这里介绍另外一个模型：Diffusion Model，除此之外介绍Conditional diffusion model、Latent diffusion model

9月前
143
1
评论

深入浅出了解生成模型-2：VAE模型原理以及代码实战

From:https://www.big-yellow-j.top/posts/2025/05/11/VAE.html 前文已经介绍了GAN的基本原理以及代码操作，本文主要介绍VAE其基本原理以及代码

10月前
307
1
评论

深入浅出了解生成模型-1：GAN模型原理以及代码实战

日常使用比较多的生成模型比如GPT/Qwen等这些大多都是“文生文”模型（当然GPT有自己的大一统模型可以“文生图”）本文主要介绍GAN

10月前
139
1
1

深入探讨Attention变种与内存优化：从MHA到Flash/Page Attention

本文主要介绍常用的Attention操作（多头注意力等）以及在KV-cahce中如何节约内容的操作包括：flash-attention、vLLM等原理

10月前
785
2
评论

稀疏注意力：Kimi & DeepSeek 论文中的系数注意力详解

主要分析Kimi和DeepSeek最新的关于稀疏注意力的计算范式，这几篇文章都是针对长上下文的压缩方法，长上下文带来的平方级别的运算或存储复杂度给推理优化带来非常大的影响。

10月前
547
点赞
评论

多模态系列-1：Qwen多模态系列论文

本文主要介绍多模态系列-1：Qwen多模态系列论文，并且对Qwen多模态的代码进行解析。将两个模型进行详细对比

10月前
257
点赞
评论

多模态系列-2：多视觉编码器协同与高低分辨率特征融合技术综述

本文主要介绍（论文发表时间：24.03-25.01）在多模态中使用**多个视觉编码器如何进行特征融合操作**

10月前
190
点赞
评论