首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
文生图/文生视频学习笔记
树獭叔叔
创建于2026-03-06
订阅专栏
文生图/文生视频学习笔记
暂无订阅
共4篇文章
创建于2026-03-06
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
深度拆解 VAE:生成式 AI 的潜空间大门
深度拆解 VAE:生成式 AI 的潜空间大门 VAE (Variational Autoencoder) 是一种生成模型,它通过将高维数据(像素)映射到一个连续的低维概率分布(潜空间),实现了数据的压
深度拆解 DiT:扩散模型与 Transformer 的巅峰结合
21-DiT详解:扩散模型遇上Transformer的图像生成革命 引言 DiT(Diffusion Transformer)是Meta AI在2023年提出的突破性工作,它用纯Transformer
深度拆解 CLIP:连接文本与视觉的语义桥梁
深度拆解 CLIP:连接文本与视觉的语义桥带 CLIP (Contrastive Language-Image Pre-training) 是现代生成式 AI(如 Stable Diffusion,
从文字到像素的“炼金术”:拆解 AI 绘画背后的 CLIP、DiT 与 VAE
当你输入“一只在霓虹灯下喝咖啡的赛博朋克猫”,点击生成,几秒钟后一张充满细节的大作就会跳出屏幕。这背后并不是某种神秘的随机魔法,而是一条精密、高效的“工业流水线”。 在这个流水线上,有三位核心“专家”