获得徽章 0
赞了这篇沸点
赞了这篇文章
赞了这篇沸点
赞了这篇沸点
赞了这篇沸点
赞了这篇沸点
#新人报道# 关于保持更新版本模型前后一致的思考
保持更新版本模型保持前后一致性
图模型前后理解一致性
其实不一致的原因大体看来有3个:
1.条件laten分布的差异
2.文本到图对齐模型差异
3.diffusion生成过程的差异
我们在训练时候既然希望能够保持前后迭代的稳定,并且保持后一版本比前一版本更优秀。
那么其实我们确实需要保证在上个版本中条件laten尽可能一致,至少我们宏观表示一致,我们希望优化的是描述细节、细粒度对齐,那么我们是不是可以通过换词换细节描述方式让模型学会细节表述(比如文本被压到的空间分布是尽可能一致)
对于整体如果不符合预期的图文,我们就在新版本中让模型纠正到正确表示
也就是我们后续模型的迭代应该是在做基准模型的sft、rlhf对齐,如果真需要做二次预训练应该也是只对表述不好的图片进行学习
保持更新版本模型保持前后一致性
图模型前后理解一致性
其实不一致的原因大体看来有3个:
1.条件laten分布的差异
2.文本到图对齐模型差异
3.diffusion生成过程的差异
我们在训练时候既然希望能够保持前后迭代的稳定,并且保持后一版本比前一版本更优秀。
那么其实我们确实需要保证在上个版本中条件laten尽可能一致,至少我们宏观表示一致,我们希望优化的是描述细节、细粒度对齐,那么我们是不是可以通过换词换细节描述方式让模型学会细节表述(比如文本被压到的空间分布是尽可能一致)
对于整体如果不符合预期的图文,我们就在新版本中让模型纠正到正确表示
也就是我们后续模型的迭代应该是在做基准模型的sft、rlhf对齐,如果真需要做二次预训练应该也是只对表述不好的图片进行学习
展开
评论
3
jym们,去年年初到年中被裁这段时间的绩效一直没发,离职协议上写了金额但没写时间只写了统一时间发放,劳动合同只写了基本工资,offer上写了总薪资,工资条还没有,这种劳动仲裁能拿回来吗
5
6
![[呲牙]](http://lf-web-assets.juejin.cn/obj/juejin-web/xitu_juejin_web/img/jj_emoji_2.cd1e2bd.png)