获得徽章 0
gpt+dit可能是OpenAI的新架构
很有可能openai应该不是纯粹的gpt架构了
而是gpt+dit 类似sora的架构
目前看来gpt+dit才可能解决无限长和多模态快速融合高效输出的问题
光gpt在图和语音这种像素点密集架构推理会很慢
光dit对于无限上下文问题解决不太好
所以sora的gpt+dit才可能解决多模态效率问题
大家讲sora基本只介绍dit往往忽略他是怎么实现视频拼接 视频续生的
token本身没问题的 图视频也是序列的
这就是为什么sora不是直接dit而是gpt+dit
展开
liangsh01于2024-05-17 17:48发布的图片
评论
国内文生图大模型生态圈来了
中文语义理解精准的t2i模型来了
拥抱dit架构模型吧
sd生态空缺的大模型
不到2个月就被国内大模型生态圈拿下
恭喜恭喜
展开
liangsh01于2024-05-15 13:37发布的图片
liangsh01于2024-05-15 13:37发布的图片
2
目前diffusion思路更类似点彩作画
矢量更像刺绣织毛衣控制线
3d矢量和建模更像竹编
diffusion+计算图建模才可能书法
物理真实性才可能更接近人
各位科研大神有兴趣
可以看看有没办法把diffusion建模时候控制点的思路扩展到控制线
感觉这块还是很有意思
这部分工作也不多
大家要不就是在研究矢量
要不就是研究矢量应用
但是好像没人在研究用线建模(笔划)方式来作画
都挤在diffusion控制点分布这个范畴
这估计是点控制理论更直观 简单
点建模方式不太符合现实应用
应该把更多实际建模逻辑引入
线的建模更符合工业应用
并且在动画 仿真里面有落地实践
在3d打印 刺绣纺织 包括可以直接无缝和cad ue结合
www.zhihu.com
展开
评论
MoE和一体化模型差异
这个有点取巧 但你有没办法反驳它[呲牙][呲牙][捂脸]
就跟一本书厚10000页
老哥我把它分成20卷
你读的时候不可能一下都所有吧
然后我跟你讲我这500页书包含你要得所有答案
但这个可能还是有问题
一个神仙什么都懂给你的答案
和一个专家团队给你的答案还是有差异的
这个很考验路由网 和和汇总网络
展开
liangsh01于2024-05-09 17:41发布的图片
评论
文字情景动画生成
文本描述情景字体生成
文字向量化贝赛尔曲线
描述方式控制贝赛尔曲线动画转变
4
ai为什么永远不会成为被演者?
ai可以画图却写不好字
很明显它不按笔划作画
演员可以各种方法毕竟被呈现者
但是他永远不会成为被演者
liangsh01于2024-05-01 12:07发布的图片
2
汽车未来可能做到和手机一样终身不需要维修
汽车很有可能做到和手机一样
终身不需要维修 4s店直接模块化置换
社区和应用服务存在大于售后服务
比车即服务 而非售后服务的周到性
从以车为中心变成以人为中心
展开
liangsh01于2024-04-30 21:42发布的图片
评论
下一页
个人成就
文章被点赞 22
文章被阅读 17,610
掘力值 943
收藏集
0
关注标签
19
加入于