NeurIPS 2024 刚刚在温哥华落幕,大会汇聚了全球顶尖 AI 研究成果,字节跳动豆包大模型团队超 20 篇论文中选,在多个前沿领域成果亮眼。
今晚 7 点,豆包大模型视觉基础研究负责人冯佳时、视觉基建负责人肖学锋,携手三位资深研究员 Xiaohai Tian、Bingyi Kang、Zilong Huang,为大家深度解析下述研究成果:
✨StoryDiffusion:探讨生成图像视频时内容一致性问题,该工作被评为 Spotlight,录取率仅为 2.4%。
✨Hyper-SD:加速扩散模型,最快 1 步生成 SOTA 级图片,GitHub 下载量超百万。
✨SD-Eval:多维度评估口语对话理解和生成的基准数据集,涵盖情感、口音、年龄和背景音四个视角。
✨Depth Anything:单目深度估计模型系列工作,目前 GitHub Star 1.2 万。
✨SuperClass:简单高效的预训练方法,首次舍弃文本编码器,训练效率高于 CLIP。 直播期间,我们还将进行多轮互动抽奖,礼品等你来拿! 今晚 7 点,快来和研究员们一起唠唠吧+emoji