OpenBayes 一周速览|Deepfake视频识别数据集上线,含28位演员的363个视频;LLaVA OneVision多模态教程上新

107 阅读4分钟

公共资源速递

This Weekly Snapshots !

5 个数据集:

  • Deepfake Detection 视频数据集

  • Wildfire Smoke 野火烟雾检测数据集

  • PubMedVision 医学 VQA 数据集

  • LAV-DF 多模态音频视觉数据集

  • DISC-Law-SFT 中文法律监督微调数据集

3 个教程:

  • 一键部署 Phi-3.5-vision-instruct

  • LLaVA OneVision 多模态全能视觉模型

  • LongWriter-glm4-9b:1 分钟生成万字悬疑小说

访问官网立即使用:openbayes.com

公共数据集

1. Deepfake Detection 视频识别数据集

该数据集专为深度伪造检测任务而设计,包含超过 363 个原创片段,其中有 28 位演员在 16 个不同的场景中的表演。

直接使用:

go.openbayes.com/ij1rv

2. Wildfire Smoke 野火烟雾检测数据集

该数据集包含 737 张图片,其中有 516 张训练图片、147 张验证图片和 74 张测试图片,标注格式为 COCO,旨在提高模型区分云/雾和烟雾的能力,建立端到端反馈循环。

直接使用:

go.openbayes.com/5FBxf

3. PubMedVision 大规模医学 VQA 数据集

此数据集包含 130 万个医学 VQA 样本,通过精细的数据处理方法,从 PubMed 国际医学期刊的论文中筛选出与医疗相关的图片及其描述,有效过滤了大量与医疗无关的图片和上下文不相关内容。

直接使用:

go.openbayes.com/kOwhf

4. LAV-DF 多模态 DeepFake 音频视觉数据集

LAV-DF 是一个多模态(视频篡改和音频篡改)数据集,源自 VoxCeleb2 数据集,包含 136,304 段视频,其中 36,431 段真实视频,99,873 段伪造视频。

直接使用:

go.openbayes.com/54osR

5. DISC-Law-SFT 高质量中文法律监督微调数据集

该数据集包含两个子集:DISC-Law-SFT-Pair 和 DISC-Law-SFT-Triplet。DISC-Law-SFT-Pair 子集通过法律三段论的指令对构造方法,引入法律推理能力;而 DISC-Law-SFT-Triplet 子集则通过构造包含输入、输出和参考信息的三元组,增强模型利用外部知识的能力。

直接使用:

go.openbayes.com/S8WYc

公共教程

1. 一键部署 Phi-3.5-vision-instruct

该模型具备广泛的图像理解、光学字符识别 (OCR)、图表和表格解析、视频剪辑摘要等功能,非常适合多种 AI 驱动的应用。在图像和视频处理相关的基准测试中表现出显著的性能提升。模型与环境已经部署完毕,大家可根据教程指引直接使用大模型进行推理生成。

在线运行:

go.openbayes.com/oFK2y

2. LLaVA OneVision 多模态全能视觉模型

LLaVA-OneVision 的特点在于其能够处理多样化的视觉任务,无论是静态图像的分析还是动态视频的解析,它都能够提供高质量的输出。只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行推理体验。

在线运行:

go.openbayes.com/L9pqO

3. 教程上新 | 1 分钟生成万字悬疑小说,LongWriter-glm4-9b 上线!

清华大学联合智谱 AI 构建了一个能够生成超过 10,000 字连贯文本的模型 LongWriter-glm4-9b,显著扩展了大型语言模型的输出潜力,在文学创作、新闻报道等实际应用中表现出极大的广泛性。目前,「一键部署 LongWriter-glm4-9b」已上线至 OpenBayes 公共教程界面,一键克隆即可开启对话。

在线运行:

go.openbayes.com/GXQMm

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

小贝还建立了「Stable Diffusion 教程交流群」,欢迎小伙伴们入群探讨各类技术问题、分享应用效果~扫描下方二维码添加小贝总微信(微信号:OpenBayes001),备注「SD 教程交流」,即可加入群聊。

开学季特惠

OpenBayes 开学季特惠强势来袭,福利抽奖+充值返现两大惊喜活动上线,中奖率 100%,最高可得 10 小时 RTX 4090 免费使用时长,扫码了解更多活动详情!

此外,OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源,并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!