OpenBayes 一周速览 | Wan 2.1 文/图生视频秒上手,精度清晰度双飞跃;解锁视觉+语言新高度!Janus-Pro-7B 模型一键启动

19 阅读4分钟

公共资源速递

5 个数据集:

  • MCTS 中文文本简化数据集

  • Big-Math 强化学习数学数据集

  • HAR 15 种人体动作识别数据集

  • DexGraspVLA 机器人抓握数据集

  • Fortune Telling 中文风水占卜数据集

1 个模型:

  • QwQ-32B

3 个教程:

  • 一键部署 YOLOv12

  • 一键部署 Janus-Pro-7B

  • Wan 2.1 文/图生视频双杀 Demo

访问官网立即使用:openbayes.com

公共数据集

1. MCTS 中文文本简化数据集

该数据集包含 723 条基于 Penn Chinese Treebank (CTB) 的标准、选自新闻语料的复杂结构句子,并且每一句都配有多个人工简化的版本,从而成为中文文本简化任务上规模最大、参考最多的评估数据集。数据集不仅适用于分级阅读、机器翻译等研究领域,还能够帮助语言学习者更好地理解和处理复杂文本。

直接使用:

go.openbayes.com/1kFad

2. Big-Math 强化学习数学数据集

Big-Math 是一个大规模、高质量的数学数据集,专为强化学习 (Reinforcement Learning, RL) 在语言模型中的应用而设计,包含超过 250k 个高质量数学问题,每个问题都配有可验证的答案。

直接使用:

go.openbayes.com/zA8kG

数据示例

3. HAR 15 种人体动作识别数据集

该数据集全称为 Human Action Recognition,包含 15 种不同类别的人类活动,约 12k+ 张标记图像(包括验证图像),每个图像只有一个人类活动类别,并保存在标记类别的单独文件夹中。

直接使用:

go.openbayes.com/0Bgps

数据示例

4. DexGraspVLA 机器人抓握数据集

这是一个包含 51 个人类演示数据样本的小型数据集,用于了解数据和格式,以及运行代码体验训练过程。此框架采用预训练的视觉-语言模型作为高层任务规划器,并学习基于扩散的策略作为低层行动控制器,其创新之处在于利用基础模型实现强大的泛化能力,并使用基于扩散的模仿学习获取灵巧行动。

直接使用:

go.openbayes.com/LpLhp

数据集结构

5. Fortune Telling 中文风水占卜数据集

该数据集含 207 个关于风水、八字等问题,每个问题有唯一对应的答案。

直接使用:

go.openbayes.com/NFmya

公共模型

1. QwQ-32B

发布机构: 阿里巴巴

该模型基于大规模强化学习 (RL) 训练,在数学推理、编程等任务上表现出色。模型在多个基准测试中表现卓越,尤其在数学推理、代码理解等任务中展现了惊人的效率。此外,QwQ-32B 集成了与智能体 (Agent) 相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

直接使用:

go.openbayes.com/BV5u7

公共教程

1. 一键部署 YOLOv12

长期以来,增强 YOLO 框架的网络架构一直是计算机视觉领域的核心课题。尽管注意力机制在建模能力上表现出色,但基于 CNN 的改进仍然是主流,因为基于注意力的模型在速度上难以匹敌。然而,YOLOv12 的推出改变了这一局面,它不仅在速度上与基于 CNN 的框架相媲美,还充分利用了注意力机制的性能优势,成为实时物体检测的新标杆。

该项目相关模型和依赖已经部署完毕,启动容器后点击 API 地址即可进入 Web 界面。

在线运行:

go.openbayes.com/YEN0G

数据集示例

2. 一键部署 Janus-Pro-7B

Janus-Pro 是一种新颖的自回归框架,它通过将视觉编码解耦到单独的路径来解决以前方法的局限性,同时仍然使用单一的、统一的转换器体系结构进行处理。这种解耦不仅缓解了视觉编码器在理解和生成方面的冲突,而且增强了框架的灵活性。

本教程为模型推理教程,展示模型推理结果。

在线运行:

go.openbayes.com/ofCka

模型界面示例

3. Wan 2.1 文-图生视频双杀 Demo

该模型分别涵盖文本生成视频 (T2V) 和图像生成视频 (I2V) 任务,为开发者提供了一个全面且开放的视频基础模型套件。Wan 2.1 在性能上超越了现有的开源模型,其轻量级版本仅需 8GB 显存即可运行,大大降低了使用门槛。

该项目相关模型和依赖已经部署完毕,运行成功后点击相应的 API 地址即可体验模型。

在线运行:

go.openbayes.com/2g0RG

动图封面

生成视频示例


以上就是小贝上周在OpenBayes的全部更新内容啦~