公共资源速递
1 个公共教程:
- DeepSeek-OCR:利用视觉模态压缩长文本上下文的新方法
5 个公共数据集:
-
FDAbench-Full 异构数据分析基准数据集
-
AutoDock-GPU_Output 对接结果数据集
-
T2I-CoReBench 多模态图像生成基准数据集
-
Bald Classification Dataset 秃头头像数据集
-
Amber_Benchmark 分子动力学性能评测数据集
访问官网立即使用:openbayes.com
公共教程
1. DeepSeek-OCR:利用视觉模态压缩长文本上下文的新方法
DeepSeek-OCR 是一款面向长上下文视觉信息压缩与识别的开源 OCR 模型。其核心引擎 DeepEncoder 的主要特色在于能够在高分辨率输入的前提下保持极低激活量,并以高压缩比将图像内容转化为可控规模的视觉 token,从而让模型能够在更长序列中稳定处理视觉信息。
在线运行:
模型示例
公共数据集
FDAbench-Full 数据集是一个用于评估数据代理(Data Agents)在异构数据分析任务中的表现的综合基准,包含 2,007 个高质量分析任务,覆盖不同数据领域、难度等级与任务类型,用于系统考察模型在数据库查询生成、SQL 理解以及金融数据分析中的能力。
在线使用:
2. AutoDock-GPU_Output 对接结果数据集
AutoDock-GPU_Output 数据集是一组由 AutoDock-GPU 生成的标准对接输出文件(.dlg),包含结合能、构象聚类与最终配体姿态等解析信息,可用于展示分子对接的完整结果格式并验证对接环境配置是否正常。
在线使用:
T2I-CoReBench 数据集是一个用于评估文本驱动图像生成模型的综合基准,包含 1,080 条高难度文本提示及约 13,500 项细粒度检查项,用于重点考察模型的组合生成能力与推理一致性。
在线使用:
4. Bald Classification Dataset 秃头头像数据集
Bald Classification 数据集是一组面向图像分类模型训练与评测的公开人脸数据集,包含约 20 万张 JPG 格式图像,按照训练集、验证集与测试集划分,支持模型对「光头(Bald)」与「非光头(Not Bald)」两类人像的自动识别与分类。
在线使用:
数据集示例
5. Amber_Benchmark 分子动力学性能评测数据集
Amber Benchmark 数据集是一组面向高性能计算(HPC)环境的标准化基准输入与配置文件,用于评估 Amber 分子动力学程序在不同硬件平台和并行架构下的性能与可扩展性。它包含 DHFR、Factor IX、Cellulose、STMV 等典型模拟体系,可用于跨平台复现实验性能并进行对比测试。
在线使用: