公共资源速递
3 个公共数据集:
-
NAMD_Benchmark 分子动力学性能基准集
-
NWChem_Benchmark 性能基准测试数据集
-
QEF_benchmark 电子结构计算基准测试数据集
5 个公共教程:
-
UserLM-8b:用户对话模拟模型
-
CPU 部署 NeuTTS-Air 语音克隆模型
-
MiMo-Audio-7B-Instruct:小米开源的端到端语音模型
-
Wan2.2-Animate-14B:开放式高级大规模视频生成模型
-
Nanonets-OCR2-3B:更准确的解释复杂文档中的视觉元素
公共数据集
NAMD Benchmark 数据集是一组专为高性能计算(HPC)环境设计的性能基准输入与配置文件集合,用于评估分子动力学模拟软件 NAMD 在不同硬件平台、并行模式(MPI、GPU、Charm++)以及编译优化设置下的运行性能。
在线使用:
NWChem 基准测试数据集是一组专门为高性能计算(HPC)环境下量子化学与分子模拟软件 NWChem 提供的标准性能测试场景。本数据集基于 NWChem 高性能计算化学软件生成,涵盖生物分子、纳米结构与固态材料的量子及经典混合计算数据,包含基态与激发态性质,采用高斯基函数与平面波两种计算方法,具备从单节点到数千处理器的高并行扩展能力,并支持分子性质与相对论效应的分析。
在线使用:
3. QEF_Benchmark 电子结构计算基准测试数据集
QEF_Benchmark 数据集基于 Quantum ESPRESSO 的核心模块(如 pw.x、ph.x 等),设计涵盖从小分子到大规模金属表面体系的多种典型计算场景。它为 HPC 环境提供了标准化的测试任务,是验证计算节点性能、编译器优化和并行效率的事实标准。
在线使用:
公共教程
UserLM-8b 可以模拟对话中的「用户」角色(基于 WildChat 对话语料库训练),用于大模型助手能力评估。该模型并非常见的大模型助手,不能模拟更真实的对话或者解决问题,但该模型有助于开发更强大的助手。
在线运行:
效果展示
NeuTTS-Air 基于 0.5B Qwen LLM 主干和 NeuCodec 音频编解码器,它在 on-device 部署和即时语音克隆上展现少样本学习能力。系统评估显示,NeuTTS Air 在开源模型中达到 SOTA 水平,尤其在超真实合成和实时推理基准上。它还能泛化到嵌入式代理和风格迁移等新场景,支持 3 秒音频克隆,并生成自然对话内容。后训练引入 GGML/ONNX 支持和水印机制,在 on-device TTS 和功耗优化评测中领先开源领域,部分场景媲美闭源模型。
在线运行:
项目示例
3. MiMo-Audio-7B-Instruct:小米开源的端到端语音模型
MiMo-Audio-7B-Base 在开源模型的语音智能与音频理解基准测试中均达到了当前最优水平(SOTA)。除标准指标外,该模型还能泛化到训练数据中未涵盖的任务,如语音转换、风格迁移和语音编辑。此外,MiMo-Audio-7B-Base 具备强大的语音续写能力,可生成高度逼真的脱口秀、朗诵、直播和辩论内容。
在线运行:
项目示例
4. Wan2.2-Animate-14B:开放式高级大规模视频生成模型
Wan2.2-Animate-14B 同时支持动作模仿和角色扮演两种模式,能基于表演者的视频,精确复制面部表情和动作,生成高度逼真的角色动画视频。该模型能将动画角色无缝替换进原视频,完美匹配场景的光照和色调。模型基于 Wan 模型构建,通过空间对齐的骨骼信号控制肢体动作,用从源图像中提取的隐式面部特征重现表情,实现高度可控和富有表现力的角色视频生成。
在线运行:
项目示例
5. Nanonets-OCR2-3B:更准确的解释复杂文档中的视觉元素
Nanonets-OCR2-3B 不仅可以将文档转换为结构化的 Markdown,还可以利用智能内容识别、语义标记和上下文感知视觉问答,能够更深入地 理解和更准确地解释复杂文档。
在线运行:
项目示例