小白狮ww

赞

2

|

搜索文章

给你一个新视角看世界——Depth-Anything-3

如果说以往的 3D 视觉模型像「术业有专攻」的匠人，那么 Depth-Anything-3（DA3）就是那个突然横空出世、把所有活都能干而且干得还贼好的「全能大师」。它的秘诀很简单：只用一个标准 V

3月前
123
点赞
评论

给你一个新视角看世界——Depth-Anything-3

从几秒走向几分钟：长视频生成进入 LongCat 时刻

在短短一年里，AI 视频生成已经从「炫技几秒」进化到「真的能讲故事」。而真正能撑起国内开源长视频创作的一员猛将，也终于登场了——来自美团的 LongCat-Video。它的能力很好概括：一句话？给

3月前
231
点赞
评论

从几秒走向几分钟：长视频生成进入 LongCat 时刻

LAMMPS 教程：以单晶铝为例，模拟材料单轴拉伸

LAMMPS（Large-scale Atomic/Molecular Massively Parallel Simulator）是一种经典的分子动力学仿真代码，专注于材料建模。它旨在在并行计算机上高

3月前
182
点赞
评论

LAMMPS 教程：以单晶铝为例，模拟材料单轴拉伸

DiffVox：让人声音效风格迁移进入「可控、轻量、专业」的新时代

没有效果器、没有混响、没有压缩——只有一段朴素的人声。过去，这意味着从零开始调：效果链、参数、风格，全靠经验一点点堆出来。现在，DiffVox 代表了另一种可能：让模型理解目标音色的特征分布，并在推理

4月前
52
点赞
评论

DiffVox：让人声音效风格迁移进入「可控、轻量、专业」的新时代

目标再多也不怕！YOLOv13 把复杂场景「看穿了」

在真实场景里，目标检测模型经常被一些「刁钻情况」整得措手不及：监控里人群密密麻麻，模型只敢报「一坨」；无人车想识别远处的交通灯，结果红绿灯被当成「发光点」；体育转播里球速太快，目标框刚跟上，球已经飞

4月前
65
点赞
评论

目标再多也不怕！YOLOv13 把复杂场景「看穿了」

VASP 教程：VASP 机器学习力场计算硅的声子谱

Vienna Ab initio Simulation Package（VASP：The VASP Manual - VASP Wiki）是一个计算机程序，用于从第一性原理进行原子尺度材料建模，例如电

4月前
52
点赞
评论

VASP 教程：VASP 机器学习力场计算硅的声子谱

表格、公式、图像全搞定！MonkeyOCR 让 AI 真正「读懂」文档

在智能文档理解领域，如何让模型既能「看懂」复杂排版，又能「理清」逻辑结构，一直是技术难题。传统 OCR 系统往往只能识别文字，却无法处理包含公式、表格、图像等复杂内容，导致信息碎片化、上下文丢失，结构

4月前
77
点赞
评论

表格、公式、图像全搞定！MonkeyOCR 让 AI 真正「读懂」文档

双人对话生成模型 MOSS 上线，支持零样本语音克隆

在语音生成这一领域，文本到语音（TTS）模型已经能够合成出高度清晰、音色动人的单人朗读语音，极大地推动了内容创作与人机交互的进步。然而，当我们试图将这项技术应用于一些更具动态和表现力的多人对话场景——

4月前
137
点赞
评论

双人对话生成模型 MOSS 上线，支持零样本语音克隆

模型不再是一整块！Hunyuan3D-Part 实现可控组件式 3D 生成

在 3D 创作里，「整体模型难拆难改」是许多人都遇过的麻烦：模型看起来完整，但一旦想换个车轮、调下护甲、给角色换个头盔，就会发现——整个 Mesh 黏成一块，牵一发动全身。这让游戏建模、资产复用、动

4月前
136
点赞
评论

模型不再是一整块！Hunyuan3D-Part 实现可控组件式 3D 生成

北大 & UCLA 推出 ROCKET-2，AI 助力 3D 游戏零样本迁移

ROCKET-2 是由 CraftJarvis 团队推出的跨视图目标对齐的视觉运动控制框架，专注于解决机器人领域中的复杂任务控制问题。该模型仅在 Minecraft 上进行预训练，便能零样本迁移至多个

4月前
50
点赞
评论

北大 & UCLA 推出 ROCKET-2，AI 助力 3D 游戏零样本迁移

个人成就

文章被点赞 14

文章被阅读 38,571

掘力值 1,738

加入于

2024-04-02