三花AI

三花AI

三花AI

AI造福人类

等 16 人订阅共194篇文章创建于2024-06-17

百度与复旦大学联合开源 Hello3：革命性数字人头动画技术

百度与复旦大学联合开源 Hello3：革命性数字人头动画技术 Hello3[1] 是复旦大学和百度联合开源的数字人头（肖像动画）技术，能让静态肖像在各种场景下动起来，而且动作自然、画面逼真。它不仅能处

1年前
223
点赞
评论

百度与复旦大学联合开源 Hello3：革命性数字人头动画技术

一秒内从单图生成可编辑 3D 模型

SAI 开源 SPAR3D：一秒内从单图生成可编辑 3D 模型 SPAR3D[8] 是 SAI 最近开源的一项图生 3D 技术，能够在短短一秒内从单张图片生成可编辑的 3D 模型。这项技术对于商业和非

1年前
357
点赞
评论

一秒内从单图生成可编辑 3D 模型

英伟达开源 Cosmos 世界模型，助力机器人与自动驾驶数据生成

英伟达开源 Cosmos 世界模型：助力机器人与自动驾驶数据生成英伟达开源了 Cosmos 世界模型[2]，这模型支持文生视频和文+视频生视频，主要应用于机器人和自动驾驶领域的大规模合成数据生成。

1年前
361
点赞
评论

英伟达开源 Cosmos 世界模型，助力机器人与自动驾驶数据生成

OpenAI CEO预测 2025 年 AI 代理将加入劳动力市场

OpenAI CEO Sam Altman 预测：2025 年 AI 代理将加入劳动力市场 Reflections[2] 是 OpenAI 的 CEO Sam Altman 在其博客上发表的一篇文章。

1年前
170
点赞
评论

OpenAI CEO预测 2025 年 AI 代理将加入劳动力市场

罗永浩 Jarvis 发布 J1 Assistant：安卓用户的 AI 新助手

罗永浩 Jarvis 发布 J1 Assistant：安卓用户的 AI 新助手罗永浩旗下的 AI 初创项目 Jarvis 近日发布了名为 J1 Assistant 的聚合类 AI 助理软件。目前，该

1年前
246
点赞
评论

罗永浩 Jarvis 发布 J1 Assistant：安卓用户的 AI 新助手

“反向试穿” 从人物中提取衣服

开源模型 try-off-anyone：实现照片中的上衣提取 try-off-anyone[1] 是一个开源模型，专门用于从人物照片中提取上衣，实现所谓的“反向试穿”。虽然模型和代码都是开源的，但实

1年前
405
点赞
评论

“反向试穿” 从人物中提取衣服

AnimateDiff 到 Runway：AI 视频生成技术的飞跃

AnimateDiff 到 Runway：AI 视频生成技术的飞跃大佬 @GerdeGotIt[5] 最近展示了一个对比：两年前使用 AnimateDiff 技术制作的 AI 动画与如今使用 Run

1年前
173
点赞
评论

AnimateDiff 到 Runway：AI 视频生成技术的飞跃

一键将普通视频转为 3D 视频

腾讯开源 StereoCrafter：一键将普通视频转为 3D 视频 StereoCrafter[3] 是腾讯开源的一个强大模型，能够将任何普通视频转换为红蓝、VR 或左右格式的 3D 视频。官方还

1年前
461
点赞
评论

一键将普通视频转为 3D 视频

OpenAI ChatGPT 及 API 宕机超 4 小时

OpenAI ChatGPT 及 API 宕机超 4 小时 OpenAI 官方发文表示，ChatGPT、API 和 Sora 部分功能已宕机超 4 小时。此次宕机原因是由上游服务商引起的，截至到目前大

1年前
172
1
评论

OpenAI ChatGPT 及 API 宕机超 4 小时

3DHM：3D 姿势到视频生成技术

3DHM：3D 姿势到视频生成技术 3DHM[1] 是又一款基于扩散模型的技术，能够将 3D 运动姿势视频与参考人物照片结合，生成高质量的视频内容。无论是舞蹈还是体操，3DHM 都能轻松生成。与其他

1年前
219
点赞
评论

3DHM：3D 姿势到视频生成技术

通义的模型命名也是越来越可爱了

QVQ-72B-Preview：开源多模态推理模型 QVQ-72B-Preview[1] 是阿里通义团队基于 Qwen2-VL-72B 构建的开源多模态推理模型，专注于增强视觉推理能力，目前还是实验性

1年前
263
点赞
评论

通义的模型命名也是越来越可爱了

DisPose：开源的跳舞视频生成增强技术

DisPose：开源的跳舞视频生成增强技术 DisPose[3] 是一种开源技术，旨在增强单图跳舞视频生成模型，它通过 ControlNet 的方式实现，能够与现有的姿势到视频模型无缝集成。官方代码

1年前
261
点赞
评论

DisPose：开源的跳舞视频生成增强技术

OpenAI 推出嵌入式 Realtime API SDK

OpenAI 推出嵌入式 Realtime API SDK OpenAI 最近开源了针对嵌入式平台的 Realtime API SDK[1]，使得开发者能够轻松将 Realtime API 集成到 E

1年前
221
点赞
评论

OpenAI 推出嵌入式 Realtime API SDK

ChatGPT 桌面应用与其他应用的协作

ChatGPT 桌面应用与其他应用的协作 OpenAI[4]的 12 Days 活动中，第 11 天展示了 ChatGPT 桌面应用与其他应用的协作。用户可以在 VSCode、Notion 等应用中

1年前
196
1
评论

ChatGPT 桌面应用与其他应用的协作

OpenAI 推出打电话和发短信给 ChatGPT

OpenAI 推出打电话和发短信给 ChatGPT OpenAI 12Days 在其活动第 10 天整了个活儿，现在你可以通过拨打 1-800-CHATGPT（1-800-242-8478）或发送短信

1年前
233
点赞
评论

OpenAI 推出打电话和发短信给 ChatGPT

谷歌出手就王炸，推出 Veo2 顶级视频生成模型

谷歌推出 Veo2：顶级视频生成模型谷歌发布了 Veo2[1] 视频模型，支持文生视频和图生视频。该模型能够生成分辨率高达 4K 的视频，并能根据提示词完成相机控制，如广角镜头、POV 和无人机拍

1年前
269
点赞
评论

谷歌出手就王炸，推出 Veo2 顶级视频生成模型

OpenAI 增强 ChatGPT 搜索功能

OpenAI 增强 ChatGPT 搜索功能 OpenAI 12Days[1] 的 12Days 活动第 8 天，官方将其命名为 ChatGPT Search Day。现在搜索功能在手机上提供更好的体

1年前
186
点赞
评论

OpenAI 增强 ChatGPT 搜索功能

Grok 免费开放，马斯克送圣诞大礼

Grok 免费开放，马斯克送圣诞大礼 Grok[1] 现在对所有人免费，包括新推出的 Grok2 模型和新的图像生成模型，全部免费提供。当然，付费用户可以享受更多的用量。此外，现在可以通过 API

1年前
245
点赞
评论

Grok 免费开放，马斯克送圣诞大礼

OpenAI 服务大规模宕机超 4 小时，更新高级语音模式的 Vison 能力

OpenAI 服务大规模宕机超 4 小时昨天，OpenAI 遭遇了大规模宕机，包括 API、网站、Sora 和 Playground 在内的服务均无法使用，宕机时间超过 4 小时。截至目前，所有服务

1年前
125
点赞
评论

OpenAI 服务大规模宕机超 4 小时，更新高级语音模式的 Vison 能力

开源的单图跳舞视频生成技术：StableAnimator

StableAnimator：开源的单图跳舞视频生成技术 StableAnimator[1] 是一种基于单张图片生成跳舞视频的技术。通过输入一张参考图片和一个姿势视频，StableAnimator 能

1年前
338
点赞
评论

开源的单图跳舞视频生成技术：StableAnimator