首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
三花AI
三花AI
创建于2024-06-17
订阅专栏
AI造福人类
等 15 人订阅
共194篇文章
创建于2024-06-17
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
百度与复旦大学联合开源 Hello3:革命性数字人头动画技术
百度与复旦大学联合开源 Hello3:革命性数字人头动画技术 Hello3[1] 是复旦大学和百度联合开源的数字人头(肖像动画)技术,能让静态肖像在各种场景下动起来,而且动作自然、画面逼真。它不仅能处
一秒内从单图生成可编辑 3D 模型
SAI 开源 SPAR3D:一秒内从单图生成可编辑 3D 模型 SPAR3D[8] 是 SAI 最近开源的一项图生 3D 技术,能够在短短一秒内从单张图片生成可编辑的 3D 模型。这项技术对于商业和非
英伟达开源 Cosmos 世界模型,助力机器人与自动驾驶数据生成
英伟达开源 Cosmos 世界模型:助力机器人与自动驾驶数据生成 英伟达开源了 Cosmos 世界模型[2],这模型支持文生视频和文+视频生视频,主要应用于机器人和自动驾驶领域的大规模合成数据生成。
OpenAI CEO预测 2025 年 AI 代理将加入劳动力市场
OpenAI CEO Sam Altman 预测:2025 年 AI 代理将加入劳动力市场 Reflections[2] 是 OpenAI 的 CEO Sam Altman 在其博客上发表的一篇文章。
罗永浩 Jarvis 发布 J1 Assistant:安卓用户的 AI 新助手
罗永浩 Jarvis 发布 J1 Assistant:安卓用户的 AI 新助手 罗永浩旗下的 AI 初创项目 Jarvis 近日发布了名为 J1 Assistant 的聚合类 AI 助理软件。目前,该
“反向试穿” 从人物中提取衣服
开源模型 try-off-anyone:实现照片中的上衣提取 try-off-anyone[1] 是一个开源模型,专门用于从人物照片中提取上衣,实现所谓的“反向试穿”。 虽然模型和代码都是开源的,但实
AnimateDiff 到 Runway:AI 视频生成技术的飞跃
AnimateDiff 到 Runway:AI 视频生成技术的飞跃 大佬 @GerdeGotIt[5] 最近展示了一个对比:两年前使用 AnimateDiff 技术制作的 AI 动画与如今使用 Run
一键将普通视频转为 3D 视频
腾讯开源 StereoCrafter:一键将普通视频转为 3D 视频 StereoCrafter[3] 是腾讯开源的一个强大模型,能够将任何普通视频转换为红蓝、VR 或左右格式的 3D 视频。 官方还
OpenAI ChatGPT 及 API 宕机超 4 小时
OpenAI ChatGPT 及 API 宕机超 4 小时 OpenAI 官方发文表示,ChatGPT、API 和 Sora 部分功能已宕机超 4 小时。此次宕机原因是由上游服务商引起的,截至到目前大
3DHM:3D 姿势到视频生成技术
3DHM:3D 姿势到视频生成技术 3DHM[1] 是又一款基于扩散模型的技术,能够将 3D 运动姿势视频与参考人物照片结合,生成高质量的视频内容。无论是舞蹈还是体操,3DHM 都能轻松生成。 与其他
通义的模型命名也是越来越可爱了
QVQ-72B-Preview:开源多模态推理模型 QVQ-72B-Preview[1] 是阿里通义团队基于 Qwen2-VL-72B 构建的开源多模态推理模型,专注于增强视觉推理能力,目前还是实验性
DisPose:开源的跳舞视频生成增强技术
DisPose:开源的跳舞视频生成增强技术 DisPose[3] 是一种开源技术,旨在增强单图跳舞视频生成模型,它通过 ControlNet 的方式实现,能够与现有的姿势到视频模型无缝集成。 官方代码
OpenAI 推出嵌入式 Realtime API SDK
OpenAI 推出嵌入式 Realtime API SDK OpenAI 最近开源了针对嵌入式平台的 Realtime API SDK[1],使得开发者能够轻松将 Realtime API 集成到 E
ChatGPT 桌面应用与其他应用的协作
ChatGPT 桌面应用与其他应用的协作 OpenAI[4]的 12 Days 活动中,第 11 天展示了 ChatGPT 桌面应用与其他应用的协作。 用户可以在 VSCode、Notion 等应用中
OpenAI 推出打电话和发短信给 ChatGPT
OpenAI 推出打电话和发短信给 ChatGPT OpenAI 12Days 在其活动第 10 天整了个活儿,现在你可以通过拨打 1-800-CHATGPT(1-800-242-8478)或发送短信
谷歌出手就王炸,推出 Veo2 顶级视频生成模型
谷歌推出 Veo2:顶级视频生成模型 谷歌发布了 Veo2[1] 视频模型,支持文生视频和图生视频。 该模型能够生成分辨率高达 4K 的视频,并能根据提示词完成相机控制,如广角镜头、POV 和无人机拍
OpenAI 增强 ChatGPT 搜索功能
OpenAI 增强 ChatGPT 搜索功能 OpenAI 12Days[1] 的 12Days 活动第 8 天,官方将其命名为 ChatGPT Search Day。现在搜索功能在手机上提供更好的体
Grok 免费开放,马斯克送圣诞大礼
Grok 免费开放,马斯克送圣诞大礼 Grok[1] 现在对所有人免费,包括新推出的 Grok2 模型和新的图像生成模型,全部免费提供。当然,付费用户可以享受更多的用量。 此外,现在可以通过 API
OpenAI 服务大规模宕机超 4 小时,更新高级语音模式的 Vison 能力
OpenAI 服务大规模宕机超 4 小时 昨天,OpenAI 遭遇了大规模宕机,包括 API、网站、Sora 和 Playground 在内的服务均无法使用,宕机时间超过 4 小时。截至目前,所有服务
开源的单图跳舞视频生成技术:StableAnimator
StableAnimator:开源的单图跳舞视频生成技术 StableAnimator[1] 是一种基于单张图片生成跳舞视频的技术。通过输入一张参考图片和一个姿势视频,StableAnimator 能
下一页