OpenAI CEO预测 2025 年 AI 代理将加入劳动力市场

144 阅读1分钟

OpenAI CEO Sam Altman 预测:2025 年 AI 代理将加入劳动力市场

Reflections[2] 是 OpenAI 的 CEO Sam Altman 在其博客上发表的一篇文章。文中,他表达了对构建传统意义上的通用人工智能(AGI)的强烈信心,并预测到 2025 年,AI 代理将“加入劳动力市场”,从而实质性地改变公司的产出方式。

此外,Sam 还发了个推,目前每月 200 美元的 OpenAI Pro 订阅服务正在经历巨额亏损,利好老黄。

阿里开源 VideoRefer:利用 LLM 实现视频对象感知与推理

1.gif

VideoRefer[1] 是阿里开源的一项专门用于视频中对象的感知和推理的技术。该技术包括数据集、模型和基准测试三大核心组件,能够对用户定义的区域进行细粒度的感知、推理和检索,支持单帧和多帧输入。简单来说,就是利用 LLM 来理解视频内容。目前,该模型的代码和模型均已开源。

VITA-1.5:开源多模态视频语音大模型

2.gif

VITA-1.5 是一个开源的多模态视频语音大模型,类似于 GPT-4o,支持实时视频语音交互。它基于 Qwen2.5 模型,具备随时打断的功能。演示视频效果不错,值得一看。佬们可以在VITA-1.5 GitHub 仓库[3]了解更多。

lmsys 文生图竞技场:Recraft V3 领跑

知名大模型竞技场lmsys[4] 近日正式上线了文生图竞技场,社区已对 7 款模型进行了 4 万次投票。

目前,Recraft V3 模型获得榜首,整体排行差不多,不像收了钱的,不过 Midjourney 和国内的各种模型目前都还没有收录。