Visual Agent 是什么?最了解视觉智能体的一群人都来杭州了|聊聊 Context Awareness 和 Visual Agent,Physical

0 阅读4分钟

「现代 AI 最让我着迷的一点是,它让我们得以用数学和哲学的方式,去触碰那些隐藏在人类互动背后的无形变量:AI 让『vibes』(氛围/感觉)变得可读、可理解。」

——Vitalik Buterin,以太坊创始人

4 月 25 日(周六)下午,RTE Meetup 落地杭州。

如果一个 Agent 不仅能看清眼前画面,更能瞬间捕捉你忽略的周边细节与上下文,会发生什么?

从桌面端的屏幕理解到可穿戴设备,能够 Always on 且实时捕获环境数据的 Visual Agent (视觉智能体) 正成为人机共同体感知物理世界的关键。

随着多模态模型的发展,获取真实世界的 Context(如视觉、音频或意图)已不再是技术瓶颈。

但拿到海量 Context 之后呢?

多模态感知不等于真实需求。 如何让 Context 与产品和市场真正契合?在哪些场景下,看懂 Vibes 才是不可替代的刚需?这才是决定下一代交互成败的必答题。

我们邀请了 蚂蚁百灵大模型、声网、Chance AI、声绘未来、湃启科技、Rokid 与 Cerul.ai 的技术专家及创始人,一起聊聊当 Agent 看得见 Vibes 时,Context Awareness 的畅想与现实。

关于 Physical AI Camp·超音速计划 2026

本次 RTE Meetup 也是「Physical AI Camp·超音速计划 2026」杭州站。

我们的创业营已经正式开启报名,目前正在招募 Voice Agent、Physical AI 和实时多模态 AI 领域的创业团队。营期内,我们将为入营项目提供技术资源支持、投融资对接,以及行业头部展会的展位资源。更重要的是,在这里你将和一群志同道合的伙伴共同探索。

RTE Meetup 议程

  • 13:30 - 14:00 丨 签到与自由交流

  • 14:00 - 14:10 丨 Intro:超音速计划 2026·Physical AI Camp 介绍

  • 14:10 - 15:10 丨 Keynote 分享

    • Visual Agent:从看得见到看得懂,还差什么? 吴晓凡,Chance AI CTO

    • 让 Agent 走出象牙塔,做那些用户觉得「很简单」的事 孙思宁,声绘未来 & 浙江湃启科技联合创始人

    • 迈向人机共生的交互终端 杨天翼,Rokid AI 产品经理

    • Teach Your AI Agents to See Jiaxi Cui(Panda),Cerul.ai Founder

  • 15:10 - 15:40 丨 圆桌讨论一:Building the Context ——Agent 视觉与感知技术底座

    • 嘉宾

      • 彭晗,蚂蚁集团高级算法专家,百灵多模态大模型后训练算法负责人

      • 张乾泽,Agora Agent Platform Lead

      • 孙思宁,声绘未来 & 浙江湃启科技联合创始人

    • 主持人: 杨慧 Cynthia Yang,RTE 开发者社区发起人

  • 15:40 - 16:10 丨 圆桌讨论二:Context-Product Fit —— 寻找多模态交互的真实场景

    • 嘉宾

      • 吴晓凡,Chance AI CTO

      • 杨天翼,Rokid AI 产品经理

      • Jiaxi Cui(Panda),Cerul.ai Founder

    • 主持人: 傅丰元,RTE 开发者社区负责人

  • 16:10 - 16:30 丨 Lightning Demo,带上你的软/硬件现场展示介绍

  • 16:30丨 自由交流

活动信息

  • 活动时间: 2026 年 4 月 25 日(周六) 14:00 - 16:30(13:30 开始签到)

  • 活动地点: 杭州西湖区灯彩街云谷中心

  • 参与方式: 扫描二维码,或点击下方链接报名

www.rtecommunity.dev/t/t_AX7NzQw…

主办方: RTE 开发者社区、超音速计划

合作伙伴: 魔搭社区、云谷中心

社区伙伴: S 创、脑放电波、Bonjour!、Research AI+、小红书科技、WAIC UP!、启师傅 AI 客厅、分子分母、机智流

💡 我们也新开了一个「Physical AI+多模态」微信群,欢迎关注 AI 硬件、跨平台开发、语音交互、视觉理解等方向的伙伴申请加入!

加微信 Creators2022,备注身份和来意(公司/项目+职位/技术栈+加 Physical AI 群),备注完整者优先入群。

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么