4月25日,在Create2025百度AI开发者大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖正式发布了全新升级的视觉大模型平台——百度智能云一见5.0!
一见5.0,通过一句话可快速生成视觉AI技能,然后用户可根据业务需求灵活编排技能、调整参数,并基于内置的场景化产线进行模型调优,提升专业场景下模型准确率。通过云边高效协同,帮助企业低成本解决视觉管理数字化的问题,让复杂的视觉场景看得见、管得住、理得清!
沈抖表示: 过去,面对一个视觉场景,开发一个视觉模型,训练周期长、门槛高、需要很多算法工程师做开发。即便这样,大量复杂视觉场景仍不能被量化管理。一见,今天迭代到了5.0版本,大幅降低了落地成本。我们不敢说一句话就能解决所有问题,但在一些标准化程度高、规则清晰的任务中,确实已经可以通过一句话,生成专业级的视觉AI应用,即使是一线业务人员也能参与开发。更重要的是,通过云边协同,成本也会大幅下降。
沈抖用一个实际应用场景展示了一见5.0的强大功能。现在连锁行业竞争非常激烈,门店不仅要保障食品供应、食品安全、库存管理这些环节正常运转,还要努力提升客户服务满意度。管理一家门店已颇具挑战,更不用说管理上百家甚至上千家门店了。假设某餐厅接到一个汉堡的外卖订单,客户备注“不要放酸黄瓜”,以往,餐厅很难实时管理每个汉堡的制作过程是否符合订单要求,但一见5.0却能将这个看似微小的客户需求转化为可量化的管理节点。
通过一见5.0,餐厅可以轻松实现以下步骤:打开一见,输入“帮我分析各个门店的汉堡制作是否符合订单要求”;一见即能迅速理解意图,拆解任务并生成初步的视觉AI应用。
打开这个视觉AI应用,可以看到,一见通过小模型实时检测汉堡,大模型理解制作流程,判断是否与订单要求匹配,让"不要酸黄瓜"这样的个性化需求,转化为可预警、可追溯、可优化的管理节点。
更为便捷的是,一见会根据门店的营业时间,推荐绑定有需求的门店,用户确认后,完整的视觉AI应用便自动运行。此外,用户还可以根据需求关联一些IoT设备,实现现场实时提醒功能。
基于文心X1,一见支持技能零代码秒生成,业务人员只需用自然语言描述需求,系统便能秒级生成完整的视觉AI应用,从需求解析、模型生成到设备绑定,一键完成部署;同时,基于文心4.5多模态大模型,一见能够自动化模型蒸馏和效果调优,确保专业场景模型的准确率超过95%;而“边端快速感知、云端深度思考”的云边协同架构既保证了秒级响应,又大幅降低部署成本,让中小企业也能拥抱视觉智能化升级。
目前,百度智能云一见已在连锁、钢铁、电力、水务、矿山、化工等20+行业应用落地,服务数百家头部客户。一见与中国钢研合作,融合一见视觉大模型平台与行业数据,打造金相分析大模型,将传统需要1年人工标注的数据处理周期,压缩至3个月端到端智能化落地;95%的分割准确率(“分割准确率”是金相分析效果最重要的判断标准之一)不仅满足实际生产需求,更让曾经依赖老师傅经验的冶金质检,转型为可标准化复制的智能流程。
当一见让专业级视觉 AI 应用从“工程师专属”到“人人可用”,视觉AI开发从“专业代码”升级为“自然语言”,或许在不远的未来,每个普通人都能借助一见成为自己业务场景的“算法工程师”,用朴素的表达,激活智能时代的无限可能。