灵珠平台之“吃瓜群众小段”智能体开发实战

0 阅读5分钟

一、前言:为什么是灵珠平台?

灵珠平台是Rokid 自研的 AI 开发平台,依托底层多模态大模型能力与轻量化开发架构,构建了一套面向全层级开发者的「零门槛-全栈化」AI 开发体系。它最吸引人的地方在于:它不仅仅是一个大模型套壳,而是一个完整的智能体编排系统

在动手之前,我们需要了解灵珠平台为我们提供了哪些“积木”:

  1. 智能体:对话式AI应用的载体,负责理解用户的语音/图片输入,并调用工作流或插件。
  2. 可视化工作流:通过拖拽节点(开始、插件、判断、代码、结束)搭建业务逻辑,无需编写复杂代码即可实现多模态交互。
  3. 插件生态:既可以调用平台内置的Rokid语音唤醒、拍照能力,也可以自定义API插件对接外部数据源(如食品数据库、ClawHub技能)。
  4. 自定义智能体(高级) :对于极客用户,灵珠平台允许填写URL和鉴权AK,直接对接自己部署的后端服务。

二、开发实战过程

引出创意

场景一: 观看春晚、跨年晚会等综艺现场,遇到陌生明星时,如何快速获取其百度百科及相关八卦;

场景二:刷短视频、影视剪辑片段时,遇到感兴趣但不熟悉的演员,怎么一键获取其权威资料及相关八卦。

场景三: 在家观看影视剧、网剧时,对出场的配角、客串演员不熟悉,能否快速了解演员背景;

基于上面的场景,基于用户的需求点,从而引出了我的创意,rokid的AI眼镜结合灵珠平台的智能体打造一个“即时返回该演员的百度百科权威信息及相关八卦新闻”的工具。

实现目标

本文将详细记录如何基于灵珠平台,通过零代码方式搭建专属智能体“吃瓜群众小段”。该智能体的核心定位及相关信息分点说明如下:

  • 目标用户:核心服务于脸盲人群,同时兼顾影视爱好者,覆盖所有在观看影视剧时存在“认不出演员”困扰、需要快速了解明星信息的人群。
  • 核心使用场景:聚焦于影视剧观看全场景,当用户遇到不认识的演员时,可通过该智能体快速识别画面中的演员,进而获取相关信息。

智能体创建过程

1.智能体基本信息

登录灵珠平台后,点击「创建」,填写智能体的基本信息,包含智能体名称、类别、功能介绍以及logo,logo可以借助市面上的各类生图AI工具生成即可,填写完可以输入提示词进行测试一下,点击确认就可以进入智能体的详细配置啦~

基本信息.png 2. 角色prompt设计

这一步的配置是最为复杂的,这里提供两个方案,我采用的后者。

方案一:借助官方提供的“提示词库”,选择适合自己的模板,然后根据自己的需求和场景填充具体的内容,当然越详细越好。

方案二:简单的描述你的智能体使用场景以及想要它实现的功能,然后将对应话术交给AI,让AI替我们生成一份详细的prompt,然后通过扣子或者腾讯元器调优一下即可(强烈建议灵珠上架同款功能)。

prompt.png

3.参数设置

这一party主要设置如下:

  • 入参选择的是图片入参
  • 插件勾选配合眼镜端的对应插件
  • 配置适合自己智能体场景的开场白

参数.png

4.调试&预览

这一步的耗时比重也比较多,主要测试各种场景,避免智能体已读乱回的情况。

  • 测试普通文字问答

调试1.png

  • 识别男星,可以正常识别出“侯明昊”,并且返回其相关作品

调试男星.png

  • 识别女星,85后小花“赵丽颖”,早期的花千骨也是火出圈的存在

调试女星.png

  • 识别国外明星,完美识别著名影星,女神级别的“奥黛丽·赫本”

调试国外.png

  • 识别动漫人物,完全可以正常识别,是喜羊羊与灰太狼剧中著名人间清醒的一个IP

调试动漫.png

5.提审&发布

最后的调试阶段通过后,正常走后面的提审就行了,这里是我的智能体的1.0.0版本的发布,没有过多的备注发布内容,点击提审即可。

提审.png

发布.png

三、实战总结&展望

在搭建“吃瓜群众小段”并落地使用的过程中,我切实感受到灵珠平台的核心优势——零门槛、高适配、易落地。无论是否具备专业开发经验,都能通过平台可视化工具快速上手,无需操心底层模型部署和硬件适配,只需专注于“演员识别+信息查询”的核心需求,就能高效完成智能体搭建。

随着灵珠平台不断优化本地数据闭环、多模型切换等功能,未来必定会深度结合AR眼镜等设备,强化AI识别能力,比如在街头偶遇明星、线下活动等场景中,也能实现快速识别和信息查询,充分发挥AR眼镜的感知优势,让演员识别这项AI能力更自然地融入日常生活,彻底解决脸盲人群的痛点,为影视爱好者提供更便捷的服务。