在线抓娃娃的基本技术架构

avatar

线上视频抓娃娃风口正劲。用户可以通过手机遥控实体娃娃机,从正面与侧面两个视角判断爪子的位置,如果抓到了娃娃,可以选择寄送到家。短短几个月内,正式和即将上线的远程视频抓娃娃App和平台已有几十家,大有之前百团大战、百车大战、千播大战之势。

对于开发者来说,从日本红起来的抓娃娃由于其娱乐性、交互性,完全有可能成为下一个国民游戏,或成为泛娱乐产品的标配场景。然而,要抓住在线抓娃娃风口,尽快利用流量变现,需要一整套包含硬件和超低延迟的视频SDK的解决方案。

一套完整的在线抓娃娃机解决方案包含以下部分:

  • 必选:
  • 娃娃机1台(为什么需要,不用解释了吧...)
  • 摄像头2个以上
  • PC机或工业主板一台,二选一
  • 音视频传输软件方案
  • 信令软件方案
  • 在线抓娃娃App
  • 可选
  • CDN云端

基本的业务流程

以声网的在线抓娃娃机解决方案为例,在线抓娃娃参与方有4个:

  • 抓娃娃机
  • App操作端:操作抓娃娃
  • App高级观众端:低延时,可观看,可与操作端发起连麦,进行互动
  • App普通观众端:高延时,可观看

抓娃娃通过PC机或工业主板,连接摄像头,并集成了实时音视频方案。在抓娃娃时:

  1. 抓娃娃机通过云端SD-RTN™,将视频流传输到操作端。
  2. 操作端通过信令,将操作指令,传输到抓娃娃机,进行操作。操作端可选择将自己的视频画面发送到云端
  3. 抓娃娃机的画面,继续通过SD-RTN™,实时传输到操作端。
  4. 高级观众端,直接从SD-RTN™获取视频流。高级观众端可向操作端发起连麦,进行互动。
  5. SD-RTN™可推一条rtmp的流至CDN云端,普通观众端可以获取这条高延时流进行观看。无法参与互动。

目前市场上,已经有一些线上抓娃娃整体解决方案,各自技术实现上有一些差异。线上抓娃娃解决方案,需要关注以下几个方面的差异:

技术差异

一. 低延时

低延时是决定线上抓娃娃体验的核心关键点。线上抓娃娃的流程是,首先,操纵者通过App通过信令来向抓娃娃机发送操作指令,由于数据包小,所以延时极低,可低达50ms。第二步,抓娃娃机向操纵端App传输视频流,操纵者通过观看视频,获得操作反馈结果。第三步,操作者根据视频图像反馈,再次操作。以上流程不断循环,就形成了整个线上抓娃娃的体验。

第一步和第三步的信令开发,较简单。有技术难度并且决定延时高低的环节,在于第二步“视频传输”。若视频传输延时过高,则用户的操作观感总有滞后感。

二.全平台支持

线上抓娃娃涉及到四方:娃娃机、娃娃机App操作端、娃娃机App高级观众端、娃娃机App普通观众端。

(一)娃娃机

目前市场上主要应用的方案有两种:

1)基于Windows平台

这种方案简易方法是,一台娃娃机配一台window电脑,连接两个摄像头,这两个摄像头安装在娃娃机的不同方位。通过Windows电脑来与App进行视频流传输。

这种方案只涉及到软件开发和极少量的硬件改造,开发速度优势明显。

2)基于Android平台

在抓娃娃机上安装树莓派或工业主板,将安卓系统集成到主板上,摄像头也链接至主板。使用这种方案,成本较低,因为不需要配备电脑。但问题在于,首先,这种方案涉及到硬件改造。在硬件选配、集成上需要耗费一点时间。其次,安卓系统安装到工业主板上极不稳定,因此需要大量的调试、开发。

3)基于Linux平台

这种方案,相较Android平台的方案,区别在于,集成到主板上的操作系统是Linux,相对稳定。

在抓娃娃行业爆发的风口,速度就是一切。因此,一个新进入抓娃娃机市场的应用,应该首选Windows平台方案,占领市场。再通过Linux平台的方案,降低成本。

(二)娃娃机App操作端和观看端

声网的线上抓娃娃方案,操作端和观看端,均是全平台支持。尤其是用户量最大的Web端。通过Web端,既可以操作,也可以观看。这有助于抓娃娃新应用快速铺开市场。

三. 用户交互

用户与抓娃娃机的交互,主要有通过信令的的操作交互,和通过视频流的社交交互。操作交互的信令层开发,相对简单。视频流的社交交互是难点。

声网的抓娃娃机方案,是基于声网的互动连麦直播SDK实现,支持操作者作为主播,可以发送自己的视频流。观看端可以看到操作者与娃娃机同屏的画面,甚至可以与操作者连麦进行音视频互动。这为线上抓娃娃扩展社交场景留下了空间。

如对我们感兴趣,或遇到开发问题,欢迎访问声网 Agora问答版块与声网工程师交流。