Web 多媒体入门 | 青训营笔记

88 阅读3分钟

这是我参与「第四届青训营 」笔记创作活动的第25天 导读: 与传统网页不同,富媒体数据的理解与处理相比于此前的网页会更难、更具有挑战。万象系统是百度搜索为了解决富媒体信息海量处理问题而设计和开发的系统,文中对万象系统进行了一次全面的总览介绍,万象系统目前在百度已经承接了搜索所需要的所有图片、视频数据的加工和处理,管理着超大量级的图片和视频实体特征数据,每天支持数十亿的处理吞吐,为百度产品的效果提升奠定了基础。

一、背景

互联网信息经历过近几年的发展,已经从早期单纯的网页形式发展成如今的图文视频并茂的时期。我们现在看到的信息呈现方式不仅仅是枯燥的全版文字网页,而是包含大量图片、视频信息的内容载体。从传统文字传递信息方式转换成图片和视频(包括语音)是人类信息传递通道的一次升级,也是更贴近自然交流过程的一个发展阶段。国家广电总局和网络视听节目管理司共同编著的《中国视听新媒体发展报告(2017)》显示:

“2016年,我国在线视频市场规模达到609亿元,同比增长56%。截至2016年8月,网络自制视听节目播放量同比增长180%,流量占比从2015年的8%增长到14%。”

——《中国视听新媒体发展报告(2017)》

从信息量来看,图片承载的信息量要多于文字,视频承载的比图片更多。同一个内容,可以用文字、图片、甚至视频方式呈现,即使是同一个图片或者视频,不同人从中获取得到的信息量也不完全一致。随着手机的普及以及手机应用APP的繁荣,内容呈现不仅仅局限在网页,**而更多地呈现于体验更好的native app,它们提供了更友好的操作和不一样的信息体验。**这些给传统搜索引擎带来很多新的挑战。

二、搜索引擎面临的新挑战

传统搜索引擎承接了用户查询获取信息的入口,在html时代内容呈现方式都有固定的规范以及统一的载体(浏览器),搜索引擎可以方便地对全网信息进行内容提炼、加工和检索,找出与用户查询最相关的结果。

然而,这种方式如今正在悄悄发生转变:

(1)以内容为核心的竞争:网页不再是信息的唯一载体