Google I/O 2022:推进知识和计算-谷歌和Alphabet的CEO演讲

随着 Google I/O 2022正式开发,谷歌和 Alphabet 的 CEO 在昨夜发表了意义深刻的演讲,Sundar 表示:

大约在 24 年前,Google 由两名研究生创立,当时 Google 拥有一个产品,以及一个远大的使命: 整合全球信息,供大众使用,使人人受益。在那之后的几十年里,我们一直在推进我们的技术来实现这一使命....

作为时隔 3 年再次回归海岸线圆形剧场,这此大会对于 Google 来说显然很有意义,而本次演讲的主题主要是围绕推进知识和计算展开,主要内容有:

  • 深化对信息的理解,从而将信息转化为知识;
  • 推动计算机技术发展,不论大家身在何处,都能方便快捷地获取信息和知识;

Sundar 通过几个简单的例子演示了在这方便的努力,例如在新冠疫情期间,Google 一直致力于提供准确的信息,帮助大家保持健康,而去年,有近 20 亿次搜索是使用 Google Search 和 Google Maps 来寻找疫苗接种点的

产品+AI

Google 翻译新增了 24 种语言,通过 AI 对 Google 翻译进行了增加,包括首批增加的美洲原住民语言支持。

关于 Google Maps 新一轮的升级,同样基于 AI ,Google Maps 已在世界各地绘制了大约 16 亿座建筑和超过 6,000 万公里的道路。

而使用计算机视觉和神经网络技术,从卫星图像中探测建筑物后,自 2020 年 7 月以来,Google Maps 上的非洲建筑物数量增加了 5 倍,从 6,000 万幢增加到了近 3 亿幢。

Google Maps 还带来了新的功能,利用 3D 绘图和机器学习技术的进步,正在融合数十亿张航拍和街景图像,以创建一个新的高保真的地图。

除了 Google Maps 之外,视频也正在成为分享信息、互相交流和学习必不可少的载体,YouTube 新功能帮助用户轻松访问视频内容,比如去年推出了自动生成的章节,让用户可以更轻松地跳转到最感兴趣的部分。

同时现在正在应用 DeepMind 的多模式技术,这项技术可以同时使用文本、音频和视频,并以更高的准确性和更快的速度自动生成章节。

后续 YouTube 的目标是将自动生成章节的视频数量增加 10 倍,从目前的 800 万到明年的 8,000 万。

接下来还会将把 YouTube 上的自动翻译字幕应用到移动设备上,这意味着观众现在可以获取 16 种自动翻译的视频字幕,创作者也可以借此吸引全球观众。

同样是基于 AI,Google Workspace 可以帮助提升工作效率,例如 Google Docs 将自动解析单词并提取出要点,这标志着自然语言处理的一个大飞跃,总结需要理解长段落、压缩信息并生成语言,而这些已经超出过去最好的机器学习模型的能力。

在接下来的几个月里,Google Chat 将使用该功能,为聊天对话提供摘要,帮助用户迅速加入群聊,或回顾重点信息。

还有关于改进 Google Meet 视频,通过 Project Starline 启发了机器学习驱动的图像处理,可以自动改善 Google Meet 的图像质量。而且这项技术适用于所有类型的设备。

另外 Google Meet 带来了摄影棚规格的虚拟灯光,可以通过调整灯光的位置和亮度,让用户身处黑暗的房间或坐在窗前仍然可以被清晰看到。

AI

通过计算使知识更易获得,如何推进知识的获取作为谷歌的使命的一部分: 从更好的语言翻译到改进的跨图像和视频的搜索体验,到使用地图对世界进行更丰富的探索。

例如继续努力提升人工智能的对话能力,对话和自然语言处理都能让人们以更简单的方式使用计算机,而推出推出 LaMDA 2 和 AI Test Kitchen用于对话应用的生成语言模型,可以打造目前最先进的对话 AI。

除了 LaMDA 2 , Pathways Language Model (PaLM) 也是迄今为止研发的最大规模的模型,基于 5,400 亿参数训练而成。

PaLM 在许多自然语言处理任务上都有着突破性的表现,例如从文本生成代码,回答数学问题,甚至解释一个笑话。

"思维提示链" 大大提高了 PaLM 的准确性,让它在包括数学问题在内的多个推理基准测试 (reasoning benchmarks) 中达到了最顶级水平。

最后,谷歌推出了全世界最大的开放机器学习中心,此机器学习中心拥有 8 个 Cloud TPU v4 芯片,是 Google 定制,建在为 Google 最大的神经模型提供支持的网络基础设施之上,能提供接近 9 x 1018 的算力,可以为 Google 的客户提供前所未有的运行复杂模型和工作负荷的能力。

展望未来,Google 在 AR 领域投入颇多: 目前已将 AR 引用到许多产品当中,包括 Google Lens、多重搜索 (multisearch)、场景探索 (scene exploration) 以及 Google Maps 的 Live Views 和沉浸式视图功能。

AR 各项性能已应用于手机终端,其神奇之处在于它可以在现实世界中为我们带来最真实、自然的体验。

总结

本次演讲中,谷歌展示了除了Android之外,还通过 AI 为其下产品如 Map、Meet、Chat、翻译、搜索等功能赋能升级,并且开发了新的 AI 框架与能力,并在接下来会对 AR 进行新一轮的拓展

评论