发布人:Google 高级研究员 Jeff Dean,代表整个 Google Brain 团队
作为整体 Google AI 工作的一部分,Google Brain 团队希望通过研究和系统工程推动人工智能向前发展。在这篇博文的第 1 部分中,我们介绍了团队在 2017 年的相关研究工作,从设计新的机器学习算法和技术到理解机器学习系统,以及与社区分享数据、软件和硬件。在这一部分中,我们将深入讨论团队在医疗保健和机器人等具体领域进行的研究,还会介绍我们在创造性、公平性和包容性方面的工作,并详细介绍一下我们的文化。
医疗保健
我们认为,机器学习技术在医疗保健领域的应用潜力巨大。我们正在解决各种各样的问题,例如协助病理学家检测癌症、 理解医疗对话来帮助医生和患者,以及使用机器学习处理基因组学中的各种问题,包括开源一个基于深度学习的高度准确的变异识别系统。
基于我们 2016 年 12 月在《美国医学会杂志》(JAMA) 上发表的研究论文,我们继续致力于尽早发现糖尿病视网膜病变 (DR) 和黄斑水肿。2017 年,我们将这个项目从研究阶段推进到实际的临床影响阶段。我们与 Verily(Alphabet
旗下的一家生命科学公司)合作,引导这项工作通过监管流程,眼下,我们正一道将这项技术集成到 Nikon 的 Optos 系列眼科相机中。此外,我们还在印度努力部署这套系统,印度的眼科医生缺口达到 127,000 人,因此,几乎一半的患者确诊时间过晚,发现时这种疾病已经导致他们视力下降。作为试点工作的一部分,我们在 Aravind 眼科医院启动了这个系统,帮助分级师更好地诊断糖尿病眼病。我们还与合作伙伴展开合作,希望了解影响糖尿病眼睛护理的人为因素,从患者和医疗保健提供商的人种学研究到眼科医生与
AI 系统互动方式的调查。
我们还与包括斯坦福大学、加利福尼亚大学旧金山分校和芝加哥大学在内的领先医疗保健组织和医疗中心合作,展示使用机器学习根据匿名病历预测医疗结果的效果(即,根据患者的当前状态,我们认为能够从数百万其他患者的病程预测相关患者的未来,并以此帮助医疗保健专业人员作出更好的决策)。我们对这项工作感到非常兴奋,期待在
2018 年与大家分享更多捷报。
机器人
我们在机器人领域的长期目标是设计学习算法,让机器人可以在混乱的现实环境中运行,并通过学习快速获得新技能和能力,而不是让它们身处精心控制的环境中,处理当今机器人所能从事的那些为数不多的手动编程任务。我们研究工作的一个重点是开发技术,让物理机器人利用它们自己的经验和其他机器人的经验来培养新的技能和能力,分享经验,共同学习。我们还在探索如何将基于计算机的机器人任务仿真与物理机器人的经验相结合,从而更快地学习新任务。尽管仿真器的物理效果与现实世界并不完全相同,但是我们观察到,对于机器人来说,仿真经验加上少量的现实世界经验比大量的实际经验能带来明显更好的结果。
除了现实世界机器人经验和仿真机器人环境外,我们还开发了能够通过观察所需行为的人类演示进行学习的机器人学习算法。我们相信,这种模仿学习方式是一种非常有前途的方法,可以让机器人快速掌握新的能力,不需要明确编程或规定某个活动的具体目标。例如,在下面这个视频中,机器人从不同的角度观察人类执行任务的过程,然后努力模仿他们的行为,从而在 15 分钟的真实世界经验中学会从杯子倒出东西。就像教自己 3 岁的孩子一样,我们可以鼓励它只洒出一点!
11 月,我们还联合筹备并举办了首届机器人学习大会 (CoRL),机器学习和机器人交叉领域的众多研究员齐聚一堂。活动总结包含更多信息,我们期待今年在苏黎世举行的大会。
基础科学
我们还非常看好运用机器学习解决重大科学问题的长期潜力。去年,我们利用神经网络预测量子化学中的分子性质、在天文数据集中发现新的系外行星、预测余震,以及使用 深度学习指导自动化证明系统。
创造性
我们对如何利用机器学习作为工具来帮助人们进行创意活动拥有浓厚的兴趣。去年,我们创建了一个 AI 钢琴二重奏工具,帮助 YouTube 音乐人 Andrew Huang 创作新音乐(另请观看 Nat & Friends 的幕后视频),并介绍了如何教机器作画。
我们还展示了如何控制在浏览器中运行的深度生成式模型创作新音乐。这项工作获得了 NIPS 2017 最佳演示奖,也是 Brain 团队的 Magenta 项目成员连续第二年赢得这个奖项,我们在
2016 年凭借 Interactive musical improvisation with Magenta 获得 NIPS 2016 最佳演示奖。在下面的 YouTube 视频中,您可以听一听演示的一部分,MusicVAE 变分自动编码器模型在两个旋律间无缝转变。
“人与 AI 研究”(PAIR) 项目
机器学习的发展为人与计算机交互的方式提供了全新的可能性。同时,确保全社会从我们开发的技术中广泛受益也至关重要。我们将这些机遇和挑战视为当务之急,并与 Google 内的许多人合作设立了“人与 AI 研究”(PAIR) 项目。
PAIR 的目标是研究和设计最有效的方式来帮助人与 AI 系统互动。我们发起了公众研讨会,将多个领域(包括计算机科学、设计,甚至艺术)的学者和从业者聚集在一起。PAIR 关注各种主题,其中一些我们已经提到过:尝试解释机器学习系统来帮助研究人员理解它们,以及通过 deeplearn.js 扩大开发者社区。我们以人为中心的机器学习工程方式的另一个例子是发布 Facets,这是一个用于可视化和理解训练数据集的工具。
机器学习的公平性和包容性
随着机器学习在技术领域发挥的作用越来越大,对包容性和公平性的考量也变得愈发重要。Brain 团队和 PAIR 一直在竭力推动这些领域取得进展。我们发表了多篇论文,涉及如何通过因果推理在机器学习系统中避免歧视、在开放数据集中体现地理多样性的重要性和 分析开放数据集来了解多元化与文化差异。我们也在与跨行业项目 Partnership on AI 紧密合作,确保公平性和包容性成为所有机器学习从业者的目标。
我们与 Google 创意实验室的同事一起制作了下面这个视频,从非技术角度对这个领域的一些问题进行了说明。
我们的文化
我们团队研究文化的一个重要方面是,赋予研究员和工程师权利,让他们可以解决他们认为最重要的基本研究问题。9 月,我们发文介绍了团队的一般研究方式。教育和辅导年轻的研究员始终贯穿我们的研究工作。我们团队去年吸纳了超过 100 名实习生,我们 2017 年大约 25% 的研究论文有实习生作为共同作者。我们在 2016 年启动了 Google Brain 学员计划,这个计划旨在辅导想要学习开展机器学习研究的人群。在成立元年(2016 年到 2017 年 5 月),27 名学员加入我们的团队,我们在半程总结和一年后回顾两篇博文中分享了计划第一年的动态,重点介绍了这些学员的研究成就。计划第一年的多位学员现在已经作为全职研究员和研究工程师留在我们团队,他们中的大多数人暂停了在加州大学伯克利分校、卡内基梅隆大学、斯坦福大学、纽约大学和多伦多大学等顶级机器学习研究机构的博士项目。2017 年 7 月,我们还迎来了第二批 35 名学员,这批学员将于 2018 年 7 月毕业,他们已经完成了一些令人振奋的研究并在众多研究场合发表论文。现在,我们升级了计划以整合 Google 内的多个其他研究团队,并将其重命名为 Google AI 学员计划(今年项目的申请截止时间已过;请访问 g.co/airesidency…,查看下一年项目的相关信息)。
2017 年,我们的工作远远超出在这篇分成两部分的博文中重点介绍的内容。我们热衷于在顶级研究场合发布我们的成果,去年,我们团队发表了 140 篇论文,其中超过 60 篇在 ICLR、ICML 和 NIPS 上发表。要详细了解我们的工作,您可以仔细阅读我们的研究论文。
您也可以在这个视频中认识我们团队的一些成员,或者阅读我们对有关 r/MachineLearning 的第二个 Ask Me Anything (AMA) 帖子的回复(也要记得浏览 2016 的 AMA)。
Google Brain 团队正在开枝散叶,在北美和欧洲吸纳了团队成员。如果您认为我们正在做的工作有趣,或者想要加入我们,您可以利用 g.co/brain 页面底部的链接查看我们的空缺职位,并申请实习、AI 学员计划、访问学者或者全职研究或工程角色。您也可以通过 Google 研究博客和我们的 Twitter 帐号 @GoogleResearch 关注我们在 2018 年的工作。您也可以关注我的个人 Twitter 帐号 @JeffDean。
感谢阅读!
作为整体 Google AI 工作的一部分,Google Brain 团队希望通过研究和系统工程推动人工智能向前发展。在这篇博文的第 1 部分中,我们介绍了团队在 2017 年的相关研究工作,从设计新的机器学习算法和技术到理解机器学习系统,以及与社区分享数据、软件和硬件。在这一部分中,我们将深入讨论团队在医疗保健和机器人等具体领域进行的研究,还会介绍我们在创造性、公平性和包容性方面的工作,并详细介绍一下我们的文化。
医疗保健
我们认为,机器学习技术在医疗保健领域的应用潜力巨大。我们正在解决各种各样的问题,例如协助病理学家检测癌症、 理解医疗对话来帮助医生和患者,以及使用机器学习处理基因组学中的各种问题,包括开源一个基于深度学习的高度准确的变异识别系统。
| 淋巴结活检,其中我们的算法正确识别出肿瘤而不是良性巨噬细胞。 |
| 筛选的首位患者(顶部)和经过培训的分级师 Iniya Paramasivam,后者正在查看系统的输出(底部)。 |
机器人
我们在机器人领域的长期目标是设计学习算法,让机器人可以在混乱的现实环境中运行,并通过学习快速获得新技能和能力,而不是让它们身处精心控制的环境中,处理当今机器人所能从事的那些为数不多的手动编程任务。我们研究工作的一个重点是开发技术,让物理机器人利用它们自己的经验和其他机器人的经验来培养新的技能和能力,分享经验,共同学习。我们还在探索如何将基于计算机的机器人任务仿真与物理机器人的经验相结合,从而更快地学习新任务。尽管仿真器的物理效果与现实世界并不完全相同,但是我们观察到,对于机器人来说,仿真经验加上少量的现实世界经验比大量的实际经验能带来明显更好的结果。
除了现实世界机器人经验和仿真机器人环境外,我们还开发了能够通过观察所需行为的人类演示进行学习的机器人学习算法。我们相信,这种模仿学习方式是一种非常有前途的方法,可以让机器人快速掌握新的能力,不需要明确编程或规定某个活动的具体目标。例如,在下面这个视频中,机器人从不同的角度观察人类执行任务的过程,然后努力模仿他们的行为,从而在 15 分钟的真实世界经验中学会从杯子倒出东西。就像教自己 3 岁的孩子一样,我们可以鼓励它只洒出一点!
11 月,我们还联合筹备并举办了首届机器人学习大会 (CoRL),机器学习和机器人交叉领域的众多研究员齐聚一堂。活动总结包含更多信息,我们期待今年在苏黎世举行的大会。
基础科学
我们还非常看好运用机器学习解决重大科学问题的长期潜力。去年,我们利用神经网络预测量子化学中的分子性质、在天文数据集中发现新的系外行星、预测余震,以及使用 深度学习指导自动化证明系统。
| 消息传递神经网络可以预测有机分子的量子性质 |
| 发现新的系外行星:观察行星遮住恒星光线时恒星的亮度。 |
我们对如何利用机器学习作为工具来帮助人们进行创意活动拥有浓厚的兴趣。去年,我们创建了一个 AI 钢琴二重奏工具,帮助 YouTube 音乐人 Andrew Huang 创作新音乐(另请观看 Nat & Friends 的幕后视频),并介绍了如何教机器作画。
| SketchRNN 模型画出的一个花园;这里提供了一个交互式演示。 |
“人与 AI 研究”(PAIR) 项目
机器学习的发展为人与计算机交互的方式提供了全新的可能性。同时,确保全社会从我们开发的技术中广泛受益也至关重要。我们将这些机遇和挑战视为当务之急,并与 Google 内的许多人合作设立了“人与 AI 研究”(PAIR) 项目。
PAIR 的目标是研究和设计最有效的方式来帮助人与 AI 系统互动。我们发起了公众研讨会,将多个领域(包括计算机科学、设计,甚至艺术)的学者和从业者聚集在一起。PAIR 关注各种主题,其中一些我们已经提到过:尝试解释机器学习系统来帮助研究人员理解它们,以及通过 deeplearn.js 扩大开发者社区。我们以人为中心的机器学习工程方式的另一个例子是发布 Facets,这是一个用于可视化和理解训练数据集的工具。
| Facets 可以提供有关您的训练数据集的数据分析。 |
随着机器学习在技术领域发挥的作用越来越大,对包容性和公平性的考量也变得愈发重要。Brain 团队和 PAIR 一直在竭力推动这些领域取得进展。我们发表了多篇论文,涉及如何通过因果推理在机器学习系统中避免歧视、在开放数据集中体现地理多样性的重要性和 分析开放数据集来了解多元化与文化差异。我们也在与跨行业项目 Partnership on AI 紧密合作,确保公平性和包容性成为所有机器学习从业者的目标。
文化差异体现在训练数据中,甚至像椅子一样的寻常物体中,如同我们在左侧这些涂鸦图案中观察到的一样。右侧的图表显示了我们如何在 ImageNet 一类的标准开放源代码数据集中发现了地理位置偏差。如果检测不到或不予以纠正,此类偏差可能会严重影响模型行为。 |
我们的文化
我们团队研究文化的一个重要方面是,赋予研究员和工程师权利,让他们可以解决他们认为最重要的基本研究问题。9 月,我们发文介绍了团队的一般研究方式。教育和辅导年轻的研究员始终贯穿我们的研究工作。我们团队去年吸纳了超过 100 名实习生,我们 2017 年大约 25% 的研究论文有实习生作为共同作者。我们在 2016 年启动了 Google Brain 学员计划,这个计划旨在辅导想要学习开展机器学习研究的人群。在成立元年(2016 年到 2017 年 5 月),27 名学员加入我们的团队,我们在半程总结和一年后回顾两篇博文中分享了计划第一年的动态,重点介绍了这些学员的研究成就。计划第一年的多位学员现在已经作为全职研究员和研究工程师留在我们团队,他们中的大多数人暂停了在加州大学伯克利分校、卡内基梅隆大学、斯坦福大学、纽约大学和多伦多大学等顶级机器学习研究机构的博士项目。2017 年 7 月,我们还迎来了第二批 35 名学员,这批学员将于 2018 年 7 月毕业,他们已经完成了一些令人振奋的研究并在众多研究场合发表论文。现在,我们升级了计划以整合 Google 内的多个其他研究团队,并将其重命名为 Google AI 学员计划(今年项目的申请截止时间已过;请访问 g.co/airesidency…,查看下一年项目的相关信息)。
2017 年,我们的工作远远超出在这篇分成两部分的博文中重点介绍的内容。我们热衷于在顶级研究场合发布我们的成果,去年,我们团队发表了 140 篇论文,其中超过 60 篇在 ICLR、ICML 和 NIPS 上发表。要详细了解我们的工作,您可以仔细阅读我们的研究论文。
您也可以在这个视频中认识我们团队的一些成员,或者阅读我们对有关 r/MachineLearning 的第二个 Ask Me Anything (AMA) 帖子的回复(也要记得浏览 2016 的 AMA)。
Google Brain 团队正在开枝散叶,在北美和欧洲吸纳了团队成员。如果您认为我们正在做的工作有趣,或者想要加入我们,您可以利用 g.co/brain 页面底部的链接查看我们的空缺职位,并申请实习、AI 学员计划、访问学者或者全职研究或工程角色。您也可以通过 Google 研究博客和我们的 Twitter 帐号 @GoogleResearch 关注我们在 2018 年的工作。您也可以关注我的个人 Twitter 帐号 @JeffDean。
感谢阅读!