MLSys 2021:联结机器学习与系统领域的桥梁

4 阅读5分钟

MLSys 2021:弥合机器学习与系统之间的鸿沟

机器学习与系统会议(MLSys)将于下周开始,虽然该会议仅创办四年,但某机构的科学家们已与其建立了深厚的历史联系。某机构学者Michael I. Jordan是其指导委员会成员;副总裁兼杰出科学家Inderjit Dhillon是董事会成员,并担任了去年的会议主席;同样是指导委员会成员的副总裁兼杰出科学家Alex Smola,则是今年的会议主席。随着深度学习革命的普及,MLSys的创立旨在连接两个能够为彼此提供丰富价值、但常常独立工作的社区:机器学习研究者和系统开发者。

会议注册仍开放 了解更多关于某机构参与MLSys 2021的信息,包括论文展示和研讨会参与。会议注册仍开放,学生注册费低至25美元,学术和专业人员的注册费为100美元。

“如果你看看那些大型的机器学习会议,它们主要关注‘看,这是一个很酷的算法,以下是它能做的惊人事情。顺便说一句,它现在识别猫的能力比以前更强了,’” Smola说。“这些会议主要展示的是能力的提升。与此同时,还有系统会议,它们主要关注文件系统、数据库、高可用性、容错性等等。那么,为什么需要介于两者之间的东西呢?因为在机器学习中,近似解通常就足够好了。并不一定需要系统提供如此强的保证。如果降低要求,可以更便宜、更快或更具扩展性地完成任务。”

Sys for ML 与 ML for sys 同时,随着深度学习的普及,很自然地会问它是否可以帮助优化计算机系统中的资源分配。“这最终是许多系统论文所做的事,” Smola说。“它们围绕着这些问题:我应该启动一台机器吗?应该停止一台吗?我应该为一台作业调度多少设备?何时判定一台机器故障?我需要多少冗余?所以你可以问自己,既然这些很多都是资源决策,我是否可以使用机器学习来预测处理这些资源决策的最佳或至少更好的策略是什么?”

“我应该启动一台机器吗?应该停止一台吗?我应该为一台作业调度多少设备?…… 我是否可以使用机器学习来预测处理这些资源决策的最佳或至少更好的策略是什么?”—— Alex Smola

Smola解释说,被MLSys接受的论文涵盖了双向研究——机器学习赋能系统以及系统支撑机器学习。他举例提到了会议在4月6日星期二举行的“通信与存储”分会场议程。“这很大程度上是一个系统分会场,” Smola说。“但即使在那里,它也涵盖了两个方向。例如,论文‘共享机器学习集群的网络内聚合’是关于如何低成本地执行操作以促进更多机器学习。但另一篇论文则是关于如何使用机器学习让这些存储系统本身变得更好。”

文化融合 Smola表示,MLSys不仅代表了研究方向的融合,也代表了文化的融合——这可能会引发一些生动的讨论。“在系统社区,本质上,除非你真正拥有一个可工作的系统,否则他们不会认真对待你,” Smola说。“这使得会议有点意思,因为你有两种不同的文化。一种是机器学习文化,它更像是‘嘿,这是一幅关于可能性的印象派画作。下一篇论文,请。’另一种是系统社区文化,它更加严谨,强调‘看,这是实际可工作的东西,而且我们已经证明了它。顺便说一句,可能现在已经有产品在使用它了。’这使得会议很有趣,因为这两种文化通常并不这样混合。这也许让系统论文带上一点更理论的倾向,而机器学习论文则更偏向实证。”

在今年的MLSys上,Smola负责监督的其中一项新增内容是一个为期一天的“芯片与编译器研讨会”,这个研讨会将关于机器学习系统设计的讨论深入到“金属”层面——即芯片级别。该研讨会由某中心网络服务的高级首席科学家Mu Li组织。“有像Hot Chips和Cool Chips这样的活动,某中心、某机构、某机构、某机构和某机构等公司会出席并展示最新的芯片,” Smola说。“但芯片只是等式的一半。所以我们认为这里是将这两个社区更紧密地结合在一起的好地方。这是一项社区建设活动。”

和过去一年所有的计算机科学会议一样,MLSys也转为线上举办。Smola表示,这样做的好处是大幅降低了注册费用——学生25美元,学术和专业人员100美元。“这对任何人来说都非常实惠,” Smola说。