发表于 2022 年 5 月 25 日
Eric Boyd人工智能平台公司副总裁
微软致力于推进人工智能,让每个人和组织都能取得更多成就。在过去的几个月里,我们谈到了Azure基础设施、Azure认知服务和Azure机器学习方面的进步,以使Azure更好地支持所有客户的人工智能需求,无论他们的规模如何。同时,我们还与世界各地一些领先的研究机构密切合作,使他们能够构建伟大的人工智能。
今天,我们非常激动地宣布,我们与Meta的持续合作将进一步扩大:Meta已经选择Azure作为战略云提供商,帮助加速AI的研发。与其他公共云产品相比,Azure平台的虚拟机之间gpu到gpu的带宽是其他公共云产品的四倍,从而实现更快的分布式AI训练。例如,Meta使用这个来训练他们最近的OPT-175B语言模型。Azure上的NDm A100 v4 VM系列还为客户提供了从几个gpu到数千个gpu自动、动态地配置任何大小的集群的灵活性,以及在实验期间暂停和恢复的能力。现在,Meta AI团队正在扩大他们的使用范围,并将更多尖端的机器学习训练工作负载引入Azure,以帮助进一步推进他们领先的AI研究。
此外,Meta和微软将合作扩大PyTorch在Azure上的应用,并加快开发者从实验到生产的过程。Azure通过一流的硬件(NDv4s和Infiniband)为PyTorch用户提供了一个全面的从顶部到底部的栈。在接下来的几个月里,微软将构建新的PyTorch开发加速器,以促进基于PyTorch的解决方案在Azure上的快速实现。微软还将继续为PyTorch提供企业级支持,使客户和合作伙伴能够在云和边缘的生产环境中部署PyTorch模型。
Meta AI副总裁Jerome Pesenti表示: “我们很高兴能够深化与Azure的合作,以促进Meta的AI研究、创新和开源努力,让世界各地更多的开发者受益。” ,“凭借Azure的计算能力和每个虚拟机1.6 TB/s的互连带宽,我们能够加快不断增长的培训需求,以更好地适应更大、更创新的AI模型。此外,我们很高兴与微软合作,将我们的经验扩展到他们的客户使用PyTorch从研究到生产的过程中。”
通过扩大Azure的超级计算能力,为世界领先的研究机构培训大型AI模型,通过扩大开源协作和实验的工具和资源,我们可以帮助开发人员和更广泛的技术社区解锁新的机会,我们的使命是为世界各地的每个人和组织赋权。