用Qwak在生产中部署ML模型

353 阅读7分钟

Deploying ML models in production with Qwak

像Pinterest、Uber、Intuit等科技公司都有什么共同点?他们的产品中都有ML驱动的服务。换句话说,他们有自己的内部机器学习工程平台,团队用它来实时或分阶段/分期部署模型。

但是,今天大多数公司的情况并非如此。有很多斗争是不言而喻的,尤其是生产中的ML模型部署。研究表明,90%的机器学习模型从未进入生产阶段。

"机器学习在生产中是可以做到的;它不应该有这么大的伤害,"Qwak的联合创始人兼首席执行官Alon Lev说,并对他的平台进行了说明。

当在生产中部署ML模型时;复杂的部分不是技术部分;它更像是这种一个团队与另一个团队之间的乒乓。"要说服别人为你做一件事需要很多时间。如果他们不理解,你就会被打回原形,毫无进展。"列夫说。

在生产中部署ML模型 (Source: Qwak)

列夫说,有了Qwak,他们已经成功地将摩擦减少到几乎为零。"你不需要再把你的模型发给任何人,"他补充说。

Qwak成立于2021年,由Lev、Ran Romano、Yuval Fernbach和Lior Penso创办。这些联合创始人以前曾领导过机器学习和数据科学创新,并在Payoneer、AWS、ironSource、Wix.com等公司工作。

在Leaders Fund、Amiti Ventures、StageOne Ventures和其他天使投资人(包括Eugen Miropolski、Noam Kaiser、Tamir Carmi、Philippe Suchet和Rani Wellingstein)的支持下,该公司总共筹集了1940万美元。

随着各行业快速数字化的发生--接近97.2%的公司声称以某种形式和形态采用了数据科学和分析,最近,技术企业家和投资者的兴趣越来越大。根据德勤,预计到2025年,MLOPs市场达到40亿美元。除了Qwak,该领域的一些其他MLOps参与者包括ZenMLCometDomino Data LabWeights and Biases等。

在生产中部署ML模型,Qwak-ly

为所有人简化ML产品化经验的是Qwak。该公司已经成功地将其ML工程平台商业化,该平台使MLOPs流程自动化,并允许公司实时管理模型。

只需一行代码,团队现在就可以快速上马他们的模型。其平台目前被多家公司使用,包括JLL、NetApp、Yotpo、Guesty、Skyline AI和其他。

**结果是。**那些在几个月内部署一到两个模型的公司,现在可以在几天内部署接近几十个模型。

JLL的工程副总裁Or Hiltch说,Qwak帮助他们专注于创造业务影响,而不是在建立基础设施上花费宝贵的时间。他说,通过使用Qwak,他们的执行时间提高了4.5倍。"在JLL,我们的开发对时间非常敏感,"他补充说。

Qwak通过为每个模型提供一个具有清晰视图的管理和可观察性平台,支持和协助研发领导、数据科学家、ML工程师、技术分析师和产品所有者。最重要的是,每个人都能从基础设施的角度到业务成果层面查看模型,有完整的指标、性能、成本和版本。

Lev说,在将ML模型部署到生产中时,数据科学和工程师之间有太多的来回奔波。因此,Qwak本质上做的是数据科学家可以在他们的平台上建立他们的模型并训练模型。一旦训练完成,你就可以通过点击一个按钮来部署模型,可以是批量流,也可以是实时的,有多种部署策略,例如A/B测试、影子部署等。

该平台有一个数据湖,它保存了所有进入模型进行预测的数据。它还有一个特征存储,允许客户支持不同的数据源和数据类型,以便在飞行中使用。"我们的特征存储与平台紧密相连,这意味着你总是可以从两个方向进行调查;你可以从特征的角度来看,比如说,什么样的模型被使用或从消耗特征;以及在特征存储中需要什么样的特征来训练和预测这个非常具体的模型,"罗马诺解释说,所有这些都可以在没有或零代码的情况下完成。

联合创始人个人还喜欢的另一个有趣的功能是设置警报--准确度等级、行动触发器等,例如,自动保留ML模型。"这超级有意义;你不能每天都去检查所有的模型,并保留它们。你需要一些或多或少强大的东西,在那里你可以更快地扩展你的模型,为一个移动的公司,"罗曼诺分享说。

以下是对Qwak平台的快速概述,以及它如何将数据科学和ML工程团队内的摩擦降到最低。

使用Qwak在生产中部署ML模型 (来源:《印度分析》杂志) Qwak)

Qwak消除了机器学习的数据科学和工程摩擦,同时允许更快的迭代、可扩展性和可定制的基础设施。这包括构建推荐引擎、NLP应用、计算机视觉等。

"他们所需要做的就是添加一行代码,输入登录凭证,然后运行构建命令。就这样,"罗曼诺说,他分享了数据科学家在使用他们的平台时必须经历的文化转变。

Qwak堆栈

在介绍团队和技术栈时,Romano说,团队由两个主要小组组成,即MLOps小组和DataOps小组。在Qwak,MLops团队负责建立机器学习工程、模型部署、基础设施、分析和自动化措施。另一方面,DataOps团队则负责处理功能存储或用于摄取数据的ETL、数据管道等。

DataOps团队和功能存储组目前使用Spark、MLflow、Redis和Iceberg技术。MLOps团队使用更多与Kubernetes、Python等相关的基础设施,用于构建模型。对于后端,他们使用Java服务、Kafka、Amazon Athena等。

途中。印度

Lev告诉AIM,他们计划每年将团队扩大一倍或三倍。"我们肯定在超速增长,"他补充说。目前,该团队由近30多名员工组成,包括数据科学家、产品开发人员、ML工程师等。

Qwak最近在美国开设了办公室,并很快计划在欧洲扩张。"我们未来几个月的主要重点将围绕中型市场。这包括独角兽企业、科技公司和数字优先的初创企业等,"Lev说。 在长期愿景方面,Lev说他们希望成为生产的首选工具。

"我们很高兴与印度市场合作,"Lev说,他们已经在与来自印度市场的两个合作伙伴合作,他们正在与他们进行POC。

"看到许多来自印度的超酷和先进的技术公司,这令人惊讶,"他补充说。Lev说,他们在印度的生态系统中看到了很多ML和数据科学举措,他们期待着增加影响。

列夫说,印度人在机器学习和数据科学方面非常精通技术,有基础设施意识,技术上也很健全。"他们往往知道什么是重要的,什么是不重要的,"他补充说,他们与印度的领先公司合作的时间很愉快。

免费试用Qwak。

The postDeploying ML models in production with Qwakappeared first onAnalytics India Magazine.