面向 AI 的 DevOps:准备好扩展您的 AI 了吗?

141 阅读4分钟

怎样才能带来强大的改变?速度+质量+规模+灵活性。正如 DevOps 将其带入软件开发一样,您可以使用 DevOps 为您的 AI 模型交付提供动力。

下一波竞争优势预计将来自人工智能 (AI) 、区块链等新兴技术。一夜之间,我们看到向这些数字技术转变的速度从几年到几个月甚至几天。为了支持这种变化,智能自动化和人工智能实施的数量正在快速增加。要将 AI 集成到您公司的 DNA 中,面向 AI 的 DevOps 原则至关重要。

面向 AI 的 DevOps 如何提供帮助

当应用于 AI 时,DevOps 通过从设计到生产的机器学习模型的运营,来实现大规模 AI。面向 AI 的 DevOps 确保正确的 AI 交付流程到位,并能够在这些不断变化和技术转型的时代带来所需的灵活性和“快速失败”方法。从本质上讲,DevOps 将通过以下方式促进模型的持续交付、部署和监控:

  • 速度:通过减少人工智能交付中的非增值活动来缩短上市时间
  • 质量:加速清理数据集并促进持续学习以提高 AI 模型质量
  • 可扩展性:优先考虑可扩展性并确保 AI 模型可以按需扩展
  • 稳定性:监控已部署的 AI 模型,使其保持可靠、稳定和准确

如何使其可重复

为了满足 AI 实施的需求,需要将最佳实践应用于 AI 模型运营。然而,围绕人工智能交付的最佳实践处于不断变化的状态。 DevOps 原则解决了这一挑战,并提出了一种可重复但适应性强的方法,以通过持续的变化提高 AI 交付的成熟度。

我们将使用 DevOps 实践的 AI 操作化分为四个阶段:

  • 数据准备:为开发 AI 模型准备正确的数据集是关键的开始步骤,因为模型的准确性取决于训练数据集的质量和大小。传统上,数据准备(数据提取、数据清理、数据标记和数据验证)是一项手动且繁琐的任务,数据科学家通常花费大约 70% 的时间。 面向 AI 的 DevOps 可以自动执行这些步骤,并使数据管道能够处理大数据。这提高了数据集的质量和大小,并使数据科学家能够专注于特征工程和 AI 模型开发
  • AI 模型开发:即使有正确的数据,开发 AI 模型也需要大量时间。人工智能模型开发包括三个主要活动:特征工程、算法选择和数据集训练。模型开发是一个迭代过程,需要多轮模型训练才能得出最优解。这通常发生在数据科学家的本地机器中,并且各个 AI 团队之间没有太多协作。 DevOps 实践通过提供弹性基础架构和并行开发、并行测试和模型版本控制流程来加速 AI 模型开发。这减少了达到最佳模型所需的时间和精力。
  • AI 模型部署:在生产中部署 AI 模型对于许多组织来说是一个极具挑战性的领域。当个别数据科学家在其本地工作站中部署在孤岛中开发的模型时,问题尤其会出现。为了让 AI 模型在生产中表现良好,它们应该能够在高度可扩展的分布式平台上实时处理传入的数据流。 DevOps 方法使 AI 模型可移植和模块化。这种架构允许人工智能大规模地操作人工智能。
  • AI 模型监控和持续学习:一旦部署,模型就会面临“模型漂移”的威胁。这是最初基于历史数据集开发生产中部署的模型的地方。然后随着时间的推移,数据和模型变得过时,模型精度降低,导致“漂移”。 面向 AI 的 DevOps 引入了持续学习的概念,其中数据(如:漂移)和模型性能指标(如:准确性)受到监控,以确保它们在更长时间内保持相关性。这会在市场上产生更好、更负责任的人工智能解决方案。

image.png

面向 AI 的 DevOps 为希望加速和改进 AI 解决方案、AI 驱动的创新和智能自动化的组织提供了一个很有前景的解决方案。 它加快了数据准备和模型开发任务,并引入了标准化流程,使人工智能大规模成为现实。 但是,尽管有明显的好处,但人工智能的可操作化问题往往没有得到解决。 现在是时候将 AI 可操作化作为核心业务目标了。

原文链接:DevOps for AI: Are you ready to scale?