面向 AI 的 DevOps：准备好扩展您的 AI 了吗？怎样才能带来强大的改变？速度+质量+规模+灵活性。正如 Dev

怎样才能带来强大的改变？速度+质量+规模+灵活性。正如 DevOps 将其带入软件开发一样，您可以使用 DevOps 为您的 AI 模型交付提供动力。

下一波竞争优势预计将来自人工智能 (AI) 、区块链等新兴技术。一夜之间，我们看到向这些数字技术转变的速度从几年到几个月甚至几天。为了支持这种变化，智能自动化和人工智能实施的数量正在快速增加。要将 AI 集成到您公司的 DNA 中，面向 AI 的 DevOps 原则至关重要。

面向 AI 的 DevOps 如何提供帮助

当应用于 AI 时，DevOps 通过从设计到生产的机器学习模型的运营，来实现大规模 AI。面向 AI 的 DevOps 确保正确的 AI 交付流程到位，并能够在这些不断变化和技术转型的时代带来所需的灵活性和“快速失败”方法。从本质上讲，DevOps 将通过以下方式促进模型的持续交付、部署和监控：

速度：通过减少人工智能交付中的非增值活动来缩短上市时间
质量：加速清理数据集并促进持续学习以提高 AI 模型质量
可扩展性：优先考虑可扩展性并确保 AI 模型可以按需扩展
稳定性：监控已部署的 AI 模型，使其保持可靠、稳定和准确

如何使其可重复

为了满足 AI 实施的需求，需要将最佳实践应用于 AI 模型运营。然而，围绕人工智能交付的最佳实践处于不断变化的状态。 DevOps 原则解决了这一挑战，并提出了一种可重复但适应性强的方法，以通过持续的变化提高 AI 交付的成熟度。

我们将使用 DevOps 实践的 AI 操作化分为四个阶段：

数据准备：为开发 AI 模型准备正确的数据集是关键的开始步骤，因为模型的准确性取决于训练数据集的质量和大小。传统上，数据准备（数据提取、数据清理、数据标记和数据验证）是一项手动且繁琐的任务，数据科学家通常花费大约 70% 的时间。面向 AI 的 DevOps 可以自动执行这些步骤，并使数据管道能够处理大数据。这提高了数据集的质量和大小，并使数据科学家能够专注于特征工程和 AI 模型开发。
AI 模型开发：即使有正确的数据，开发 AI 模型也需要大量时间。人工智能模型开发包括三个主要活动：特征工程、算法选择和数据集训练。模型开发是一个迭代过程，需要多轮模型训练才能得出最优解。这通常发生在数据科学家的本地机器中，并且各个 AI 团队之间没有太多协作。 DevOps 实践通过提供弹性基础架构和并行开发、并行测试和模型版本控制流程来加速 AI 模型开发。这减少了达到最佳模型所需的时间和精力。
AI 模型部署：在生产中部署 AI 模型对于许多组织来说是一个极具挑战性的领域。当个别数据科学家在其本地工作站中部署在孤岛中开发的模型时，问题尤其会出现。为了让 AI 模型在生产中表现良好，它们应该能够在高度可扩展的分布式平台上实时处理传入的数据流。 DevOps 方法使 AI 模型可移植和模块化。这种架构允许人工智能大规模地操作人工智能。
AI 模型监控和持续学习：一旦部署，模型就会面临“模型漂移”的威胁。这是最初基于历史数据集开发生产中部署的模型的地方。然后随着时间的推移，数据和模型变得过时，模型精度降低，导致“漂移”。面向 AI 的 DevOps 引入了持续学习的概念，其中数据（如：漂移）和模型性能指标（如：准确性）受到监控，以确保它们在更长时间内保持相关性。这会在市场上产生更好、更负责任的人工智能解决方案。

面向 AI 的 DevOps 为希望加速和改进 AI 解决方案、AI 驱动的创新和智能自动化的组织提供了一个很有前景的解决方案。 它加快了数据准备和模型开发任务，并引入了标准化流程，使人工智能大规模成为现实。但是，尽管有明显的好处，但人工智能的可操作化问题往往没有得到解决。现在是时候将 AI 可操作化作为核心业务目标了。

原文链接：DevOps for AI: Are you ready to scale?