Azure Copilot 现已更新,增加了六个代理,涵盖整个云管理生命周期,以协助用户进行迁移、部署、优化、可观测性、弹性和故障排除。
译自:How Azure Copilot’s New Agents Automate DevOps and SecOps
作者:Mary Branscombe
Azure 上有超过 200 种不同的服务,以及数千种资源类型。在本周的 Ignite 会议上,其中大部分将获得新功能。Azure 中的 Copilot 已经可以帮助您获取资源信息、编写脚本、审查您的云账单并进行基本故障排除——但它的功能一直相当有限。
现在,微软正在用一个新名称 Azure Copilot 更新它,并增加了六个代理——用于迁移、部署、优化、可观测性、弹性及故障排除——涵盖了整个云管理生命周期,Azure Experiences and Ecosystems(包括 Azure 门户、CLI 和 Copilot)的 CVP 和 GM Annie Pearl 表示。
“最大的技术增强是一个编排器,它接收自然语言并根据任务确定调用哪个代理或多个代理,”Pearl 在接受 The New Stack 采访时说。“通过 Azure Copilot,您可以从手动工作流转变为,嘿,让我与一个代理合作来优化我的虚拟机,帮助我解决问题,调查警报,或者确保我最重要的工作负载是多区域或有弹性的。”
您得到的不仅仅是聊天中的文本回复:新界面看起来就像您在 Azure 门户中习惯的格式化仪表板信息和见解,但带有针对您关注点的自定义建议——因此您不必点击租户中所有内容的层级。
由于需要处理的事情太多,许多管理员没有时间检查每个工作负载的配置效率或实现效果是否达到最佳,尤其是在工作负载已经运行且没有引起问题的情况下。与其等到您已经发现问题,或者收到比预期更昂贵的云账单,或者听说了一项新服务并想了解它是否有用,不如让代理主动提出建议、编写脚本,并在您同意的情况下为您采取行动。
“例如,部署代理:它不仅接受了 Azure 良好架构框架和最佳实践的训练,还会问我关于部署时可能需要做出的不同权衡的问题。”
– Annie Pearl,微软 Azure 体验部 CVP
“我不再需要浏览学习文档[获取某个功能]、回来、创建自己的 Bicep 模板或 Terraform 文件,然后复制粘贴一些 API 端点[粘贴进去],现在代理可以为我完成所有这些工作,”Pearl 解释说。“我可以给它一个任务。我可以进行一些来回的沟通。例如,部署代理不仅接受了 Azure 良好架构框架和最佳实践的训练,还会问我关于部署时可能需要做出的不同权衡的问题。它可以创建基础架构即代码,然后我可以——自动或通过人工介入——将其推送到 GitHub。”
如果您正在对连接到 API 的超时进行故障排除,并且代理建议更改网络访问设置,它将为您提供一个您可以复制并运行的 Azure CLI 命令,并且还可以选择让代理为您进行更改——提前向您展示它将要更改的内容。
“人们不想要一个黑箱。是的,我希望您自动化它,但我需要您向我解释您所做的一切,这样我就可以看到[是否]您做得正确,是否符合我的预期,以及我是否知道它是正确的,”CCS Insight 的首席企业研究员 Bola Rotibi 认为,这种可解释性是根本性的。
她希望将其进一步发展,也许可以选择将最重要或影响最广泛的更改发送给其他人批准,这样如果以后出现问题,指挥链就会很清楚。
新的运维仪表板
您可以在门户(全屏沉浸式聊天或侧边栏)和 Azure CLI 中使用新界面,GitHub Copilot 中也提供了一些相关操作;此外,还有一个新的统一 Azure 运维中心仪表板。该仪表板除了“汇集了许多分散的管理体验”之外,还将新代理直接置于运维团队所需的各种工作流程中。
根据 IDC 的说法,这使其在组织寻求代理式人工智能以提高生产力方面更加有用。
“以前,您可以要求 Copilot 总结您的成本,但现在优化代理可以主动建议节省成本的方法,生成可直接使用的 PowerShell 或 CLI 脚本,并调整您的虚拟机大小或更改您的虚拟机 SKU,”Rotibi 解释说。
这包括阐明成本和性能等权衡:“它将重点介绍成本和可持续性操作,并比较财务绩效和碳排放影响,然后提出关于如何降低成本、改善可持续性影响以及保持或提高性能的建议。它将解释这些建议[为何有效]并比较替代方案;您可以像‘我想添加这个变量,我想删除那个变量’一样进行来回对话,然后它将生成脚本来实施它们。”
有时,这些更改将如何影响您的 Azure 账单的详细信息会比较笼统——例如添加弹性,影响中等——但对虚拟机建议的更改将为您提供具体的美元和二氧化碳排放节省量,或者一个关于利用率预期如何变化以及更改是否会影响性能的图表。
可观测性代理将主动显示关于令人担忧的指标的警报(仪表板已经可以做到这一点),但也会在后台进行调查以收集详细信息,以便您可以深入研究。
“它将提供特定于服务的遥测和可观测性数据,”Rotibi 说,“它会查看指标、跟踪和日志等内容,并从 Azure Monitor 和诊断工具收集运行状况信号。”
过度劳累的运维
开发人员已经使用了多年的编码代理,GitHub Copilot 和 VS Code 已经连接到 Azure MCP 服务器,但代理正变得对通常不堪重负的运维团队越来越受欢迎。
微软的 Pearl 承认,云并没有让情况变得更好。“如今,他们正在手动处理大量不同的仪表板和所有这些零散的工具;云的复杂性带来了更多挑战,并给这些角色带来了更大的压力。”
Rotibi 表示同意。“当我们与组织[讨论]云时,令我惊讶的是,人们仍然陷在细节中,并且他们试图弄清楚事情,”她说。云只是他们必须处理的众多事务之一,还包括安全、身份、人工智能、政府战略、监管以及他们自己行业和垂直领域的特定需求。
“组织团队不得不承担集成的麻烦,他们对此感到厌倦,因为这变得越来越复杂。”
– Bola Rotibi,CCS Insight 首席企业研究员
“组织团队不得不承担集成的麻烦,他们对此感到厌倦,因为这变得越来越复杂,”Rotibi 指出。
尽管她警告说,认为代理会解决您所有问题“有点过于轻率”,“但我认为他们提出的基本前提是正确的。是的,这很困难。是的,可以实现更多的自动化。您猜怎么着?微软可以提供帮助。天哪,来得正是时候。为什么你们以前不做呢?”
Rotibi 补充说,为您的特定工作负载配置正确的云配置仍然将是共同的责任,但“现在有更多事物以数字方式表达,因此微软实际上可以做更多事情。”
Pearl 所说的“代理式云运维”是试图通过提供代理来承担部分负担,从而提高运维团队的效率。
“我们还能够在多代理工作流中让这些代理协同工作,”Pearl 说。
当然,开发人员也会发现部署代理很有用。
“我们与 GitHub 有非常好的集成,”Pearl 继续说道,“这样您就可以将部署代理构建的基础架构即代码直接推送到 GitHub。但这非常侧重于代理式云运维,并真正试图自动化 IT 运维、SecOps、DevOps、数据运维、FinOps 等所有运维角色。”
GitHub 正在采取类似的主动方法,Microsoft Defender for Cloud 已集成到 GitHub Advanced Security 中,因此您可以筛选出运行时风险,例如包含敏感数据或暴露于公共互联网的工作负载,并在这些问题出现时通知开发人员——以及建议的自动修复。
Copilot 比以前有更多的历史记录,因此您可以查看过去的对话,了解您过去用它来做什么,并且由于您启动的一些任务需要时间,您可以在一个提示仍在处理时开始新的聊天。
“Copilot 从客户可以访问的数据中提取信息:它与 ARM 和 RBAC 策略对齐,它可以访问用户有权访问和授权的任何内容。”
– Pearl
它还可以获得更多关于您的租户的上下文信息,尽管代理能做什么取决于您的账户的权限和授权,Pearl 指出。
“Copilot 从客户可以访问的数据中提取信息:它与 ARM 和 RBAC 策略对齐,它可以访问用户有权访问和授权的任何内容,”她解释说。“我们从 Microsoft Learn 和 API 文档以及我们的故障排除代理那里获取了基础数据。它调用 Azure 控制平面等数据源以获取编排和管理上下文。它将调用 [Azure 资源图] 以获取您的资源的实时清单。”
Pearl 所说的“提示启动器”将指导用户提供使与生成式 AI 的交互更有用的额外详细信息(当搜索引擎多年来训练我们只用几个关键词来获得相关结果时,这可能很难)。
“我们代表用户进行上下文注入,”Pearl 继续说道。“我们可以看到用户在哪个页面,他们在门户的哪个位置,他们正在查看哪些资源,然后还可以查看他们的整个 Azure 帐户。这是对话式的——我们正在提出后续问题并进行澄清。”
但请放心,如果代理走错了方向,您可以重新引导它们。
翻译成微语
对于新用户来说,Azure 的一个长期存在的问题(或者习惯了本地服务器的用户)是弄清楚哪些服务有用——甚至与他们在 AWS 或 GCP 上的使用相对应。
Pearl 管理着微软的初创公司计划,并承认“如果一个初创公司创始人或原生 AI 开发人员习惯了 AWS,那么转向 Azure 可能需要一些翻译”。
Azure Copilot 可以帮助他们,还可以帮助用户弄清楚像 AKS Automatic 或 HorizonDB 这样的新服务是否与他们相关——以及他们需要做什么才能将现有的特定工作负载切换到不同的服务,包括这可能会对云账单产生什么影响。
“我们可以使用自然语言来部署一个带有 PostgreSQL 后端的 Python Flask 应用程序,并启用 Application Insights 的监控,以及在 Key Vault 中保护机密,”Pearl 说。“您可以通过自然语言告诉部署代理您试图创建的基础架构,它将为您创建那些 Terraform 文件以供审查,并遵循 Azure 良好架构框架的最佳实践,然后您可以将其推送到 GitHub。”
由于 Azure Copilot 基于 Learn 内容和 API 文档,她建议代理“很快”就能准备好处理新推出的服务。
Rotibi 说,微软选择了正确的起点,既可以提高生产力,也可以辅导经验较少的员工。
“如果您在 IT 基础架构运维或甚至部署领域,这些都是每个人都有的功能。任何有多年经验的人都知道,这些是我需要做的事情;而且初级人员正在成长,这正是他们需要帮助的地方。”
“我们经常从客户那里听到的一些问题是关于故障排除——希望更快、更主动地检测问题。”
– Pearl
此外,Copilot 本身也将继续发展。Pearl 将这种早期访问预览称为“第一阶段”,旨在满足常见请求和痛点。
“我们经常从客户那里听到的一些问题是关于故障排除——希望更快、更主动地检测问题。每个客户都关心弹性,所以代理的设计就是提出高可用性、灾难恢复的建议,并生成代码和操作。对于部署,客户确实希望更简单、更具指导性的体验。优化,客户确实在努力优化成本和性能。[这些]代理经过调整,可以分析利用率,并推荐和执行成本节省。识别出虚拟机可能以 30% 的利用率运行,并模拟缩减规模可能是什么样子,同时还要确保这与性能保持平衡。”
未来,Azure Copilot 可能会超越您已使用的服务,推荐其他可能更有用的服务——例如,使用托管数据库服务而不是自己运行数据库。
“我们拥有用户自己可以访问的所有数据,”Pearl 说。“想象一下,您正在查看日志、遥测数据、指标和性能以及成本,并且您可以对所有这些数据进行三角测量,以获得关于改进您现有的产品配置或换用更合适的产品以获得智能建议。”
微软“需要了解在集成、混合、多云世界中是什么样的”。
– Rotibi
考虑到一些组织只使用微软和 Azure 服务,Copilot 也需要处理第三方服务,并且可能不仅仅是在 Azure 上,Rotibi 指出“[微软]需要了解在集成、混合、多云世界中是什么样的”。
微软可以在这里利用其合作伙伴生态系统,特别是新兴的 MCP 标准。
“他们目前还没有第三方连接器,”Rotibi 说,“但在大型企业中有标准:你知道他们会使用特定的应用程序和解决方案。有一系列需要连接的东西,无论是 Databricks、Snowflake,还是其他任何东西。”
Rotibi 还预计,组织将希望 Azure Copilot 的输出集成到他们其他的日志记录系统中,如 Splunk、AppDynamics 或 Dynatrace,以及微软自己的可观测性平台,用于捕获更改、分析它们,有时甚至重放它们进行测试,使代理成为该工作流程的一部分。
“市场上存在一定的成熟度,自动化水平、捕获水平允许更好的对话和更好的工作方式;微软正在利用这一点,”Rotibi 说。
她认为,要使 Azure Copilot 这样的工具成功成为一种新的云配置管理方式,将需要集成,以及对代理操作和机制的可见性和透明度。“我认为这就是他们在努力做的;[问题是]他们取得了什么程度的成熟度和深度。我认为他们已经做了很多,而且很多都非常好——我认为还有更多工作要做。”