基于 Microsoft Foundry 的智能体式 AI——设置你的 Microsoft Foundry 环境

16 阅读11分钟

在本章中,你将学习如何登录 Azure portal,然后创建一个 resource group。Resource group 创建完成后,你就可以创建新的 Microsoft Foundry resource:需要提供 resource 名称、要使用的 region,以及第一个 project 的名称。根据你要使用的 models,选择适合的 region。例如,如果你想使用 Computer Use Preview,它目前只在 Sweden Central 和 East US2 可用。Model availability 变化很快,因此请参考 Microsoft Learn 网站上的文档,了解 models 可在哪些 region 中使用。

本章将覆盖以下主要主题:

  • Setting up a resource group
  • Creating Microsoft Foundry project resource
  • Deploying the Azure OpenAI model

Technical requirements

你已经学习了 generative AI applications 和 agentic AI applications。本章中,我们将创建后续章节所需的必要 resources,用于构建新的 generative AI 和 agentic AI applications。

开始之前,请确保选择一个大多数 models 都可用的 region。例如: learn.microsoft.com/en-us/azure…

此外,要跟随本章操作,必须具备使用 Azure portal 的基础知识。

Setting up a resource group

本节将介绍如何使用 Azure portal UI 创建 resource group 并选择 region。Resource group creation 也可以通过 command-line 功能完成。读完本章后,你将能够非常熟练地在自己选择的 region 中创建 resource group,并用它来逻辑上管理本项目的所有 resources。Resource groups 允许我们根据不同的 development、testing 和 production environments,组织 application 使用的 resources。这样可以更容易地管理、运营和治理 application resource。

下面,我们将逐步讨论如何使用 Azure portal,如何搜索 resource group,以及如何在指定 region 中创建一个 resource group。

Creating a resource group

现在,我们根据下面步骤创建 resource group。我会在 Sweden Central region 创建 resource group,因为这个 region 可用 models 最多。

首先,打开浏览器并访问:

https://portal.azure.com

然后,进入 portal 页面顶部的 Search bar,输入:

resource group

image.png

图 2.1:Search resource group

点击 Resource groups,然后点击 Create

image.png

图 2.2:Click Create

在下一页中,确保选择了正确的 subscription ID。随后,我们需要为 resource group 提供名称,并为 deployment 选择合适 region。

image.png

图 2.3:Create a resource group

表单填写完成后,在页面底部点击 Review + Create

image.png

图 2.4:Review + Create

Validation 完成后,点击 Create

等待流程完成。

点击 Go to resource group

image.png

图 2.5:After deployment completion

此时应该会看到一个空的 resource group。

你可以使用 Azure Portal(UI)、Azure CLI,或 Bicep / ARM templates 等 infrastructure-as-code tools 创建 resource。名称应该唯一,并且可以遵循你公司的 naming convention。Names 应全部使用小写,不包含任何 special characters。

现在,你已经学习了如何创建 resource group,用于组织后续本书或某个指定 application 中将要使用的 resources。

Creating Microsoft Foundry resource

接下来,你将学习如何创建 Microsoft Foundry project resource。Microsoft Foundry 是一个 end-to-end generative AI 和 agentic AI development platform。Microsoft Foundry 覆盖从 development 到 evaluation、monitoring、auditing 和 lineage 的完整流程,并在 model catalog 中提供 11K models。Model count 会根据当前可用情况变化,因为 models 正在快速增长。

延续上一节中创建 resource group 的内容,我们将在该 resource group 中创建 Microsoft Foundry project resource。请按照以下说明操作:

进入上一节刚刚创建的 resource group。

现在,点击右侧 pane 中的 Create 按钮。界面中有左右两个 pane:左侧 pane 是可选择的 resources 菜单,右侧是主要工作区域。

输入:

Microsoft Foundry

如下所示: image.png

图 2.6:Search operation

按 Enter 搜索后,你应该会看到如下图所示的 Microsoft Foundry。

image.png

图 2.7:Microsoft Foundry

点击 Create arrow,并选择 Microsoft Foundry。这会带你进入创建实际 resource 的表单页面。下一页将显示创建 resource 所需的 configuration。

在下一屏中,你应该会看到如下图内容:

image.png

图 2.8:Foundry details

现在,我们需要填写表单,并继续进入下一屏。在这里,我们需要选择合适的 subscription。然后选择上一节创建的 resource group。为 AI Foundry resource 提供一个唯一名称;名称最好全部使用小写。如果需要,也可以遵循某种 naming convention。为你的第一个 project 提供 default project name。选择你想使用的 region。在这个示例中,我选择 Sweden Central,使其与 resource group 一致,并基于 model availability 进行选择。

所有信息填写完成后,点击 Next 按钮。

这一屏会显示一个选项,用于根据你的 corporate guidance 保护 resource。为了本书演示,我们只选择:

All networks, including the internet, can access this resource.

image.png

图 2.9:Network configuration

对于安全部署,请与你的 networking 和 firewall team 咨询,理解并配置这一部分。建议选择 Selected networks,并使用你的 private IP space 为 Microsoft Foundry resource 配置 network security,以保护你的 resources。随后点击 Next 按钮。

下一屏用于选择 resources 与其他 resources 通信时使用的 identity。我们将选择 System assigned。对于想了解 system-assigned 和 user-assigned managed identities 差异的读者,可以参考 Microsoft 文档链接:

https://learn.microsoft.com/en-us/azure/ai-services/multi-service-resource?pivots=azportal

image.png

图 2.10:Selecting Identity

请注意其中的 note:登录 Azure portal 的用户,例如你自己,应通过 role-based access control(RBAC)被添加到 Azure AI UserAzure AI Project Manager role 中,才能使用该 resource。

选择完成后,点击 Next 按钮。

下一屏会提供使用自有 encryption key 的选项:

image.png

图 2.11:Encryption

在这里的示例中,我们不会选择任何内容。该选项用于当我们想对存储的数据使用 storage-level encryption 时。默认情况下,Microsoft Keys 会用于 encryption;只有当 customer 想 bring their own key 时,才应选择该选项。现在,点击 Next 按钮继续。这里有关于不同 encryption options 的链接。

下一屏是 tags。如果你的组织希望用 cost center、owner email address、owner name 或其他 application IDs 标记 resource,可以在这里添加,然后点击 Next 按钮:

image.png

图 2.12:Adding Tags

最后一页是 Review + submit。这里会执行 validation check,以确保 company policies(如果有)已经被应用。这里也是我们 review 当前选择和 configuration options 是否有效的地方。如果有任何缺失或不正确,请返回并根据需要修改。

image.png

图 2.13:Review and submit

当 name 和 region 验证完成后,点击页面底部的 Create 按钮。你应该会在 portal UI 的 notification section 中看到 deployment 正在初始化。随后页面会变为 Deployment is in progress,如下图所示:

image.png

图 2.14:Deployment in progress

等待 deployment 继续执行。

image.png

图 2.15:Deployment completed

现在,点击 Go to resource,进入下一节内容。

Resource 创建完成后,请为已登录用户按照以下说明配置正确的 RBAC security permissions:

https://learn.microsoft.com/en-us/azure/foundry/concepts/rbac-foundry?pivots=fdp-project

要配置 RBAC,用户应是 owner,或者联系 Azure administrators 获取相关 permission。

创建 Microsoft Foundry resource 可以通过 User Interface、使用 Bicep scripts 的 command line,或 Azure Command Line interface 完成。Name 应该唯一,并可以遵循公司 naming convention。Names 应全部小写且不包含 special characters。选择 region 前,请确保 model availability;同时也要确认 responsible AI 和 red team 等其他 features 是否在该 region 可用。在本书写作时,Sweden Central 和 East US2 具备所有功能,因此我们选择 Sweden Central,因为它是一个 low-traffic data center。

在本节中,你学习了如何创建 Microsoft Foundry resource,以及所需的 configurations,例如 name、resource group name、region、第一个 project 的名称,以及配置 networking、identity、encryption 和 tags 的能力。所有信息填写后,你看到系统如何要求 review 和 validation,以确保 deployment 能成功完成。整个流程都通过 UI 引导和设置,使你更容易理解各个选项并创建 resource。

Deploying the Azure OpenAI model

在本节中,你将学习如何部署 Azure OpenAI GPT 4.1 model,并验证功能是否可用。Microsoft Foundry resource 创建完成并配置 RBAC 后,我们需要登录 UI,部署几个 models,为 generative AI 或 agentic AI applications development 做准备。大多数 agentic AI applications 都需要 language model;对于 retrieval-augmented generation(RAG),还可能需要 text embedding models。我们也可以登录 Microsoft Foundry UI,然后使用 playground 学习 model 能做什么。

在上一节创建 Microsoft Foundry resource 后,点击 Go to resource 继续进入 resource。

也可以回到 Azure portal,并搜索 resource name,作为另一种查找 resource 的方式。

点击 Go to resource 后,它应该会带你进入 Microsoft Foundry resource blade,也就是我们会看到 Studio UI 链接的地方。

现在,找到以下按钮:

image.png

图 2.16:The Foundry portal button

点击 Go to Foundry portal

它会带你进入新的 UI。如果系统要求继续,请点击 Continue,进入 Microsoft Foundry UI。Foundry UI 应如下图所示:

image.png

图 2.17:Microsoft Foundry UI

Microsoft Foundry UI 是一个综合性的 low-code development UI,面向 developers,帮助其更快构建并测试功能。对于 enterprise-grade development,建议使用 SDK approach,后续章节会覆盖这一部分。Microsoft Foundry 的 User Interface 和 Python SDK first approaches 两种方式都可用。目前,Python SDK 和其他几种语言可用。

找到 Models + endpoints 按钮,并点击该链接:

image.png

图 2.18:Models + endpoints button

接下来,你会看到一个可部署 models 的页面。第一次进入时,它是空的;如果你已经部署过 model,就会在该页面看到已部署的 models。页面中也有一个 Deploy model 选项,如下图所示:

image.png

图 2.19:Deploy Model initial screen

点击 Deploy model 选项的向下箭头,然后选择 Deploy base model

现在,你应该会看到一个窗口:左侧显示 model 列表,右侧窗口会在选择 model 时显示 model information。列表中的 models 会通过 hidden layer 进行 safety evaluation,确保它们先被安全评估,并更适合安全使用。Microsoft 会负责这些 evaluations,以确保 model consumption 安全且可信。

向下滚动到 gpt-4.1,点击 radio button,你应该会看到如下页面:

image.png

图 2.20:Individual model selection screen

这里我们选择 gpt-4.1 model。Model 选择完成后,点击 Confirm

随后,它会显示 deployment 选项,如下图所示:

image.png

图 2.21:Model deployment screen

如上图所示,该页面提供 deployment name。在本例中,我们选择 gpt-4.1,deployment 选择 Global Standard

Deployment 有多种类型,例如:

  • Global Standard
  • Data Zone Standard
  • Data Zone Batch
  • Global Provisioned Throughput
  • Data Zone Provisioned Throughput
  • Regional Provisioned Throughput

关于各种 deployment types 及其作用,请参考相关文档。

对于本节主题,我们选择 global deployment,因为它具备 scalability,并且提供最多的 tokens per minute(TPM)。它可以在 capacity 可用的地方运行,并提供 high availability。

点击 Customize 按钮查看更多 details。这里可以选择 model version,也可以提升 TPM rate limit。默认情况下,我们会使用 100K,但你可以增加 TPM limit。Max TPM limits 可以在 Microsoft Learn 网站上查看,链接如下:

https://learn.microsoft.com/en-us/azure/foundry/foundry-models/quotas-limits

该限制可能会基于 model capabilities 变化。这里也可以选择 content filter。默认情况下,所有 Azure OpenAI models 都带有 DefaultV2 content filter,这是一个内置 filter,用于保护 model 免受 hateful、sexual、violent 和 biased content 影响。该 filter 默认启用,但也提供了 disable 选项。如果你想禁用它,需要填写一份表单,并经过 legal review 才能接受 “disable” 选项。请看下图:

image.png

图 2.22:Model deployment advanced

现在,点击 Deploy 按钮,并等待 model deployment 完成。

下一屏会显示已部署 model,其中应该包含查看 Endpoint information 的选项,包括 key、带有 model 详细信息的 model card,以及多种语言的 sample code。并不是所有 models 都会提供所有语言的 code;有些可能提供,有些可能只显示 REST endpoint access。这里也可以 request more quota、查看 models usage、logs,并打开 playground。让我们点击 Open in playground 按钮:

image.png

图 2.23:GPT-4.1 model card

你应该会看到 chat playground 页面打开。现在,你可以开始与 model 对话,学习并实验它的能力。左侧 pane 中有控制 maximum tokens 和 temperature 的选项。你也可以根据需要更改 system,并尝试不同内容。Playground 只是用于实验和查看 model 对特定 use case 或 task 如何响应,它不是 application builder。

尝试部署不同 models,并使用 playground 学习不同 models 的 prompting。Prompt engineering 是向 model 提问的艺术,目的是让 model 做到我们希望它做的事情。

继续探索 Microsoft Foundry 中的其他选项,例如 playgrounds、agents、templates、model catalog、fine-tuning。这些功能按 sections 组织,例如 Build and customizeObserve and optimizeProtect and governAzure Open AIMy Assets。这些都是 Microsoft Foundry portal User Interface 中可供我们探索的其他功能。

回顾一下,本节帮助我们理解了 Microsoft Foundry UI。我们还学习了如何使用多种 deployment options 部署 model,以及控制 TPM 的能力。我们也探索了 Model Catalog 中可用于 deployment 的 models。Catalog 支持部署 Azure OpenAI、Grok、LLaMA 和 NVIDIA models,用于 inference 和 fine-tuning。它包含来自 Hugging Face、Meta、NVIDIA 和其他 vendors 的约 11,000 个 open-source models。

Summary

本章中,我们学习了如何创建 Microsoft Foundry resource,也学习了如何使用 Microsoft Foundry 的功能,例如 Model Catalog、Agent creation、playgrounds、deploying models、evaluations 等。我们看到如何部署新的 models,并使用 playground 实验新 models。我们还学习了如何安全地部署 resource,以及 identity 等其他选项,并了解如何 tag resources,使 administrators 能够更容易搜索这些 resources,以进行 management 和 operations。我们看到了多种部署 models 的方式,以及可用 model 列表,包括 Azure OpenAI models、model router、Grok、LLaMA,以及其他 open-source models 和 closed-source models。

下一章中,我们将详细覆盖 Microsoft Foundry 的核心概念和工具。

Further reading

  • Overview:
    https://learn.microsoft.com/en-us/azure/foundry/what-is-foundry
  • Model Catalog:
    https://learn.microsoft.com/en-us/azure/foundry-classic/concepts/foundry-models-overview
  • Trustworthy AI:
    https://learn.microsoft.com/en-us/azure/foundry/responsible-use-of-ai-overview
  • Quotas and Limits:
    https://learn.microsoft.com/en-us/azure/foundry/openai/quotas-limits?tabs=bash%2Ctier1
  • Model Lifecycle management:
    https://learn.microsoft.com/en-us/azure/foundry/openai/concepts/model-retirement-schedule