智能体 AI 平台
智能体 AI 框架是一个工具包,用于创建能够通过工具使用和记忆自主或半自主地推理、计划和采取行动的智能体系统。这些框架提供了创建能够与环境交互、做出决策和执行任务的智能体所需的结构。有几个流行的智能体 AI 平台,如 LangChain、CrewAI 和 Phidata。在本教程中,我们将使用 Phidata 平台——一个轻量级、开发者友好的平台。Phidata 内置了对各种工具和 LLM 的访问,让你只需几行代码即可构建和部署 AI 智能体。Phidata 中流行的内置工具和模型包装器。
构建 YouTube 摘要智能体
YouTube 摘要智能体旨在从任何 YouTube 视频中提取关键见解和要点。它通过提供简洁的摘要来节省时间,无需观看整个内容。出于教程的目的,我们将使用 Google Colab 笔记本来编写和执行代码,并使用 Phidata 智能体 AI 平台为智能体提供支持。
模型:在 Phidata 中,我们将利用 Groq 模型托管平台——一个在专用 GPU 基础设施上运行 LLM 的推理服务(注意它与 Grok 不同,Grok 是 xAI 的 LLM)。由于 LLM 是资源密集型的,使用 Groq 有助于从本地或 Colab 提供的硬件中卸载计算,确保更快、更高效的执行。Groq 可以访问来自不同 LLM 提供商的多种模型。
工具:为了检索 YouTube 视频数据,我们将使用 YouTubeTools,Phidata 框架的内置工具。该工具帮助我们访问视频元数据和字幕,然后智能体将其传递给选定的 LLM 以生成准确、有见地的摘要。
以下是 YouTube 摘要智能体的代码:
from phi.agent import Agent
from phi.model.groq import Groq
from phi.model.openai import OpenAIChat
from phi.tools.youtube_tools import YouTubeTools
agent = Agent(
# model=Groq(id="llama3-8b-8192"),
model=Groq(id="llama-3.3-70b-versatile"), ## 切换不同的 LLM 模型
tools=[YouTubeTools()],
show_tool_calls=True,
# debug_mode=True,
description="You are a YouTube agent. Obtain the captions of a YouTube video and answer questions.",
)
agent.print_response("Summarize this video www.youtube.com/watch?v=vSt…, markdown=True, stream=True)
上述代码中的 YouTube 链接是 Andrew Ng 关于机器学习专业的视频。如下所示,它准确总结了视频内容。请注意,由于 LLM 的概率性质,响应在不同运行中可能会有所不同。
与
YouTube 视频总结摘要智能体(见上述代码)生成的输出。上述代码中的 YouTube 链接是 Andrew Ng 关于机器学习专业的视频。如下所示,它准确总结了视频内容。请注意,由于 LLM 的概率性质,响应在不同运行中可能会有所不同。
详细教程
要运行上述代码,我们需要获取 Groq 模型托管平台的 API 密钥,如这里所述。
步骤 1:克隆笔记本
- 在这里克隆 colab 笔记本(需要 Google 账户)
- 安装依赖项(第一个代码单元格)
步骤 2:获取 Groq 的 API 密钥
为了运行智能体,鉴于我们使用 Groq 模型托管平台,我们需要一个 Groq 账户。请按照以下步骤注册/登录 Groq 并获取 API 密钥。
- 访问 Groq 开发者门户。 打开浏览器并访问:console.groq.com
- 注册或登录。如果你已有账户,请点击登录。如果你是新用户,请点击注册并按照提示创建账户(你可能需要验证你的电子邮件)。
- 访问 API 部分。登录后,你将进入 Groq 控制台。然后从侧边栏或仪表板导航到 API 密钥部分。
- 生成新的 API 密钥。 点击“创建 API 密钥”按钮。给你的密钥起个名字(例如,“workshop-key”),然后点击创建或生成。
- 复制并安全存储密钥。 你的 API 密钥将只显示一次——立即复制并将其存储在安全的位置。切勿在客户端代码或公共仓库中暴露你的 API 密钥。
步骤 3。在 Secret Manager 中添加 API 密钥
- 点击 colab 左侧的 Secrets(钥匙标志)
- 提供名称为 GROQ_API_KEY,值为步骤 5 中复制的 API 密钥
- 切换“开启”笔记本访问