轻松部署AI应用:用AI Studio和Cloud Run一步搞定

406 阅读3分钟

什么是Cloud Run和AI Studio?

  • Cloud Run 是谷歌云提供的一个托管服务,能帮你快速运行应用程序。它的优点是简单、灵活、自动扩展,甚至没请求时自动“休眠”,节省费用。
  • AI Studio 是谷歌提供的AI开发平台,支持用最新的AI模型(比如Gemini系列)快速开发AI应用。

主要亮点

  1. 一键部署AI应用到Cloud Run
    在AI Studio里开发好应用后,只需点击一个按钮,就能把应用部署到Cloud Run,几秒钟内生成可访问的HTTPS链接。
  2. 支持Gemma 3模型直接部署
    Gemma是一个高效的单GPU AI模型,AI Studio支持直接把Gemma 3模型部署到Cloud Run,启动快(GPU实例5秒内启动),且自动按需扩展。
  3. 支持MCP协议的AI代理自动部署
    MCP是一个开放协议,规范AI代理如何与环境交互。现在Cloud Run支持MCP服务器,允许兼容的AI代理(比如智能助手、AI集成开发环境)自动部署应用。

Cloud Run的优势

  • 自动弹性扩展:根据请求自动增加或减少资源,没请求时自动降到零,节省费用。
  • 按请求计费:最低计费单位100毫秒,免费额度每月200万请求。
  • 安全管理API密钥:API密钥保存在服务器端,客户端无法访问,安全性高。
  • 新用户赠送300美元免费额度,方便测试和开发。

代码示例:用Python调用部署在Cloud Run上的Gemma 3模型

python
from google import genai
from google.genai.types import HttpOptions

# 配置客户端,替换为你的API密钥和Cloud Run部署的URL
client = genai.Client(
    api_key="你的API密钥",
    http_options=HttpOptions(base_url="你的CloudRun应用URL")
)

# 调用Gemma模型生成文本
response = client.models.generate_content_stream(
    model="gemma-3-4b-it",
    contents=["写一个关于魔法背包的故事,你是互动文字冒险游戏的叙述者。"]
)

# 输出生成的文本
for chunk in response:
    print(chunk.text, end="")

详细步骤示例:从AI Studio到Cloud Run部署

  1. 在AI Studio中选择或创建AI应用。
  2. 点击“部署到Cloud Run”按钮。
  3. 等待几秒,系统自动完成部署。
  4. 获取应用的HTTPS链接,分享给用户或嵌入网站。
  5. 需要更新时,直接在AI Studio修改代码,再次一键部署即可。

MCP服务器支持示例

MCP(Model Context Protocol)是AI代理与工具交互的标准协议。Cloud Run MCP服务器让AI代理能自动部署应用。

示例配置:

json
{
  "cloud-run": {
    "command": "npx",
    "args": ["-y", "https://github.com/GoogleCloudPlatform/cloud-run-mcp"]
  }
}

这样,AI助手或IDE插件就能通过MCP协议调用Cloud Run,自动完成应用部署。


总结

  • AI Studio + Cloud Run = 快速开发+一键部署
  • Gemma 3模型支持GPU加速,启动快,性能好
  • MCP协议让AI代理自动部署应用成为可能
  • Cloud Run按需计费,免费额度大,适合各种规模的AI应用

用最简单的方式,开发一个AI应用,马上部署上线,享受自动扩展和低成本的云端运行体验。


如果你想开始体验,可以先注册谷歌云,获得300美元免费额度,试试AI Studio和Cloud Run的强大结合!