什么是Cloud Run和AI Studio?
- Cloud Run 是谷歌云提供的一个托管服务,能帮你快速运行应用程序。它的优点是简单、灵活、自动扩展,甚至没请求时自动“休眠”,节省费用。
- AI Studio 是谷歌提供的AI开发平台,支持用最新的AI模型(比如Gemini系列)快速开发AI应用。
主要亮点
- 一键部署AI应用到Cloud Run
在AI Studio里开发好应用后,只需点击一个按钮,就能把应用部署到Cloud Run,几秒钟内生成可访问的HTTPS链接。 - 支持Gemma 3模型直接部署
Gemma是一个高效的单GPU AI模型,AI Studio支持直接把Gemma 3模型部署到Cloud Run,启动快(GPU实例5秒内启动),且自动按需扩展。 - 支持MCP协议的AI代理自动部署
MCP是一个开放协议,规范AI代理如何与环境交互。现在Cloud Run支持MCP服务器,允许兼容的AI代理(比如智能助手、AI集成开发环境)自动部署应用。
Cloud Run的优势
- 自动弹性扩展:根据请求自动增加或减少资源,没请求时自动降到零,节省费用。
- 按请求计费:最低计费单位100毫秒,免费额度每月200万请求。
- 安全管理API密钥:API密钥保存在服务器端,客户端无法访问,安全性高。
- 新用户赠送300美元免费额度,方便测试和开发。
代码示例:用Python调用部署在Cloud Run上的Gemma 3模型
python
from google import genai
from google.genai.types import HttpOptions
# 配置客户端,替换为你的API密钥和Cloud Run部署的URL
client = genai.Client(
api_key="你的API密钥",
http_options=HttpOptions(base_url="你的CloudRun应用URL")
)
# 调用Gemma模型生成文本
response = client.models.generate_content_stream(
model="gemma-3-4b-it",
contents=["写一个关于魔法背包的故事,你是互动文字冒险游戏的叙述者。"]
)
# 输出生成的文本
for chunk in response:
print(chunk.text, end="")
详细步骤示例:从AI Studio到Cloud Run部署
- 在AI Studio中选择或创建AI应用。
- 点击“部署到Cloud Run”按钮。
- 等待几秒,系统自动完成部署。
- 获取应用的HTTPS链接,分享给用户或嵌入网站。
- 需要更新时,直接在AI Studio修改代码,再次一键部署即可。
MCP服务器支持示例
MCP(Model Context Protocol)是AI代理与工具交互的标准协议。Cloud Run MCP服务器让AI代理能自动部署应用。
示例配置:
json
{
"cloud-run": {
"command": "npx",
"args": ["-y", "https://github.com/GoogleCloudPlatform/cloud-run-mcp"]
}
}
这样,AI助手或IDE插件就能通过MCP协议调用Cloud Run,自动完成应用部署。
总结
- AI Studio + Cloud Run = 快速开发+一键部署
- Gemma 3模型支持GPU加速,启动快,性能好
- MCP协议让AI代理自动部署应用成为可能
- Cloud Run按需计费,免费额度大,适合各种规模的AI应用
用最简单的方式,开发一个AI应用,马上部署上线,享受自动扩展和低成本的云端运行体验。
如果你想开始体验,可以先注册谷歌云,获得300美元免费额度,试试AI Studio和Cloud Run的强大结合!