本文首发【零一探秘】公众号
就在几个小时前,Google 推出了其最新的开源项目——Gemini CLI,将 Gemini AI 直接带入了开发者最熟悉的命令行终端,极大提升了开发和运维的工作效率。下面将带你详细了解 Gemini CLI 的功能亮点、使用方法。
什么是 Gemini CLI?
Gemini CLI 是由 Google 推出的开源 AI 终端助手,基于 Gemini 2.5 Pro 大模型,能够在命令行环境中为开发者提供代码理解、内容生成、自动化运维等多项智能服务。它不仅支持代码相关的任务,还能处理文档、图片等多模态内容。
主要功能亮点
- 超大代码上下文理解与编辑 得益于 Gemini 的 100 万 token 上下文窗口,Gemini CLI 能够轻松处理和编辑大型代码库,支持跨文件、跨模块的复杂操作。
- 多模态生成能力 除了文本,Gemini CLI 还能通过 PDF、手绘草图等输入生成应用,支持与 Imagen、Veo 等媒体生成工具集成,满足多样化开发需求。
- 自动化运维与工作流 无论是查询 Pull Request、批量重命名文件,还是复杂的 rebase 操作,Gemini CLI 都能通过自然语言指令自动完成,大幅提升效率。
- Google 搜索集成 内置 Google Search 工具,为模型提供实时、权威的外部信息,增强 AI 回答的准确性和实用性。
- 开放与可扩展性 Gemini CLI 完全开源(Apache 2.0 协议),支持通过 Model Context Protocol (MCP) 和插件机制扩展新能力,开发者可根据自身需求进行个性化定制。
免费高额度,人人可用
只需用个人 Google 账号登录,即可获得 Gemini 2.5 Pro 的免费使用权,每分钟 60 次、每天 1,000 次模型请求,远超市面同类产品。对于有更高需求的专业开发者,还可以通过 API Key 或企业授权获得更高额度和专属模型。
如何快速上手?
- 环境准备:安装 Node.js 18 或更高版本。
- 启动方式:
- 直接运行:
npx https://github.com/google-gemini/gemini-cli
- 全局安装:
npm install -g @google/gemini-cli
gemini
3. 安装完成后进入主题选择界面,可以根据个人喜好选择命令行配色。
然后身份验证:按提示用 Google 账号登录,享受免费高额度。如需更高额度或自定义模型,可在 Google AI Studio 生成 API Key 并设置环境变量:
export GEMINI_API_KEY="YOUR_API_KEY"
Gemini CLI试用
本地安装完成后,我简单试用了一下,在命令行中输入描述这个项目的主要架构组成,并生成mermaid时序图,结果如下图
但是在使用过程中,发现经常出现异常中断的情况,目前感觉还不是很稳定,而且测试官方提供的生成视频的demo也没有成功。估计是刚发布,还存在bug或者使用的人太多导致...
期待后续的稳定版本~
安装体验地址:github.com/google-gemi…