Google 最新的 Gemini 3 Flash 模型现已正式登陆 Gemini CLI。对于我们这些长时间在终端环境中工作的开发者来说,这是一个值得关注的更新。Flash 模型在效率上做了深度优化,不仅在速度和成本上极具优势,其在 SWE-bench 评测中取得的 78% 的代码智能体(agentic coding)得分,甚至超过了 Gemini 3 Pro。
这意味着,现在我们可以在终端里同时拥有两个强大的模型,速度与质量不再是单选题。
启用 Gemini 3 Flash
在开始之前,需要确认你是否拥有访问权限。
访问资格
目前,大多数付费层级的用户都可以直接使用 Gemini 3 Pro 和 Gemini 3 Flash。
| 用户类型 | 访问状态 |
|---|---|
| Google AI Pro 或 AI Ultra 订阅者 (非商业) | ✅ 直接可用 |
| 通过 Google AI 或 Vertex API 密钥付费的用户 | ✅ 直接可用 |
| 已被管理员授权使用预览模型的 Code Assist 用户 | ✅ 直接可用 |
| 已注册候补名单的免费用户 | ✅ 已开通,请查收邮件 |
| 其他免费用户 | ⏳ 逐步开放中 |
如果你暂时无法访问,可以查阅官方文档了解其他获取权限的方式。
升级与配置
确认拥有访问权限后,只需几个简单的步骤即可在 Gemini CLI 中启用 Flash 模型。
第一步是确保 Gemini CLI 已升级到 0.21.1 或更高版本。在终端中运行以下命令即可完成更新:
npm install -g @google/gemini-cli@latest
升级成功后,运行 gemini 命令启用 Gemini CLI,然后运行 /settings 命令,进入设置界面。在这里,你会看到一个名为 “Preview features” 的选项,按 Enter 键将其切换为 true 状态。

启用预览功能后,最后一步就是选择模型。按 Esc 退回到上一个界面,运行 /model 命令,此时列表中应该会出现 Gemini 3 相关的选项,直接选择它即可(笔者是免费用户,所以这里没有o(╥﹏╥)o)。

完成这些配置后,Gemini CLI 就准备就绪了。
Flash 模型能做什么?
Gemini 3 Flash 的集成不仅仅是多了一个模型选项,它为终端工作流带来了实质性的效率提升。
智能路由与手动选择
Gemini CLI 内置了智能的自动路由功能。当你发出一个指令时,CLI 会判断任务的复杂度,将高度复杂的推理任务交给 Gemini 3 Pro,而将其他任务分配给 Gemini 3 Flash,以实现速度和效果的平衡。
当然,如果你希望所有任务都由 Flash 模型处理以追求极致的速度,也可以通过 /model 命令手动锁定 Gemini 3 Flash。
复杂代码生成
过去,要一次性生成具备完整功能且结构复杂的代码,通常需要依赖 Pro 级别的模型。例如,Gemini 2.5 Flash 在处理复杂逻辑时常常会出错。
现在,Gemini 3 Flash 的推理能力得到了显著增强。例如,我们可以尝试让它构建一个金门大桥的 3D 体素(Voxel)模拟程序。虽然 Pro 模型生成的视觉效果可能更胜一筹,但 Flash 模型同样能够精准地完成这个任务,生成可直接部署的代码。这证明了,一个快速的原型设计工具,同样可以保证高质量的代码输出。

处理海量上下文
在维护大型代码库时,我们常需要从上百条 Pull Request 评论中找到那条真正需要执行的修改意见。这要求模型具备强大的长上下文理解能力,不能在处理大量信息的过程中“迷失”方向。
在一个演示中,Gemini 3 Flash 成功处理了一个包含 1000 条评论的模拟 PR 线程。它准确地从大量无关讨论中定位到一个关于调整超时的关键请求,并一次性正确地将修改应用到对应的配置文件中。这种从海量噪声中提取有效信号并精确执行的能力,非常实用。
辅助基础设施测试
验证后端服务时,需要模拟真实的用户流量进行压力测试。但编写能够处理并发和模拟特定用户旅程的负载测试脚本通常很耗时。
这类任务非常适合交给 Gemini 3 Flash。它可以快速生成一个使用 asyncio 的 Python 脚本,模拟并发用户在“成功下单”、“支付失败”和“库存超时”这三种场景下的行为。当首次执行脚本出现协议错误时,模型能立即分析错误堆栈信息(traceback)并修复脚本。整个过程只需要几秒钟,你就可以在 Cloud Run 仪表盘上观察到负载测试的结果。
Flash 与 Pro 模型对比
为了更直观地理解这两个模型在 Gemini CLI 中的定位,下面的表格提供了一个简单的对比。
| 特性 | Gemini 3 Flash | Gemini 3 Pro |
|---|---|---|
| 最佳用途 | 高频次的日常开发任务、快速原型设计、代码生成与调试 | 高度复杂的推理、多步骤规划、跨领域知识整合 |
| 响应速度 | 非常快 | 快 |
| 成本 | 较低 | 较高 |
| 代码智能体 (SWE-bench) | 78% | 略低于 Flash (在特定基准上) |
| 复杂逻辑处理 | 强 | 顶尖 |
Gemini 3 Flash 的出现,为终端开发提供了一个新的性能基准。它提升了高频次开发任务的效率下限,并通过与 CLI 的智能路由集成,帮助我们更快、更高效地工作。无论是构建新原型还是管理复杂的基础设施,现在都有一个能跟上我们工作节奏的开发助手。
立即更新你的 Gemini CLI,开始使用 Gemini 3 Flash,体验更低成本、更高效率的终端开发工作流。
开发必备:API 全流程管理神器 Apifox
介绍完上文的内容,我想额外介绍一个对开发者同样重要的效率工具 —— Apifox。作为一个集 API 文档、API 调试、API 设计、API 测试、API Mock、自动化测试等功能于一体的 API 管理工具,Apifox 可以说是开发者提升效率的必备工具之一。
如果你正在开发项目需要进行接口调试,不妨试试 Apifox。注册过程非常简单,你可以直接在这里注册使用。

注册成功后可以先看看官方提供的示例项目,这些案例都是经过精心设计的,能帮助你快速了解 Apifox 的主要功能。
使用 Apifox 的一大优势是它完全兼容 Postman 和 Swagger 数据格式,如果你之前使用过这些工具,数据导入会非常方便。而且它的界面设计非常友好,即使是第一次接触的新手也能很快上手,快去试试吧!
