一天 15k 星,代码生成碾压 Claude,连 Cursor 都慌了?谷歌 Gemini CLI 杀疯了
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
编辑|Tina
今天,谷歌正式发布了GeminiCLI,这是其AI助手在终端环境下的一个版本。这款工具的亮点在于其非常慷慨的免费使用配额:它支持每分钟60次、每天1,000次的模型调用。
免费配额“开挂”,
逼疯Claude?
继2月的ClaudeCode和4月的OpenAICodexCLI之后,谷歌也在6月推出了GeminiCLI。至此,三大AI实验室都已发布了各自的“终端智能体”工具——这类CLI工具可以读取、修改文件,并在终端中代表用户执行命令。
估计不少人原本以为这类终端工具会一直是一个小众方向,但现在看来这是低估了它的潜力——不少开发者每月在ClaudeCode上的花费高达数百美元甚至是数千美元,说明这个“小众市场”其实比预想中大得多、也重要得多。
相对ClaudeCode,谷歌在价格方面可谓“豪横”:
使用个人Google账号登录,即可免费获得GeminiCodeAssist许可。这将解锁Gemini2. 5Pro模型和百万token上下文窗口。在此次预览期间,谷歌提供业界最宽松的调用配额:每分钟最多60次、每天最多1000次请求,全部免费。
目前来看,社区对GeminiCLI的关注重点集中在其超大免费配额上。评论者直言:“太夸张了,这会给Anthropic带来巨大压力。”“确实如此——如果这些调用限制是真的而且免费,那终于有真正的竞争了。”
与ClaudeCode不同,GeminiCLI和OpenAICodexCLI一样是开源的(使用Apache2. 0许可)。并且GeminiCLI在不到一天的时间里,获得了15. 1k星。
GeminiCLI提供的功能包括代码编写、问题调试、项目管理、文档查询以及代码解释。它还连接了MCP(模型上下文协议)服务器,具备AgenticAI能力。
CLI工具的优势在于,它可以与任何编辑器或IDE搭配使用,而不局限于特定插件支持的工具;同时还支持多实例并发运行。部分开发者也认为,命令行交互效率更高。
因为整体开源,所以我们还可以看到它的systemprompt。
一如既往,这份系统提示词不仅定义了工具行为,也是一份非常精炼准确的使用文档。比如它对代码注释的原则是:
注释:请谨慎添加注释,重点说明“为什么”要这么做,尤其是处理复杂逻辑时,而不是解释“做了什么”。只有在确实能提升可读性或用户明确要求时,才添加高价值注释。请勿修改与你更改无关的注释,也绝不要通过注释与用户交流或说明你的更改。
系统默认使用的技术栈也颇有参考价值。
如果用户没有指定技术偏好,默认建议如下:
Web前端:React(JavaScript/TypeScript)+BootstrapCSS,结合MaterialDesign设计规范;
后端API:Node. js+Express. js或Python+FastAPI;
全栈应用:Next. js(React/Node. js)+Bootstrap+MaterialDesign,或Python(Django/Flask)+React/Vue. js前端;
命令行工具(CLI):Python或Go;
3D游戏:HTML/CSS/JavaScript+Three. js;
2D游戏:HTML/CSS/JavaScript。
胜过专用,
GeminiCLI靠什么?
GeminiCLI接入的是谷歌最先进的编码与推理模型Gemini2. 5Pro,具备代码理解、文件操作、命令执行和动态故障排查等能力,全面提升命令行的使用体验。用户可以通过自然语言编写代码、调试问题,并优化工作流程。
不仅如此,GeminiCLI还能基于MCP调用其他谷歌服务,在终端中生成图像或视频,实现从编码到创作的一体化体验。
在发布会上展示的一体化演示和背后的技术理念,其实揭示了GeminiCLI的关键定位——它不仅是一个写代码的工具,而是一个连接多模态智能、打通编码与创作的“终端智能体”。这一理念也体现在背后所依赖的Gemini2. 5Pro模型选择上。
值得注意的是,Gemini2. 5Pro本身并不是为代码任务特别训练的“代码专用模型”,而是一个覆盖更广泛能力边界的通用模型。那么,为何谷歌没有像某些竞争对手那样,专门为GeminiCLI打造一个定制化的代码模型?在一场深度访谈中,产品负责人ConnieFan和研究负责人DannyTarlow分享了他们的思考。
ConnieFan表示,虽然特定任务确实可以从专用模型中受益,例如Cursor训练的代码补全模型“在非常窄的用例里做得非常好”,但她强调,对于大多数现实世界中的开发任务而言,编码需求往往不局限于代码本身。
例如她提到的一个经典“vibecheck”请求:“帮我做一个泰勒·斯威夫特歌曲排行榜app”——这就需要模型不仅懂代码,还要理解上下文、具备常识,甚至有些UI/UX审美。“这些常识背后其实是用户真实的编程需求”,她总结说,“大多数通用任务,并不能从一个纯代码模型中受益。”
DannyTarlow则进一步指出:“代码专用模型到底意味着什么?‘代码’已经不仅仅是代码本身,它涵盖了软件开发过程中的各种环节,涉及多种信息源,有些专属于代码,有些则不是。如果只强化代码能力而削弱其他能力,反而会限制模型的表现。我们更倾向于通用模型上的协同发展,寻求不同能力之间的融合和平衡,打造一个‘通才型’模型,这才是更优的发展路径。”
实际上,现在已经有越来越多开发者开始注意到Gemini2. 5Pro在代码生成和理解方面的显著提升。
在Claude长期占据主导的讨论氛围中,不少人也开始发出“Gemini要逆袭了吗?”、“Google要翻盘了吗?”的声音。社交媒体上,有用户分享了一些开发体验:在一个约50万行代码规模的项目中,使用ClaudeCode生成的代码质量“远远不如cline+Gemini2. 5Pro”,要达到同等效果,Claude需要开发者全程盯着。
还有开发者表示,在Trae上使用Gemini2. 5Pro编程的完成率已经大幅超过Claude3.7。也有开发者表示Gemini修复bug的速度明显快于ClaudeCode。
一个3D渲染的处理问题,让ClaudeCode修了两个小时的bug还没解决,结果问Gemini2. 5Pro,只用了5分钟就搞定了。感觉对于那些看起来难度比较高的问题,可以先让Gemini写好详细的说明书,然后再让ClaudeCode按照它来实现,这种组合用法可能会挺不错的。
这些反馈表明,过去一年,谷歌在代码能力上的提升已经进入“质变期”。Gemini编码产品负责人ConnieFan表示,Gemini2. 5Pro之所以能获得良好口碑,关键在于两个方面的系统性演进:“数据”和“方法论”。
从数据的角度看,“代码仓库上下文”变得非常关键。现在模型的目标不再只是做简单的代码补全,而是要理解并修改分布在多个文件、涉及多个模块的大型代码库:“模型要能完成那些你如果花一小时坐下来,在熟悉的代码库上下文中亲自去做的复杂改动。”
为了让模型真正理解这些上下文,谷歌也开始系统性地挖掘内部工程师资源。
其中还包括JeffDean这样的一些人,“他们代表了一种‘能力新等级’的标准,”Connie直言,“我们拥有世界上最聪明、最出色、有时也最有主见的十几万工程师。”借助他们在不同语言、技术栈、经验水平上的反馈,谷歌能够覆盖更广泛的使用场景,提升模型在“专业开发者细腻口味”上的匹配能力。“我们过去其实并没有很好地利用这一点,但现在我们开始真正这样做了,而且效果非常惊人。”
从研究角度看,Gemini团队并未将全部筹码押在“单一大上下文窗口”的方案上,而是探索双路线:一方面持续扩展上下文长度,另一方面发展具有自主搜索、推理能力的agentic编程模型,模型以代理的形式与用户交互,甚至具备一定程度的自主性。
正如研究负责人DannyTarlow所描述:
“如果我们把你(人类开发者)丢进一个大代码库里,你会怎么做?你会用代码搜索、看文件结构、点来点去,读点代码再搜索其他信息。agentic模型就模仿了这种方式。”
更有趣的是,当模型成功处理一个百万行代码库时,用户会感受到一种“魔法般”的惊喜。而这正是Gemini2. 5Pro所在意的方向:不仅是模拟人类的工作方式,更是突破人类经验限制,发展出“非人类”的全新解法。
正因如此,不少开发者开始转而重视起谷歌在这场AI编程竞赛中的回归。Gemini是否“翻盘”尚未可知,但“赶超”的信号,正在越来越清晰。
参考链接:
https ://www. youtube.com/watch?v=jwbG_m-X-gE
声明:本文为AI前线整理,不代表平台观点,未经许可禁止转载。
活动推荐
6月27~28日的AICon北京站将继续聚焦AI技术的前沿突破与产业落地,围绕AIAgent构建、多模态应用、大模型推理性能优化、数据智能实践、AI产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索AI应用的无限可能!
今日荐文
成立5年最高估值超百亿,摩尔线程之后,又一家AI芯片独角兽争当“国产GPU第一股”
谷歌将A2A捐赠给Linux基金会,但代码实现还得靠开发者自己?!
印裔1号位删Karpathy团队90%代码、算力暴涨50倍!马斯克Robotaxi10年终上线,30元乘车体验刷屏
字节张一鸣重回一线?消息人士:不存在;MiniMax被曝将赴港IPO;Ilya拒绝扎克伯格公司收购后其CEO被挖走|AI周报
AI编码工具双雄也开始商业互捧了?Cursor×Claude最新对谈:两年后,几乎100%代码都将由AI生成!
你也「在看」吗?👇