刚刚，Gemini 2.5 Pro升级，成编程模型新王

发布日期: 2025-05-07

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

机器之心报道
编辑：Panda
你的默认编程模型是什么？或许可以换一换了。
刚刚，GoogleDeepMind发布了Gemini2.5Pro的最新更新版本：Gemini2.5Pro(I/Oedition)。
其最大的进步是编程能力大幅提升，不仅在LMArena编程排行榜上名列第一，同时也在WebDevArena排行榜上更是以显著优势超过了昔日霸主Claude3.7Sonnet(20250219)！
不仅如此，现在用户只需使用一个提示词即可构建Web应用、游戏和模拟程序等，甚至用户仅需提供一张手绘草图+功能描述，就能得到一个带有自己设计的UI的功能完备的应用。
此外，下面的视频还展示了Gemini2.5Pro(I/Oedition)的另一项能力，可以根据自然图像生成代码，而这些代码可以动态表示自然图像中内容。
自家模型更新，谷歌的多位大佬也纷纷出来站台。

可以看到，只需一张描述画板应用的简单草图加上一句简单的提示词，Gemini2.5Pro(I/Oedition)就创建出了一个功能完备的Web应用。
另外，谷歌母公司AlphabetCEO、GoogleAI负责人JeffDean也都各自发布了宣传推文。
谷歌博客表示，他们原计划在几周后的GoogleI/O大会上发布Gemini2.5ProPreview(I/Oedition)，「但由于大家对这一模型的热情高涨，我们希望尽快将其交付到大家手中，以便人们能够立即开始构建。」
「Gemini2.5Pro的编程和多模态推理功能获得了广泛好评，此次更新正是基于此。除了专注于UI的开发之外，这些提升还扩展到了其他编程任务，例如代码转换、代码编辑和开发复杂的智能体工作流。」
这些增强能力让Gemini2.5Pro在WebDevArena中的Elo分数大幅提升：比上一版本高出147分！WebDevArena排行榜衡量的是人类对模型构建美观且功能强大的Web应用能力的偏好。
此外，新版Gemini2.5Pro在原生多模态和长上下文方面依然强势；它在视频理解方面表现一流——在VideoMME基准测试中获得了84.8%的分数。
以下视频展示了Gemini2.5Pro根据单条YouTube视频生成交互式学习应用的示例，同时还给出了新旧Gemini2.5Pro的对比。
网友实测，新版Gemini2.5Pro真的行
既然是编程模型新王，网友们的测试热情可以说被瞬间激发。随便检索一下互联网，我们就能找到大量网友们分享的测试案例。
比如网友@thenomadevel让Gemini2.5ProPreview(I/Oedition)用p5.js编写了一个直接可玩的记忆配对游戏。
https ://x.com/thenomadevel/status/1919823630143213715
DeepMind产品设计师TimBettridge则VibeCode（氛围编程）了好几个不同的游戏和应用，比如这个看起来相当不错的星球飞行游戏：
https ://x.com/TimBettridge/status/1919847724645789721
又比如这个功能完备的书架应用：
还有一个支持3D浏览的虚拟版芝加哥艺术博物馆。
更有网友用不到20分钟的时间构建了一个完整的城市交通模拟器。
https ://x.com/WesRothMoney/status/1919887823257108941
机器之心也做了简单的尝试，将我们手绘的一张动物图片变成了一个简单的电子宠物游戏：
看起来，VibeCoder们又有新选择了。
参考链接
https ://blog.google/products/gemini/gemini-2-5-pro-updates/
©THEEND
转载请联系本公众号获得授权
投稿或寻求报道：liyazhou@jiqizhixin.com