刚刚,Gemini 2.5 Pro升级,成编程模型新王


刚刚,Gemini 2.5 Pro升级,成编程模型新王

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

机器之心报道
编辑:Panda
你的默认编程模型是什么?或许可以换一换了。
刚刚,GoogleDeepMind发布了Gemini2.5Pro的最新更新版本:Gemini2.5Pro(I/Oedition)。
其最大的进步是编程能力大幅提升,不仅在LMArena编程排行榜上名列第一,同时也在WebDevArena排行榜上更是以显著优势超过了昔日霸主Claude3.7Sonnet(20250219)!
不仅如此,现在用户只需使用一个提示词即可构建Web应用、游戏和模拟程序等,甚至用户仅需提供一张手绘草图+功能描述,就能得到一个带有自己设计的UI的功能完备的应用。
此外,下面的视频还展示了Gemini2.5Pro(I/Oedition)的另一项能力,可以根据自然图像生成代码,而这些代码可以动态表示自然图像中内容。
自家模型更新,谷歌的多位大佬也纷纷出来站台。

可以看到,只需一张描述画板应用的简单草图加上一句简单的提示词,Gemini2.5Pro(I/Oedition)就创建出了一个功能完备的Web应用。
另外,谷歌母公司AlphabetCEO、GoogleAI负责人JeffDean也都各自发布了宣传推文。
谷歌博客表示,他们原计划在几周后的GoogleI/O大会上发布Gemini2.5ProPreview(I/Oedition),「但由于大家对这一模型的热情高涨,我们希望尽快将其交付到大家手中,以便人们能够立即开始构建。」
「Gemini2.5Pro的编程和多模态推理功能获得了广泛好评,此次更新正是基于此。除了专注于UI的开发之外,这些提升还扩展到了其他编程任务,例如代码转换、代码编辑和开发复杂的智能体工作流。」
这些增强能力让Gemini2.5Pro在WebDevArena中的Elo分数大幅提升:比上一版本高出147分!WebDevArena排行榜衡量的是人类对模型构建美观且功能强大的Web应用能力的偏好。
此外,新版Gemini2.5Pro在原生多模态和长上下文方面依然强势;它在视频理解方面表现一流——在VideoMME基准测试中获得了84.8%的分数。
以下视频展示了Gemini2.5Pro根据单条YouTube视频生成交互式学习应用的示例,同时还给出了新旧Gemini2.5Pro的对比。
网友实测,新版Gemini2.5Pro真的行
既然是编程模型新王,网友们的测试热情可以说被瞬间激发。随便检索一下互联网,我们就能找到大量网友们分享的测试案例。
比如网友@thenomadevel让Gemini2.5ProPreview(I/Oedition)用p5.js编写了一个直接可玩的记忆配对游戏。
https ://x.com/thenomadevel/status/1919823630143213715
DeepMind产品设计师TimBettridge则VibeCode(氛围编程)了好几个不同的游戏和应用,比如这个看起来相当不错的星球飞行游戏:
https ://x.com/TimBettridge/status/1919847724645789721
又比如这个功能完备的书架应用:
还有一个支持3D浏览的虚拟版芝加哥艺术博物馆。
更有网友用不到20分钟的时间构建了一个完整的城市交通模拟器。
https ://x.com/WesRothMoney/status/1919887823257108941
机器之心也做了简单的尝试,将我们手绘的一张动物图片变成了一个简单的电子宠物游戏:
看起来,VibeCoder们又有新选择了。
参考链接
https ://blog.google/products/gemini/gemini-2-5-pro-updates/
©THEEND
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin.com


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录