刚刚!OpenAI上线o3-pro,性能碾压Gemini与Claude,重新定义“最强模型”


刚刚!OpenAI上线o3-pro,性能碾压Gemini与Claude,重新定义“最强模型”

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

大数据文摘出品
刚刚!OpenAI发布了它自称“迄今为止最强大”的模型:o3-pro。
——这是此前发布的推理模型o3的“加强版”。
o3-pro属于“推理模型”,它可以一步步拆解问题、逻辑严密地得出结论。这种能力使它在物理、数学、编程等严谨性要求较高的领域表现更为稳定可靠。
OpenAI宣称,在评估中,o3-pro在所有测试领域都优于基础版o3,尤其在科学、教育、写作辅助、商业分析和编程等领域,获得了评审的一致好评。它不仅在准确性、清晰度、全面性上表现更强,还更擅长理解复杂指令。
目前,o3-pro已经上线:
ChatGPTPro和Team用户已可使用(取代旧版o1-pro);
企业和教育用户将在下周获得权限;
开发者API也已经接入,价格为每百万输入tokens20美元,输出tokens80美元。
顺便说一句,百万输入tokens大约等于75万字——比《战争与和平》还要长一点。
除了基础对话能力,o3-pro还拥有多项高级功能:联网搜索、视觉识别、Python工具调用、文件分析、甚至可以基于记忆进行个性化响应。但也并非完美无缺:
例如,暂时不支持图片生成;Canvas工作区功能不兼容;临时对话功能暂时关闭;响应速度相比o1-pro略慢。

而这场替换来的悄无声息。没有发布会,也没有demo视频。OpenAI用惯常方式在changelog中写道:“评审一致认为o3-pro在科学、教育、编程、商业和写作帮助等关键领域优于o3。”评价中,“清晰度”“全面性”“指令执行力”“准确性”成为关键词。
Onemorething
除了新模型,还有另一个消息:
OpenAI原计划在6月发布的开源模型——推迟了。
6月10日,SamAltman在X上发文宣布:开源模型将延迟至“夏末”上线。他写道:“我们的研究团队做了一些意想不到又非常惊艳的事情,我们相信这非常值得等待,但还需要一点时间。”
这本应是OpenAI多年来首个真正意义上的开源权重模型。据称,它将具备与o系列相似的“推理能力”,目标是超越当前最强开源推理模型,如DeepSeek的R1。而在这条时间线上,OpenAI已落后一步——就在同一天,Mistral发布了自家首个推理模型家族Magistral;更早之前,Qwen推出了一套支持推理与快速切换的混合模型。
据TechCrunch报道,OpenAI此前内部也在讨论给开源模型接入云端能力,例如复杂问题时自动请求OpenAI云模型协助。但这些功能最终是否会出现在首发版本中,尚未可知。
Altman曾公开承认,OpenAI在“开源与封闭”的争议中站到了“历史错误的一边”。这次推迟,某种意义上,是技术节奏的调整,也可能是一次产品路线的重新权衡。
推理模型显然是今年AI赛道的新焦点:更像人类思维、更少幻觉、更适用于复杂任务。但当商业化模型抢占企业市场,开源模型抢占开发者生态,OpenAI是否还能两头通吃?
真正的问题是:它还来得及夺回“开源”的主动权吗?


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录