推理大模型并非一定要推理。


推理大模型并非一定要推理。

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

论文笔记分享,ReasoningModelsCanBeEffectiveWithoutThinking。ucberkeley。
目前主流的推理模型在解决问题时,通常会有一个think阶段。这种方式虽然结果会大幅提升,但消耗的计算资源却不少。
所以,这个文章研究的问题是:AI真的需要这么“认真思考”吗?
注:本文写于o3发布之前,o3的思考充分利用工具能力,模型即产品,有一点跳脱o1版推理大模型的范畴了。另外,今天开源的Gemini2.5Flash,支持了thinkingbudget,有一些理念与本论文趋同。
所以他们用了NoThinking的方式,就是让AI直接给出答案,跳过所有中间推理步骤。
就类似下图框出来那样,或者直接
对比正常的模式。效果竟然还不错。
省3~4倍资源。
始终优于没有经过RL训练的非推理模型。
很适合多次尝试,允许模型采样多次,看pass@k的效果。
在一些任务中,跟正常思考的模型的结果差不多。
如下图:
限定token预算(在达到指定token之后,强行添加,如答案是xxx的内容上去)之后,很多数据集表现比经过think的效果更好。


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录