Qwen 3 将于本周发布!


Qwen 3 将于本周发布!

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

阿里通义千问Qwen团队确认:Qwen3本周正式发布,将推理和非推理能力首次合二为一。
——多位网友晒出ICLR2025大会上的截图,并如是转发宣称。
据爆料称,通义千问(Qwen)团队的JunyangLin在ICLR2025大会上的演讲中提及了这一确定性的重要消息:
Qwen3本周必定上线!
而本次更新,不仅仅是例行升级,Qwen团队显然是下了功夫,提出了一个相当有野心的计划——
打造一个真正意义上的通用模型/智能体(GeneralistModel/Agent)。
从官方释出的幻灯片来看,Qwen3的技术路线清晰明了:

具体而言,基础模型先经历4ktokens预训练(基准10ktokens),再逐步推进到惊人的256ktokens预训练(基准1000ktokens)。而后,在指令模型(InstructModel,256k)基础上,进一步经历RLHF(人类反馈强化学习)和SFT(监督微调)多个阶段,逐步达到32k到256k的精细化训练。
此外,Qwen3不仅能处理超长文本,还能具备高效的推理与非推理任务融合能力,将模型和智能体两大概念完美融合在一起。
AdamBENKHALIFA(@Thunderhead_exe)也表达了自己的期待:
@ZhaoTing1024这一个月真的太疯狂了!看来到四月底,所有AI巨头都会有大动作🤯
Jonathan(@Yang_davidbowie)则更关心多模态的表现:
@nopainkiller@JustinLin610多模态也会同时发布吗?这次发布的会是全尺寸模型,还是专注单一尺寸?
根据此前Qwen团队的传统来看,每次重磅发布都极具规模,及发布时机的精心选取。
如刚刚过去的2025年春节期间(具体为1月29日,农历新年第一天),Qwen于一次性推出了包括旗舰MoE架构模型Qwen2.5-Max、多模态的Qwen2.5-VL系列以及长文本模型Qwen2.5-1M在内的多项重量级产品,展示了其强大的工程实力。
不得不说,Qwen团队实在是太会挑日子了。就有网友对其发布时间表示又期待又想吐槽:
qwen团队贼恶心,一定要在某个长假前发布🤮
无论刻意或无意,虽然发布时间略有微词,但不能否认的是,Qwen团队已经成为中国AI在全球竞争中的一面重要旗帜。尤其是去年发布的Qwen2.5,在各类国际基准测试中频频超越GPT-4o与Gemini2.0Flash,技术实力毋庸置疑。
随着Qwen3的到来,即DeepSeekR2的发布传言,AI模型或又将迎来新一轮的技术升级潮。
这一次,通义千问将如何定义「通用模型」与「智能体」?
拭目以待!
(信源来源于网络,真实度有待考证,还请谨慎辨别。)
👇
👇
👇
另外,我还用AI进行了全网的AI资讯采集,并用AI进行挑选、审核、翻译、总结后发布到《AGIHunt》的知识星球中。
这是个只有信息、没有感情的AI资讯信息流(不是推荐流、不卖课、不讲道理、不教你做人、只提供信息)


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录