DeepSeek R1迎来小更新大升级,性能直逼OpenAI o3!
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
整理|苏宓
出品|CSDN(ID:CSDNnews)
近日,DeepSeek悄然发布了其R1大模型的最新版本——DeepSeek-R1-0528,目前已开启公测。
一贯低调的DeepSeek在此番发布时,并未附带详细的技术说明,只是在官方微信社群中告知用户,“DeepSeekR1模型已完成小版本试升级”,大家可以自行前往官方网页、APP、小程序进行测试。
HuggingFace地址:https ://huggingface. co/deepseek-ai/DeepSeek-R1-0528
但从用户体验反馈来看,本次名曰”小更新“也依然带来了不小的实质性改进,尤其是在推理和输出方面。具体来看,新版的DeepSeekR1:
推理能力增强:模型在“思维链”(Chain-of-Thought)推理方面表现更为结构化,逻辑性更强。
文本输出质量提升:生成的文本更具条理,语言风格更为成熟,接近Google等领先模型的水平。
代码生成优化:在编程任务中,R1的输出更为连贯,代码质量更高。
对此,Reddit用户B89983ikei在使用后表示:“它在编程方面真的非常厉害!!只用一次对话,就能创建一个完整的游戏,包含多个选项,而且完全可玩!!
我注意到新版R1的一个显著变化是……它在编程方面更强了!!但它却在一些(未知的)演绎推理挑战上失败了……这些题它以前可是能答对的!!另一个明显的变化是,现在它在推理时会体现出差异性,而且会用用户的母语思考,不再像以前那样只用英文。”
不过,B89983ikei也补充道:「对我来说,我很喜欢解决那种偏“抽象”的推理题……所以我觉得这个版本的R1反而变弱了。我猜这是因为它现在的思维方式发生了变化……它更专注于精确的问题,反而忽略了更抽象的部分。我不确定这是不是一件好事!!对我来说,这是个倒退……
当我们去掉那些更抽象的思维时,也许就等于在去掉更接近“真实思考”的东西!!如果你能明白我在说什么……有没有其他人也注意到了这一点!?
还有,这次更新的文本格式我也不太喜欢……更让人困惑!!没有以前看着舒服了……用了太多没必要的emoji!!这些是一个喜欢并一直在用DeepSeek的用户的建设性批评!!」
与此同时,也有网友发现新版DeepSeekR1在响应时间上略有增加,但多数用户认为这是为了获得更准确结果而值得的权衡。
在进行测试后,还有用户给出了新款DeepseekR1的第一个基准测试!
新的DeepseekR1-0528在LiveCodeBench基准测试中的表现几乎与o3(high)相当。
X网友YuchenJin经过实测还发现,”我的氛围检查:它似乎是唯一能够始终正确回答’9. 9-9. 11是多少?‘的模型。“
和旧版对比时,OpenRouter透露,“新版本的DeepSeekR1目前已训练至1亿tokens,且还在持续增长,其中还包括一个免费版本!”对比图如下所示:
整体来看,DeepSeek自2023年成立以来,一直在专注打造高性能的通用人工智能模型。像DeepSeekv3和R1这样的模型,在多个评测中都拿到了很不错的成绩。特别是R1,它是开源的,采用MIT协议,大家可以免费使用、修改,甚至拿来做商业项目,这对于推动AI技术的普及和创新有很大帮助。
那么你试用上最新的R1模型了吗?感觉怎么样?欢迎留言分享你的使用体验!
好啦,今天的内容分享就到这,感觉不错的同学记得分享点赞哦!
PS:程序员好物馆持续分享程序员学习、面试相关干货,不见不散!
点分享
点收藏
点点赞
点在看