DeepSeek R2意外泄露~


DeepSeek R2意外泄露~

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

DeepSeekR2信息遭到泄露:
1.2T参数,78B激活,混合MoE架构
比GPT-4o便宜97.3%(每百万输入0.07美元,每百万输出0.27美元)
5.2PB训练数据,在C-Eval2.0上达到89.7%的准确率
更好的视觉能力,在COCO数据集上达到92.4%的准确率
在华为昇腾910B芯片上达到82%的利用率
有网友表示如果这些关于DeepSeekR2的信息有一半是真的,那将是震撼性的:
DeepSeekR2更详细的信息:

https ://www.jiuyangongshe.com/a/1h4gq724su0
推荐阅读
•动手设计AIAgents:Coze版(编排、记忆、插件、workflow、协作)
•DeepSeekR1+Agent的下半场
•RAG全景图:从RAG启蒙到高级RAG之36技,再到终章AgenticRAG!
•Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1.2万字,20+文献,27张图)
欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录