DeepSeek R2意外泄露~

发布日期: 2025-04-27

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

DeepSeekR2信息遭到泄露：
1.2T参数，78B激活，混合MoE架构
比GPT-4o便宜97.3%（每百万输入0.07美元，每百万输出0.27美元）
5.2PB训练数据，在C-Eval2.0上达到89.7%的准确率
更好的视觉能力，在COCO数据集上达到92.4%的准确率
在华为昇腾910B芯片上达到82%的利用率
有网友表示如果这些关于DeepSeekR2的信息有一半是真的，那将是震撼性的：
DeepSeekR2更详细的信息：

https ://www.jiuyangongshe.com/a/1h4gq724su0
推荐阅读
•动手设计AIAgents：Coze版（编排、记忆、插件、workflow、协作）
•DeepSeekR1+Agent的下半场
•RAG全景图：从RAG启蒙到高级RAG之36技，再到终章AgenticRAG！
•Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解（1.2万字，20+文献，27张图）
欢迎关注我的公众号“PaperAgent”，每天一篇大模型（LLM）文章来锻炼我们的思维，简单的例子，不简单的方法，提升自己。

ZejunCao

https://zejuncao.github.io/2025/04/27/1000000514-2247494320-2/