2025-07-11
综述 | 从“说出来”到“脑中算”:Latent Reasoning的范式跃迁与无限可能
2025-07-10
ZejunCao
UIUC提出隐式监督新范式:无需标注/RM即可全面提升多模态Reasoning的感知能力
2025-07-10
ZejunCao
AI'学霸'也解不出高中题?耶鲁、复旦发布MMSciBench,揭示AI理科推理能力短板
2025-07-10
ZejunCao
直播预约 | 从大模型的安全对齐到欺骗性对齐系列工作分享
2025-07-09
ZejunCao
LLM长文本内卷,谁是真英雄?告别跑分玄学,我们需要一把“公道秤”
2025-07-09
ZejunCao
奖励模型迎来预训练新时代!上海AI Lab和复旦联合重塑RL奖励机制
2025-07-08
ZejunCao
重塑AI记忆边界:MemOS开源!时序推理较OpenAI提升159%
2025-07-08
ZejunCao
数学推理热潮下的冷思考!如何训练真正'全能'的推理模型?
2025-07-07
ZejunCao
Doc2X:构建可扩展高精度多格式文档解析管道的API技术实践
2025-07-07
ZejunCao
提示工程死亡?不,它刚刚重生为计算科学:一篇讲透Prompt设计的科学基础
2025-07-06
ZejunCao
关键突破:理论验证了 RL for LLM 路线的可行性
2025-07-06
ZejunCao
GRPO-λ破解LLM强化学习崩溃难题!
2025-07-05
ZejunCao
牛津证实CoT不可解释!大家不要再用错了
2025-07-05
ZejunCao
中山大学&华为联合提出 Issue Resolution 数据集构建神器SWE-Factory:每条只要$0.024
2025-07-04
ZejunCao
普林斯顿等高校提出AgentDistill:无需任何训练即可继承大Agent复杂能力,性能提升48%,成本降低90%
2025-07-04
ZejunCao
邱锡鹏老师团队发现SFT与DPO破壁统一:内隐奖励作为桥梁
2025-07-03
ZejunCao
看了这本全是图解的书,算是真的掌握LLM基础和前沿了...
2025-07-01
ZejunCao
直播预约 | 视觉智能驱动的多模态对齐与推理系列工作分享
2025-07-01
ZejunCao
别只卷文本了!港科大、微软这份爆火的“视觉思维”路线图,才是多模态的未来!
2025-07-01
ZejunCao
思维锚点:破解LLM Reasoning黑箱的关键句
2025-06-29
ZejunCao