今日开源(2025-07-07):昆仑万维Skywork-Reward-V2,0.6B-8B参数奖励模型,2600万偏好对训练


今日开源(2025-07-07):昆仑万维Skywork-Reward-V2,0.6B-8B参数奖励模型,2600万偏好对训练

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

🏆基座模型
①项目:Skywork-Reward-V2
★Skywork-Reward-V2是一系列设计用于多种任务的奖励模型,基于Bradley-Terry模型,训练于2600万精心策划的偏好对上。该项目通过人类与大型语言模型的协同管道,提升了训练数据的规模和质量,达到了卓越的性能表现。与第一代Skywork-Reward相比,Skywork-Reward-V2在数据规模和质量上有显著提升,并在多个主要奖励模型基准测试中表现出色。
☆一键收藏:
https ://sota. jiqizhixin.com/project/skywork-reward-v2
②项目:DeepSWE
★DeepSWE-Preview是一个完全开源的、最先进的编码模型,专为在软件工程任务中表现出色而设计。该项目仅通过强化学习进行训练,展示了在复杂代码库中导航和查看/编辑多个文件的强大推理能力。DeepSWE-Preview在SWE-Bench-Verified上取得了59. 0%的成绩,目前在开源权重类别中排名第一。该模型基于Qwen3-32B进行训练,并启用了思维模式。经过仅200步的强化学习训练,SWE-Bench-Verified的得分提高了约20%。
☆一键收藏:
https ://sota. jiqizhixin.com/project/deepswe
🤖Agent开发
①项目:Causal-Copilot
★Causal-Copilot是一个自主因果分析智能体,旨在帮助科学家超越相关性,揭示自然和社会现象背后的机制。该项目通过结合大型语言模型(LLM)驱动的领域知识和最先进的因果技术,自动化整个因果分析工作流程,包括数据检查、算法和超参数选择、代码生成、不确定性评估以及PDF报告创建。用户可以通过简单的对话触发这些功能,从而专注于科学洞察而非实现细节。
☆一键收藏:
https ://sota. jiqizhixin.com/project/causal-copilot
②项目:Co-Sight
★Co-Sight是一个开源项目,旨在提供一个类似于Manus的系统,支持低成本的大模型生成高质量的报告。该项目可以灵活地在私有环境中部署,帮助企业和个人快速构建自己的报告生成系统。Co-Sight在成本、质量、稳定性和易用性之间取得了良好的平衡,适用于需要生成高质量报告的各种场景。
☆一键收藏:
https ://sota. jiqizhixin.com/project/co-sight
🛠️框架平台、必备工具
①项目:MemOS
★MemOS是一个为大语言模型(LLMs)设计的操作系统,旨在通过增强其长期记忆能力来提升模型的上下文感知、交互一致性和个性化。MemOS允许LLMs存储、检索和管理信息,从而在多种推理任务中表现出显著的性能提升。
☆一键收藏:
https ://sota. jiqizhixin.com/project/memos
②项目:Awesome-Deep-Research
★Awesome-Deep-Research是一个全面的资源库,专注于前沿的自主智能体深度研究。该项目为研究人员、开发者和爱好者提供了一个探索人工智能与自主智能体交汇点的入口。资源库包含行业领先的产品和解决方案、开源实现和工具、最新的研究论文和突破、评估基准和实用应用等内容。
☆一键收藏:
https ://sota. jiqizhixin.com/project/awesome-deep-research


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录