今日开源(2025-04-14):Skywork-OR1,7B/32B三个推理模型,规则增强学习训练,数学和代码推理表现远超同类


今日开源(2025-04-14):Skywork-OR1,7B/32B三个推理模型,规则增强学习训练,数学和代码推理表现远超同类

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

🏆基座模型
①项目:Skywork-OR1
★Skywork-OR1是一系列强大的数学和代码推理模型,采用大规模基于规则的增强学习进行训练。该系列包括两个通用推理模型(Skywork-OR1-7B-Preview和Skywork-OR1-32B-Preview)以及一个专门用于数学推理的模型(Skywork-OR1-Math-7B)。这些模型在数学和代码任务中表现出色,尤其是在数学推理方面,Skywork-OR1-Math-7B在AIME24和AIME25上的得分远超同类模型。
☆一键收藏:
https ://sota.jiqizhixin.com/project/skywork-or1
🤖Agent开发
①项目:SkillWeaver
★SkillWeaver是一个以技能为中心的框架,旨在通过自主合成可重用的技能API来实现智能体的自我改进。智能体在新网站上自主发现技能,执行技能以进行练习,并将练习经验提炼为稳健的API。通过迭代探索,持续扩展轻量级、即插即用的API库,显著增强智能体的能力。
☆一键收藏:
https ://sota.jiqizhixin.com/project/skillweaver
②项目:Graphiti
★Graphiti是一个用于构建和查询时间感知知识图谱的框架,专为在动态环境中运行的AI智能体设计。与传统的检索增强生成(RAG)方法不同,Graphiti能够持续整合用户交互、结构化和非结构化企业数据以及外部信息,形成一个连贯且可查询的图谱。该框架支持增量数据更新、高效检索和精确的历史查询,无需完全重新计算图谱,非常适合开发交互式、上下文感知的AI应用。
☆一键收藏:
https ://sota.jiqizhixin.com/project/graphiti
🛠️框架平台、必备工具
①项目:HoloPart
★HoloPart是一个生成式3D部分遮挡分割项目,旨在将3D形状分解为完整且语义上有意义的部分。该项目提供了代码、预训练模型和交互式演示,支持用户上传带有部分分割的网格文件,并通过HoloPart管道进行分割。项目依赖于多个开源项目和研究工作,致力于推动3D生成领域的研究。
☆一键收藏:
https ://sota.jiqizhixin.com/project/holopart
②项目:Nabla-GFlowNet
★Nabla-GFlowNet是一个用于扩散模型的高效奖励微调方法,旨在更好地保留预训练模型中的样本多样性和先验知识。通过调整奖励尺度和采样策略,Nabla-GFlowNet能够在不显著增加计算资源的情况下,提高模型的多样性和性能。
☆一键收藏:
https ://sota.jiqizhixin.com/project/nabla-gfn
📊数据指令
①项目:MegaMath
★MegaMath是一个大规模的数学预训练数据集,包含3700亿个token。该数据集通过重新提取CommonCrawl中的数学文档、识别高质量的数学相关代码以及合成QA风格文本和代码块等方式进行构建。MegaMath旨在为不同的训练需求提供多样化的数据变体,适用于从头训练或持续预训练大型语言模型。
☆一键收藏:
https ://sota.jiqizhixin.com/project/megamath
今日大模型在线列表·API免费调用
2025年4月14日更新
【上新!多模态模型】
Janus-Pro-7B
gemma-3-12b-it
Qwen2.5-VL-32B-Instruct
DeepSeek-R1-Distill-Qwen-7B
————-详细内容————-
【上新!多模态模型】
Janus-Pro-7B
清湛/山东4090公共线路;推理用时5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Janus-Pro-7B_04f3775aec/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/5b1bb89a-c790-4c71-9cae-e1e9ff424b3f
gemma-3-12b-it
清湛/山东4090公共线路;推理用时
8s
API调用地址:
https ://sota.jiqizhixin.com/model-api/gemma-3-12b-it_2bca5948b1/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/b718cf5a-420d-4e2e-a8db-0cd33c0dee64
Qwen2.5-VL-32B-Instruct
清湛/山东4090公共线路;推理用时10s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Qwen2_5-VL-32B-Instruct_0aa83a1bc0/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/d1bdba2b-ccab-4406-9508-0aedae444368
【DeepseekR1系列】
DeepSeek-R1-Distill-Qwen-7B
清湛/山东4090公共线路;推理用时
5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-7B_78216da51b/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/ff02de2b-827f-4aae-96eb-0ec8b7cc12fa
📋查看API调用文档:
https ://jiqizhixin.feishu.cn/wiki/EfHwwEuXZimdgpkQLXLcrOwKnyb
💻试用更多模型API:
https ://sota.jiqizhixin.com/xt-terminal


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录