今日开源（2025-04-14）：Skywork-OR1，7B/32B三个推理模型，规则增强学习训练，数学和代码推理表现远超同类

发布日期: 2025-04-14

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

🏆基座模型
①项目：Skywork-OR1
★Skywork-OR1是一系列强大的数学和代码推理模型，采用大规模基于规则的增强学习进行训练。该系列包括两个通用推理模型（Skywork-OR1-7B-Preview和Skywork-OR1-32B-Preview）以及一个专门用于数学推理的模型（Skywork-OR1-Math-7B）。这些模型在数学和代码任务中表现出色，尤其是在数学推理方面，Skywork-OR1-Math-7B在AIME24和AIME25上的得分远超同类模型。
☆一键收藏：
https ://sota.jiqizhixin.com/project/skywork-or1
🤖Agent开发
①项目：SkillWeaver
★SkillWeaver是一个以技能为中心的框架，旨在通过自主合成可重用的技能API来实现智能体的自我改进。智能体在新网站上自主发现技能，执行技能以进行练习，并将练习经验提炼为稳健的API。通过迭代探索，持续扩展轻量级、即插即用的API库，显著增强智能体的能力。
☆一键收藏：
https ://sota.jiqizhixin.com/project/skillweaver
②项目：Graphiti
★Graphiti是一个用于构建和查询时间感知知识图谱的框架，专为在动态环境中运行的AI智能体设计。与传统的检索增强生成（RAG）方法不同，Graphiti能够持续整合用户交互、结构化和非结构化企业数据以及外部信息，形成一个连贯且可查询的图谱。该框架支持增量数据更新、高效检索和精确的历史查询，无需完全重新计算图谱，非常适合开发交互式、上下文感知的AI应用。
☆一键收藏：
https ://sota.jiqizhixin.com/project/graphiti
🛠️框架平台、必备工具
①项目：HoloPart
★HoloPart是一个生成式3D部分遮挡分割项目，旨在将3D形状分解为完整且语义上有意义的部分。该项目提供了代码、预训练模型和交互式演示，支持用户上传带有部分分割的网格文件，并通过HoloPart管道进行分割。项目依赖于多个开源项目和研究工作，致力于推动3D生成领域的研究。
☆一键收藏：
https ://sota.jiqizhixin.com/project/holopart
②项目：Nabla-GFlowNet
★Nabla-GFlowNet是一个用于扩散模型的高效奖励微调方法，旨在更好地保留预训练模型中的样本多样性和先验知识。通过调整奖励尺度和采样策略，Nabla-GFlowNet能够在不显著增加计算资源的情况下，提高模型的多样性和性能。
☆一键收藏：
https ://sota.jiqizhixin.com/project/nabla-gfn
📊数据指令
①项目：MegaMath
★MegaMath是一个大规模的数学预训练数据集，包含3700亿个token。该数据集通过重新提取CommonCrawl中的数学文档、识别高质量的数学相关代码以及合成QA风格文本和代码块等方式进行构建。MegaMath旨在为不同的训练需求提供多样化的数据变体，适用于从头训练或持续预训练大型语言模型。
☆一键收藏：
https ://sota.jiqizhixin.com/project/megamath
今日大模型在线列表·API免费调用
2025年4月14日更新
【上新！多模态模型】
Janus-Pro-7B
gemma-3-12b-it
Qwen2.5-VL-32B-Instruct
DeepSeek-R1-Distill-Qwen-7B
————-详细内容————-
【上新！多模态模型】
Janus-Pro-7B
清湛/山东4090公共线路；推理用时5s
API调用地址：
https ://sota.jiqizhixin.com/model-api/Janus-Pro-7B_04f3775aec/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/5b1bb89a-c790-4c71-9cae-e1e9ff424b3f
gemma-3-12b-it
清湛/山东4090公共线路；推理用时8s
API调用地址：
https ://sota.jiqizhixin.com/model-api/gemma-3-12b-it_2bca5948b1/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/b718cf5a-420d-4e2e-a8db-0cd33c0dee64
Qwen2.5-VL-32B-Instruct
清湛/山东4090公共线路；推理用时10s
API调用地址：
https ://sota.jiqizhixin.com/model-api/Qwen2_5-VL-32B-Instruct_0aa83a1bc0/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/d1bdba2b-ccab-4406-9508-0aedae444368
【DeepseekR1系列】
DeepSeek-R1-Distill-Qwen-7B
清湛/山东4090公共线路；推理用时5s
API调用地址：
https ://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-7B_78216da51b/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/ff02de2b-827f-4aae-96eb-0ec8b7cc12fa
📋查看API调用文档：
https ://jiqizhixin.feishu.cn/wiki/EfHwwEuXZimdgpkQLXLcrOwKnyb
💻试用更多模型API：
https ://sota.jiqizhixin.com/xt-terminal