今日开源（2025-04-17）：Perception R1，3B多模态大模型强化学习，GRPO后训练，突破感知任务性能阈值

发布日期: 2025-04-17

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

🏆基座模型
①项目：PerceptionR1
★PerceptionR1是一个可扩展的强化学习框架，采用群体相对策略优化（GRPO）进行多模态大模型（MLLM）的后训练。该项目引入了一种新的分析框架——感知困惑分析，揭示了在感知任务中有效应用强化学习的关键阈值。PerceptionR1在多个视觉感知基准上取得了显著的性能提升，尤其是在COCO2017验证集上达到了31.9%的mAP，成为首个在此规模上达到如此性能的3B级MLLM。
☆一键收藏：
https ://sota.jiqizhixin.com/project/perception-r1
🛠️框架平台、必备工具
①项目：CodexCLI
★Codex是一个轻量级的编码agent，专为在终端中运行而设计。它为开发者提供了类似ChatGPT的推理能力，并能够实际运行代码、操作文件和进行迭代开发。Codex支持自动化审批，确保安全性和版本控制。作为一个开源项目，Codex允许开发者查看和贡献其发展。
☆一键收藏：
https ://sota.jiqizhixin.com/project/codex-cli
②项目：Orval

☆一键收藏：
https ://sota.jiqizhixin.com/project/orval
③项目：UniCombine
★UniCombine是一个统一的多条件组合框架，利用扩散变换器实现多条件可控生成。该项目能够有效处理任意组合的输入条件，并与所有条件实现显著的对齐，包括但不限于文本提示、空间映射和主题图像。UniCombine在多条件生成任务中展示了出色的效果，如主题插入任务、主题空间任务和多空间任务。
☆一键收藏：
https ://sota.jiqizhixin.com/project/unicombine
④项目：AutoToM
★AutoToM是一个用于开放式心智理论的自动化贝叶斯逆向规划和模型发现工具。该项目旨在通过自动化的方式进行模型发现和逆向规划，以帮助理解和模拟人类的心智理论。AutoToM可以在不同的数据集上运行，并支持自定义输入以进行模型发现和逆向规划。
☆一键收藏：
https ://sota.jiqizhixin.com/project/autotom
🤖Agent开发
①项目：Index
★Index是一个先进的开源浏览器智能体，能够自主在网络上执行复杂任务。它由Claude3.7Sonnet提供支持，并计划在未来支持更多模型。Index还提供托管API，用户可以通过托管UI或完全自托管UI来试用。该项目支持由Laminar提供支持的高级浏览器代理可观测性。
☆一键收藏：
https ://sota.jiqizhixin.com/project/index
今日大模型在线列表·API免费调用
2025年4月17日更新
GLM-Z1-9B-0414
GLM-Z1-32B-0414
【多模态模型】
Janus-Pro-7B
gemma-3-12b-it
Qwen2.5-VL-32B-Instruct
DeepSeek-R1-Distill-Qwen-7B
————-详细内容————-
【上新！GLM-Z1系列】
GLM-Z1-9B-0414
清湛/山东4090公共线路；推理用时5s
API调用地址：
https ://sota.jiqizhixin.com/model-api/GLM-Z1-9B-0414_be760d73e2/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/fed46ab7-aa27-4acd-885d-fc9d1213a9a9
GLM-Z1-32B-0414
清湛/山东4090公共线路；推理用时8s
API调用地址：
https ://sota.jiqizhixin.com/model-api/GLM-Z1-32B-0414_b0166a39f1/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/7d51b45a-0bfc-42fb-89b5-21c0418dff9f
【多模态模型】
Janus-Pro-7B
清湛/山东4090公共线路；推理用时5s
API调用地址：
https ://sota.jiqizhixin.com/model-api/Janus-Pro-7B_04f3775aec/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/5b1bb89a-c790-4c71-9cae-e1e9ff424b3f
gemma-3-12b-it
清湛/山东4090公共线路；推理用时8s
API调用地址：
https ://sota.jiqizhixin.com/model-api/gemma-3-12b-it_2bca5948b1/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/b718cf5a-420d-4e2e-a8db-0cd33c0dee64
Qwen2.5-VL-32B-Instruct
清湛/山东4090公共线路；推理用时10s
API调用地址：
https ://sota.jiqizhixin.com/model-api/Qwen2_5-VL-32B-Instruct_0aa83a1bc0/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/d1bdba2b-ccab-4406-9508-0aedae444368
【DeepseekR1系列】
DeepSeek-R1-Distill-Qwen-7B
清湛/山东4090公共线路；推理用时5s
API调用地址：
https ://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-7B_78216da51b/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/ff02de2b-827f-4aae-96eb-0ec8b7cc12fa
📋查看API调用文档：
https ://jiqizhixin.feishu.cn/wiki/EfHwwEuXZimdgpkQLXLcrOwKnyb
💻试用更多模型API：
https ://sota.jiqizhixin.com/xt-terminal