今日开源(2025-04-24):Skywork-R1V 2.0,38B参数推理模型,视觉链式思维突破,数学/图像理解SOTA


今日开源(2025-04-24):Skywork-R1V 2.0,38B参数推理模型,视觉链式思维突破,数学/图像理解SOTA

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

🏆基座模型
①项目:Skywork-R1V2.0
★昆仑万维Skywork-R1V2.0版本开源,多模态推理实现了再进化,成为最强高考数理解题利器,在视觉语言基准测试中表现领先。Skywork-R1V是首个开源的多模态推理模型,具备先进的视觉链式思维能力。该模型能够在视觉输入上进行多步骤的逻辑推理,将复杂的图像问题分解为可管理的步骤。此外,它还能够解决视觉数学问题,并高精度地解释科学和医学图像。Skywork-R1V无缝集成文本和图像,实现更丰富的上下文感知理解。
☆一键收藏:
https ://sota.jiqizhixin.com/project/skywork-r1v
②项目:ThinkLite-VL
★ThinkLite-VL项目旨在通过MCTS(蒙特卡罗树搜索)引导的样本选择,实现数据高效的视觉推理自我改进。该项目的核心是利用MCTS算法优化样本选择过程,从而在减少数据使用的情况下,提升视觉推理任务的性能。
☆一键收藏:
https ://sota.jiqizhixin.com/project/thinklite-vl
⚙️Robotics开发
①项目:ManipTrans
★ManipTrans是一个专注于高效灵巧双手操作转移的项目,采用残差学习方法。该项目的目标是通过先进的算法和数据集,提升机器人在复杂环境中的操作能力。项目已被CVPR2025接收,展示了其在计算机视觉和机器人领域的创新性。
☆一键收藏:
https ://sota.jiqizhixin.com/project/maniptrans
🛠️框架平台、必备工具
①项目:MagiAttention
★MagiAttention是一种分布式注意力机制,旨在通过上下文并行(CP)策略支持多种注意力掩码类型,并在广泛的场景中实现线性可扩展性。该项目特别适用于涉及超长、异构掩码训练的任务,如视频生成。MagiAttention可以轻松集成到流行的训练框架中,如Megatron-LM和Pytorch的原生FSDP。项目致力于不断提升性能和通用性,为更广泛的研究社区提供支持。
☆一键收藏:
https ://sota.jiqizhixin.com/project/magiattention
②项目:TTRL
★TTRL(Test-TimeReinforcementLearning)是一个开源解决方案,旨在处理没有真实标签的数据,特别是测试数据的在线强化学习。该项目主要研究在大语言模型中进行推理任务时的强化学习,核心挑战在于推理过程中没有真实信息的奖励估计。尽管这种设置看似难以捉摸,但通过使用TTS中的常见做法,如多数投票,TTRL能够有效地驱动强化学习训练。
☆一键收藏:
https ://sota.jiqizhixin.com/project/ttrl
③项目:WorldGen
★WorldGen是一个强大的工具,可以通过文本提示和图像在几秒钟内生成3D场景。它适用于游戏、模拟、机器人和虚拟现实应用程序。WorldGen支持360°自由探索生成的3D场景,能够处理室内和室外、真实和非真实风格的多样化场景,并支持任意分辨率和相机设置的实时渲染。
☆一键收藏:
https ://sota.jiqizhixin.com/project/worldgen
今日大模型在线列表·API免费调用
2025年4月24日更新
Janus-Pro-7B
DeepSeek-R1-Distill-Qwen-7B
————-详细内容————-
【多模态模型】
Janus-Pro-7B
清湛/山东4090公共线路;推理用时5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Janus-Pro-7B_04f3775aec/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/5b1bb89a-c790-4c71-9cae-e1e9ff424b3f
【DeepseekR1系列】
DeepSeek-R1-Distill-Qwen-7B
清湛/山东4090公共线路;推理用时
5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-7B_78216da51b/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/ff02de2b-827f-4aae-96eb-0ec8b7cc12fa
📋查看API调用文档:
https ://jiqizhixin.feishu.cn/wiki/EfHwwEuXZimdgpkQLXLcrOwKnyb
💻试用更多模型API:
https ://sota.jiqizhixin.com/xt-terminal


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录