今日开源(2025-03-10):Long-VITA,长上下文视觉语言模型,支持百万视觉token,媲美20B模型,开源数据训练


今日开源(2025-03-10):Long-VITA,长上下文视觉语言模型,支持百万视觉token,媲美20B模型,开源数据训练

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

🏆基座模型
①项目:Long-VITA
★Long-VITA是一个强大的长上下文视觉语言模型,支持超过一百万个视觉token。该项目在仅使用开源数据的基础上进行训练,包含1700万个公开可用的样本。Long-VITA在图像和视频理解基准测试中取得了与最先进的20B参数模型相媲美的竞争性结果。
☆一键收藏:
https ://sota.jiqizhixin.com/project/long-vita
🤖Agent开发
①项目:AppAgentX
★AppAgentX是一个基于大语言模型的智能GUI智能体,旨在提高智能手机用户的操作效率。通过引入记忆机制,该智能体能够记录任务执行历史,识别重复的操作序列,并进化出高层次的快捷操作,从而替代低效的低层次操作。这种方法不仅保留了智能和灵活性,还显著提高了操作效率和准确性。
☆一键收藏:
https ://sota.jiqizhixin.com/project/appagentx
②项目:ANUS
★ANUS是一个强大、灵活且易于访问的开源AI智能体框架,旨在革新任务自动化。通过现代AI技术和最佳实践构建,ANUS代表了下一代AI智能体框架,提供无与伦比的能力和易用性。用户可以创建AI智能体来执行复杂任务、在多智能体环境中协作解决问题、与网络服务、文档和代码交互,并处理包括文本、图像和音频在内的多模态输入。
☆一键收藏:
https ://sota.jiqizhixin.com/project/anus
③项目:OpenManus-RL
★OpenManus-RL是一个由Ulab-UIUC和MetaGPT共同领导的开源项目,旨在通过强化学习(RL)调优大语言模型(LLM)智能体。该项目受到成功的推理LLM调优项目的启发,探索基于RL的新范式,特别是在智能体推理和工具集成方面。项目将定期更新探索方向和结果,并在GAIA、AgentBench、WebShop和OSWorld等agent基准上进行严格测试。
☆一键收藏:
https ://sota.jiqizhixin.com/project/openmanus-rl
🛠️框架平台、必备工具
①项目:H-CoT
★H-CoT项目旨在通过劫持思维链(Chain-of-Thought)安全推理机制,破解大型推理模型(LRMs)的安全性,包括OpenAI的O1/O3、DeepSeek-R1和Gemini2.0FlashThinking。该项目展示了一种通用且可转移的攻击方法,能够利用模型自身的中间推理过程来突破其安全推理机制。通过H-CoT,模型的拒绝率显著下降,有时甚至从98%降至2%以下,甚至将原本谨慎的语气转变为愿意提供有害内容。项目还引入了恶意教育者基准(Malicious-EducatorBenchmark),以测试LRMs中的安全问题。
☆一键收藏:
https ://sota.jiqizhixin.com/project/h-cot
②项目:Ditto

☆一键收藏:
https ://sota.jiqizhixin.com/project/torch-trtllm
今日大模型在线列表·API免费调用
2025年3月10日更新
【上新啦!】
Qwen2.5-14B-DeepSeek-R1-1M
MiniCPM-V-2.6
DeepSeek-R1-Distill-Qwen-32B
————-详细内容————-
【上新啦!】
Qwen2.5-14B-DeepSeek-R1-1M
清湛/山东4090公共线路;推理用时6s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Qwen2_5-14B-DeepSeek-R1-1M_4ddc0ba1dd/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/79f906d9-3f99-40e2-ae77-b60855a7b9e4
MiniCPM-V-2.6
清湛/山东4090公共线路;推理用时
6s
API调用地址:
https ://sota.jiqizhixin.com/model-api/MiniCPM-V-2_6_2adf3ff1e5/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/fb323d83-b737-464d-9bf5-a6d72adbee2f
DeepSeek-R1-Distill-Qwen-32B
清湛/山东4090公共线路;推理用时~80s
API调用地址:
https ://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-32B_74848ad356/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/bf9b6504-8270-44ee-830c-a4c690ef304b
📋查看API调用文档:
https ://jiqizhixin.feishu.cn/wiki/EfHwwEuXZimdgpkQLXLcrOwKnyb
💻试用更多模型API:
https ://sota.jiqizhixin.com/xt-terminal


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录