今日开源(2025-04-21):SimpleAR,0.5B/1.5B自回归视觉模型,1024分辨率图像,改进图像美学和提示对齐
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
🏆基座模型
①项目:SimpleAR
★SimpleAR是一个自回归视觉生成模型,旨在推动文本到图像生成的前沿。该项目展示了在仅使用0.5B参数的情况下,能够生成1024分辨率的高保真图像,并在多个挑战性基准上取得了竞争性结果。通过监督微调和群体相对策略优化训练,SimpleAR在图像美学和提示对齐方面实现了显著改进。项目开源了所有训练和推理代码,鼓励更多人参与自回归视觉生成的研究。
☆一键收藏:
https ://sota.jiqizhixin.com/project/simplear
🤖Agent开发
①项目:CortexON
★CortexON是一个开源的多智能体AI系统,旨在通过自动化和简化日常任务来提升效率。该系统受到Manus和OpenAIDeepResearch等先进智能体平台的启发,能够执行复杂的工作流程,包括全面的研究任务、技术操作和复杂的业务流程自动化。CortexON集成了多个专门的智能体,这些智能体动态协作以实现用户定义的目标,如实时互联网搜索、文件管理、代码生成和API集成等。
☆一键收藏:
https ://sota.jiqizhixin.com/project/cortexon
②项目:GUICourse
★GUICourse项目旨在通过提升通用视觉语言模型(VLMs)的基础能力和GUI知识,训练视觉基础的GUI智能体。该项目提供了完整的数据集、代码和模型,帮助改进VLMs的OCR和定位能力、GUI系统知识以及交互技能。
☆一键收藏:
https ://sota.jiqizhixin.com/project/guicourse
🛠️框架平台、必备工具
①项目:Hyper-RAG
★Hyper-RAG是一种基于超图驱动的检索增强生成方法,旨在解决大语言模型(LLM)在生成内容时出现的幻觉问题。通过捕捉领域特定知识中的成对及超越成对的相关性,Hyper-RAG在NeurologyCorp数据集上的实验中,平均提高了12.3%的准确性,并在复杂查询下保持稳定性能。Hyper-RAG-Lite变体在检索速度上提高了一倍,并提升了3.3%的性能,证明了其在高风险应用如医疗诊断中的有效性。
☆一键收藏:
https ://sota.jiqizhixin.com/project/hyper-rag
②项目:V1
★V1项目旨在通过设计辅助任务来推进多模态推理,特别是通过视频未来预测任务来提升模型的推理能力。该项目提出了一种新的任务和相应的数据集,要求模型根据视频的前半部分推测未来事件。这种任务不仅挑战了现有多模态大模型的能力,还通过自监督学习的方式利用视频数据中的因果逻辑,推动模型在时间和因果维度上的推理能力。
☆一键收藏:
https ://sota.jiqizhixin.com/project/v1
③项目:Meetily
★Meetily是一个开源的AI会议助手,能够捕捉实时会议音频,进行实时转录,并生成会议摘要,同时确保用户隐私。该项目适合希望专注于讨论的团队,自动捕捉和组织会议内容,无需外部服务器或复杂的基础设施。Meetily支持在本地设备上运行,具有成本效益,并且可以自定义以满足特定需求。
☆一键收藏:
https ://sota.jiqizhixin.com/project/meetily
今日大模型在线列表·API免费调用
2025年4月21日更新
GLM-Z1-9B-0414
GLM-Z1-32B-0414
【多模态模型】
Janus-Pro-7B
gemma-3-12b-it
Qwen2.5-VL-32B-Instruct
DeepSeek-R1-Distill-Qwen-7B
————-详细内容————-
【上新!GLM-Z1系列】
GLM-Z1-9B-0414
清湛/山东4090公共线路;推理用时5s8s
API调用地址:
https ://sota.jiqizhixin.com/model-api/GLM-Z1-9B-0414_be760d73e2/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/fed46ab7-aa27-4acd-885d-fc9d1213a9a9
GLM-Z1-32B-0414
清湛/山东4090公共线路;推理用时
API调用地址:
https ://sota.jiqizhixin.com/model-api/GLM-Z1-32B-0414_b0166a39f1/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/7d51b45a-0bfc-42fb-89b5-21c0418dff9f
【多模态模型】
Janus-Pro-7B
清湛/山东4090公共线路;推理用时5s8s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Janus-Pro-7B_04f3775aec/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/5b1bb89a-c790-4c71-9cae-e1e9ff424b3f
gemma-3-12b-it
清湛/山东4090公共线路;推理用时
API调用地址:
https ://sota.jiqizhixin.com/model-api/gemma-3-12b-it_2bca5948b1/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/b718cf5a-420d-4e2e-a8db-0cd33c0dee64
Qwen2.5-VL-32B-Instruct
清湛/山东4090公共线路;推理用时10s5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Qwen2_5-VL-32B-Instruct_0aa83a1bc0/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/d1bdba2b-ccab-4406-9508-0aedae444368
【DeepseekR1系列】
DeepSeek-R1-Distill-Qwen-7B
清湛/山东4090公共线路;推理用时
API调用地址:
https ://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-7B_78216da51b/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/ff02de2b-827f-4aae-96eb-0ec8b7cc12fa
📋查看API调用文档:
https ://jiqizhixin.feishu.cn/wiki/EfHwwEuXZimdgpkQLXLcrOwKnyb
💻试用更多模型API:
https ://sota.jiqizhixin.com/xt-terminal