今日开源(2025-04-28):Step1X-Edit,19B多模态图像编辑模型,媲美GPT-4o,结合DiT的解耦式架构


今日开源(2025-04-28):Step1X-Edit,19B多模态图像编辑模型,媲美GPT-4o,结合DiT的解耦式架构

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

🏆基座模型
①项目:Step1X-Edit
★Step1X-Edit是一个先进的图像编辑模型,旨在提供与闭源模型(如GPT-4o和Gemini2Flash)相媲美的性能。该模型采用多模态大语言模型(LLM)来处理参考图像和用户的编辑指令,通过提取潜在嵌入并与扩散图像解码器集成来生成目标图像。项目通过构建数据生成管道来生产高质量数据集,并开发了一个名为GEdit-Bench的新基准进行评估。实验结果表明,Step1X-Edit在GEdit-Bench上的表现优于现有的开源基线,并接近领先的专有模型。
☆一键收藏:
https ://sota.jiqizhixin.com/project/step1x-edit
🤖Agent开发
①项目:VoltAgent
★VoltAgent是一个开源的TypeScript框架,专为构建和编排AI智能体而设计。它提供了基础结构和工具,简化了AI智能体应用的开发过程。通过提供模块化构建块、标准化模式和抽象,VoltAgent帮助开发者快速创建聊天机器人、虚拟助手、自动化工作流或复杂的多智能体系统。它支持与OpenAI、Google、Anthropic等流行AI模型的兼容性,并提供了丰富的工具和集成选项,使智能体能够连接到外部API、数据库和服务,执行实际任务。
☆一键收藏:
https ://sota.jiqizhixin.com/project/voltagent
🛠️框架平台、必备工具
①项目:ChatWiki
★ChatWiki是一款开源的知识库AI问答系统,基于大语言模型(LLM)和检索增强生成(RAG)以及GraphRAG知识图谱构建。该系统提供开箱即用的数据处理和模型调用能力,支持多种文档格式如docx、excel、pdf、ofd等。ChatWiki支持国产化浏览器和多种大模型,适用于企业、高校和政务部门快速搭建私有知识库AI问答系统。
☆一键收藏:
https ://sota.jiqizhixin.com/project/chatwiki
②项目:Chatlog
★Chatlog是一款聊天记录工具,旨在帮助用户轻松使用自己的聊天数据。该工具支持从本地数据库文件获取聊天数据,兼容Windows和macOS系统,并支持微信多个版本。Chatlog提供了终端UI界面和命令行工具,允许用户查询聊天记录、联系人、群聊等信息。此外,它还支持多媒体消息的解密和多账号管理。通过HTTPAPI服务,用户可以方便地访问和管理聊天数据,并与支持MCP协议的AI助手无缝集成。
☆一键收藏:
https ://sota.jiqizhixin.com/project/chatlog
③项目:ToolRL

☆一键收藏:
https ://sota.jiqizhixin.com/project/toolrl
④项目:DFloat11
★DFloat11是一个无损压缩框架,能够在不影响精度的情况下,将大语言模型(LLM)的大小减少约30%。该框架支持在资源受限的硬件上进行高效的GPU推理,输出与原始模型保持位对位的相同。DFloat11与HuggingFace框架无缝集成,支持更长的输入上下文,并显著提高生成速度。
☆一键收藏:
https ://sota.jiqizhixin.com/project/dfloat11
今日大模型在线列表·API免费调用
2025年4月28日更新
Qwen2.5-VL-7B-Instruct
Qwen2.5-VL-3B-Instruct
GLM-Z1-9B-0414
Janus-Pro-7B
DeepSeek-R1-Distill-Qwen-7B
————-详细内容————-
【Qwen2.5-VL系列】
Qwen2.5-VL-7B-Instruct
清湛/山东4090公共线路;推理用时5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Qwen2_5-VL-7B-Instruct_f9ecfcedb3/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/37da5bd4-1647-44d6-a2f2-883d6016ad59
Qwen2.5-VL-3B-Instruct
清湛/山东4090公共线路;推理用时
8s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Qwen2_5-VL-3B-Instruct_f749b05e2d/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/4c3ac3f2-5fa1-4d4d-964c-d86b34ed0b57
【GLM-Z1系列】
GLM-Z1-9B-0414
清湛/山东4090公共线路;推理用时8s
API调用地址:
https ://sota.jiqizhixin.com/model-api/GLM-Z1-9B-0414_b0a854c28b/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/fed46ab7-aa27-4acd-885d-fc9d1213a9a9
【多模态模型】
Janus-Pro-7B
清湛/山东4090公共线路;推理用时
5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Janus-Pro-7B_04f3775aec/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/5b1bb89a-c790-4c71-9cae-e1e9ff424b3f
【DeepseekR1系列】
DeepSeek-R1-Distill-Qwen-7B
清湛/山东4090公共线路;推理用时~5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-7B_78216da51b/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/ff02de2b-827f-4aae-96eb-0ec8b7cc12fa
📋查看API调用文档:
https ://jiqizhixin.feishu.cn/wiki/EfHwwEuXZimdgpkQLXLcrOwKnyb
💻试用更多模型API:
https ://sota.jiqizhixin.com/xt-terminal


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录