今日开源(2025-04-25):英伟达开源DAM多模态视觉语言模型,3B参数,交互式区域描述生成模型,支持点/框/涂鸦输入


今日开源(2025-04-25):英伟达开源DAM多模态视觉语言模型,3B参数,交互式区域描述生成模型,支持点/框/涂鸦输入

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

🏆基座模型
①项目:DescribeAnything
★DescribeAnything项目由NVIDIA、UCBerkeley、UCSF等机构合作开发,旨在通过输入图像或视频的特定区域(如点、框、涂鸦、掩码)生成详细的描述。该项目还推出了一个新的基准测试DLC-Bench,用于评估模型在DLC任务上的表现。项目提供了多种交互式演示和命令行工具,支持用户在不安装额外依赖的情况下生成详细的本地化图像描述。
☆一键收藏:
https ://sota.jiqizhixin.com/project/describe-anything
②项目:Tina
★Tina项目旨在通过低秩适应(LoRA)技术在强化学习过程中增强小型语言模型的推理能力。该项目展示了Tina模型在性能上与同基模型的全参数训练的SOTA基线模型相当,甚至在某些情况下更优。特别是,最佳Tina模型在AIME24上实现了超过20%的性能提升和43.33%的Pass@1准确率。项目的再现成本仅为9美元,所有实验的再现成本为526美元。
☆一键收藏:
https ://sota.jiqizhixin.com/project/tina
🤖Agent开发
①项目:CreateAgentApp
★CreateAgentApp是一个开源项目,旨在帮助用户选择合适的AI智能体框架。该项目提供了多个使用不同框架编写的智能体示例,用户可以通过对比这些示例来选择最适合自己需求的框架。项目涵盖了多种LLM工作流和智能体示例,适合用于构建实际应用中的AI智能体。
☆一键收藏:
https ://sota.jiqizhixin.com/project/create-agent-app
②项目:Rowboat
★Rowboat是一个由AI驱动的多智能体构建工具,旨在帮助用户快速创建和管理多智能体工作流。通过简单的指令,用户可以构建复杂的多智能体系统,例如为食品配送公司创建一个处理配送状态和缺失物品的助手。Rowboat集成了OpenAI的AgentsSDK,提供了HTTPAPI和PythonSDK接口,方便用户将其集成到自己的应用中。
☆一键收藏:
https ://sota.jiqizhixin.com/project/rowboat
🛠️框架平台、必备工具
①项目:ElatoAI
★ElatoAI是一个基于OpenAI实时API的实时AI语音项目,旨在通过ArduinoESP32、SecureWebsockets和Deno边缘函数实现超过10分钟的不间断全球对话。该项目适用于AI玩具、AI伴侣和AI设备等,提供了一个开源平台,用户可以通过DIY硬件设计和软件配置,快速搭建自己的AI语音设备。
☆一键收藏:
https ://sota.jiqizhixin.com/project/elatoai
②项目:Hyprnote
★Hyprnote是一个专为连续会议设计的AI记事本。它能够记录和转录会议内容,并从原始会议笔记中生成强大的摘要。Hyprnote的特别之处在于其离线工作能力,使用开源模型(如Whisper和Llama),并且具有高度的可扩展性,支持通过插件进行功能扩展。
☆一键收藏:
https ://sota.jiqizhixin.com/project/hyprnote
今日大模型在线列表·API免费调用
2025年4月25日更新
Janus-Pro-7B
DeepSeek-R1-Distill-Qwen-7B
————-详细内容————-
【多模态模型】
Janus-Pro-7B
清湛/山东4090公共线路;推理用时5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Janus-Pro-7B_04f3775aec/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/5b1bb89a-c790-4c71-9cae-e1e9ff424b3f
【DeepseekR1系列】
DeepSeek-R1-Distill-Qwen-7B
清湛/山东4090公共线路;推理用时
5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-7B_78216da51b/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/ff02de2b-827f-4aae-96eb-0ec8b7cc12fa
📋查看API调用文档:
https ://jiqizhixin.feishu.cn/wiki/EfHwwEuXZimdgpkQLXLcrOwKnyb
💻试用更多模型API:
https ://sota.jiqizhixin.com/xt-terminal


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录