今日开源(2025-04-23):Dia,1.6B参数对话式TTS模型,支持情感语调控制,可生成非语言交流声效,仅支持英语


今日开源(2025-04-23):Dia,1.6B参数对话式TTS模型,支持情感语调控制,可生成非语言交流声效,仅支持英语

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

🏆基座模型
①项目:Dia
★Dia是由NariLabs开发的一个拥有16亿参数的文本到语音(TTS)模型。该模型能够直接从文本生成高度逼真的对话,并支持通过音频进行情感和语调控制。此外,Dia还可以生成非语言交流,如笑声、咳嗽等。目前,该模型仅支持英语生成。
☆一键收藏:
https ://sota.jiqizhixin.com/project/dia-2
🤖Agent开发
①项目:Suna
★Suna是一个完全开源的AI助手,旨在通过自然对话帮助用户轻松完成现实世界的任务。它结合了强大的功能和直观的界面,能够理解用户需求并提供结果。Suna的工具包包括无缝的浏览器自动化、文件管理、网页爬取和扩展搜索功能、系统任务的命令行执行、网站部署以及与各种API和服务的集成。这些功能协同工作,使Suna能够通过简单的对话解决复杂问题并自动化工作流程。
☆一键收藏:
https ://sota.jiqizhixin.com/project/suna
🛠️框架平台、必备工具
①项目:SRPO
★SRPO-Qwen-32B是一个跨领域的大规模强化学习框架,旨在系统地解决多领域推理挑战。该项目在AIME24和LiveCodeBench基准测试中超越了DeepSeek-R1-Zero-32B的表现,同时仅使用了约1/10的训练步骤。SRPO基于GroupRelativePolicyOptimization(GRPO),引入了两项关键方法创新:两阶段跨领域训练范式和历史重采样(HR)技术,以提高训练效率和推理性能。
☆一键收藏:
https ://sota.jiqizhixin.com/project/srpo
②项目:FAR
★FAR(FrameAutoRegressiveModel)是一种新型的自回归视频生成基线模型,旨在通过自回归上下文预测连续帧。其目标与视频建模高度契合,类似于语言建模中的下一个标记预测。FAR在不需要额外图像到视频微调的情况下,利用干净的视觉上下文进行无条件预训练,在视频生成和视频预测任务中均取得了先进的结果。该模型支持在长视频序列上进行高效训练,并通过多级KV缓存加速长视频的自回归推理。
☆一键收藏:
https ://sota.jiqizhixin.com/project/far
③项目:tiny-llm
★tiny-llm是一个为系统工程师设计的教程项目,旨在使用MLX构建大语言模型(LLM)的服务基础设施。项目不依赖高级神经网络API,而是基于MLX的数组/矩阵API,从零开始构建模型服务,并进行优化。项目的目标是学习高效服务LLM模型的技术,特别是Qwen2模型。项目计划分为三周,逐步实现从基础PythonAPI到C++/Metal自定义内核的优化。
☆一键收藏:
https ://sota.jiqizhixin.com/project/tiny-llm-2
④项目:PageIndex
★PageIndex是一个文档索引系统,专为需要推理的增强生成(RAG)而设计。它通过将长文档构建为搜索树结构,使其适合于基于推理的检索。PageIndex可以将冗长的PDF文档转换为语义树结构,类似于优化后的“目录”,以便与大型语言模型(LLMs)一起使用。该系统特别适用于金融报告、监管文件、学术教科书、法律或技术手册等超出LLM上下文限制的文档。
☆一键收藏:
https ://sota.jiqizhixin.com/project/pageindex
今日大模型在线列表·API免费调用
2025年4月23日更新
GLM-Z1-9B-0414
GLM-Z1-32B-0414
【多模态模型】
Janus-Pro-7B
gemma-3-12b-it
Qwen2.5-VL-32B-Instruct
DeepSeek-R1-Distill-Qwen-7B
————-详细内容————-
【上新!GLM-Z1系列】
GLM-Z1-9B-0414
清湛/山东4090公共线路;推理用时5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/GLM-Z1-9B-0414_be760d73e2/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/fed46ab7-aa27-4acd-885d-fc9d1213a9a9
GLM-Z1-32B-0414
清湛/山东4090公共线路;推理用时
8s
API调用地址:
https ://sota.jiqizhixin.com/model-api/GLM-Z1-32B-0414_b0166a39f1/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/7d51b45a-0bfc-42fb-89b5-21c0418dff9f
【多模态模型】
Janus-Pro-7B
清湛/山东4090公共线路;推理用时5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Janus-Pro-7B_04f3775aec/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/5b1bb89a-c790-4c71-9cae-e1e9ff424b3f
gemma-3-12b-it
清湛/山东4090公共线路;推理用时
8s
API调用地址:
https ://sota.jiqizhixin.com/model-api/gemma-3-12b-it_2bca5948b1/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/b718cf5a-420d-4e2e-a8db-0cd33c0dee64
Qwen2.5-VL-32B-Instruct
清湛/山东4090公共线路;推理用时10s
API调用地址:
https ://sota.jiqizhixin.com/model-api/Qwen2_5-VL-32B-Instruct_0aa83a1bc0/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/d1bdba2b-ccab-4406-9508-0aedae444368
【DeepseekR1系列】
DeepSeek-R1-Distill-Qwen-7B
清湛/山东4090公共线路;推理用时
5s
API调用地址:
https ://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-7B_78216da51b/chat/completions
获取秘钥:
https ://sota.jiqizhixin.com/xt-terminal/ff02de2b-827f-4aae-96eb-0ec8b7cc12fa
📋查看API调用文档:
https ://jiqizhixin.feishu.cn/wiki/EfHwwEuXZimdgpkQLXLcrOwKnyb
💻试用更多模型API:
https ://sota.jiqizhixin.com/xt-terminal


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录