今日开源（2025-04-23）：Dia，1.6B参数对话式TTS模型，支持情感语调控制，可生成非语言交流声效，仅支持英语

发布日期: 2025-04-23

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

🏆基座模型
①项目：Dia
★Dia是由NariLabs开发的一个拥有16亿参数的文本到语音（TTS）模型。该模型能够直接从文本生成高度逼真的对话，并支持通过音频进行情感和语调控制。此外，Dia还可以生成非语言交流，如笑声、咳嗽等。目前，该模型仅支持英语生成。
☆一键收藏：
https ://sota.jiqizhixin.com/project/dia-2
🤖Agent开发
①项目：Suna
★Suna是一个完全开源的AI助手，旨在通过自然对话帮助用户轻松完成现实世界的任务。它结合了强大的功能和直观的界面，能够理解用户需求并提供结果。Suna的工具包包括无缝的浏览器自动化、文件管理、网页爬取和扩展搜索功能、系统任务的命令行执行、网站部署以及与各种API和服务的集成。这些功能协同工作，使Suna能够通过简单的对话解决复杂问题并自动化工作流程。
☆一键收藏：
https ://sota.jiqizhixin.com/project/suna
🛠️框架平台、必备工具
①项目：SRPO
★SRPO-Qwen-32B是一个跨领域的大规模强化学习框架，旨在系统地解决多领域推理挑战。该项目在AIME24和LiveCodeBench基准测试中超越了DeepSeek-R1-Zero-32B的表现，同时仅使用了约1/10的训练步骤。SRPO基于GroupRelativePolicyOptimization(GRPO)，引入了两项关键方法创新：两阶段跨领域训练范式和历史重采样(HR)技术，以提高训练效率和推理性能。
☆一键收藏：
https ://sota.jiqizhixin.com/project/srpo
②项目：FAR
★FAR（FrameAutoRegressiveModel）是一种新型的自回归视频生成基线模型，旨在通过自回归上下文预测连续帧。其目标与视频建模高度契合，类似于语言建模中的下一个标记预测。FAR在不需要额外图像到视频微调的情况下，利用干净的视觉上下文进行无条件预训练，在视频生成和视频预测任务中均取得了先进的结果。该模型支持在长视频序列上进行高效训练，并通过多级KV缓存加速长视频的自回归推理。
☆一键收藏：
https ://sota.jiqizhixin.com/project/far
③项目：tiny-llm
★tiny-llm是一个为系统工程师设计的教程项目，旨在使用MLX构建大语言模型（LLM）的服务基础设施。项目不依赖高级神经网络API，而是基于MLX的数组/矩阵API，从零开始构建模型服务，并进行优化。项目的目标是学习高效服务LLM模型的技术，特别是Qwen2模型。项目计划分为三周，逐步实现从基础PythonAPI到C++/Metal自定义内核的优化。
☆一键收藏：
https ://sota.jiqizhixin.com/project/tiny-llm-2
④项目：PageIndex
★PageIndex是一个文档索引系统，专为需要推理的增强生成（RAG）而设计。它通过将长文档构建为搜索树结构，使其适合于基于推理的检索。PageIndex可以将冗长的PDF文档转换为语义树结构，类似于优化后的“目录”，以便与大型语言模型（LLMs）一起使用。该系统特别适用于金融报告、监管文件、学术教科书、法律或技术手册等超出LLM上下文限制的文档。
☆一键收藏：
https ://sota.jiqizhixin.com/project/pageindex
今日大模型在线列表·API免费调用
2025年4月23日更新
GLM-Z1-9B-0414
GLM-Z1-32B-0414
【多模态模型】
Janus-Pro-7B
gemma-3-12b-it
Qwen2.5-VL-32B-Instruct
DeepSeek-R1-Distill-Qwen-7B
————-详细内容————-
【上新！GLM-Z1系列】
GLM-Z1-9B-0414
清湛/山东4090公共线路；推理用时5s
API调用地址：
https ://sota.jiqizhixin.com/model-api/GLM-Z1-9B-0414_be760d73e2/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/fed46ab7-aa27-4acd-885d-fc9d1213a9a9
GLM-Z1-32B-0414
清湛/山东4090公共线路；推理用时8s
API调用地址：
https ://sota.jiqizhixin.com/model-api/GLM-Z1-32B-0414_b0166a39f1/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/7d51b45a-0bfc-42fb-89b5-21c0418dff9f
【多模态模型】
Janus-Pro-7B
清湛/山东4090公共线路；推理用时5s
API调用地址：
https ://sota.jiqizhixin.com/model-api/Janus-Pro-7B_04f3775aec/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/5b1bb89a-c790-4c71-9cae-e1e9ff424b3f
gemma-3-12b-it
清湛/山东4090公共线路；推理用时8s
API调用地址：
https ://sota.jiqizhixin.com/model-api/gemma-3-12b-it_2bca5948b1/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/b718cf5a-420d-4e2e-a8db-0cd33c0dee64
Qwen2.5-VL-32B-Instruct
清湛/山东4090公共线路；推理用时10s
API调用地址：
https ://sota.jiqizhixin.com/model-api/Qwen2_5-VL-32B-Instruct_0aa83a1bc0/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/d1bdba2b-ccab-4406-9508-0aedae444368
【DeepseekR1系列】
DeepSeek-R1-Distill-Qwen-7B
清湛/山东4090公共线路；推理用时5s
API调用地址：
https ://sota.jiqizhixin.com/model-api/DeepSeek-R1-Distill-Qwen-7B_78216da51b/chat/completions
获取秘钥：
https ://sota.jiqizhixin.com/xt-terminal/ff02de2b-827f-4aae-96eb-0ec8b7cc12fa
📋查看API调用文档：
https ://jiqizhixin.feishu.cn/wiki/EfHwwEuXZimdgpkQLXLcrOwKnyb
💻试用更多模型API：
https ://sota.jiqizhixin.com/xt-terminal