智谱开源新一代GLM大模型，推速度快DeepSeek-R1八倍，还启用了全新域名Z.ai！

发布日期: 2025-04-15

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

以下文章来源于微信公众号：机器之心
作者：机器之心
链接：https ://mp.weixin.qq.com/s/kPAIeYwIAqyIPf1585jR-w
本文仅用于学术分享，如有侵权，请联系后台作删文处理
导读
大模型开源浪潮席卷全球，智谱迎势出击：深夜重磅发布全新GLM模型体系，覆盖基座、推理、沉思三大方向，推理性能超DeepSeek-R1八倍，全面迈入“开源+智能体”新阶段！
相比OpenAI的DeepResearch，「AutoGLM沉思」不仅会想（deepresearch），还能边想边干(operator）！昨天，智谱宣布其核心技术链路完全开源！包括：
基座模型GLM-4-32B-0414
推理模型GLM-Z1-32B-0414
沉思模型GLM-Z1-Rumination-32B-0414
另外，小尺寸的9B系列同时开源，包括：GLM-4-9B-0414、GLM-Z1-9B-0414。
以上均遵循MIT许可协议。目前，系列所有模型可以通过z.ai访问体验。新版基座模型和推理模型已同步上线智谱MaaS平台。体验链接：https ://chat.z.ai/
https ://bigmodel.cn/
作为国内最早开源大模型的人工智能公司，智谱一直致力于推动AI普惠。随着开源生态建设成为新一轮竞争焦点，智谱曾表示2025年将成为智谱的开源年，持续加码生态建设。
新一代基座模型GLM-4-32B-0414以32B参数量比肩更大参数量主流模型性能。由于预训练阶段加入了更多代码类、推理类数据，并在对齐阶段针对智能体能力进行了优化，它有着行业最好的行动能力，在工具调用、联网搜索、代码等智能体任务方面更加有效。
GLM-4-32B-0414支持在对话过程中实时展示生成代码，支持包括HTML、CSS、JS和SVG在内的语言。无需切换到其它程序，用户一键点击即可在对话窗口实时看到代码运行结果，以便进行灵活的修改与调整。
同步开源的GLM-Z1-32B-0414推理模型则创造了「以小博大」的典范。它基于新一代基础模型、在预训练阶段加入了更多推理类数据并在对齐阶段深度优化了通用能力，320亿参数量即可实现满血版DeepSeek-R1（6710亿参数）的推理性能。在AIME24/25、LiveCodeBench、GPQA等基准测试中展现出较为强大的数理推理能力，比肩满血版DeepSeek-R1，可以胜任更多复杂任务。
除了推理性能，成本也是一大亮点。得益于优化GQA参数、量化、投机采样等技术，该推理模型能够在消费级显卡上流畅运行，同时实现每秒200token的极速响应，相当于人类语速的50倍，做到了「问题未看清，答案已生成」的极致体验。GLM-Z1-Rumination-32B-0414沉思模型代表了新一代AI的发展方向。相比之前仍停留在深度思考阶段的推理模型，这个经过强化学习训练的版本展现出更强的自主能力。它不再局限于静态知识推理，而是能够像人类研究者一样主动联网搜索资料、调用各种工具、进行深度分析并自我验证，形成完整的思考闭环。这种「实时搜索-深度分析-动态验证」的循环思考模式，让AI在处理开放性问题时更加游刃有余，标志着AI从单纯的高智商向高智商与高自主并重的转变。当然，作为前沿技术，该模型在自主探索和准确性方面仍有提升空间，研发团队正在持续优化中。最后，GLM-Z1-9B-0414是一个惊喜。尽管尺寸更小，GLM-Z1-9B-0414在数学推理和通用任务中依然展现出极为优秀的能力，其整体表现已处于同尺寸开源模型中的领先水平。
特别是在资源受限的场景下，该模型在效率与效果之间实现了出色的平衡，为追求轻量化部署的用户提供了强有力的选择。
智谱核心还是在向企业提供模型即服务（MaaS），重点在于服务。目前，智谱已有1000多个大模型规模化应用，覆盖传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景的多个头部企业。现在，基座、推理两类模型也已同步上线智谱MaaS开放平台，面向企业与开发者提供API服务，满足用户多快好省的需求。其中，推理模型有三个版本，针对不同业务场景需求。
定位国内最快推理模型，推理速度可达200tokens/秒，比常规快8倍；适合高并发、极速响应业务场景。
价格仅为DeepSeek-R1的1/30，适合高频调用场景；算得上国内最高性价比的推理模型。
支持免费使用，旨在进一步降低模型使用门槛。
GLM-Z1-AirX（极速版）响应速度
RI响应速度
对应价格表：
上线的基础模型包括两个版本：GLM-4-Air-250414、GLM-4-Flash-250414，其中GLM-4-Flash-250414完全免费。本地部署，旗舰级配置需要1张H100/A100显卡，高性能配置则需要4张4090/3090系列显卡。对于选择在线体验的用户，则可以通过MaaS平台获得极速或性价比版本的服务，同时也能体验完整的DeepResearch功能。
对于想要完整体验模型能力的玩家们，即日起App与网页端登录z.ai，即可与最新的GLM模型免费对话。这里集合了沉思模型、推理模型、对话模型，后续也将作为智谱最新模型的交互体验入口。网页体验链接：https ://chat.z.ai/因为对标OpenAI的DeepResearch，我们先简单体验了一下沉思模型的深度调研能力。既然卫生巾都塌房了，女性如何选择安全可信的卫生用品呢？输入问题后，模型开始上网找新闻、看报告，阅读做笔记，按照搞清事实、各种标准、如何辨别、选择的逻辑组织内容。
几分钟过后，自动生成一份详细指南。
沉思模型更适合做深度调研，追求强大的开发体验，不妨试试基础模型。例如：给我设计一个移动端机器学习平台的UI，其中要包括训练任务，存储管理，和个人统计界面。个人统计界面要用图表展示用户过去一段时间的各类资源使用情况。使用TailwindCSS来美化页面，把这3个手机界面平铺展示到一个HTML页面中。
不过，用svg展示一只骑自行车的鸬鹚，还是失败了。
还等啥，现在就去体验吧。
欢迎加入《AI未来星球》，一起成长
扫描下方二维码即可加入~
你可以获得什么？
1、大白之前花费10W+购买，AI行业各场景私有数据集下载，星球内倾情分享；2、AI行业研发、产品、商业落地问题咨询（目前AI公司创业中），都可获高质量解答，有效期一年，无限次提问，有问必答。3、定期邀请AI行业各类嘉宾分享，创业/商业等方面的经验！
帮助你解决遇到的实际问题，升职加薪！
大家一起加油！