重磅:智谱AI推出新一代GLM系列模型,性能媲美千亿参数模型!分享一波深度体验


重磅:智谱AI推出新一代GLM系列模型,性能媲美千亿参数模型!分享一波深度体验

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

智谱GLM开源推理模型性能比肩世界先进水平,同时启用全球域名”z.ai”
智谱AI今日宣布GLM模型家族迎来新一代开源模型GLM-4-32B-0414系列,包含基座、推理、沉思模型权重,全部采用MITLicense授权。新版基座模型和推理模型已同步上线智谱MaaS平台,并可通过全新域名”z.ai”免费体验。
除模型开源外,推理模型GLM-Z1-32B与基础模型GLM-4-32B两款模型同步上线智谱MaaS开放平台(bigmodel.cn),面向企业与开发者提供API服务。
本次上线的基础模型有两个版本,包括GLM-4-Air-250414和GLM-4-Flash-250414,后者完全免费。
上线的推理模型分为三个版本,分别满足不同场景需求:
GLM-Z1-AirX(极速版):国内最快推理模型,推理速度高达200tokens/s,8倍于常规速度;
GLM-Z1-Air(高性价比版):价格仅为DeepSeek-R1的1/30,适合高频调用场景;
GLM-Z1-Flash(免费版):支持免费使用,进一步降低模型使用门槛。
如下图所示,我们可以直接在智谱MaaS开放平台的体验中心来测试模型效果说实话这个推理速度真心快,尤其在对于推理模型来说体验更加友好了。下面是一个Z1推理模型实测的效果,基本上3-4秒就可以把思维链和答案内容回复完毕,终于不用花费大量时间等待推理模型思考了!
此次发布的推理模型GLM-Z1-Air/AirX-0414不仅性能比肩DeepSeek-R1等世界一流推理模型,且推理速度最高可达200Tokens/秒,成为国内迄今最快的商业模型。更令人瞩目的是,GLM-Z1-Air-0414的价格仅为DeepSeek-R1的1/30,极大降低了企业应用AI推理能力的成本门槛。
本次开源所有模型全部遵循更加宽松的MITLicense。免费商用,分发,让开发者更自由的使用和开发模型。开源模型有9B和32B两个尺寸,涵盖基座模型,推理模型和沉思模型,具体如下:
huggingface下载链接🔗:https ://huggingface.co/collections/THUDM/glm-4-0414-67f3cbcb34dd9d252707cb2e
基础模型GLM-4-32B以320亿参数量比肩更大参数量的国内外主流模型,该模型经过了15T高质量数据的预训练,其中包含大量推理类的合成数据,为后续的强化学习扩展打下了基础。
在后训练阶段,除了针对对话场景进行了人类偏好对齐外,我们还通过拒绝采样和强化学习等技术强化了模型在指令遵循、工程代码、函数调用方面的效果,旨在加强智能体任务所需的原子能力。
GLM-4-32B在工程代码、Artifacts生成、函数调用、搜索问答及报告等方面都取得了不错的效果,部分Benchmark甚至可以媲美更大规模的GPT-4o、DeepSeek-V3-0324(671B)等模型。
GLM-4-32B强化了代码生成能力,可以生成更为复杂的单文件代码。z.ai的对话模式中也支持对生成的HTML和SVG进行预览,便于用户查看生成效果并对内容进行进一步修改。后面实测会看到很多例子
GLM-Z1-32B是具有深度思考能力的推理模型,这是在GLM-4-32B的基础上,通过冷启动和扩展强化学习,以及在数学、代码和逻辑等任务上对模型的进一步训练得到的。相对于基础模型,GLM-Z1-32B显著提升了数理能力和解决复杂任务的能力。在训练的过程中,我们还引入了基于对战排序反馈的通用强化学习,进一步增强了模型的通用能力。
在部分任务的性能表现上,在仅使用32B参数的情况下,可与参数高达6710亿的DeepSeek-R1相媲美。我们在AIME24/25、LiveCodeBench、GPQA等基准测试中对GLM-Z1-32B进行了评估,评估结果显示GLM-Z1-32B展现了较为强大的数理推理能力,为更多复杂任务的解决提供了支持。
不同于一般的深度思考模型,沉思模型通过更长时间的深度思考来解决更开放和更复杂的问题,沉思模型还能在深度思考过程中结合搜索工具处理复杂任务,并利用多种规则型奖励来指导和扩展端到端强化学习训练。
支持“自主提出问题—搜索信息—构建分析—完成任务”的完整流程。
技术底座源自强化学习扩展与端到端的DeepResearch策略训练,具备博士级研究能力的潜力。
沉思模型在研究型写作和复杂检索任务上的能力得到了显著提升。
推理模型GLM-Z1-32B与基础模型GLM-4-32B同步上线智谱MaaS开放平台(bigmodel.cn),面向企业与开发者提供API服务:
GLM-4-Air-250414:0.5元/M
GLM-4-Flash-250414:免费
GLM-Z1-AirX(极速版):5元/M,推理速度高达200tokens/s,是常规速度的8倍
GLM-Z1-Air(高性价比版):0.5元/M,价格为DeepSeek-R1的1/30
GLM-Z1-Flash(免费版):完全免费使用
通过优化量化、投机采样技术,改进推理框架和调度平台性能,降低长思考对KVCache显存压力,实现更快推理速度和更大并发量。
智谱AI启用全新域名”z.ai”,该平台集成对话、推理与沉思三类GLM模型,自即日起向全球用户免费开放使用。
z.ai目前已上线三款开源模型:
GLM-4-32B(对话模型):具备强大代码生成能力,支持全新Artifacts功能
Z1-32B(推理模型):超强推理性能,在线体验最高达200Tokens/秒的极速输出
Z1-Rumination-32B(沉思模型):驱动DeepResearch能力的强大模型
z.ai不仅是GLM模型的展示入口,也将持续演进为下一代AI应用平台,覆盖从文本生成、深度问答到多轮对话的智能场景,助力用户快速进行智能问答、信息检索与研究任务。
接下来我们通过z.ai平台来实测体验基座、推理、沉思模型效果。
作为程序员,我们会经常用到大模型来写代码,下面主要测试下基础模型GLM-4-32B的实战能力,我们从基础编程、前端开发,后端开发以及深度学习模型能力来测试。
创建一个Python函数来检查一个字符串是否是回文,并处理大小写和标点符号。
可以看到GLM-4-32B可以很轻松的写出来回文检测函数功能。
接下来我们通过贪心算法问题来测试基础编程能力
实现一个简单的贪心算法解决硬币找零问题,使用Python。
设计一个响应式导航栏,在手机上显示汉堡菜单,在桌面端显示完整菜单。使用HTML、CSS和JavaScript实现。
实现一个具有深色模式切换功能的个人作品集首页,包含项目展示、技能展示和联系表单。
这个效果属实经验到我了,回想之前本科毕业设计手撸Bootstrap模板了!
请帮我生成一个天气预测的页面,尽量和IOS风格保持一致
使用D3.js设计一个互动式疫情数据仪表板,展示不同地区的确诊病例、康复人数和死亡人数。
看了下对话界面,这个页面一共写了1000多行代码,这太惊人了,现在模型这么能写了吗!
请将对话文字内容做成一个html页面,尽量好看一些。
下面是我问了一个关于个性化减脂食谱:鸡胸肉芝士烤西兰花配蒜香猪肉的问题
然后我们将对话内容通过GLM-4-32B转为页面
这里有个有意思的地方是,竟然学会了配图,看了下是链接了一个图片链接,虽然匹配图片和内容不相关,有点神奇,难道是模型训练的时候把一些图片链接知识也学进去了,但是是没有上下文信息,也就是模态匹配能力,这个也可以理解。
创建一个PythonFastAPI服务,处理图片上传并进行简单的图像处理(如调整大小、旋转和应用滤镜)。
通过uvicornmain:app–reload可以完美的运行这个服务。
请帮我编写一个多头注意力机制代码,基于Pytorch实现[图片]
列出并解释解决非线性微分方程y’=y^2+x^2的步骤
如下图所示,左侧为思考过程右侧为答案,可以看到推理模型GLM-Z1-32B的思考能力特别强,并且解题逻辑思维比较清晰。
请解决这个组合数学问题:在一个有10人的团队中,需要选出一个3人委员会和一个4人委员会,两个委员会不能有重复的人。有多少种不同的选择方式?
设计一个只用天平(不用砝码)称量出8个外表完全相同的球中唯一一个重量不同的球,并确定它是比其他球重还是轻的最优策略
这个题目求解非常谨慎,并且思考过程比较久,在反复验证推理,避免出错,这个推理以及上下文吞吐能力很强大!
一个创业公司需要制定定价策略。市场调研显示,定价为p元时,预计每月销量为(1000-5p)。生产成本为每件20元,固定成本为5000元。请找出使利润最大化的定价策略,并分析不同假设条件下的变化。
提出一种新的可能的网络安全威胁,并设计对应的防御策略[图片]这个公式、过程推理以及表格生成都具备了,非常不错的例子!
解释为什么在寒冷地区的冬天,湖面会结冰但湖底的水仍然是液态

下面通过一个问题类体验下报告生成的过程:
请帮我调研一份关于检索增强生成(RAG)的综述
进行用户意图理解,针对这个问题,首先需要明白RAG的定义是什么
问题拆解以及需要生成的报告目录生成
信息递归检索
针对这个问题,从论文和博客两个角度检索了内容,我们可以看到会调用函数OpenLink来进行网页读取
报告结构生成
按照报告目录标题检索内容生成对应部分报告
更多模型库可以查看模型广场:https ://www.bigmodel.cn/console/modelcenter/square
添加微信,备注”LLM“进入大模型技术交流群
如果你觉得这篇文章对你有帮助,别忘了点个赞、送个喜欢

/作者:致Great


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录