智谱开源,深度思考、deepresearch模型。


智谱开源,深度思考、deepresearch模型。

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

智谱开源。GLM-4-32B-0414系列,性能与OpenAI的GPT系列和DeepSeek的V3/R1系列相当,且包含了一个具有深度思考的deepresearch能力的模型。
GLM-Z1-32B-0414是一个具有深度思考能力的推理模型,效果比肩OpenAI的GPT系列和DeepSeek的V3/R1系列。
GLM-Z1-9B-0414是个惊喜。尽管规模较小,GLM-Z1-9B-0414在数学推理和通用任务中依然展现出极为优秀的能力。
GLM-Z1-Rumination-32B-0414是一种具有沉思能力的深度推理模型(对标OpenAI的DeepResearch)。不同于一般的深度思考模型,沉思模型通过更长时间的深度思考来解决更开放和复杂的问题(例如:撰写两个城市AI发展对比情况,以及未来的发展规划),沉思模型在深度思考过程中结合搜索工具处理复杂任务,并经过利用多种规则型奖励来指导和扩展端到端强化学习训练得到。Z1-Rumination在研究型写作和复杂检索任务上的能力得到了显著提升。
Z1-Rumination注:
不支持自定义系统提示词,不支持自定义工具,你的所有tools和system字段会被apply_chat_template忽略。使用该模型需要外接搜索引擎或者自定义retrievalAPI。
一共支持四个工具,分别是
https ://github.com/THUDM/GLM-4/blob/main/README_zh.md
https ://huggingface.co/THUDM/GLM-4-9B-0414


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录