智谱GLM-4.7,Coding开源第一,其他也很强

开源 coding 模型,终于卷到 Claude Sonnet 4.5 头上了。

图片

智谱再次放出大招,正式发布并开源 GLM-4.7!

图片

这是一款专为 Agentic Coding 打造的模型,在 LiveCodeBench V6 上拿下 84.8 分,直接超越了 Claude Sonnet 4.5。

图片

而这个时间点也颇为微妙:就在几天前,智谱的港股招股书刚刚挂网,冲击「全球大模型第一股」。

技术突破 + 资本加持,可谓是双喜临门

屠榜开源 + 紧逼闭源

先来看看 GLM-4.7 的成绩单之猛:

编程能力:

图片
  • LiveCodeBench V6:84.8 分,开源 SOTA,超越 Claude Sonnet 4.5

  • LMArena Code Arena 盲测:开源第一、国产第一,超越 GPT-5.2

  • SWE-bench Verified:国产第一

推理能力:

图片

  • AIME 2025 数学竞赛:开源 SOTA,超越 Claude Sonnet 4.5 和 GPT-5.1

  • HLE(Human Last Exam):42%,比 GLM-4.6 提升 38%,接近 GPT-5.1

Agent 能力:

图片

  • BrowseComp 网页任务评估:67 分

  • τ²-Bench 真实世界交互评估:开源 SOTA,接近 Claude Sonnet 4.5(84.7 分)

图片

Mikel(@MikelEcheve) 称 GLM-4.7 简直就是个「编程怪兽」:

GLM-4.7 来了,这是一个编程怪兽 🤖💥

它在 LiveCodeBench V6 上拿到 84.8 分,超越了 Claude 4.5。

还有:

  • LM Arena(开源)第一
  • 比 GLM-4.6 提升 38%
  • HLE benchmark 42%

开源正在光速前进。关注 @Zai_org 🚀

Rogue(@Rogue0114) 称:

智谱刚刚发布了 GLM-4.7,他们在某些 benchmark 上是最好的开源模型,而且和 Claude Sonnet 4.5 一样强。

这帮人太能整了。

图片

而最大的意义在于,开源才是人类进步的根本驱动力。

图片

模型规格

GLM-4.7 核心参数如下:

  • 输入/输出模态:文本(暂无视觉能力,估计 GLM-4.7V 正在路上)

  • 上下文长度:200K

  • 最大输出 token:128K

图片

支持的能力包括:思考模式(Thinking Mode)、流式输出、Function Call、上下文缓存、结构化输出。

图片

值得一提的是,GLM-4.7 提供了多种思考模式,可以在对话中按轮次切换是否启用思考,还将「交错式思考」升级为「保留式思考」,让复杂任务的连续推理更稳定。

图片

图片

模型价格

GLM-4.7 的完整定价如下(单位:美元):

图片

作为对比,Claude Sonnet 4.5 的定价是输入 $3/MTok、输出 $15/MTok。

图片

GLM-4.7 的输入价格只有 Claude Sonnet 4.5 的五分之一,输出价格不到七分之一,而在 LiveCodeBench V6 上的表现还更胜一筹。

对比下来,可以说是简直不能更香了。

Coding Plan:性价比之选

智谱专门为 AI 编程推出了 GLM Coding Plan 订阅套餐,起价仅 $3/月,支持 Claude Code、Cline、OpenCode、Roo Code 等主流编程工具。

(再一次心疼我 200$ 的 Claude Max,这个月用完就又得退了……)

图片

本次 GLM-4.7 融入 Coding Plan 后,带来了几个显著升级:

  • Claude Code 全面支持思考模式,支持轮级切换,复杂任务的连续推理更稳定

  • 针对 Skills / Subagent / Claude.md 等关键能力做定向优化,工具调用成功率更高

  • Claude Code 中智谱专属 MCP 免安装,视觉理解能力开箱即用,可以直接解析截图、设计稿、报错图

  • 内置搜索与网页读取,信息获取到代码落地一站闭环

  • 前端审美更出色,页面构建的整体观感进一步提升

已订阅 GLM Coding Plan 包月套餐的用户,将自动升级至 GLM-4.7

图片

作为「体验进化季」的首个惊喜,购买套餐的用户都将获得「体验卡」礼包,可邀请 3~7 位新用户好友免费体验 7 天的套餐权益。

图片

而离谱的是,GLM 4.7 的 1 年订阅(接近 Opus 4.5 级别)= Codex/Claude Code 的 1 个月 Max Plan。

图片

依旧是欢迎用我的码(且收益全部转发群中,群见评论区):

https://z.ai/subscribe?ic=UDMXEJSSXQ

牛刀小试

光看 benchmark 和 coding 指标,感觉有点不像是真的,会不会有「刷榜」的嫌疑,GLM-4.7 的底层能力(智商)实际如何呢?

我也照旧,用这道模型智商基本功的测试题试了一下:

我有70块钱,我借给小明五十块钱,他又用这五十块在我这里买了五十块钱的水果。第二天我借给小明30块钱,小明用这30块钱买了30块钱的牛奶,小明还欠我多少钱?请先推理,最后给出结论。

要知道,这道题看似简单,实则暗藏陷阱。

很多模型会被「买东西」这个动作迷惑,弄不清钱到底有没有回到了你手里。

GLM-4.7 经过一番思考后,最终回答:小明还欠你 80 块钱。

图片

答案正确!

推理稳定,没有翻车。

有兴趣的朋友可以拿这道题去测测其他模型,看看谁会中招,言过其实

而 GLM-4.7 除了基础智商和编程能力,还有超强的前端能力及 PPT 能力,所以我还测了另一个关于 Skills 和 MCP 的 PPT case ——在我上次的文章 MCP 或将成弃子 后,确实 Skills 正受到更多人的关注,于是我让 GLM-4.7 给出制作一个关于 Skills 和 MPC 差异的 PPT:

图片

GLM-4.7 经过多轮的检索思考后给出了最终的 PPT,内容全面,配色也恰当好处拿捏的很准确:

<<< 左右滑动见更多 >>>

使用大全

GLM-4.7 的使用方式也是做足了准备,全面上线:

国内用户:

  • 智谱 MaaS 平台(bigmodel.cn)

  • 智谱清言

海外用户:

  • z.ai

  • OpenRouter

开源部署:

  • GLM-4.7 模型也已在 Hugging Face、ModelScope 发布,采用 MIT 协议

企业用户:

  • 可通过 bigmodel.cn 直接购买 Coding Plan 企业版套餐

API 调用示例:

curl -X POST "https://api.z.ai/api/paas/v4/chat/completions" \  -H "Content-Type: application/json" \  -H "Authorization: Bearer your-api-key" \  -d '{    "model""glm-4.7",    "messages": [      {        "role""user",        "content""你的问题"      }    ],    "thinking": {      "type""enabled"    },    "max_tokens": 4096,    "temperature": 1.0  }'

Python SDK 调用:

也支持直接用 OpenAI 的 Python SDK,只需改一下 base_url:

双喜临门

就在 GLM-4.7 发布前几天,智谱的港股招股书正式挂网。

根据招股书披露:

  • 2024 年收入 3.12 亿元,在中国独立通用大模型开发商中排名第一,在所有通用大模型开发商中排名第二,市场份额 6.6%

  • 开源模型全球下载量超过 4500 万

  • 日均 token 消耗量达到 4.2 万亿

  • 已为超过 8000 万台设备提供支持

  • B6 轮融资后估值达到 243.77 亿元

背后的投资阵容也相当豪华:美团、蚂蚁集团、腾讯、雷军、联想创投等均间接持股。

从全球竞争格局看,智谱的上市将使中国 AI 企业首次在资本市场节奏上快人一步于 OpenAI、Anthropic 等美国巨头。

GLM-4.7 的发布,正好为招股书提供了一份硬实力的注脚,这不是用 PPT 在造模型,而是真刀真枪地在 benchmark 上和国际闭源选手掰手腕。

技术立身,资本加持。

双喜临门喜!




参考链接:

  • GLM-4.7 文档:https://docs.z.ai/guides/llm/glm-4.7

  • 智谱 MaaS 平台:https://bigmodel.cn

  • 海外 API:https://z.ai

  • Coding Plan 订阅:https://z.ai/subscribe

  • 开源模型:Hugging Face、ModelScope