开源 coding 模型,终于卷到 Claude Sonnet 4.5 头上了。
智谱再次放出大招,正式发布并开源 GLM-4.7!
这是一款专为 Agentic Coding 打造的模型,在 LiveCodeBench V6 上拿下 84.8 分,直接超越了 Claude Sonnet 4.5。
而这个时间点也颇为微妙:就在几天前,智谱的港股招股书刚刚挂网,冲击「全球大模型第一股」。
技术突破 + 资本加持,可谓是双喜临门。
屠榜开源 + 紧逼闭源
先来看看 GLM-4.7 的成绩单之猛:
编程能力:
LiveCodeBench V6:84.8 分,开源 SOTA,超越 Claude Sonnet 4.5
LMArena Code Arena 盲测:开源第一、国产第一,超越 GPT-5.2
SWE-bench Verified:国产第一
推理能力:
AIME 2025 数学竞赛:开源 SOTA,超越 Claude Sonnet 4.5 和 GPT-5.1
HLE(Human Last Exam):42%,比 GLM-4.6 提升 38%,接近 GPT-5.1
Agent 能力:
BrowseComp 网页任务评估:67 分
τ²-Bench 真实世界交互评估:开源 SOTA,接近 Claude Sonnet 4.5(84.7 分)
Mikel(@MikelEcheve) 称 GLM-4.7 简直就是个「编程怪兽」:
Rogue(@Rogue0114) 称:
而最大的意义在于,开源才是人类进步的根本驱动力。
模型规格
GLM-4.7 核心参数如下:
输入/输出模态:文本(暂无视觉能力,估计 GLM-4.7V 正在路上)
上下文长度:200K
最大输出 token:128K
支持的能力包括:思考模式(Thinking Mode)、流式输出、Function Call、上下文缓存、结构化输出。
值得一提的是,GLM-4.7 提供了多种思考模式,可以在对话中按轮次切换是否启用思考,还将「交错式思考」升级为「保留式思考」,让复杂任务的连续推理更稳定。
模型价格
GLM-4.7 的完整定价如下(单位:美元):
作为对比,Claude Sonnet 4.5 的定价是输入 $3/MTok、输出 $15/MTok。
GLM-4.7 的输入价格只有 Claude Sonnet 4.5 的五分之一,输出价格不到七分之一,而在 LiveCodeBench V6 上的表现还更胜一筹。
对比下来,可以说是简直不能更香了。
Coding Plan:性价比之选
智谱专门为 AI 编程推出了 GLM Coding Plan 订阅套餐,起价仅 $3/月,支持 Claude Code、Cline、OpenCode、Roo Code 等主流编程工具。
(再一次心疼我 200$ 的 Claude Max,这个月用完就又得退了……)
本次 GLM-4.7 融入 Coding Plan 后,带来了几个显著升级:
Claude Code 全面支持思考模式,支持轮级切换,复杂任务的连续推理更稳定
针对 Skills / Subagent / Claude.md 等关键能力做定向优化,工具调用成功率更高
Claude Code 中智谱专属 MCP 免安装,视觉理解能力开箱即用,可以直接解析截图、设计稿、报错图
内置搜索与网页读取,信息获取到代码落地一站闭环
前端审美更出色,页面构建的整体观感进一步提升
已订阅 GLM Coding Plan 包月套餐的用户,将自动升级至 GLM-4.7。
作为「体验进化季」的首个惊喜,购买套餐的用户都将获得「体验卡」礼包,可邀请 3~7 位新用户好友免费体验 7 天的套餐权益。
而离谱的是,GLM 4.7 的 1 年订阅(接近 Opus 4.5 级别)= Codex/Claude Code 的 1 个月 Max Plan。
依旧是欢迎用我的码(且收益全部转发群中,群见评论区):
https://z.ai/subscribe?ic=UDMXEJSSXQ
牛刀小试
光看 benchmark 和 coding 指标,感觉有点不像是真的,会不会有「刷榜」的嫌疑,GLM-4.7 的底层能力(智商)实际如何呢?
我也照旧,用这道模型智商基本功的测试题试了一下:
要知道,这道题看似简单,实则暗藏陷阱。
很多模型会被「买东西」这个动作迷惑,弄不清钱到底有没有回到了你手里。
GLM-4.7 经过一番思考后,最终回答:小明还欠你 80 块钱。
答案正确!
推理稳定,没有翻车。
有兴趣的朋友可以拿这道题去测测其他模型,看看谁会中招,言过其实
而 GLM-4.7 除了基础智商和编程能力,还有超强的前端能力及 PPT 能力,所以我还测了另一个关于 Skills 和 MCP 的 PPT case ——在我上次的文章 MCP 或将成弃子 后,确实 Skills 正受到更多人的关注,于是我让 GLM-4.7 给出制作一个关于 Skills 和 MPC 差异的 PPT:
GLM-4.7 经过多轮的检索思考后给出了最终的 PPT,内容全面,配色也恰当好处拿捏的很准确:
<<< 左右滑动见更多 >>>
使用大全
GLM-4.7 的使用方式也是做足了准备,全面上线:
国内用户:
智谱 MaaS 平台(bigmodel.cn)
智谱清言
海外用户:
z.ai
OpenRouter
开源部署:
GLM-4.7 模型也已在 Hugging Face、ModelScope 发布,采用 MIT 协议
企业用户:
可通过 bigmodel.cn 直接购买 Coding Plan 企业版套餐
API 调用示例:
curl -X POST "https://api.z.ai/api/paas/v4/chat/completions" \-H "Content-Type: application/json" \-H "Authorization: Bearer your-api-key" \-d '{"model": "glm-4.7","messages": [{"role": "user","content": "你的问题"}],"thinking": {"type": "enabled"},"max_tokens": 4096,"temperature": 1.0}'
Python SDK 调用:
也支持直接用 OpenAI 的 Python SDK,只需改一下 base_url:
双喜临门
就在 GLM-4.7 发布前几天,智谱的港股招股书正式挂网。
根据招股书披露:
2024 年收入 3.12 亿元,在中国独立通用大模型开发商中排名第一,在所有通用大模型开发商中排名第二,市场份额 6.6%
开源模型全球下载量超过 4500 万
日均 token 消耗量达到 4.2 万亿
已为超过 8000 万台设备提供支持
B6 轮融资后估值达到 243.77 亿元
背后的投资阵容也相当豪华:美团、蚂蚁集团、腾讯、雷军、联想创投等均间接持股。
从全球竞争格局看,智谱的上市将使中国 AI 企业首次在资本市场节奏上快人一步于 OpenAI、Anthropic 等美国巨头。
GLM-4.7 的发布,正好为招股书提供了一份硬实力的注脚,这不是用 PPT 在造模型,而是真刀真枪地在 benchmark 上和国际闭源选手掰手腕。
技术立身,资本加持。
双喜临门,恭喜!
参考链接:
GLM-4.7 文档:https://docs.z.ai/guides/llm/glm-4.7
智谱 MaaS 平台:https://bigmodel.cn
海外 API:https://z.ai
Coding Plan 订阅:https://z.ai/subscribe
开源模型:Hugging Face、ModelScope