智谱GLM-4.7，Coding开源第一，其他也很强

AGIHunt

2025-12-24 07:02发布于北京科技领域创作者

开源 coding 模型，终于卷到 Claude Sonnet 4.5 头上了。

智谱再次放出大招，正式发布并开源 GLM-4.7！

这是一款专为 Agentic Coding 打造的模型，在 LiveCodeBench V6 上拿下 84.8 分，直接超越了 Claude Sonnet 4.5。

而这个时间点也颇为微妙：就在几天前，智谱的港股招股书刚刚挂网，冲击「全球大模型第一股」。

技术突破 + 资本加持，可谓是双喜临门。

屠榜开源 + 紧逼闭源

先来看看 GLM-4.7 的成绩单之猛：

编程能力：

LiveCodeBench V6：84.8 分，开源 SOTA，超越 Claude Sonnet 4.5
LMArena Code Arena 盲测：开源第一、国产第一，超越 GPT-5.2
SWE-bench Verified：国产第一

推理能力：

AIME 2025 数学竞赛：开源 SOTA，超越 Claude Sonnet 4.5 和 GPT-5.1
HLE（Human Last Exam）：42%，比 GLM-4.6 提升 38%，接近 GPT-5.1

Agent 能力：

BrowseComp 网页任务评估：67 分
τ²-Bench 真实世界交互评估：开源 SOTA，接近 Claude Sonnet 4.5（84.7 分）

Mikel(@MikelEcheve) 称 GLM-4.7 简直就是个「编程怪兽」：

GLM-4.7 来了，这是一个编程怪兽 🤖💥
它在 LiveCodeBench V6 上拿到 84.8 分，超越了 Claude 4.5。
还有：
LM Arena（开源）第一
比 GLM-4.6 提升 38%
HLE benchmark 42%
开源正在光速前进。关注 @Zai_org 🚀

Rogue(@Rogue0114) 称：

智谱刚刚发布了 GLM-4.7，他们在某些 benchmark 上是最好的开源模型，而且和 Claude Sonnet 4.5 一样强。
这帮人太能整了。

而最大的意义在于，开源才是人类进步的根本驱动力。

模型规格

GLM-4.7 核心参数如下：

输入/输出模态：文本（暂无视觉能力，估计 GLM-4.7V 正在路上）

上下文长度：200K
最大输出 token：128K

支持的能力包括：思考模式（Thinking Mode）、流式输出、Function Call、上下文缓存、结构化输出。

值得一提的是，GLM-4.7 提供了多种思考模式，可以在对话中按轮次切换是否启用思考，还将「交错式思考」升级为「保留式思考」，让复杂任务的连续推理更稳定。

模型价格

GLM-4.7 的完整定价如下（单位：美元）：

作为对比，Claude Sonnet 4.5 的定价是输入 $3/MTok、输出 $15/MTok。

GLM-4.7 的输入价格只有 Claude Sonnet 4.5 的五分之一，输出价格不到七分之一，而在 LiveCodeBench V6 上的表现还更胜一筹。

对比下来，可以说是简直不能更香了。

Coding Plan：性价比之选

智谱专门为 AI 编程推出了 GLM Coding Plan 订阅套餐，起价仅 $3/月，支持 Claude Code、Cline、OpenCode、Roo Code 等主流编程工具。

（再一次心疼我 200$ 的 Claude Max，这个月用完就又得退了……）

本次 GLM-4.7 融入 Coding Plan 后，带来了几个显著升级：

Claude Code 全面支持思考模式，支持轮级切换，复杂任务的连续推理更稳定
针对 Skills / Subagent / Claude.md 等关键能力做定向优化，工具调用成功率更高
Claude Code 中智谱专属 MCP 免安装，视觉理解能力开箱即用，可以直接解析截图、设计稿、报错图
内置搜索与网页读取，信息获取到代码落地一站闭环
前端审美更出色，页面构建的整体观感进一步提升

已订阅 GLM Coding Plan 包月套餐的用户，将自动升级至 GLM-4.7。

作为「体验进化季」的首个惊喜，购买套餐的用户都将获得「体验卡」礼包，可邀请 3～7 位新用户好友免费体验 7 天的套餐权益。

而离谱的是，GLM 4.7 的 1 年订阅（接近 Opus 4.5 级别）= Codex/Claude Code 的 1 个月 Max Plan。

依旧是欢迎用我的码（且收益全部转发群中，群见评论区）：

https://z.ai/subscribe?ic=UDMXEJSSXQ

牛刀小试

光看 benchmark 和 coding 指标，感觉有点不像是真的，会不会有「刷榜」的嫌疑，GLM-4.7 的底层能力（智商）实际如何呢？

我也照旧，用这道模型智商基本功的测试题试了一下：

我有70块钱，我借给小明五十块钱，他又用这五十块在我这里买了五十块钱的水果。第二天我借给小明30块钱，小明用这30块钱买了30块钱的牛奶，小明还欠我多少钱？请先推理，最后给出结论。

要知道，这道题看似简单，实则暗藏陷阱。

很多模型会被「买东西」这个动作迷惑，弄不清钱到底有没有回到了你手里。

GLM-4.7 经过一番思考后，最终回答：小明还欠你 80 块钱。

答案正确！

推理稳定，没有翻车。

有兴趣的朋友可以拿这道题去测测其他模型，看看谁会中招，言过其实

而 GLM-4.7 除了基础智商和编程能力，还有超强的前端能力及 PPT 能力，所以我还测了另一个关于 Skills 和 MCP 的 PPT case ——在我上次的文章 MCP 或将成弃子后，确实 Skills 正受到更多人的关注，于是我让 GLM-4.7 给出制作一个关于 Skills 和 MPC 差异的 PPT：

GLM-4.7 经过多轮的检索思考后给出了最终的 PPT，内容全面，配色也恰当好处拿捏的很准确：

<<< 左右滑动见更多 >>>

使用大全

GLM-4.7 的使用方式也是做足了准备，全面上线：

国内用户：

智谱 MaaS 平台（bigmodel.cn）
智谱清言

海外用户：

z.ai
OpenRouter

开源部署：

GLM-4.7 模型也已在 Hugging Face、ModelScope 发布，采用 MIT 协议

企业用户：

可通过 bigmodel.cn 直接购买 Coding Plan 企业版套餐

API 调用示例：

curl -X POST "https://api.z.ai/api/paas/v4/chat/completions" \  -H "Content-Type: application/json" \  -H "Authorization: Bearer your-api-key" \  -d '{    "model": "glm-4.7",    "messages": [      {        "role": "user",        "content": "你的问题"      }    ],    "thinking": {      "type": "enabled"    },    "max_tokens": 4096,    "temperature": 1.0  }'

Python SDK 调用：

也支持直接用 OpenAI 的 Python SDK，只需改一下 base_url：

双喜临门

就在 GLM-4.7 发布前几天，智谱的港股招股书正式挂网。

根据招股书披露：

2024 年收入 3.12 亿元，在中国独立通用大模型开发商中排名第一，在所有通用大模型开发商中排名第二，市场份额 6.6%
开源模型全球下载量超过 4500 万
日均 token 消耗量达到 4.2 万亿
已为超过 8000 万台设备提供支持
B6 轮融资后估值达到 243.77 亿元

背后的投资阵容也相当豪华：美团、蚂蚁集团、腾讯、雷军、联想创投等均间接持股。

从全球竞争格局看，智谱的上市将使中国 AI 企业首次在资本市场节奏上快人一步于 OpenAI、Anthropic 等美国巨头。

GLM-4.7 的发布，正好为招股书提供了一份硬实力的注脚，这不是用 PPT 在造模型，而是真刀真枪地在 benchmark 上和国际闭源选手掰手腕。

技术立身，资本加持。

双喜临门，恭喜！

参考链接：

GLM-4.7 文档：https://docs.z.ai/guides/llm/glm-4.7
智谱 MaaS 平台：https://bigmodel.cn
海外 API：https://z.ai
Coding Plan 订阅：https://z.ai/subscribe
开源模型：Hugging Face、ModelScope