Anthropic 终于坐不住了,发布了大模型 Claude Opus 4.8。
就在不久前Anthropic的Claude Opus 4.7 被吐槽单价贵、降智还有话痨浪费 token,已经开始逼得大批开发者放弃 Claude code改用性价比更高体验更好的以GPT 5.5为底座的Codex。
而就在一天前,Anthropic不仅宣布获得了 H 轮 650 亿美元的融资,估值接近万亿美元,还发布了Opus 4.8,官方宣传总结下来就三个关键词,“降本、诚实、动态工作流”。咱们这次不看打分看真实反馈,扒一扒这次的Claude 的模型迭代到底怎么样!
先说成本这块,官方虽然API 保持了原价,但推出了一个 2.5 倍速的 Fast 模式,并将价格打到了原来的三分之一。
然而现实却很骨感,Pro 或 Max 用户的配额仍然会被很快烧光,原因是为了获得高质量的交付结果,大家已经习惯开高推理模式(High Effort)干活,它的成本依然不是一般人能承受的。对比国货之光 DeepSeek V4 刚宣布的再次降价 75%,Opus 4.8更是贵的没边了。
Anthropic还极力宣传Opus 4.8 改善了“自我纠错”能力,遇到不会的问题会主动认怂,不再瞎编,并且说动态工作流能解决复杂、庞大或历史包袱重的代码。
但是有用户测评下来,发现Opus 4.8 是典型的“Greenfield Project”绿地项目的高手,意思是“它从零开始,写新代码、起新项目”的能力确实很强。因为这时候没有历史包袱,地上全是绿草地,这大楼你想怎么盖就怎么盖。
但面对复杂老旧代码和深度商业战略分析的时候,仍然会开始严重幻觉、甚至捏造数据。所以,尽管在综合跑分上 Opus 4.8 略胜 GPT 5.5,但在最考验实战的终端编程和代码审核上,GPT 5.5依然是更稳健的选择。
不过,我理解Opus 4.8 这次最重磅的迭代是动态工作流(Dynamic Workflows)——只要输入一个模糊的宏观任务,主 Agent 就会自己写调度脚本,分身出几十甚至上百个子 Agent 同时干活。也有用户已经在使用这个能力并且猛夸这个功能确实帮他们大大的提升了工作效率。
但也不是说这个功能就是完美的,比如拿它去和 Codex 的并行任务对比
Opus 4.8 动态工作流优势在于全自动“总分总”推进,AI 自己派发、自己汇总,理论上并行数量无上限;问题在于主 Agent 一旦产生幻觉出现错误,那你纯纯的就是在烧钱玩了。
而Codex在执行并行任务的时候,会进行基于 Git 的工作树隔离,能做到8 到 10 个 Agent 独立平行、互不干扰,容错率极高,写烂一个直接删掉即可;不过它还是需要人类介入,手动分配和 review 每一个任务,自动化程度略差一些。
但是如果是为了高质量靠谱的交付工作,我宁愿选 codex+GPT5.5 的组合。
当然,咱们今天也只是基于首发两天的海外真实反馈。毕竟 Claude Code 依然是目前应用最广泛、生态最庞大的 AI 编码工具。随着未来几天更多开发者分享出更复杂的实测案例,Opus 4.8 的动态工作流到底实战能力如何,多烧钱?咱们拭目以待。