继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

Anthropic发布Claude Opus 4.7:以克制定义AI新范式

holdtom
关注TA
已关注
手记 1892
粉丝 241
获赞 994

当其他AI公司争相炫耀自家模型的“无所不能”时,Anthropic却选择了一条截然不同的道路。他们不仅不急于展示全部实力,反而公开表示:“我们拥有更强大的技术,但目前还不能完全开放。”这种反常规的策略,在2026年4月17日随着Claude Opus 4.7的正式发布,得到了最生动的诠释。

一、能力进阶:从“聪明”到“可靠”

Opus 4.7的发布看似按部就班——官方博客一如既往地罗列了各项性能指标与应用场景。然而,细究之下,其背后的战略意图耐人寻味。

首先,是硬核性能的全面跃升。在SWE-Bench Verified等关键软件工程基准测试中,Opus 4.7以87.6%的成绩大幅超越前代的80.8%。这意味着它能更精准地处理复杂的编程任务,并在执行过程中主动进行自我验证,确保结果的严谨性。

其次,是交互逻辑的根本性转变。与以往倾向于“揣摩用户意图”的模型不同,Opus 4.7展现出近乎刻板的指令遵循能力。它会严格按字面意思执行命令,这虽然提升了精确度,但也意味着旧有的提示词模板可能失效,用户需要适应一种全新的、更精确的沟通方式。

此外,多模态能力也得到显著增强。支持高达375万像素的图像输入,使其能够清晰“看懂”复杂的软件界面、代码截图和设计稿。这一升级并非为了简单的图像识别,而是为了让AI智能体能在真实的屏幕环境中有效工作,为其Computer Use功能提供了坚实的视觉基础。

二、“阉割”即产品:安全优先的新逻辑

Opus 4.7最引人注目的地方,在于它是一款被“有意削弱”的模型。官方明确指出,这是首款用于测试新型网络安全防护机制的公开模型。就在上周,Anthropic因Mythos Preview模型的网络安全能力过于强大而决定暂不公开。Opus 4.7的发布,正是为了在可控范围内验证这些安全机制。

为此,Anthropic推出了“网络安全验证项目”,对模型能力进行分级管理。普通用户使用的是带有严格安全护栏的版本,而经过认证的专业人士则可申请更高权限。这种做法标志着AI竞争逻辑的转变:从单纯比拼“谁更强”,转向关注“谁能用得更安全”。

三、成本与体验:为“思考”付费

尽管官方宣称Opus 4.7的定价与前代持平(输入5美元/百万tokens,输出25美元/百万tokens),但实际使用成本可能会上升。新的分词器和“高思考强度”模式会导致token消耗量增加。这揭示了Anthropic的产品哲学:用户购买的不再是简单的问答服务,而是一个具备深度思考、试错和验证能力的完整任务执行过程。

配套发布的Claude Code更新也体现了这一思路。“自动模式”(auto mode)巧妙地平衡了智能体的自主性与安全性,根据操作风险等级决定是自动执行还是请求授权。而“深度审查”(/ultrareview)功能则让AI进入代码审查阶段,实现了从“写代码”到“审代码”的闭环,真正参与到完整的软件开发生命周期中。

结语

Anthropic通过Opus 4.7传递了一个清晰的信号:在AI能力逼近临界点的今天,“选择不做什么”比“能够做什么”更能体现一家公司的远见与责任感。这种以安全和可控为核心的克制,或许将成为下一代AI产品的核心竞争力。市场最终将检验,这种审慎的价值是否会被广泛认可。

打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP