手记

黄仁勋“抢吃龙虾”:英伟达祭出10倍算力核弹,OpenClaw正式迈入企业级时代

北京时间3月17日凌晨,英伟达GTC大会在加州圣何塞拉开帷幕。CEO黄仁勋一登台便抛出重磅判断:“我们正站在一场堪比PC革命与互联网革命的全新平台变革起点。”而这场变革的核心燃料,不再是数据或带宽,而是——Token

更令人震撼的是,他将此前对AI基础设施市场的预测直接翻倍:从2025到2027年,全球在Blackwell及后续系统上的投入将高达1万亿美元,其中60%来自超大规模云厂商。原因只有一个:AI已越过“训练拐点”,全面进入推理与生成爆发期


一、Vera Rubin:不是芯片,而是一座“Token工厂”

今年英伟达没有只发布一块GPU,而是推出了一整套名为 Vera Rubin 的AI算力系统——堪称史上最大规模的“AI基建工程”。

其旗舰产品 NVL72 机架集成了72颗Rubin GPU与36颗Vera CPU,通过第六代NVLink全互连,并配备ConnectX-9网卡、BlueField-4 DPU等七款全新芯片。这套系统专为智能体(Agent)时代打造,覆盖从预训练、微调到推理的全生命周期。

性能提升堪称恐怖:

  • 每瓦Token吞吐量提升10倍
  • 训练混合专家模型所需GPU数量仅为Blackwell的1/4;
  • 单Token推理成本降至十分之一

黄仁勋将其称为“Token King”——因为数据中心的角色正在转变:过去是存储文件的仓库,如今是批量生产Token的智能工厂

而更大的“核弹”还在后头:Vera Rubin Ultra NVL576
通过创新的双层NVLink拓扑,它将8个NVL72机架互联,形成一个统一的576 GPU域,实现跨机架的极致扩展。内部代号“Polyphe”的原型系统已验证该架构可行性。

甚至,英伟达还把算力送上了太空——宣布研发 Vera Rubin Space-1 轨道计算平台,专为极端散热环境设计。


二、LPU登场:专为万亿参数模型打造的“语言加速器”

Vera Rubin的惊人效率,离不开一项关键新组件:LPU(Language Processing Unit)

去年底,英伟达以约200亿美元战略入股AI推理芯片公司Groq,获得其核心技术授权。如今,NVIDIA Groq 3 LPX 正式亮相,标志着专用语言推理单元进入主流。

LPU并非取代GPU,而是与其协同:

  • 针对智能体所需的低延迟、长上下文、高确定性推理优化;
  • 每兆瓦推理吞吐量最高提升35倍
  • 支持万亿参数模型在百万Token上下文中高效运行。

LPX机架采用全液冷设计,集成256颗LPU,提供128GB片上SRAM与640TB/s纵向带宽。多颗LPU可像单一巨型处理器般协同工作,彻底突破传统GPU在解码阶段的瓶颈。

据悉,LPU目前由三星代工,未来或转向台积电;更长远看,Groq架构甚至可能融入下一代Feynman GPU中。


三、NemoClaw:英伟达版“企业级OpenClaw”上线

近期火爆技术圈的 OpenClaw,被黄仁勋誉为“AI时代的操作系统”——一个能自主创建、调度、分解任务的智能体平台。但他也直言:原生OpenClaw缺乏企业级安全机制

为此,英伟达联合全球顶尖安全团队,在OpenClaw基础上打造了 NemoClaw,并集成进 NVIDIA Agent Toolkit

NemoClaw的核心升级包括:

  • 自动部署安全沙箱(OpenShell运行时),隔离AI智能体的网络访问与工具调用;
  • 支持本地开源模型(如Nemotron)与云端前沿模型的混合调用,通过“隐私路由”确保敏感数据不出域;
  • 一键安装优化,开发者只需一条命令即可启动安全智能体环境。

黄仁勋强调:“每一家企业都需要自己的OpenClaw战略。”在他看来,Claw类系统未来将与Linux、Kubernetes同等重要。

配套推出的 Nemotron 3 Super 模型(1200亿参数,专为智能体优化)进一步强化了边缘部署的可行性。结合cuDF、cuOPT等NVIDIA生态工具,智能体可直接执行数据分析、路径规划等复杂任务。

目前,开发者可通过 build.nvidia.com 获取工具包,企业用户则可在AWS、Azure、GCP上直接部署。


四、AI不止于代码:物理世界的智能体正在崛起

数字智能体之外,英伟达也在加速AI向物理世界渗透。

GTC现场展示了110台机器人,并宣布比亚迪、现代、日产、吉利等车企将采用 DRIVE Hyperion 平台开发L4级自动驾驶汽车。
与Uber合作的自动驾驶车队计划于2027年在洛杉矶、旧金山率先落地,2028年扩展至四大洲28城,全部由NVIDIA DRIVE AV全栈驱动。

同时,英伟达发布 Isaac GR00T 开放机器人模型Cosmos 物理AI框架,构建从仿真训练到真实部署的闭环。Keynote压轴登场的“雪宝”机器人,正是在虚拟世界训练后获得物理躯体的成果——或许不久将在迪士尼乐园与游客互动。


结语:AI的下半场,是智能体的黄金时代

从10倍算力提升的Vera Rubin,到企业级安全的NemoClaw,再到驶向街头的自动驾驶车队,英伟达正全力押注一个判断:AI的未来不在单点模型,而在能自主行动、持续学习、安全协作的智能体生态

Token是新货币,算力是新电力,而智能体,将成为连接数字与物理世界的核心载体。
正如黄仁勋所言:“AI的下半场才刚刚开始。”
这一次,你准备好上车了吗?

0人推荐
随时随地看视频
慕课网APP