北京时间3月17日凌晨,英伟达GTC大会在加州圣何塞拉开帷幕。CEO黄仁勋一登台便抛出重磅判断:“我们正站在一场堪比PC革命与互联网革命的全新平台变革起点。”而这场变革的核心燃料,不再是数据或带宽,而是——Token。
更令人震撼的是,他将此前对AI基础设施市场的预测直接翻倍:从2025到2027年,全球在Blackwell及后续系统上的投入将高达1万亿美元,其中60%来自超大规模云厂商。原因只有一个:AI已越过“训练拐点”,全面进入推理与生成爆发期。
一、Vera Rubin:不是芯片,而是一座“Token工厂”
今年英伟达没有只发布一块GPU,而是推出了一整套名为 Vera Rubin 的AI算力系统——堪称史上最大规模的“AI基建工程”。
其旗舰产品 NVL72 机架集成了72颗Rubin GPU与36颗Vera CPU,通过第六代NVLink全互连,并配备ConnectX-9网卡、BlueField-4 DPU等七款全新芯片。这套系统专为智能体(Agent)时代打造,覆盖从预训练、微调到推理的全生命周期。
性能提升堪称恐怖:
- 每瓦Token吞吐量提升10倍;
- 训练混合专家模型所需GPU数量仅为Blackwell的1/4;
- 单Token推理成本降至十分之一。
黄仁勋将其称为“Token King”——因为数据中心的角色正在转变:过去是存储文件的仓库,如今是批量生产Token的智能工厂。
而更大的“核弹”还在后头:Vera Rubin Ultra NVL576。
通过创新的双层NVLink拓扑,它将8个NVL72机架互联,形成一个统一的576 GPU域,实现跨机架的极致扩展。内部代号“Polyphe”的原型系统已验证该架构可行性。
甚至,英伟达还把算力送上了太空——宣布研发 Vera Rubin Space-1 轨道计算平台,专为极端散热环境设计。
二、LPU登场:专为万亿参数模型打造的“语言加速器”
Vera Rubin的惊人效率,离不开一项关键新组件:LPU(Language Processing Unit)。
去年底,英伟达以约200亿美元战略入股AI推理芯片公司Groq,获得其核心技术授权。如今,NVIDIA Groq 3 LPX 正式亮相,标志着专用语言推理单元进入主流。
LPU并非取代GPU,而是与其协同:
- 针对智能体所需的低延迟、长上下文、高确定性推理优化;
- 每兆瓦推理吞吐量最高提升35倍;
- 支持万亿参数模型在百万Token上下文中高效运行。
LPX机架采用全液冷设计,集成256颗LPU,提供128GB片上SRAM与640TB/s纵向带宽。多颗LPU可像单一巨型处理器般协同工作,彻底突破传统GPU在解码阶段的瓶颈。
据悉,LPU目前由三星代工,未来或转向台积电;更长远看,Groq架构甚至可能融入下一代Feynman GPU中。
三、NemoClaw:英伟达版“企业级OpenClaw”上线
近期火爆技术圈的 OpenClaw,被黄仁勋誉为“AI时代的操作系统”——一个能自主创建、调度、分解任务的智能体平台。但他也直言:原生OpenClaw缺乏企业级安全机制。
为此,英伟达联合全球顶尖安全团队,在OpenClaw基础上打造了 NemoClaw,并集成进 NVIDIA Agent Toolkit。
NemoClaw的核心升级包括:
- 自动部署安全沙箱(OpenShell运行时),隔离AI智能体的网络访问与工具调用;
- 支持本地开源模型(如Nemotron)与云端前沿模型的混合调用,通过“隐私路由”确保敏感数据不出域;
- 一键安装优化,开发者只需一条命令即可启动安全智能体环境。
黄仁勋强调:“每一家企业都需要自己的OpenClaw战略。”在他看来,Claw类系统未来将与Linux、Kubernetes同等重要。
配套推出的 Nemotron 3 Super 模型(1200亿参数,专为智能体优化)进一步强化了边缘部署的可行性。结合cuDF、cuOPT等NVIDIA生态工具,智能体可直接执行数据分析、路径规划等复杂任务。
目前,开发者可通过 build.nvidia.com 获取工具包,企业用户则可在AWS、Azure、GCP上直接部署。
四、AI不止于代码:物理世界的智能体正在崛起
数字智能体之外,英伟达也在加速AI向物理世界渗透。
GTC现场展示了110台机器人,并宣布比亚迪、现代、日产、吉利等车企将采用 DRIVE Hyperion 平台开发L4级自动驾驶汽车。
与Uber合作的自动驾驶车队计划于2027年在洛杉矶、旧金山率先落地,2028年扩展至四大洲28城,全部由NVIDIA DRIVE AV全栈驱动。
同时,英伟达发布 Isaac GR00T 开放机器人模型 与 Cosmos 物理AI框架,构建从仿真训练到真实部署的闭环。Keynote压轴登场的“雪宝”机器人,正是在虚拟世界训练后获得物理躯体的成果——或许不久将在迪士尼乐园与游客互动。
结语:AI的下半场,是智能体的黄金时代
从10倍算力提升的Vera Rubin,到企业级安全的NemoClaw,再到驶向街头的自动驾驶车队,英伟达正全力押注一个判断:AI的未来不在单点模型,而在能自主行动、持续学习、安全协作的智能体生态。
Token是新货币,算力是新电力,而智能体,将成为连接数字与物理世界的核心载体。
正如黄仁勋所言:“AI的下半场才刚刚开始。”
这一次,你准备好上车了吗?
随时随地看视频