继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

AI Infra新纪元:当模型创新撞上通信瓶颈,一场由“连接”定义的创业浪潮

三国纷争
关注TA
已关注
手记 480
粉丝 51
获赞 183

在DeepSeek V4以1.6T参数与1M上下文震撼业界的同时,硅谷一家成立仅7个月的公司正以20亿美元估值洽谈第三轮融资——它没有大模型,没有Agent,只专注于一件事:让GPU之间“说上话”。

这并非巧合,而是一场由软件创新倒逼硬件革命的必然。当AI模型的演进速度超越了算力基础设施的承载能力,“通信”便从幕后走向台前,成为决定AI未来十年格局的关键变量


一、错配的时代:万亿参数与“沉默”的GPU

2026年,AI模型进入“超大规模+超长上下文+超密集Agent交互”的三重爆发期:

  • DeepSeek V4-Pro:总参数1.6T(激活49B),上下文1M;
  • MoE架构普及:单次推理激活专家数动态变化,通信模式高度非稳态;
  • Agent系统兴起:Token消耗量呈指数级增长,分布式推理成为常态。

这些创新本应释放更强智能,却在现有算力集群中遭遇“木桶效应”——GPU算力闲置率高达30%-50%,根源在于网络无法支撑同步通信需求。

传统数据中心网络为通用负载设计,追求兼容性与成本平衡。但在AI场景下,其三大缺陷暴露无遗:

  1. 时延不可预测:TCP/IP栈引入毫秒级抖动,远超GPU微秒级同步窗口;
  2. 带宽利用率低:AllReduce等集合通信在InfiniBand或RoCE上效率不足60%;
  3. 扩展性天花板:跨机架通信成为性能断崖点。

正如一位NVIDIA架构师所言:“我们造出了F1赛车,却还在用乡间土路。”


二、破局之道:Scale-Up与Scale-Out的双重革命

解决通信瓶颈,需在两个层级同时重构:

Scale-Up(纵向扩展):打造“超级GPU”

目标:将同一机架内的数十张GPU视为单一计算单元。

  • 技术核心:超高速互连(如NVLink、UALink)、内存语义一致性、确定性时延。
  • 代表方案:NVIDIA NVL72(130TB/s内部带宽)、Upscale AI的SkyHammer芯片架构。

SkyHammer的突破在于全栈协同设计

  • ASIC层:原生支持ESUN/UEC等新兴协议,预留未来标准接口;
  • 系统层:自适应拥塞控制,确保高负载下仍维持亚微秒级延迟;
  • 机架层:将GPU、XPU、HBM内存统一编址,实现“逻辑单体化”。

Scale-Out(横向扩展):构建“万卡互联”

目标:让数千张GPU组成的集群像一台机器般高效协作。

  • 技术核心:无损以太网、高性能RDMA、全局遥测与可观测性。
  • 代表方案:Upscale AI的Open Ethernet架构,基于NVIDIA Spectrum-X与SONiC构建。

其关键创新是将网络从“管道”变为“智能体”

  • 实时感知GPU利用率与通信模式;
  • 动态调整路由策略与缓冲区分配;
  • 提供端到端运维可视化,降低故障排查成本。

三、创业图谱:AI Infra的黄金赛道已现

模型与Agent的创新,正在催生一个千亿级的AI Infra新市场。据公开数据,2026年Q1全球AI基础设施融资额已超2025年全年50%,其中网络通信领域尤为火热:

细分赛道 代表公司 融资亮点 核心价值
AI专用网络芯片 Upscale AI 7个月融超3亿美元,估值20亿 全栈式Scale-Up/Out解决方案
Eridu 融资2亿美元 光互联+电互联融合架构
AI赋能芯片设计 Ricursive 融资3亿美元 用AI加速网络芯片物理设计
Cognichip 融资6000万美元 自主AI驱动的RTL生成
新型算力芯片 Unconventional AI 融资4.75亿美元 非冯·诺依曼架构,原生支持稀疏通信
MatX 融资5亿美元 存算一体,减少数据搬运

这场竞赛的本质,是从“算力为中心”转向“通信为中心” 的范式迁移。未来的赢家,不再是单纯提供更快芯片的公司,而是能重新定义“计算边界” 的系统级创新者。


四、中国机会:从追赶到定义

当前,中国在开源大模型(如DeepSeek V4)上已实现全球领先,但在AI Infra底层,尤其是高端网络芯片与互连协议上,仍处于追赶阶段。

然而,差距即机遇:

  • 需求侧:中国拥有全球最活跃的AI应用场景与最迫切的算力需求;
  • 供给侧:华为、阿里、腾讯等巨头正大力投入超节点(Scale-Up)研发;
  • 生态侧:2026 Open AI Infra Summit等平台推动国产标准(如UALink)落地。

可以预见,未来2-3年,中国将涌现出一批对标Upscale AI的本土企业,它们或聚焦光互联、或深耕协议栈、或专攻液冷集成,共同构建自主可控的AI通信底座


结语:连接,是智能的终极瓶颈

回望计算机史,每一次算力飞跃都伴随着通信革命:

  • CPU多核时代催生了QPI/UPI;
  • GPU并行计算推动了PCIe与NVLink;
  • 如今,万亿参数AI正呼唤新一代“神经突触”。

Upscale AI们的崛起,标志着AI Infra进入“精耕细作”阶段——不再盲目堆砌算力,而是通过极致优化连接效率,榨取每一分硬件潜能

在这场由模型创新点燃、由通信技术承接的革命中,真正的护城河,或许不在于你拥有多少GPU,而在于你能让它们多么高效地“看见”彼此、“理解”彼此,并最终,“协同”创造智能。

当DeepSeek说“现在,我们看见你了”,
它的背后,正站着一群让“看见”成为可能的人。

打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP