英伟达拟为Vera Rubin引入GPU直连存储,HBF崛起预期升温
2026-05-20 09:08:392

大模型参数量的指数级增长正让传统高带宽内存(HBM)捉襟见肘,单纯依靠HBM堆叠已难以填平“内存墙”鸿沟。为此,英伟达据传将在下一代Vera Rubin GPU架构中引入GPU Direct Storage技术,让GPU直连高速闪存,绕过CPU和系统内存,直接读取大规模数据集。这一设计可将NVMe SSD等设备映射为GPU可用的扩展内存池,大幅降低数据搬运延迟,同时突破HBM容量上限。
韩国媒体The Elec的报道指出,亚马逊也在同步研发类似的存储直通方案,但英伟达的动作更为激进。Vera Rubin平台若能原生支持GPU直连存储,将为万亿参数模型的训练和推理提供全新的内存层次结构。该路径不再仅仅依赖HBM的带宽,而是结合大容量闪存构建近存储计算(near-storage compute)能力,在成本和扩展性上更具优势。
这一转变也瞬间点燃了业界对高带宽闪存(HBF)的热情。由铠侠和西部数据旗下闪迪提出的HBF概念,通过堆叠3D NAND并优化接口,旨在提供接近HBM带宽级别、同时拥有数倍容量的存储方案。一旦GPU直连存储架构成熟,HBF有望填补HBM与NAND SSD之间的空白,成为AI基础设施中新的关键拼图。业界普遍认为,随着Vera Rubin等下一代芯片的推出,HBF的商用化进程将显著加速。


