业界探讨将HBM与GPU分离以突破内存容量瓶颈,光学互连或成关键技术

业界探讨将HBM与GPU分离以突破内存容量瓶颈,光学互连或成关键技术

AI大模型参数量的指数级攀升,让算力芯片的内存墙问题日益尖锐。传统方案中,高带宽内存与GPU或ASIC紧密封装在同一基板上,虽缩短了物理距离却严重受限于封装面积和硅中介层尺寸,单颗芯片所能集成的HBM堆栈数量已触达天花板。为打破这一僵局,业内开始系统性地考虑将HBM从处理器旁彻底剥离,通过更高密度的外部互连来扩展总内存容量。

据ZDNet援引某韩国头部存储厂研究员的观点,这一思路已在内存供应商与先进封装企业间展开讨论。核心构想是把GPU和HBM分别置于不同基板甚至不同模块,两者间以高速光学链路替代传统的电互连。由于光子传输在能效比、带宽密度和抗干扰能力上具备天然优势,尤其在数厘米到数十厘米的中长距芯片间互连场景下,光学方案有望突破SerDes电信号的物理极限,使单GPU能访问的HBM堆栈数量增加数倍。

研究人员指出,当前HBM与处理器封装在一起时,热预算、物理空间和信号完整性共同限制了堆叠数量。一旦将内存分离,就可以在独立的内存阵列中并行布置更多HBM,从而构建容量可达TB级的片外内存池。而实现这一目标的关键在于共封装光学或片上光互联的成熟度,其需要为GPU到HBM提供至少TB/s级别的聚合带宽,同时保持纳秒级的低延迟。

目前,包括NVIDIA、AMD、英特尔在内的主要芯片厂商以及三星、SK海力士等存储巨头均有布局光学互连技术的迹象。部分研发方案已尝试在AI加速器封装中引入硅光子中介层,利用微环调制器和波导实现高密度光I/O。尽管光引擎的集成封装良率与散热仍是量产前的核心挑战,但若成功,这一分离式架构不仅将突破内存容量瓶颈,还有望重构AI硬件形态,让计算与内存解耦成为下一代超大规模系统的标配。

相关推荐