AI算力扩张遇瓶颈:内存供给紧张成关键

美光科技首席执行官近期指出,随着大模型推理规模的持续扩大,生成式AI对token的需求呈指数级增长,而token的处理速度直接受限于内存的带宽与容量。当前,DRAM与NAND的产能已经进入紧张状态,短期内难以通过扩产来匹配需求激增,导致内存成为客户的战略资产。

从第一性原理看,这一矛盾根源在于半导体制造的物理与资本周期:从晶圆厂立项到量产至少需要三到五年,且高端制程的产能提升受光刻机等关键设备供给限制。与此同时,AI模型的算力需求并非线性增长,而是随token数量的提升呈超线性扩散,这使得对内存的需求增长速率超过了传统PC与服务器市场的供给弹性。即便如此,需求侧也存在技术迭代的逆向调节,例如模型压缩、稀疏化以及新型存算一体化架构,这些手段在中长期可以部分抑制对传统DRAM的依赖。

综上,内存供应紧张是真实的结构性瓶颈,但并非不可逾越的生存危机。短期内价格上行和供需失衡将迫使企业加速多元化布局,包括投资高带宽HBM、存算一体芯片以及探索新材料存储;长期则会激励算法层面的效率提升,形成硬件与软件的协同进化。判断上,内存短缺将在未来一年至两年内成为AI扩张的关键约束,推动产业链向更高效的存算融合方向演化。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注