从GPU饥渴到内存饥渴,AI瓶颈正在转移

美光科技核心数据中心业务负责人近日坦言,AI推理的上下文窗口持续扩大,若内存不足则需指数级重复计算,导致GPU利用率断崖式下降。公司全球同步建设五座晶圆厂仍跟不上需求——这则新闻的背后,是AI军备竞赛的物理瓶颈正在从算力转移到存储。

从第一性原理出发,生存优先:AI企业的核心竞争力取决于能否以可承受成本完成推理。内存不是辅助品,而是直接决定GPU利用率的“战略资产”——内存每提升一倍,理论算力利用率可呈平方倍增长。这种非对称性意味着,谁先突破内存供给,谁就能在AI效率竞争中占据绝对优势。但我们需要警惕新闻中的叙事刻意煽动恐慌:美光作为供应商,有动力放大需求缺口以推动价格上涨。真正的判断应基于供应链数据:当前HBM3E产能被三星和SK海力士垄断,美光虽在扩产,但良率和产能爬坡存在巨大不确定性。

这本质上是技术热潮中“基础设施滞后”的再一次重演:需求增速始终快于产能扩张,涨价是缓解短缺的少数有效手段。短期内存价格将持续走高,且会倒逼市场寻求替代方案——如存算一体架构、CXL互联池化内存。对于中国半导体产业,这既是警示也是机会:HBM高度依赖进口,自主突破的时间窗口正在收窄;但同时,内存短板是确定的非对称机会——哪怕只解决部分卡脖子环节,也能享受长期红利。核心判断:内存是AI时代的“新石油”,但当前叙事中隐含的“无限增长”假设需要被证伪——当记忆体产能真正满足需求时,故事就会转向另一个瓶颈。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注