过去十八个月,GPT-4级模型的输入Token价格从每百万60美元跌到6美元,跌幅九成,比光伏组件的降价速度还快。华尔街见闻把它称为“计费维度战争”,其实只是同一幕剧的下半场:当技术不再稀缺,价格就会逼近边际成本,而边际成本在GPU利用率提升、推理框架优化、专用芯片量产的夹击下迅速归零。Token不再是“高科技单位”,它正退化为像千瓦时一样无趣的基础设施度量。
多维账单的出现,是云厂商在模型同质化之后寻找利润补丁的必然动作。搜索、缓存、会话时长、结果质量,这些新维度把报价单变成魔方,让客户难以比价,从而保住毛利。对企业而言,预算逻辑被迫从“谁更便宜”转向“在我具体场景下谁更抗跌”,本质是重新评估系统级生存概率——如果你的业务链任一环节被一次降价击穿,你就站在可被消灭的位置上,这直接违反生存优先原则。
更深层的信号是:价值正在快速离开模型层,向应用层和系统级迁移。过去融资故事里,参数规模就是护城河;如今百亿参数开源模型随处可见,护城河被填平。下一步,真正具备非对称收益的是能把模型蒸馏成场景现金流、并保留退出权的团队——轻资产、快迭代、现金流早回正,一旦规则再变,也能像壁虎断尾一样瞬间止损。Token已死,应用当立,这不是口号,是黑暗森林里新的公理。