AI模型层分裂成两条路,上游反而更稳了

Anthropic在一轮融资会上摆出了一组数字:一季度营收48亿美元,二季度预计冲到109亿,6月当季有望实现5.59亿美元运营利润。去年它还跟投资者说至少要到2028年才有可能全年盈利,现在利润表已经提前动了。推动这轮变化的是企业客户对Claude编程工具和智能体能力的真实需求——一个人同时放出几十上百个智能体去跑代码、分析、多步推理,包月套餐根本兜不住背后的消耗。

AI收费正在从“无限自助”转向“按杯计费”。这背后不只是一个定价方式的变化,更是整个产业链账本的重写。桥水的一位CIO说得更直白:现在世界上唯一比算力供应增长更快的,是算力需求;配给已经开始了,方式包括提价、限制访问权限,甚至实验室内部暂停研究项目。

在这个节点上,高盛和SemiAnalysis对“AI交易下一阶段”的判断产生了明显分歧。高盛盯着上游:芯片、HBM、先进封装、数据中心、电力——过去两年最确定的利润先留在了这些环节,云厂商扛着资本开支,企业端的ROI还没大面积写进利润表。SemiAnalysis看的则是另一头:token已经从问答成本变成了生产资料,代码、研究、建模、图表分析开始为更强模型付费,推理优化和硬件迭代又在持续压低单位成本,模型实验室这一层会从烧钱层往利润层挪。

Anthropic的出现提供了一条验证路径:在最前沿的高价值任务里,一个token可以卖出好价钱,而且企业愿意买单。DeepSeek则给出了截然不同的答案——5月22日它把V4-Pro API原本75%的折扣永久化,正式价只有原价的四分之一,Flash型号更便宜。这条路线走的是大量廉价调用,对agent、编程助手、客服和文档这类依赖缓存重复的工作流尤其友好。

两条路同时跑通意味着什么?第一,上游(算力、电、存储)暂时不会退场——高价值token和低成本token都在把总需求往外推,供给仍然偏紧,“稀缺溢价”上加了一层更大的总量。第二,中间层(模型路由、编排、预算控制)会变得非常值钱——企业不再只买一个模型,而是要根据任务特性在Anthropic和DeepSeek、高端和低配之间动态调度,谁把调度效率做到极致,谁就卡住了一个关键生态位。

高盛的担心也没有完全消失。Anthropic证明的是顶尖模型厂可以在高端场景提前赚钱;DeepSeek证明的是低价能让更多产品成立。但这不等于普通企业已经把AI成本稳定地变成了利润表里的正回报。DeepSeek的低价本身也伴随着利润压缩,用利润换触达、用规模换平台习惯,能不能跑通还要看架构效率、开发者的持续采用以及地缘合规的拖累。

不过市场的主问题已经变了。它不再只问“谁卖铲子”,也不再只问“模型厂什么时候赚钱”。Anthropic和DeepSeek把模型层拆成了两条路:一条把单个token做贵,一条把token总量做大。只要两条路都不是孤例,SemiAnalysis关于“利润池仍在扩张”的判断就会比高盛那套“上游先赚满、下游供养不足”的框架更接近现实。上游还有空间,靠的已经不光是稀缺,更是下游第一次开始用两种不同的方式,把这门生意同时做贵和做大。

接下来几个季度,财报里最值得盯的是几类数字:Anthropic这类高端模型的收入质量和毛利改善能不能延续,DeepSeek这类低价路线能不能把开发者采用变成稳定调用量,云厂商的资本开支能不能更顺畅地转进收入和合同,上游的内存、算力和机架瓶颈会不会继续把需求往前挤。下一轮市场分歧,大概率会沿着这些数字继续拉开。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注