最近,多家云厂商宣布下调算力价格,降幅令人震撼。
比如腾讯云宣布,大幅下调DeepSeek-V4系列API价格,最高降幅达97.5%。
小米MiMo官方宣布, MiMo-V2.5系列API永久降价。相比原始API定价,新定价最高降幅可达99%。
这让很多投资者感到困惑:算力需求不是在迅猛增长吗?算力价格为何却“脚踝斩”了,投资AI算力中心能盈利吗?一些算力中心是不是已经开始血亏了?
如果AI算力中心不赚钱,AI牛市还能持续吗?
要看懂算力市场的最新变化,首先需要明白一个基本逻辑:Token和Token是不一样的,是分层级的。
中低端的Token(通用对话、轻量推理)的确过剩了,缺少客户,所以开始卷价格;而高端Token(千亿级模型、多模态、生成视频、复杂推理)价格非常坚挺,而且在上涨。
不同GPU卡产生的Token,因为能承担的工作不同,价格天差地别。H100、H200、B200这些卡产生的算力,可以卖到每千Token0.01到0.1 元 ;而A800、昇腾 910产生的算力,每千Token为0.001到0.003元。
至于缓存命中、边缘计算成本接近于零,每千Token可以低至0.000025元。
最近疯狂降价的,就是后两类Token,尤其是“缓存命中”。它的含义是,这个问题之前用户问过,平台不需要再跑一次大模型推理,直接把缓存里的现成答案返回给用户就可以了,成本接近于零。
在中国内地目前的算力结构中,高端只占5%到10%,中端占40%到50%,低端占40%到50%。而美国高端占30%到40%,中端占35%到45%,低端只占20%到25%。
造成这种差别的,主要是美国的封锁政策,国内企业买不到先进的GPU卡。
5月31日,美国升级了管控政策,这让中资企业通过东南亚或欧洲的合资公司买英伟达先进GPU设立海外AI训练中心难度更高,国内的高端算力会更加稀缺。
这一轮中低端算力大降价,血亏的主要是不上规模的民营算力中心,他们没有先进的卡,手里主要是A800、昇腾 910等。
如果在2024年高点买入,以每台A800 的8卡服务器为例,每年的折旧、电费、运维等费用高达70到85万元。这些企业没有长期服务协议,没有客户,只能散租,利用率低,每台的年收入可能不到20万元左右,妥妥的血亏。
所以中报和三季报将是分化季。很快将有一批蹭算力热度的上市公司,在报表上体现出血亏,到那时虚高的股价可能腰斩。而有真实业绩+高增长支撑的科技企业,未来还有机会创新高。
美国的限制对国产高端算力,比如华为昇腾、海光、壁仞等构成利好。
特别提示:本文为观点和信息分享,不构成任何投资建议。