![]()
作者|川 川
編輯|大 風(fēng)
有沒有發(fā)現(xiàn),這半年AI圈的畫風(fēng)變得有點(diǎn)快?
去年這個時候,大家還在為算力降價狂歡。阿里云帶頭喊出“最高降幅60%”,騰訊云、華為云、百度云齊刷刷跟上,那陣仗,簡直像雙十一大促。創(chuàng)業(yè)群里天天有人曬賬單:“看,我這一百萬Token才花了幾毛錢!”那會兒人人都覺得,AI創(chuàng)業(yè)的春天來了,算力跟白菜一樣便宜,誰還做不起大模型應(yīng)用啊?
結(jié)果呢?打臉來得太快。
就上個月,風(fēng)向一百八十度大轉(zhuǎn)彎。谷歌、亞馬遜、騰訊、阿里、百度,10天之內(nèi)全發(fā)了漲價公告。漲多少?普遍30%到50%。最狠的是騰訊云,有個核心產(chǎn)品直接漲了400%。
從“跳樓大甩賣”到“坐火箭式漲價”,前后不到一年。到底發(fā)生了什么?誰在背后推著價格往上走?更重要的是,這波漲價潮里,誰最慘,誰在偷笑?
去年還在“打骨折”,今年為什么集體漲價?
先簡單回顧一下這出“反轉(zhuǎn)大戲”。
2025年4月,阿里云率先扔出一顆重磅炸彈:核心產(chǎn)品最高降價60%。這可不是小打小鬧,是實(shí)打?qū)嵉摹把鼣卦俅蛘邸薄>o接著,京東云說“隨便降,我跟”,騰訊云、華為云、百度云全部跟進(jìn)。一時間,算力市場硝煙彌漫,價格戰(zhàn)打得那叫一個熱鬧。
![]()
那會兒的口號是什么?“讓AI用得起”“算力普惠”。很多創(chuàng)業(yè)公司真的信了,開始大張旗鼓地?zé)齌oken、跑模型。
然而,免費(fèi)的午餐從來吃不長久。
2026年1月,亞馬遜AWS悄悄干了件事——沒有任何發(fā)布會,沒有任何預(yù)告,直接把EC2服務(wù)器價格上調(diào)了15%左右。別看幅度不大,意義可大了:這是云服務(wù)行業(yè)近二十年來第一次漲價。要知道,過去二十年,AWS降價的次數(shù)超過一百次,從來只有往下走,沒有往上調(diào)的道理。
這一下,像是推倒了多米諾骨牌。
3月11日,騰訊云跟進(jìn),旗下Tencent HY2.0 Instruct模型輸入價格從0.0008元/千tokens漲到0.004505元/千tokens——漲幅463%,四倍多。3月18日,阿里云宣布算力卡產(chǎn)品上漲5%到34%,百度智能云也跟著漲了5%到30%。那些之前免費(fèi)公測的大模型,比如GLM 5、MiniMax 2.5、Kimi 2.5,全部結(jié)束“白嫖期”,轉(zhuǎn)入正式計費(fèi)。
從“搶著降價”到“搶著漲價”,為什么變化這么快?
表面看是云廠商扛不住了。GPU芯片越買越貴,數(shù)據(jù)中心的電費(fèi)占運(yùn)營成本的40%到60%,再加上2025年下半年存儲芯片也開始漲價,成本端的壓力實(shí)實(shí)在在地壓過來了。但真正讓漲價變成“不得不做”的,是另一個更根本的原因——算力,真的不夠用了。
誰在瘋狂“吃”Token?140萬億的真相
之前不是說算力過剩嗎?怎么突然就不夠用了?
答案是:Token被“吃”得太快了。
根據(jù)國家數(shù)據(jù)局局長劉烈宏在今年3月披露的數(shù)據(jù):到2026年3月,中國每天的Token調(diào)用量已經(jīng)突破了140萬億。
這個數(shù)字有多夸張?給你兩個參照:
· 2024年初,這個數(shù)字只有1000億。兩年時間,漲了一千多倍。
· 2025年底,這個數(shù)字是100萬億。也就是說,僅僅過去三個月,又漲了40%——光這三個月新增的量(40萬億),就是2024年初全天的400倍。
這不是線性增長,這是海嘯。
那么問題來了:誰在瘋狂消耗Token?
答案就一個詞:智能體(Agent)。
去年開始,以開源智能體OpenClaw(江湖人稱“龍蝦”)為代表的產(chǎn)品火得一塌糊涂。AI從一個只會“聊天”的機(jī)器人,變成了一個能“干活”的助手——幫你訂機(jī)票、寫代碼、做PPT、分析數(shù)據(jù)……聽起來很酷對吧?但代價是,智能體干一件簡單的事,消耗的Token量是普通對話的10倍到100倍。
![]()
舉個例子:讓AI幫你寫一個爬蟲腳本。如果是普通對話,它給你一段代碼,你復(fù)制走人,消耗幾百個Token。但如果是智能體,它要自己跑代碼、報錯、調(diào)試、再跑、再調(diào)……來來回回十幾輪,Token消耗直接奔著幾萬去了。
更別提視頻生成這種“吞金獸”。有分析指出,生成1分鐘的視頻大約要消耗10萬億Token。而現(xiàn)在的視頻模型,生成5秒的視頻才收你幾毛錢到幾塊錢——這哪是賺錢,這分明是賠本賺吆喝。但架不住用的人多啊,視頻、音樂、代碼、數(shù)據(jù)分析……每個方向都在瘋狂“吃”Token。
供給跟不上需求,算力自然就漲價了。這不是陰謀,是赤裸裸的供需失衡。
算力排位賽:大廠吃肉,小玩家連湯都喝不上
漲價這件事,對不同的人,意味完全不同。
對云廠商來說,漲價其實(shí)是好事。有券商算過一筆賬:阿里云每提價1%,它的利潤率就能提升1個百分點(diǎn)。所以你看到的數(shù)據(jù)是,阿里云的份額不降反升,已經(jīng)占到了中國AI云市場的36%。而在AI調(diào)用量這個更細(xì)的賽道里,火山引擎(字節(jié)旗下)更是占了將近50%——也就是說,全中國一半的Token調(diào)用,走的是火山引擎的管道。
與此同時,華為云、騰訊云的份額在微幅下滑。頭部效應(yīng)越來越明顯:大廠越做越強(qiáng),資源越聚越集中。
那誰最慘?
中小AI創(chuàng)業(yè)公司,以及那些剛?cè)刖值男⊥婕摇?/p>
原因很簡單:漲價直接推高了他們的運(yùn)營成本。以前Token便宜的時候,你可以隨便跑實(shí)驗、隨便調(diào)模型,反正花不了幾個錢。現(xiàn)在價格翻了幾倍甚至十幾倍,每一輪訓(xùn)練、每一次推理都要掂量掂量。
![]()
更麻煩的是,小玩家沒有議價能力。大客戶可以跟云廠商簽長期協(xié)議,鎖定一個相對優(yōu)惠的價格。你一個初創(chuàng)公司,一年才花幾萬塊錢的算力費(fèi),誰跟你談?wù)劭郏恐荒芾侠蠈?shí)實(shí)按漲價后的價格付錢。
很多原本打算做AI應(yīng)用的項目,算了一筆賬之后,默默擱置了。還有一些已經(jīng)在做的,要么縮減規(guī)模,要么自己扛著虧損硬撐。偏偏終端市場競爭又激烈,你不敢輕易給用戶漲價——隔壁家還免費(fèi)呢,你一收費(fèi)用戶全跑了。最后所有的成本壓力,只能自己咽下去。
一位從業(yè)者跟我吐槽:“以前覺得算力便宜,創(chuàng)業(yè)門檻低了。現(xiàn)在才發(fā)現(xiàn),門檻不是低了,是先讓你進(jìn)來,再把門關(guān)上。”
這其實(shí)是一場殘酷的排位賽。過去二十年,云廠商靠“低價走量、先圈地再盈利”的打法活得很滋潤。但那個時代結(jié)束了。算力正式告別補(bǔ)貼期,進(jìn)入商業(yè)化定價階段。未來比拼的不再是誰更便宜,而是誰的服務(wù)更穩(wěn)定、誰的生態(tài)更完善、誰能幫企業(yè)真正用好每一分算力。
而在這場排位賽里,小玩家大概率要被甩下車。
回頭看看這一年多的過山車,你會發(fā)現(xiàn)一個挺扎心的真相:
算力從“白菜價”到“火箭價”,本質(zhì)上是AI行業(yè)從野蠻生長走向成熟的一個縮影。免費(fèi)時代結(jié)束了,價值競爭開始了。那些靠補(bǔ)貼活著的商業(yè)模式會死掉,而那些真正有技術(shù)、有場景、有用戶的產(chǎn)品,會在算力成本上升的環(huán)境中活下來,甚至活得更好。
AI創(chuàng)業(yè)的核心競爭力,從來不是算力有多便宜,而是你拿算力來干什么。
算力時代,Token確實(shí)貴。但比Token更貴的,是一個知道怎么用好Token的腦子。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.