作者 | 松壑
![]()
2008年2月,巴菲特在致伯克希爾·哈撒韋股東的年度信中寫下了一段后來被反復(fù)引用的話:
假如一位有遠(yuǎn)見的資本家當(dāng)年能把萊特兄弟在基蒂霍克的試飛飛機(jī)打下來,顯然是在為他的繼任者造了大福。
這當(dāng)然是一句玩笑,巴菲特真正想說的是:
最糟糕的生意,是那種增長很快、需要大量資本來維持增長、最后卻幾乎賺不到錢的生意。
想想航空業(yè)吧,自萊特兄弟的年代起,持久的競爭優(yōu)勢就從未出現(xiàn)過。
這段話寫在巴菲特人生中第一次投資航空股失敗將近二十年之后。從1989年到2020年,巴菲特曾斥資百億美元涉足北美航空股,但最終割肉巨虧離場。
民航業(yè)的出現(xiàn),是人類交通方式的巨大革命,但作為一門生意,它的特征是:
巨大的資本開支、激烈的價(jià)格競爭、以及無論行業(yè)如何增長都難以回報(bào)股東的利潤結(jié)構(gòu)。
從萊特兄弟首飛到巴菲特寫下那封信的整整一百多年,航空業(yè)消滅的資本比創(chuàng)造的利潤還要多。
改變世界的技術(shù)和賺錢的生意之間,可能隔著一道永遠(yuǎn)無法逾越的鴻溝。
許多年以后,那架從基蒂霍克起飛的飛機(jī),以另一種形式重新升空了。
一.免費(fèi)午餐散場
2026年5月4日,五一假期的最后一天,豆包在蘋果App Store頁面掛出了付費(fèi)版本的服務(wù)聲明。三檔訂閱價(jià)格浮出水面:標(biāo)準(zhǔn)版每月68元、加強(qiáng)版每月200元、專業(yè)版每月500元。話題當(dāng)天沖上微博熱搜第一。
豆包官方稱免費(fèi)服務(wù)將始終保留,付費(fèi)版面向?qū)I(yè)生產(chǎn)力場景,方案仍在測試階段。但用戶最焦慮的不是收不收費(fèi),而是免費(fèi)版是否會被降配?
過去十幾年中國互聯(lián)網(wǎng)的商業(yè)化劇本已經(jīng)演過太多遍了:先免費(fèi)獲客,再降低免費(fèi)體驗(yàn),最后引導(dǎo)付費(fèi)升級。
但這一次,促使豆包祭出付費(fèi)版的因素,并不止于其在簡中互聯(lián)網(wǎng)遙遙領(lǐng)先市占率基礎(chǔ)上的一次用戶收割,而是成本端也開始扛不住了。
2026年3月QuestMobile數(shù)據(jù)顯示,豆包月活用戶達(dá)到3.45億,穩(wěn)居AI原生應(yīng)用第一,比第二名千問和第三名DeepSeek的總和起來還多。一季度月人均使用次數(shù)54.8次,平均活躍率33.5%。
3.45億月活,每人每月用55次,背后的成本注定是一個(gè)天文數(shù)字。
這種情況下,已經(jīng)有不止少數(shù)用戶反饋,豆包在晚間等高峰時(shí)段已出現(xiàn)用戶發(fā)起次數(shù)過多導(dǎo)致的算力排隊(duì)現(xiàn)象。
AI領(lǐng)域的持續(xù)投入與成本之下,字節(jié)跳動(dòng)2025年凈利潤同比下滑超過70%,全年約1500億資本開支中,約900億砸向算力采購。
抖音副總裁李亮解釋了這與優(yōu)先股和期權(quán)變動(dòng)等會計(jì)因素有關(guān),但AI投入確實(shí)對其利潤帶來了影響。
但后續(xù)的投入仍然是個(gè)天文數(shù)字,據(jù)FT報(bào)道字節(jié)2026年的資本支出預(yù)算約1600億人民幣,其中850億用于AI芯片采購。
豆包免費(fèi)或許很好用,但背后是字節(jié)的成本在負(fù)重前行,商業(yè)公司都有盈利的追求。就算抖音已成為流量印鈔機(jī),它也不可能無限期買芯片、投算力長期供數(shù)億人免費(fèi)使用。
互聯(lián)網(wǎng)古早期的普遍免費(fèi)邏輯,在AI時(shí)代正出現(xiàn)根本性變化,大廠們可能更早地進(jìn)入收費(fèi)期,來對沖日漸龐大且令人恐懼的電力和算力成本。
二 .地表最強(qiáng)也不夠賺
豆包的困境或許是"用戶太多、成本太高",那么看看大洋彼岸那家被全球開發(fā)者公認(rèn)為"地表最強(qiáng)"的Anthropic的毛利率,也仍然有著顯著的天花板。
Claude在編程和Agent場景中擁有難以撼動(dòng)的口碑,據(jù)Sacra估算的截至2026年3月數(shù)據(jù),Anthropic年化收入已達(dá)到約300億美元,較一年前增長約14倍。超過500家企業(yè)客戶年消費(fèi)超過100萬美元,財(cái)富10強(qiáng)中有8家是Claude的客戶。
收入增長堪稱人類商業(yè)史上的奇跡,然而利潤呢?
在走出了前期成本泥潭的2025年,Anthropic的毛利率改善后也僅有40%,但仍然低于此前50%的目標(biāo)。公司預(yù)計(jì)到2028年毛利率才有望達(dá)到77%。
作為參考,傳統(tǒng)SaaS軟件公司的毛利率通常在75%到85%之間。Anthropic到2028年的目標(biāo),才剛剛摸到SaaS行業(yè)的底線。
這意味著,哪怕地表最強(qiáng)的大模型,在賣Token這件事上,也很難賺到SaaS級別的利潤。
原因也很簡單,每一次推理調(diào)用都需要實(shí)打?qū)嵉叵腉PU算力和電力,這筆成本不會因?yàn)槟P透斆骶妥詣?dòng)消失。
Anthropic的CEO達(dá)里奧·阿莫迪曾對Fortune雜志說,如果AI進(jìn)展延遲12個(gè)月,他就會破產(chǎn),一家年收入300億美元的公司說出這種話,足以說明Token生意的現(xiàn)金流壓力始終懸于行業(yè)頭頂。
![]()
三 .成本的剛性
Token這門生意本身雖然代表了未來的方向,但在給股東帶來回報(bào)方面,前景并不樂觀。
從成本邊際變化來說,生意大致可以分成三類:
第一類是邊際成本趨零型。
它們是軟件SaaS、游戲皮膚、數(shù)字音樂。
這些業(yè)態(tài)一次開發(fā)完成,每多一個(gè)用戶的增量成本幾乎為零, WPS多賣一份訂閱,邊際開支微乎其微。這類生意的毛利率往往在75%-85%甚至更高,是資本市場最鐘愛的模型。
第二類是邊際成本穩(wěn)步遞減型。
正如制造業(yè)所遵循的萊特定律:累計(jì)產(chǎn)量每翻一倍,單位成本下降約15%到20%。流水線、批量制造和現(xiàn)代化機(jī)床決定了制造業(yè)的規(guī)模越大時(shí),成本越低。
第三類就是Token這門生意所處的位置——邊際成本遞減,但存在剛性底線。
必須承認(rèn),賣Token的成本并非完全恒定不變。隨著規(guī)模擴(kuò)大,推理芯片的利用率會提高,波峰波谷也可以通過混合調(diào)度打平,KV Cache等技術(shù)可以減少重復(fù)計(jì)算,模型蒸餾和量化也在持續(xù)降低單Token的算力消耗。
火山引擎總裁譚待在2024年就介紹過,火山通過PD分離和KV Cache等技術(shù)手段,實(shí)現(xiàn)了可持續(xù)的降本。DeepSeek V4在2026年4月發(fā)布時(shí),更是通過全新的混合注意力機(jī)制,將百萬上下文推理所需的計(jì)算量和顯存分別降至V3.2的27%和10%。
但關(guān)鍵問題是:無論技術(shù)如何優(yōu)化,Token生成永遠(yuǎn)需要實(shí)時(shí)計(jì)算。每一次推理請求都要GPU運(yùn)算、消耗電力、占用芯片壽命。
不能把上一次推理的結(jié)果"復(fù)用"給下一個(gè)用戶,每一個(gè)回答都是一次全新的計(jì)算。這使得Token的成本曲線有一個(gè)永遠(yuǎn)無法觸及零的剛性底線,正如航空業(yè)無論怎么優(yōu)化燃油效率,每飛一趟航班都需要燒掉實(shí)打?qū)嵉暮接鸵粯印?/p>
更令人擔(dān)憂的是,短期內(nèi)這條成本曲線甚至出現(xiàn)了上翹。
DRAM存儲器價(jià)格在2026年二季度預(yù)估跳升高達(dá)63%,NAND閃存價(jià)格飆升75%。摩根士丹利4月研報(bào)指出,存儲之后,EUV光刻機(jī)和CPU將成為新的瓶頸。華為昇騰服務(wù)器3月底啟動(dòng)第二輪調(diào)價(jià),910C單臺上漲16萬至48萬元不等。阿里云4月18日起AI算力產(chǎn)品全線漲價(jià),最高漲幅34%。
Token 生意的邊際成本雖能隨技術(shù)優(yōu)化和規(guī)模效應(yīng)緩慢下行,卻存在無法擊穿的剛性底線,永遠(yuǎn)無法像傳統(tǒng) SaaS 那樣趨近于零,這也注定了它的盈利天花板遠(yuǎn)低于標(biāo)準(zhǔn)化軟件生意。
四 .價(jià)格無限戰(zhàn)爭
再來說競爭格局。
2024年下半年到2025年初,中國大模型市場經(jīng)歷了一場慘烈的價(jià)格戰(zhàn)。字節(jié)豆包報(bào)價(jià)低至0.0008元/千tokens,阿里通義千問主力模型降價(jià)97%,智譜將GLM-4-Plus降價(jià)90%。一元錢能買百萬token,這在兩年前不可想象。
到了Agent主導(dǎo)的2026年,風(fēng)向突然轉(zhuǎn)變了。
智譜率先打響漲價(jià)第一槍。從2月12日發(fā)布GLM-5到4月的GLM-5.1落地,三次相對上一代GLM-4.7累計(jì)漲幅達(dá)到83%。智譜CEO張鵬在中關(guān)村論壇年會上直言:調(diào)整價(jià)格是為了回歸正常的商業(yè)價(jià)值,長期低價(jià)競爭不利于行業(yè)發(fā)展;瓶頸在算力,不在客戶。
然而漲價(jià)的代價(jià)立竿見影。
GLM-5在2月中旬曾在OpenRouter平臺位列全球第三,是中國調(diào)用量最高的模型。三次漲價(jià)后,到4月中旬已跌至第17位。
從時(shí)間線上看,智譜連續(xù)大幅漲價(jià)的區(qū)間,恰好與 GLM 系列在 OpenRouter 調(diào)用量排名明顯下滑重合。雖不能簡單將排名下跌完全歸咎于漲價(jià),但同步走勢也側(cè)面說明一件事:
AI Token 行業(yè)用戶價(jià)格敏感度極高、產(chǎn)品差異化壁壘不足、缺乏強(qiáng)勢定價(jià)權(quán),廠商很難脫離價(jià)格戰(zhàn)獨(dú)立提價(jià)而不丟失市場份額。
因?yàn)榫驮谥亲V漲價(jià)同時(shí),幾度延期的DeepSeek突然扔出炸彈。
2026年4月24日,DeepSeek發(fā)布了V4預(yù)覽版并同步開源,V4-Pro總參數(shù)1.6萬億、激活參數(shù)49B,性能比肩頂級閉源模型;V4-Flash總參數(shù)2840億、激活參數(shù)僅13B,輸入定價(jià)低至0.14美元/百萬tokens。
DeepSeek團(tuán)隊(duì)在技術(shù)報(bào)告中坦誠承認(rèn),V4-Pro"略落后于GPT-5.4和Gemini-3.1-Pro",但仍然以不到Claude Opus 4.6的1/8價(jià)格提供接近的性能,這對Token的"售價(jià)錨點(diǎn)"構(gòu)成了持續(xù)的破壞。
Token生意的競爭順序正在和航空業(yè)呈現(xiàn)出驚人的相似,即飛機(jī)誰都能買,航線誰都能飛,除非建立起壟斷性的網(wǎng)絡(luò)效應(yīng),否則競爭對手總能以更低的票價(jià)把乘客搶走。
在一個(gè)開源模型不斷逼近閉源前沿的世界里,靠賣token建立持久的商業(yè)護(hù)城河,難度可想而知。
一年前比誰降得狠,一年后比誰漲得快。這種180度的急轉(zhuǎn)彎本身就說明了一件事,這個(gè)行業(yè)的定價(jià)權(quán)極不穩(wěn)定。
定價(jià)權(quán)不穩(wěn)定的行業(yè),很難成為好生意。
![]()
五 .搬運(yùn)工抵達(dá)戰(zhàn)場
有關(guān)脆弱定價(jià)權(quán)的一個(gè)有趣旁證是,當(dāng)大模型公司還在為Token成本焦頭爛額時(shí),一批聰明人已經(jīng)找到了更輕巧的玩法。
那就是Token中轉(zhuǎn)站。
獵豹移動(dòng)董事長兼CEO傅盛推出了AI API聚合平臺EasyRouter.io,通過統(tǒng)一接口幫用戶調(diào)用GPT、Claude、Gemini、DeepSeek等40余個(gè)主流大模型;幾乎同一時(shí)間,波場創(chuàng)始人孫宇晨也上線了類似產(chǎn)品b.ai。
最魔幻的一幕發(fā)生在5月5日。
特朗普家族的項(xiàng)目World Liberty Financial(WLFI)生態(tài)下的首個(gè)AI項(xiàng)目WorldClaw宣布上線,首發(fā)產(chǎn)品WorldRouter聚合了Claude、GPT、Gemini等300余個(gè)主流AI模型,聲稱調(diào)用成本比官方定價(jià)低30%,用WLFI旗下穩(wěn)定幣USD1結(jié)算,鎖倉WLFI代幣可兌換AI算力額度。
套餐則分四檔,最貴的Max Plan售價(jià)9999美元,還宣稱買Claude API額度,送海湖莊園私人晚宴抽獎(jiǎng)資格,有機(jī)會與特朗普長子小唐納德共進(jìn)晚餐。
中轉(zhuǎn)站之所以能讓人蜂擁而入,在于它的商業(yè)模式極其簡單:聚合多家大模型的API接口,統(tǒng)一封裝后轉(zhuǎn)售給終端用戶,賺取價(jià)格差和服務(wù)費(fèi)。它不需要訓(xùn)練模型、買GPU或建數(shù)據(jù)中心,它不生產(chǎn)Token,只做Token的搬運(yùn)工。
但是,當(dāng)一門生意的終端定價(jià)低到連"二道販子"都能從中分到一杯羹時(shí),說明生產(chǎn)者自己大概率是在貼著成本、甚至虧著本在賣。
更耐人尋味的是這門生意的競爭門檻。EasyRouter上線不到一周,就被開源社區(qū)開發(fā)者公開質(zhì)疑其產(chǎn)品直接使用了NewAPI的開源代碼卻去除了版權(quán)信息。
這個(gè)插曲,本身說明了Token中轉(zhuǎn)站的技術(shù)壁壘接近于零,一套開源網(wǎng)關(guān)代碼、一臺服務(wù)器、幾個(gè)API Key,啟動(dòng)資金兩千到五千元人民幣,就能開張營業(yè)。
價(jià)格差、跨境壁壘、多模型適配的工程成本,這些縫隙疊加在一起,就給了中間商生存的空間,但當(dāng)一個(gè)行業(yè)的中間商門檻低到這種程度,上游生產(chǎn)者的利潤空間可想而知。
這門生意的出現(xiàn),也恰恰映射了Token定價(jià)機(jī)制和競爭格局的深層矛盾。
因?yàn)榕cToken定價(jià)內(nèi)耗并存的,還有另一個(gè)殘酷真相:
大模型的行業(yè)競爭中,很難出現(xiàn)一家巨頭可以在全部維度上長期確定的保持絕對領(lǐng)先地位。
Claude在編程和Agent場景中口碑最強(qiáng),全球開發(fā)者社區(qū)幾乎將其視為代碼生成的基座生產(chǎn)力。
但在圖像生成領(lǐng)域,OpenAI在4月21日發(fā)布的GPT Image 2一舉登頂LM Arena所有圖像排行榜第一,以242分的領(lǐng)先優(yōu)勢創(chuàng)下該榜單有史以來最大差距,而數(shù)個(gè)月前,該領(lǐng)域的王者還是谷歌的Nano banana 2。
往前倒推兩個(gè)月,字節(jié)的Seedance 2.0于春節(jié)前橫空出世,以多模態(tài)音視頻聯(lián)合生成能力驚艷全網(wǎng);而在數(shù)學(xué)推理和科學(xué)領(lǐng)域,Gemini 3.1 Pro和DeepSeek V4又各有所長。
每個(gè)垂直能力維度上,領(lǐng)先者都在輪換。今天的王者可能三個(gè)月后就被追平,半年后就被超越。
這種"旋轉(zhuǎn)門"式的競爭格局,對用戶和投資者意味著同一件事,沒有人能通過訂閱單一模型來一勞永逸。
這也是為什么越來越多的深度AI用戶選擇同時(shí)訂閱多個(gè)模型:編程用Claude,作圖用ChatGPT,視頻用即夢,日常對話用豆包或DeepSeek,各取所長、按需切換。
Token中轉(zhuǎn)站的繁榮,正是這種多模型并行需求的產(chǎn)物:用戶需要一個(gè)統(tǒng)一入口來調(diào)用不同廠商的API,而不是被鎖定在任何一家。
對模型廠商來說,這意味著用戶忠誠度極低、遷移成本幾乎為零。Claude編程再強(qiáng),用戶也不會因此在視頻生成上容忍你的劣勢,他會直接切到Seedance。GPT作圖再好,用戶也不會因此放棄Claude的Agent能力。
每一家都在某個(gè)維度上階段性領(lǐng)先,但沒有一家能形成全面壟斷,也就沒有一家能建立起真正的定價(jià)權(quán)。
這和航空業(yè)又何其相似,每家航空公司都有自己的強(qiáng)勢航線,但乘客從來不會因?yàn)橐患夜揪€飛得好就容忍京廣線的高票價(jià),屆時(shí)他們會毫不猶豫地切換到另一家。
![]()
六.給顯卡打工,比燃料吃力
如果把視野拉遠(yuǎn)一些,Token這門生意面臨的還不只是成本、競爭格局和定價(jià)問題。
看整條價(jià)值鏈上的利潤分配就知道了。
2026年,全球科技巨頭以前所未有的速度把利潤表上的數(shù)字搬到資產(chǎn)負(fù)債表上。字節(jié)全年資本開支約1600億人民幣。谷歌 2026 年資本開支預(yù)計(jì) 1800 億至 1900 億美元,Meta 預(yù)計(jì) 1250 億至 1450 億美元。
然而這些錢最終都會流向英偉達(dá)與臺積電。
英偉達(dá)2026財(cái)年?duì)I收2159億美元,同比增長65%,GAAP毛利率高達(dá)71.1%。臺積電一季度凈利潤同比增長58.3%。ASML將2026年全年銷售預(yù)期上調(diào)至360億至400億歐元。
大模型公司燒錢買顯卡、付電費(fèi)、打Token價(jià)格戰(zhàn),英偉達(dá)和臺積電賺走了超額利潤。這和航空業(yè)一百年來的格局如出一轍,航空公司燒錢買飛機(jī)、付航油費(fèi)、打票價(jià)戰(zhàn),最后波音和空客賺走了利潤。
價(jià)值鏈上最肥的那一段,往往不屬于直接面對用戶的那一環(huán)。
更深層的問題在于"重資產(chǎn)悖論"。
即用戶越多,需要的資本開支就越大;
資本開支越大,折舊和運(yùn)營成本就越高;
激烈的競爭又限制了定價(jià)空間。
利潤被兩頭擠壓,模型越流行,資產(chǎn)負(fù)債表可能就越沉重。
市場喜歡將Token比作AI時(shí)代的燃料,這種敘事傳播度雖然很廣,但可能也低估了Token生意的困難程度。
燃料是資源品。石油、天然氣、金屬礦產(chǎn),它們有一個(gè)共同的特征:
供給側(cè)存在天然約束。
地殼里的原油儲量是有限的,OPEC可以聯(lián)手限產(chǎn)抬價(jià),一口油井的開采成本構(gòu)成了價(jià)格的硬底。
正因?yàn)楣┙o有約束,資源品的生產(chǎn)商可以在需求旺盛時(shí)享有定價(jià)權(quán),沙特阿美和必和必拓的利潤率長期維持在令人羨慕的水平。
Token恐怕并不具備這種屬性。
服務(wù)器、機(jī)房、電力、顯卡,這些生產(chǎn)Token的物理母體在理論上是長期且無限的,只要愿意投錢買更多的GPU、建更多的數(shù)據(jù)中心、拉更多的電力專線,就可以無限放大Token的產(chǎn)出,很難有自然資源或自然規(guī)則約束這個(gè)過程,需要消耗的無非是資本和電力,這兩樣?xùn)|西都是可以在市場上買到。
近年來,置身AI浪潮中的海內(nèi)外科技大廠加大算力開支蜂擁而上,更像是短期以“不能把產(chǎn)能讓給友商”為核心目標(biāo)的一種擔(dān)心掉隊(duì)的恐懼所驅(qū)動(dòng)。
但長期結(jié)構(gòu)上,Token的供給側(cè)永遠(yuǎn)無法形成類似OPEC那樣的卡特爾狀態(tài)。
在石油行業(yè),即便需求暴漲,供給擴(kuò)張也受限于勘探周期和地質(zhì)條件。在Token行業(yè),需求暴漲的信號一旦出現(xiàn),全球的科技巨頭會在幾個(gè)季度內(nèi)集體把資本開支翻倍,新的算力潮水般涌入市場。
短期內(nèi)可能出現(xiàn)算力荒,比如2026年春季OpenClaw引爆的Agent熱潮,但中期來看,只要利潤率足夠高,就會有更多資本涌入建設(shè)產(chǎn)能,然后再次把價(jià)格打下來。
這是一個(gè)典型的"高利潤吸引資本、資本消滅利潤"的循環(huán)。
石油和銅是自然地理環(huán)境所塑造的稀缺性,這顯然是Token所不具備的。
也有人將Token比作傳統(tǒng)電力,就像每一度電都需要燒煤或轉(zhuǎn)動(dòng)渦輪來即時(shí)生產(chǎn),且電力本身極難儲存和差異化。
但它實(shí)際的競爭格局恐怕還不如電力,因?yàn)楹笳咂鸫a有輸配網(wǎng)絡(luò)構(gòu)成的區(qū)域性壟斷,而Token連這一層保護(hù)都沒有,正如算力服務(wù)器在廊坊,用戶請求可以從東南亞發(fā)過來,中間沒有物理壁壘。
![]()
七.升維敘事的隱秘代價(jià)
行業(yè)里不乏樂觀者。
火山引擎總裁譚待在2025年末的FORCE原動(dòng)力大會上提出了一個(gè)有趣的觀點(diǎn):目前基于Token的商業(yè)模式還很原始。
他認(rèn)為,隨著Agent的進(jìn)步和普及,Token最終會走出"原材料"的定位,例如Agent可以將模型串聯(lián),云平臺把Token組裝成Agent,從更高抽象層次創(chuàng)造價(jià)值。"今天討論Token,是在IT預(yù)算環(huán)節(jié)考慮;抽象成Agent后,可從BPO(業(yè)務(wù)外包)角度看待,那就是在擴(kuò)大整個(gè)市場的規(guī)模了。"
譚待2026年4月進(jìn)一步表示,AI行業(yè)以未來所有Token所能創(chuàng)造的收入規(guī)模作為終局來看,當(dāng)前大概相當(dāng)于一場42公里馬拉松中"跑了一公里左右。
智譜CEO張鵬提出的則是Token Architecture Capability(TAC),即智能調(diào)用量乘以智能質(zhì)量乘以經(jīng)濟(jì)轉(zhuǎn)化效率。他在財(cái)報(bào)會上毫不諱言地將智譜定位為"中國的Anthropic",并認(rèn)為高復(fù)雜度、高可靠性的高階Token將擁有持續(xù)的定價(jià)權(quán)。
這些觀點(diǎn)都有道理。但它們本質(zhì)上在說同一件事:
賣原始的Token不賺錢,必須往上走,賣更高級的智能服務(wù)才可能賺錢。
問題是,這個(gè)升維敘事里藏著一個(gè)容易被忽略的隱秘代價(jià)。
無論服務(wù)抽象到多高的層次,Agent也好、BPO也好、數(shù)字員工也好,只要需要調(diào)用大模型來完成任務(wù),底層就必然在消耗Token。
這個(gè)生意會向客戶收取一個(gè)遠(yuǎn)高于Token成本的服務(wù)費(fèi),就像律所按小時(shí)收費(fèi)而不是按打字?jǐn)?shù)收費(fèi)一樣,可以賺取“智能溢價(jià)”。
但這里有兩個(gè)問題。
一是模型側(cè)的成本仍然是剛性的。
服務(wù)做得越多,底層消耗的Token就越多,成本隨之線性增長。一個(gè)Agent執(zhí)行一次復(fù)雜任務(wù),Token消耗量可以達(dá)到普通對話的15倍以上。如果定價(jià)不能在覆蓋成本基礎(chǔ)上保留合理利潤,生意很難長久維持。
二是溢價(jià)受制于競爭。
只要服務(wù)本身不具備獨(dú)占性的數(shù)據(jù)壁壘或網(wǎng)絡(luò)效應(yīng),競爭對手就可以用同樣的底層模型、搭建類似的Agent工作流,以更低的價(jià)格搶走客戶。從Token到Agent的升維,本質(zhì)上是從一個(gè)紅海游到另一個(gè)紅海。
真正能在升維中賺到錢的,是那些在Token消耗之上疊加了不可替代價(jià)值的人。
他們或許擁有獨(dú)占性的行業(yè)數(shù)據(jù)、或許有根深蒂固的客戶關(guān)系、或許是競爭對手難以復(fù)制的工作流集成深度。但這種護(hù)城河不是Token本身賦予的,而是要在Token之外獨(dú)立構(gòu)建的。
![]()
八.高價(jià)值≠好生意
回到文章開頭巴菲特在致股東信中開的那個(gè)地獄笑話。
航空業(yè)改變了人類的出行方式,但一百多年來,它成為一批又一批投資者的陷阱。
AI絕對會極大程度改變?nèi)祟惖墓ぷ骱蜕罘绞剑uToken這門生意,未來的命題之一,或許是如何避免重蹈航空股的覆轍。
許多時(shí)候,高價(jià)值從來不等于好生意,更不等同于股東回報(bào)。
好生意需要滿足幾個(gè)條件:邊際成本可控且能持續(xù)下降至低位,供給端存在約束或壁壘,競爭格局相對集中,擁有定價(jià)權(quán),能夠持續(xù)向股東返還超額回報(bào)。
這些條件,Token經(jīng)濟(jì)一個(gè)也不完全滿足。
它的邊際成本雖然在下降,但存在永遠(yuǎn)無法觸零的剛性底線;供給端沒有任何自然約束,資本可以無限堆疊算力來擴(kuò)張產(chǎn)出;競爭格局極度紅海,開源勢力持續(xù)攪局;定價(jià)權(quán)在漲價(jià)和降價(jià)之間劇烈搖擺;利潤大頭流向了上游芯片供應(yīng)商。即便升維到智能服務(wù)層,底層的Token成本仍然如影隨形。
在那封2007年的致股東信里,巴菲特還留了另一句話并不太出名的話:
航空業(yè)的資本消耗自萊特兄弟首飛就是無底洞。
投資者總被增長吸引,雖然他們本應(yīng)被增長嚇退。
把這句話中的"航空業(yè)"替換成"大模型",把"萊特兄弟首飛"替換成"ChatGPT3.5出圈",恐怕依然有可能成立。
Token是高價(jià)值的,它正在重塑編程、醫(yī)療、教育、金融等一切知識密集型行業(yè)。
但很多高價(jià)值的東西未必是好生意,就像電力的出現(xiàn)塑造了整個(gè)人類工業(yè)文明,但全球電力公司的平均凈利潤率也不過是個(gè)位數(shù)。
未來真正能賺到錢的,或許不是賣Token本身,而是那些在Token之上建立起獨(dú)占性壁壘的人,那些擁有不可替代的行業(yè)數(shù)據(jù)的人,那些把AI深度嵌入業(yè)務(wù)流程、使客戶遷移成本高到無法離開的人,那些站在Token之上、而不是站在Token之中的人。
但在這些業(yè)態(tài)涌現(xiàn)之前,純粹的生產(chǎn)Token很難成為一個(gè)好生意。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.