1
Anthropic禁止訂閱用戶(hù)通過(guò)龍蝦等第三方工具接入后,小米大模型團(tuán)隊(duì)負(fù)責(zé)人羅福莉凌晨發(fā)了篇帖子討論這事。
![]()
主要內(nèi)容可以概括為兩點(diǎn)。
第一,A社的做法雖然會(huì)短期推高使用成本,如果用戶(hù)繼續(xù)使用Claude模型,但長(zhǎng)期來(lái)看會(huì)帶來(lái)很好的工程紀(jì)律。
工程紀(jì)律的意思是,社區(qū)會(huì)因?yàn)槟P统杀旧仙陂_(kāi)發(fā)產(chǎn)品時(shí)做更合理的工程優(yōu)化來(lái)提升token的使用效率。
這里她點(diǎn)名批評(píng)了龍蝦,上下文管理做得很拉胯,一個(gè)用戶(hù)請(qǐng)求會(huì)觸發(fā)多輪工具調(diào)用,每次都是攜帶長(zhǎng)上下文的獨(dú)立API請(qǐng)求。
第二,她呼吁模型廠商不要打價(jià)格戰(zhàn),不要靠低價(jià)吸引用戶(hù)入坑后,又用縮水的模型和不穩(wěn)定的服務(wù)去損害體驗(yàn)。
我們前兩天寫(xiě)了篇文章,《小米這次也沒(méi)把價(jià)格打下來(lái)》,其中提到MiMo Token Plan目前價(jià)格相對(duì)其他廠商同等套餐偏貴。
羅福莉沒(méi)有直接承認(rèn)這點(diǎn),但間接回答了這個(gè)問(wèn)題:小米的目標(biāo)是“長(zhǎng)期穩(wěn)定地交付高質(zhì)量的模型和服務(wù) —— 而不是讓你沖動(dòng)付款,然后棄船。”
我們之前文章里提到,MiMo套餐偏貴的事實(shí)其實(shí)跟小米給大眾的主流印象是有差距的,畢竟觀眾更熟悉性?xún)r(jià)比敘事。
但這也不是小米搞AI后就變了,小米這個(gè)定價(jià)肯定也談不上賺錢(qián),只是在其他選手虧損搞token傾銷(xiāo)的時(shí)候,選擇了更貼近成本的定價(jià)策略。
token傾銷(xiāo)這個(gè)詞可能有點(diǎn)重,因?yàn)橐且缘陀诔杀臼圪u(mài)AI服務(wù)這個(gè)標(biāo)準(zhǔn)看,目前行業(yè)里基本沒(méi)誰(shuí)能逃得過(guò)。
但有些玩家定價(jià)的確相當(dāng)激進(jìn),低價(jià)吸引用戶(hù)過(guò)來(lái)后保證不了體驗(yàn),比如我就遇到過(guò)某家套餐服務(wù)卡頓甚至不可用的情況。
大模型跟其他傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品不同。傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品邊際成本可以不計(jì),用戶(hù)翻倍成本增加很少。大模型產(chǎn)品成本跟用戶(hù)規(guī)模比例擴(kuò)張。
而且還因?yàn)槭欠菢?biāo)品,廠商很容易在背后做手腳,稍微降點(diǎn)智用戶(hù)不容易察覺(jué),察覺(jué)到也沒(méi)有實(shí)際證據(jù)。
當(dāng)然,即便存在這些一些問(wèn)題,我仍然認(rèn)為模型廠商價(jià)格戰(zhàn)是利大于弊的,是雙贏的局面。
用戶(hù)客觀上因?yàn)閮r(jià)格戰(zhàn)得到了便宜,這是加速新技術(shù)采納的決定性因素。
DeepSeek去年的模型并沒(méi)有在能力上超過(guò)GPT或者Claude,但R1的意義仍然沒(méi)有被高估,因?yàn)榘殉杀窘档蛶资秾?duì)技術(shù)普及的促進(jìn)必然強(qiáng)于某個(gè)增量SOTA模型。
至于虧錢(qián)賣(mài)token不可持續(xù),我只能說(shuō)不是現(xiàn)階段二線廠商配考慮的問(wèn)題。
Anthropic模型能力頂尖,產(chǎn)品體驗(yàn)差異化,所以哪怕經(jīng)常封號(hào)拔網(wǎng)線也一堆用戶(hù)求著交錢(qián)。
彭博上個(gè)月報(bào)道,Anthropic當(dāng)時(shí)年化收入已經(jīng)達(dá)到200億美元,相比去年底翻倍還多,這個(gè)夸張的增長(zhǎng)速度隱隱有取OpenAI而代之的意思了。
但二線廠商之間模型能力并沒(méi)有拉開(kāi)差距,不同廠商輪流領(lǐng)先,性?xún)r(jià)比是不得不走的路子。
羅福莉評(píng)價(jià)是對(duì)的,龍蝦就是vibe coding出來(lái)的一堆屎山。
因?yàn)槭鞘荷剑运鼪](méi)有架構(gòu)設(shè)計(jì),沒(méi)有工程優(yōu)化,天生就浪費(fèi)效率。
但它能火起來(lái),能讓一堆專(zhuān)業(yè)的非專(zhuān)業(yè)的用戶(hù)愿意用,就已經(jīng)算是功德無(wú)量了。
所有二線廠商都應(yīng)該給龍蝦磕一個(gè),我很難想象沒(méi)有龍蝦他們得多努力才能證明自己的價(jià)值。
這是OpenRouter上不同模型的使用統(tǒng)計(jì)
![]()
在龍蝦火爆之前,你在這個(gè)排行里根本看不到二線模型廠商,除了硅谷御四家,其余全是others。
但現(xiàn)在排行榜前幾名,已經(jīng)被阿里、小米、階躍星辰的模型占滿(mǎn)了。
![]()
話(huà)說(shuō)新模型出來(lái),免費(fèi)放OpenRouter上吸引大家用一用,已經(jīng)成為國(guó)內(nèi)廠商的慣例。OpenRouter現(xiàn)在已經(jīng)淪為PR前沿陣地。
這兩天阿里發(fā)布Qwen3.6,宣傳登上OpenRouter排行榜首。小米MiMo之前也宣傳登頂了OpenRouter。都是免費(fèi)試用。
某種程度上說(shuō),龍蝦耗token甚至可以理解成是feature。
大模型研發(fā)門(mén)檻很高,但大模型供給一直以來(lái)都是不稀缺的,因?yàn)橛脩?hù)不需要那么多模型。龍蝦把性?xún)r(jià)比放大成了真正的競(jìng)爭(zhēng)力。
簡(jiǎn)單拉下數(shù)據(jù)。MiniMax去年總收入7900萬(wàn)美元,龍蝦爆火后2月ARR已超1.5億美元。月之暗面發(fā)布K2.5模型后,不到20天收入超去年全年,且海外收入首次超過(guò)國(guó)內(nèi)。
AI的確在推動(dòng)各個(gè)產(chǎn)業(yè)發(fā)生變革,不過(guò)就AI自身而言,至今為止都還沒(méi)有跑通獨(dú)立的盈利模式。OpenAI和Anthropic收入在快速增長(zhǎng),但能否覆蓋巨額研發(fā)和資本支出仍有疑問(wèn)。
至于智譜、MiniMax和月之暗面?zhèn)儯嚯x閉環(huán)的商業(yè)模式就更為遙遠(yuǎn)了。
這種情況下,敘事成為生存的要義。敘事不能只靠畫(huà)餅,模型廠商的第一性原理就是模型得有人用。
沒(méi)人用,敘事就崩塌了。有人用,越來(lái)越多人用,敘事才會(huì)變得圓滿(mǎn)。
去年底,月之暗面估值43億美元,現(xiàn)在正以180億美元尋求融資,翻了四倍不止。智譜今天收盤(pán)780港幣,是1月份IPO發(fā)行價(jià)116港幣的6.7倍。MiniMax的IPO發(fā)行價(jià)是165港幣,現(xiàn)在股價(jià)是950,也是翻了快6倍。
不能只算token賬。
2
二線模型廠商在成本和規(guī)模壓力下,已經(jīng)有提價(jià)動(dòng)作。但這暫時(shí)不會(huì)達(dá)到擺脫價(jià)格戰(zhàn)的地步。
小米的處境比較特殊,它有自己完整的產(chǎn)品矩陣和硬件生態(tài),MiMo的第一使命是融入并改造這個(gè)現(xiàn)有生態(tài)。哪怕不對(duì)外賣(mài)token,小愛(ài)同學(xué)、智能手機(jī)、小米汽車(chē)、IoT設(shè)備生態(tài),MiMo都能有大有作為的空間。
智譜、MiniMax、月之暗面?zhèn)儎t處在另一個(gè)處境。它們有C端產(chǎn)品,但這個(gè)賽道競(jìng)爭(zhēng)極其慘烈。目前看來(lái)獨(dú)立的AI產(chǎn)品,無(wú)論是通用助手,還是細(xì)分賽道,字節(jié)、騰訊和阿里都有碾壓性的優(yōu)勢(shì),也有爭(zhēng)奪的意志。
相較之下,API賣(mài)token的生意看起來(lái)好一些,雖然好得有限。因?yàn)檫@只關(guān)乎模型質(zhì)量,而騰訊和Meta的經(jīng)驗(yàn)表明,模型研發(fā)不只是錢(qián)和資源的因素。
但龍蝦窗口期不會(huì)無(wú)限延續(xù)。
如果龍蝦只是一陣風(fēng),過(guò)段時(shí)間隨風(fēng)而逝,那自然二線廠商也就不能指望這個(gè)出貨渠道了。
如果龍蝦代表的不是一個(gè)工具的短暫流行,而是C端AI產(chǎn)品的一種范式,那大科技公司一定會(huì)出手。
這些公司有流量、有分發(fā)、有用戶(hù)信任,它們會(huì)以自己的競(jìng)品收割市場(chǎng),并且會(huì)優(yōu)先使用自己訓(xùn)練的模型,而不是采購(gòu)二線廠商的API。
模型跟產(chǎn)品的結(jié)合是大趨勢(shì)。阿里打通千問(wèn)App跟通義模型研發(fā)團(tuán)隊(duì),搞出了組織調(diào)整和人事出走風(fēng)波。姚順雨入職騰訊,也是首先做團(tuán)隊(duì)整合,不同研發(fā)部門(mén)之間的整合以及研發(fā)跟產(chǎn)品的整合。
羅福莉批評(píng)龍蝦耗token,提到Claude Code更節(jié)省上下文的工程設(shè)計(jì),這是另一個(gè)產(chǎn)品需要跟模型打通的案例。
龍蝦架構(gòu)上的天然缺陷,意味著每次工具調(diào)用都攜帶完整的長(zhǎng)上下文發(fā)起獨(dú)立請(qǐng)求,用戶(hù)的一個(gè)操作可能在后臺(tái)觸發(fā)十幾輪API調(diào)用。這不僅燒token,也制造延遲,制造不穩(wěn)定。
Claude Code對(duì)上下文做精細(xì)管理,知道什么時(shí)候該壓縮歷史,什么時(shí)候該截?cái)啵趺丛诒A羧蝿?wù)狀態(tài)的同時(shí)減少冗余信息的傳遞。
這背后是Anthropic對(duì)自己模型能力邊界的深刻理解。只有模型研發(fā)者,才能把產(chǎn)品和模型調(diào)優(yōu)成渾然一體的東西。
AI產(chǎn)品的第一代范式是,模型作為通用API,產(chǎn)品套在外面。這個(gè)范式催生了龍蝦,也催生了無(wú)數(shù)套殼應(yīng)用。它降低了創(chuàng)業(yè)門(mén)檻,但也帶來(lái)了巨大的效率浪費(fèi)。產(chǎn)品不理解模型,模型不適配產(chǎn)品,兩邊都在用蠻力彌補(bǔ)彼此的信息差。
如今第二代范式正在浮現(xiàn):模型與產(chǎn)品深度整合,從架構(gòu)層面共同設(shè)計(jì)。Claude Code是一個(gè)樣本:模型不再是被調(diào)用的服務(wù),而是產(chǎn)品本身的一部分。
這個(gè)趨勢(shì)下,純粹的模型API廠商面臨的壓力會(huì)越來(lái)越大,沒(méi)有產(chǎn)品可能成為它們的致命缺陷。如果競(jìng)爭(zhēng)力來(lái)自模型與應(yīng)用層的深度整合,那API層的價(jià)格競(jìng)爭(zhēng)就是一場(chǎng)慢性消耗。
行業(yè)一直喜歡說(shuō)模型即產(chǎn)品,用這句話(huà)強(qiáng)調(diào)模型的基礎(chǔ)作用和重要性沒(méi)問(wèn)題。但除非你的商業(yè)模式是只賣(mài)API,否則模型始終是產(chǎn)品的組成部分,而不是產(chǎn)品的全部。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.