這個五一假期最大的驚嚇就是,假期的最后一天,豆包發布了收費的消息。
這個消息的意義就是,國內大模型應用,單純依靠免費換規模的階段終結了。
再說一個判斷,這個趨勢將是不可避免和無法逆轉的,而且很快會蔓延到全行業。人人為AI付費的時代到來了。
那這個趨勢最終意味著什么?以及,它和最近發布的DeepSeek V4的核心價值,有何關聯?
——導語
01
豆包收費,這事意味著什么?
肯定有很多人對豆包收費感到不滿。因為大家覺得,這次又是一次經典的先靠免費收割用戶,形成使用習慣后,再用收費來割韭菜的操作。
經典互聯網時代的操作,大家都很熟悉了。
不能說這種看法全無道理,但這里,我雖然不是替豆包辯解,但我也不認為豆包應該被批評。
因為這件事的底層邏輯就是,免費模式的大旗,豆包不愿意扛了,也沒有必要扛了。
注意,不愿意扛,和扛不住,是兩個概念。
截至2026年第一季度,豆包的月活用戶為3.45億,這是第三方數據。
![]()
這個數字很漂亮。但背后冰冷的事實就是,如按2026年3月的這個統計口徑,豆包日均Token使用量突破120萬億,相比其2024年5月首次推出時,增長超過1000倍。
據測算,如果豆包繼續免費,一年的成本在37-45億元之間。請注意,這個測算是基于3月份的用戶數據,而現在已經是5月了。
也許你會問,相對于2025年字節650億人民幣左右的凈利潤,三四十億的成本就是個零頭,字節完全扛得住啊,為啥要收費?
但問題是,人家豆包的帳不是這么算的:
第一筆賬,三四十億,只是表面成本。
嚴格說,這里面只包含了模型研發迭代的成本和用戶的消耗。而且,這只是一個今年3月的靜態數字。
現在有兩個趨勢很明顯。一個是,用戶使用AI的深度越來越深,很多人把AI已經嵌入了自己的工作流、生活場景。另一個是,個體使用AI的時長不斷提升。
加之,現在大模型競爭壓力、迭代壓力越來越大,研發費用的投入只會越來越大。
所以,“三四十億”這個數字,在6個月內飚過100億,是眼前就能看到的。
到時候還免費嗎?
第二筆賬,是你看不到的背后成本。
大家都承認豆包反應很快、輸出很流暢,覆蓋生活需求完全沒問題。但有沒有想到,為了提供這些能力,字節做的基礎設施建設,可是非常耗費金錢的。公開的數據顯示,字節2025年全年資本支出約1500億人民幣,其中大部分投向來AI基礎設施;2026年的預算更激進:資本支出預算約1600億人民幣,其中850億人民幣專門用于AI芯片采購。
這才是免費模式給字節壓力越來越大的底層原因。
第三筆賬:字節不是第一個吃螃蟹的。
在此之前,不管是海外的ChatGPT、Gemini、Claude等模型都實現了訂閱,國內的頭部模型如Kimi(49元/月)、智譜(49元/月)也都開始了收費。
字節有必要做一個"不合群"的免費者嗎?沒必要。而且,既然它想收,就一定收得上來。那么,干嘛不收呢?
順便做個預測,目前頭部大模型企業,特別是巨頭,比如千問、百度、元寶,只要在牌桌上的,只要提供全民免費服務的,陸續都會開啟收費模式。這絕對不是我故作驚人語。
![]()
02
豆包收費,和DeepSeek有啥關系?
豆包收費咋和DeepSeek V4扯上關系了呢?
很簡單,DeepSeek V4代表著這樣一種路線——它沒法單槍匹馬阻止AI收費時代的到來,但它可以降低或延遲我們為AI付費的“痛”。
一個大家喜歡討論的問題是,為什么在這次模型性能不算驚艷的情況下,很多人仍說DeepSeek V4是國運級產品?
我認為,這主要是它帶來了AI的成本革命,并且在這條路上走的更遠了。
V4上線才兩天,直接兩輪連環降價。先全系輸入緩存命中價格砍到首發價的十分之一,再給Pro版本打了個2.5折。結果就是,V4-Flash的百萬Token緩存命中輸入,硬生生壓到人民幣兩分錢。
![]()
它終于讓大規模跑Agent這件事,從"用不起"變成了"隨便跑"。
但便宜,不等于是廉價。降本,靠的其實是DeepSeek的技術領先。V4-Pro處理百萬Token的推理算力,只有上一代的27%。最核心的MoE架構,總參數1.6萬億,每推理一次只激活1.6萬億參數里的3%(約490億參數),單次算力需求砍掉了97%。
我舉個例子,大模型就像一個有一萬盞燈泡的體育場。以往,哪怕場里只有你一個人,為了給你照亮,它可能就要亮起幾百盞甚至幾千盞燈。
DeepSeek做的就是智能化的燈光管理。如果照亮你只需要3盞燈,那剩下9997盞就不會亮起。它追求的是滿足你的需求的前提下,用極致的智能來實現成本的最優。
我們算個細賬。目前,在同等百萬Token基準下對比:Claude Opus 4.7僅輸入就高達5美元,輸出另算25美元;而DeepSeek V4-Flash疊加緩存命中后的價格低至0.02元/百萬Token——按匯率不那么嚴格的換算,這個差距意味著:在緩存命中時,V4-Flash的成本可以壓到Claude Opus 4.7的兩千分之一。
這意味著什么?意味著即使AI全面收費時代到來,你仍然可以用一個相對合理的成本使用AI。而使用AI,是未來每個個人的基本競爭力,也是國家的競爭力。
還有一點極為重要的是,DeepSeek V4是在國產硬件上跑起來的。
告訴大家一個行情信息,由于供不應求,英偉達H100一年期GPU租賃合同價格,已經從2025年10月的每GPU每小時1.70美元的低點飆升至2026年3月的每GPU每小時2.35美元,漲幅近40%。
但與此同時,V4首發即適配華為昇騰超節點全系產品,昇騰950超節點計劃也在2026年Q4批量上市,實現8192卡規模組網,FP8精度下算力達到8 EFLOPS,訓練性能較上一代提升17倍,推理性能提升26.5倍。
換言之,DeepSeek不僅用技術在降本,也在生態上通過部署國產硬件在降本。能夠做到這兩頭一起用力極致壓縮成本的,目前DeepSeek是絕對的領先。
未來的AI就是數字時代的基礎設施。而基礎設施只有足夠大、足夠多,才能產生社會效益,而大的前提,又是必須做到足夠便宜。所以,給V4一個國運級的評價,一點都不為過。
03
AI的人人付費時代終將到來,但可能沒有你想的那么可怕
最近有一種悲觀的論調,認為將來人們會分為"用得起收費AI"和"用不起收費AI"兩個群體,它們之間的競爭力會越拉越遠。
這個結論放到兩個個體的對比上或許成立,但放大到社會層面,我認為不太可能。
當互聯網開始普及時,早期網民最大的開支確實是網費;移動互聯網時代,早期的流量費也是讓人心驚肉跳。
但今天還有人會為每個月百來塊的網費或者幾十塊的流量套餐叫苦嗎?不會,因為網絡建設的早期成本已經攤薄殆盡,用戶規模反而大了幾十倍、幾百倍,所以運營商有足夠的降價空間和利潤空間。
我認為,未來我們甚至會忘記互聯網這個概念,只有云側和端側。
你未來所使用的一切數字服務,本質都是AI服務,都是Token經濟,你使用的每一項功能,每一個操作,每一個行為,都是AI在調度、在服務、在網線上流淌、在端側運行。
![]()
在那個時代到來時,基礎的、免費的AI服務的水準,會比現在的付費高級會員高很多,但價格基本會降到今天電話費、寬帶費的標準。而你真正需要付費的可能是一些極高水準的AI能力,是那些深入嵌套在你的工作流、生活場景里的剛需性通用人工智能頂級能力。
這一切都會在未來的十年到二十年里陸續到來。這不是一個幻覺——人們已經總結出了一些規律,如清華大學團隊發表在Nature Machine Intelligence上的研究就提出了"模型密度定律”——大模型的智能密度每100天提升一倍。
這意味著什么?同等能力的模型,在3.3個月后僅需要一半的參數就能實現。
簡單說,它將和硬件側的摩爾定律一起,為我們畫出一條AI性能持續提升但成本持續下降的可預期曲線。
實證數據已經擺在那里——GPT-3.5級別的模型API價格,在20個月內下降了266.7倍,但它依然有人在用。未來人們用AI會越來越務實,不是追求頂級模型的頂級版本,而是自然適配按需使用。
所以,我的總結是,付費時代沒什么好怕的。如果真正要怕什么,那可怕的是——付費了卻得不到應有的進步——那才是真割韭菜。
結語
豆包用自己的行為證明了,大模型的C端付費時代已經開啟。
DeepSeek則用V4證明了,我們可以用國產的硬件,提供極具競爭力的AI能力。
DeepSeek官方發布V4的文章最后引了一句《荀子》的話,"不誘于譽,不恐于誹,率道而行,端然正己。"
它的意思是,不被贊譽收買,不被非議嚇退,沿著自己認定的路走,端正地做好自己。
這句話,放在今天這個時間點,再讀一遍,份量完全不同。它就是中國AI產業該走的那條路。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.