![]()
梁文鋒又出手了,而且還是二連降價。
4月25日,DeepSeek-V4-Pro開啟限時2.5折優惠,輸入價格(緩存命中)降至0.25元/百萬tokens。
業內還沒反應過來呢,結果4月26日晚間,DeepSeek就再次降價。
全系API輸入緩存命中價格直接降至首發價的1/10。
疊加限時折扣后,V4-Pro的緩存輸入低至0.025元/百萬tokens, V4-Flash降至0.02元/百萬tokens,創下全球大模型價格新低。
![]()
這是個什么概念呢?
上海譯文出版的《挪威的森林》,全書約20萬字。將整本書命中緩存后喂給DeepSeek-V4-Pro,那么其總成本不到1分錢。
DeepSeek這次降的,不只是token的單價。它是把“長文本、長代碼、長知識庫”這些原本最燒錢的AI應用場景,全都打入了價格的谷底。
01
摸著DeepSeek過河
DeepSeek兩天兩降,這不是簡單的價格戰。
先用限時折扣測試市場承受力和服務器負載,緊接著對緩存命中這一高頻場景實施永久性降價。尤其是對于RAG知識庫、智能客服、文檔分析等緩存命中率超過60%的應用場景,成本可以直接下降90%以上。
DeepSeek研究員陳德里在社交媒體上確認,輸入緩存降價是永久性的,并打上了“AGI for Everyone”的標簽。
雖然說國內所有AI公司,幾乎都是摸著DeepSeek過河,但DeepSeek這波降價之后,卻并非所有人都擔心。
尤其是大廠,他們壓根不在乎DeepSeek降價。
這是因為,大廠賣API的本質,是賣背后的一整套服務。大模型API只是用來引流的,真正賺錢的是背后的計算、存儲、數據庫等云服務。
![]()
以阿里云為例,4月15日算力卡漲5%-34%、存儲漲30%,但同時又愿意代理DeepSeek。關鍵點就在于,即便是客戶使用DeepSeek,他們依然離不開阿里云的算力和存儲。
阿里、騰訊、字節這些AI大廠,他們靠的是生態和平臺賺錢。
真正難受的是智譜、MiniMax和月之暗面這樣的中間層。
智譜AI在4個月里已經連續三次漲價。2月代碼訂閱套餐上調30%,3月旗艦API上調20%,4月8日再次上調10%,累計漲幅83%。調價后,GLM系列編程場景緩存命中Token單價已接近Claude Sonnet 4.6的水平。
智譜CEO張鵬的解釋只有一句話:“瓶頸在算力,不在客戶。”
在首份財報中,智譜公開了自己的商業邏輯公式:AGI商業價值=智能上限×Token消耗規模。
對于智譜這個上市公司來說,算力是稀缺資源。智譜的API年化收入(ARR)在過去12個月暴漲60倍至17億元,Token調用量在價格上漲83%的背景下仍增長400%。
問題不是客戶不愿意付錢,而是現有算力已經接近滿載,繼續低價只會讓服務質量下降。與其通過價格戰搶來大量低價值客戶,不如提高價格篩選出高價值客戶,把有限的算力用在刀刃上。
月之暗面和MiniMax的特點是量大便宜,當DeepSeek把API價格打到這么低,這兩家或多或少都會有些難堪。
但月之暗面的K 2.6以及MiniMax即將發布的M3模型,性能都要高于DeepSeek-V4-Pro。他們在客戶群體上可能會和DeepSeek有交集,但很難形成全面沖突。
促使DeepSeek降價的原因或許來自于融資,此前DeepSeek曾傳出100億美元估值,如今隨著阿里、騰訊入局,估值進一步拉高至200億美元。
估值拉高以后,融的金額也就多了,同時梁文鋒也需要用市場、收入來證明DeepSeek達到估值所對應的高度。
所以即便DeepSeek是在賠本賺吆喝,也并不會讓人感到非常意外。
對于上市公司來說,API就是核心收入,壓低API價格就等于降低毛利。
更關鍵的是,如果承認“我們也要降價才能競爭”,就等于承認“我們沒有技術護城河”。但如果堅持高價,又必須拿出足夠有說服力的差異化價值。
DeepSeek降價的本質是他們找到了對應的客戶。
梁文鋒不需要DeepSeek有最強的性能。
無論是企業客戶還是個人客戶,模型的性能和使用體驗之間有一道鴻溝。模型的性能跑分是它的上限,但是我們只需要我們能用到的部分。
只要有足夠多的開發者和企業知道“還有這么便宜的選擇”,整個行業的定價體系就會被重構。就像當年小米手機對智能手機市場的沖擊一樣,不是銷量第一,但改變了所有人對“合理價格”的預期。
而且梁文鋒也意識到一個問題,那就是AI就是基礎設施,就和柴米油鹽是一樣的,那么價格戰就變得在所難免,最終,AI也會像云計算一樣走向“規模經濟+薄利多銷”。
在這個邏輯下,誰的成本結構更優、誰的技術迭代更快、誰能更早實現規模效應,誰就能活到最后。
02
DeepSeek給國產AI芯片替代講故事
更關鍵的是,DeepSeek已經適配華為昇騰生態。
DeepSeek官方透露,目前Pro版本的服務吞吐受限于高端算力,預計下半年昇騰950超節點批量上市后,Pro的價格還將大幅下調。
所以這次價格下降,還只是預告而已。
昇騰950超節點通過集群方案彌補了單卡制程差距。
單顆昇騰910C芯片的BF16性能僅為英偉達Blackwell單芯片的約三分之一,但通過超節點集群方式,單個CloudMatrix 384集群的BF16總性能反而是NVL72的1.7倍,總內存容量為后者3.6倍,總內存帶寬為后者2.1倍。
![]()
這還只是算力的方面,考慮硬件成本,事情就會更有意思。
華為昇騰950PR的定價約7萬元人民幣,英偉達同級別H200約合人民幣25萬元。根據英偉達AI在X上發布的信息,DeepSeek的確可以部署在英偉達Blackwell架構芯片上,不過這個成本更高,約為40萬元人民幣。
如果我們按FP8精度來算,昇騰950PR是7萬元/PFLOPS,英偉達H200是6.31萬元/PFLOPS。昇騰950PR畢竟是一張推理卡,如果我們按照推理專用的FP4精度來算,昇騰950PR是4.49萬元/PFLOPS,英偉達B200是4.44萬元/PFLOPS。
DeepSeek這次降價,砍在了緩存命中的價格上。
這個場景的特點是,模型不用每次重新理解全部上下文,大量重復輸入可以復用,壓力主要集中在推理吞吐、顯存/內存帶寬、調度和緩存管理上。
換句話說,它不是最依賴“單卡訓練峰值”的場景,而是更適合通過國產芯片集群、工程優化和規模化調度來攤薄成本的場景。
那么我們如果把單卡的性價比優勢放到大規模集群部署里,結果又會如何呢?
以100卡集群為例,國內常用的英偉達H20方案裸卡成本為1000萬,13臺服務器主機286萬,加上機柜等,總價約為不到1500萬元。同規模華為昇騰950PR的方案約為1000萬出頭。
昇騰950PR的單卡功耗(600W)比H20(350W)高,但單位算力功耗低65%,相同算力下對電力和制冷的需求大幅降低,基建投入顯著減少。
并且,1張昇騰950PR的推理吞吐量約等于2.2-2.8張H20。這就導致實際上昇騰方案可能要比英偉達H20的方案節省60%到70%。
而大模型的API價格,很大程度上取決于硬件成本。那么DeepSeek打折,也很可能帶動一波國產AI芯片銷量。
連DeepSeek都開始大規模使用國產芯片,整個產業鏈就會被激活。云廠商會增加國產芯片的采購,芯片廠商會加大研發投入,開發者會適配國產生態。
華為昇騰、寒武紀、海光信息、摩爾線程、沐曦股份、昆侖芯、平頭哥真武、天數智芯8家國產AI芯片品牌在DeepSeek-V4發布當天就完成了適配。
在DeepSeek-V4發布當天,AI算力芯片板塊股價大漲。在A股,海光信息以8.2%的增幅領漲、寒武紀增幅為2.23%,在港股,天數智芯的漲幅達到9.54%。
這是一個正向循環。
當然,這并不意味著國產算力已經全面替代英偉達。訓練側仍然更依賴高端GPU、成熟軟件棧和大規模集群經驗DeepSeek真正走通的路徑,可能不是“一夜之間替代英偉達”,而是先在推理側、緩存場景、長文本應用里,把國產算力的性價比優勢釋放出來。
芯片只是第一層。
真正決定國產算力能不能吃下這波需求的,是軟件生態。模型能不能穩定跑在昇騰上,推理框架能不能適配,算子有沒有優化,開發者遷移成本有多高,才決定了這條路是“能演示”,還是“能商業化”。
DeepSeek的價值在于,它不是一家邊緣模型廠商做適配,而是一個頭部模型親自把流量和需求帶進國產算力生態。
03
梁文鋒仍然需要給DeepSeek找商業模式
梁文鋒真正的殺招不在于“便宜”,而在于“定價”。
梁文鋒在用DeepSeek的影響力,讓市場形成一個新的認知:“如果DeepSeek這個級別的模型已經能做到這個價,別家為什么還要賣這么貴?”
一旦這個錨點形成,其他廠商就陷入了兩難。跟價,利潤空間被壓縮;不跟,就必須向客戶解釋“我貴在哪里”。
梁文鋒曾在2024年表示:“我們只是按照自己的步調來做事,然后核算成本定價。我們的原則是不貼錢,也不賺取暴利。這個價格也是在成本之上稍微有點利潤。我們降價一方面是因為我們在探索下一代模型的結構中,成本先降下來了,另一方面也覺得無論API,還是AI,都應該是普惠的、人人可以用得起的東西。”
他認為,只有讓AI真正普惠,才能激發出足夠大的應用市場。也只有應用市場足夠大,技術迭代的飛輪才能真正轉起來。
![]()
便宜可以打開市場,但便宜本身不是商業模式。
DeepSeek不能一輩子靠超低API價格活著。
API價格打到這個程度,短期內可以制造影響力,吸引客戶,不過它很難成為一家長期公司的全部收入來源。
尤其是大模型推理本身仍然消耗算力、電力、帶寬和運維,價格越低,調用量越大,對基礎設施的壓力也越大。
低價可以是入口,卻不應該成為終點。
DeepSeek的目標,是成為中國AI開發者的“默認底座”。
只要足夠多的應用和agent以DeepSeek作為基座模型開發,那么DeepSeek就掌握了入口。
API收入只是第一層,模型標準、開發者生態、企業部署、算力適配、云廠商合作,才是梁文鋒想要的商業化空間。
DeepSeek更大的商業化機會,可能在企業私有化部署。
對于金融、政務、制造、能源這些行業來說,價格不是唯一問題,數據安全可控才是核心問題。
它們未必會長期使用公共API,但會愿意為一套能部署在自己機房、自己云環境里的模型系統付費。
梁文鋒可以把開源模型作為入口,把企業級部署、調優、運維、安全、權限管理、知識庫接入變成真正的收費服務。
如果DeepSeek長期只停留在模型層,它仍然會被卷入無休止的價格戰。模型能力會被追趕,API價格會繼續下降,開發者也會在不同模型之間切換。
真正能提高商業化上限的,是應用層產品,比如agent和CLI。
所以我始終認為,DeepSeek的低價API,應該不是梁文鋒心里所想的商業化答案,更像是一個入口。
它先用價格打穿市場,再用開源建立生態,再用企業服務、私有化部署、云廠商合作和應用產品去承接價值。
這才能把“底座”的價值最大化。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.