網易首頁 > 網易號 > 正文申請入駐

20萬字不到1分錢，梁文鋒把token價格打骨折了

2026-04-28 12:31:44　來源: 字母榜

北京舉報

分享至

梁文鋒又出手了，而且還是二連降價。

4月25日，DeepSeek-V4-Pro開啟限時2.5折優惠，輸入價格（緩存命中）降至0.25元/百萬tokens。

業內還沒反應過來呢，結果4月26日晚間，DeepSeek就再次降價。

全系API輸入緩存命中價格直接降至首發價的1/10。

疊加限時折扣后，V4-Pro的緩存輸入低至0.025元/百萬tokens, V4-Flash降至0.02元/百萬tokens，創下全球大模型價格新低。

這是個什么概念呢？

上海譯文出版的《挪威的森林》，全書約20萬字。將整本書命中緩存后喂給DeepSeek-V4-Pro，那么其總成本不到1分錢。

DeepSeek這次降的，不只是token的單價。它是把“長文本、長代碼、長知識庫”這些原本最燒錢的AI應用場景，全都打入了價格的谷底。

摸著DeepSeek過河

DeepSeek兩天兩降，這不是簡單的價格戰。

先用限時折扣測試市場承受力和服務器負載，緊接著對緩存命中這一高頻場景實施永久性降價。尤其是對于RAG知識庫、智能客服、文檔分析等緩存命中率超過60%的應用場景，成本可以直接下降90%以上。

DeepSeek研究員陳德里在社交媒體上確認，輸入緩存降價是永久性的，并打上了“AGI for Everyone”的標簽。

雖然說國內所有AI公司，幾乎都是摸著DeepSeek過河，但DeepSeek這波降價之后，卻并非所有人都擔心。

尤其是大廠，他們壓根不在乎DeepSeek降價。

這是因為，大廠賣API的本質，是賣背后的一整套服務。大模型API只是用來引流的，真正賺錢的是背后的計算、存儲、數據庫等云服務。

以阿里云為例，4月15日算力卡漲5%-34%、存儲漲30%，但同時又愿意代理DeepSeek。關鍵點就在于，即便是客戶使用DeepSeek，他們依然離不開阿里云的算力和存儲。

阿里、騰訊、字節這些AI大廠，他們靠的是生態和平臺賺錢。

真正難受的是智譜、MiniMax和月之暗面這樣的中間層。

智譜AI在4個月里已經連續三次漲價。2月代碼訂閱套餐上調30%,3月旗艦API上調20%,4月8日再次上調10%，累計漲幅83%。調價后，GLM系列編程場景緩存命中Token單價已接近Claude Sonnet 4.6的水平。

智譜CEO張鵬的解釋只有一句話：“瓶頸在算力，不在客戶。”

在首份財報中，智譜公開了自己的商業邏輯公式：AGI商業價值=智能上限×Token消耗規模。

對于智譜這個上市公司來說，算力是稀缺資源。智譜的API年化收入（ARR）在過去12個月暴漲60倍至17億元，Token調用量在價格上漲83%的背景下仍增長400%。

問題不是客戶不愿意付錢，而是現有算力已經接近滿載，繼續低價只會讓服務質量下降。與其通過價格戰搶來大量低價值客戶，不如提高價格篩選出高價值客戶，把有限的算力用在刀刃上。

月之暗面和MiniMax的特點是量大便宜，當DeepSeek把API價格打到這么低，這兩家或多或少都會有些難堪。

但月之暗面的K 2.6以及MiniMax即將發布的M3模型，性能都要高于DeepSeek-V4-Pro。他們在客戶群體上可能會和DeepSeek有交集，但很難形成全面沖突。

促使DeepSeek降價的原因或許來自于融資，此前DeepSeek曾傳出100億美元估值，如今隨著阿里、騰訊入局，估值進一步拉高至200億美元。

估值拉高以后，融的金額也就多了，同時梁文鋒也需要用市場、收入來證明DeepSeek達到估值所對應的高度。

所以即便DeepSeek是在賠本賺吆喝，也并不會讓人感到非常意外。

對于上市公司來說，API就是核心收入，壓低API價格就等于降低毛利。

更關鍵的是，如果承認“我們也要降價才能競爭”，就等于承認“我們沒有技術護城河”。但如果堅持高價，又必須拿出足夠有說服力的差異化價值。

DeepSeek降價的本質是他們找到了對應的客戶。

梁文鋒不需要DeepSeek有最強的性能。

無論是企業客戶還是個人客戶，模型的性能和使用體驗之間有一道鴻溝。模型的性能跑分是它的上限，但是我們只需要我們能用到的部分。

只要有足夠多的開發者和企業知道“還有這么便宜的選擇”，整個行業的定價體系就會被重構。就像當年小米手機對智能手機市場的沖擊一樣，不是銷量第一，但改變了所有人對“合理價格”的預期。

而且梁文鋒也意識到一個問題，那就是AI就是基礎設施，就和柴米油鹽是一樣的，那么價格戰就變得在所難免，最終，AI也會像云計算一樣走向“規模經濟+薄利多銷”。

在這個邏輯下，誰的成本結構更優、誰的技術迭代更快、誰能更早實現規模效應，誰就能活到最后。

DeepSeek給國產AI芯片替代講故事

更關鍵的是，DeepSeek已經適配華為昇騰生態。

DeepSeek官方透露，目前Pro版本的服務吞吐受限于高端算力，預計下半年昇騰950超節點批量上市后，Pro的價格還將大幅下調。

所以這次價格下降，還只是預告而已。

昇騰950超節點通過集群方案彌補了單卡制程差距。

單顆昇騰910C芯片的BF16性能僅為英偉達Blackwell單芯片的約三分之一，但通過超節點集群方式，單個CloudMatrix 384集群的BF16總性能反而是NVL72的1.7倍，總內存容量為后者3.6倍，總內存帶寬為后者2.1倍。

這還只是算力的方面，考慮硬件成本，事情就會更有意思。

華為昇騰950PR的定價約7萬元人民幣，英偉達同級別H200約合人民幣25萬元。根據英偉達AI在X上發布的信息，DeepSeek的確可以部署在英偉達Blackwell架構芯片上，不過這個成本更高，約為40萬元人民幣。

如果我們按FP8精度來算，昇騰950PR是7萬元/PFLOPS，英偉達H200是6.31萬元/PFLOPS。昇騰950PR畢竟是一張推理卡，如果我們按照推理專用的FP4精度來算，昇騰950PR是4.49萬元/PFLOPS，英偉達B200是4.44萬元/PFLOPS。

DeepSeek這次降價，砍在了緩存命中的價格上。

這個場景的特點是，模型不用每次重新理解全部上下文，大量重復輸入可以復用，壓力主要集中在推理吞吐、顯存/內存帶寬、調度和緩存管理上。

換句話說，它不是最依賴“單卡訓練峰值”的場景，而是更適合通過國產芯片集群、工程優化和規模化調度來攤薄成本的場景。

那么我們如果把單卡的性價比優勢放到大規模集群部署里，結果又會如何呢？

以100卡集群為例，國內常用的英偉達H20方案裸卡成本為1000萬，13臺服務器主機286萬，加上機柜等，總價約為不到1500萬元。同規模華為昇騰950PR的方案約為1000萬出頭。

昇騰950PR的單卡功耗（600W）比H20（350W）高，但單位算力功耗低65%，相同算力下對電力和制冷的需求大幅降低，基建投入顯著減少。

并且，1張昇騰950PR的推理吞吐量約等于2.2-2.8張H20。這就導致實際上昇騰方案可能要比英偉達H20的方案節省60%到70%。

而大模型的API價格，很大程度上取決于硬件成本。那么DeepSeek打折，也很可能帶動一波國產AI芯片銷量。

連DeepSeek都開始大規模使用國產芯片，整個產業鏈就會被激活。云廠商會增加國產芯片的采購，芯片廠商會加大研發投入，開發者會適配國產生態。

華為昇騰、寒武紀、海光信息、摩爾線程、沐曦股份、昆侖芯、平頭哥真武、天數智芯8家國產AI芯片品牌在DeepSeek-V4發布當天就完成了適配。

在DeepSeek-V4發布當天，AI算力芯片板塊股價大漲。在A股，海光信息以8.2%的增幅領漲、寒武紀增幅為2.23%，在港股，天數智芯的漲幅達到9.54%。

這是一個正向循環。

當然，這并不意味著國產算力已經全面替代英偉達。訓練側仍然更依賴高端GPU、成熟軟件棧和大規模集群經驗DeepSeek真正走通的路徑，可能不是“一夜之間替代英偉達”，而是先在推理側、緩存場景、長文本應用里，把國產算力的性價比優勢釋放出來。

芯片只是第一層。

真正決定國產算力能不能吃下這波需求的，是軟件生態。模型能不能穩定跑在昇騰上，推理框架能不能適配，算子有沒有優化，開發者遷移成本有多高，才決定了這條路是“能演示”，還是“能商業化”。

DeepSeek的價值在于，它不是一家邊緣模型廠商做適配，而是一個頭部模型親自把流量和需求帶進國產算力生態。

梁文鋒仍然需要給DeepSeek找商業模式

梁文鋒真正的殺招不在于“便宜”，而在于“定價”。

梁文鋒在用DeepSeek的影響力，讓市場形成一個新的認知：“如果DeepSeek這個級別的模型已經能做到這個價，別家為什么還要賣這么貴？”

一旦這個錨點形成，其他廠商就陷入了兩難。跟價，利潤空間被壓縮；不跟，就必須向客戶解釋“我貴在哪里”。

梁文鋒曾在2024年表示：“我們只是按照自己的步調來做事，然后核算成本定價。我們的原則是不貼錢，也不賺取暴利。這個價格也是在成本之上稍微有點利潤。我們降價一方面是因為我們在探索下一代模型的結構中，成本先降下來了，另一方面也覺得無論API，還是AI，都應該是普惠的、人人可以用得起的東西。”

他認為，只有讓AI真正普惠，才能激發出足夠大的應用市場。也只有應用市場足夠大，技術迭代的飛輪才能真正轉起來。

便宜可以打開市場，但便宜本身不是商業模式。

DeepSeek不能一輩子靠超低API價格活著。

API價格打到這個程度，短期內可以制造影響力，吸引客戶，不過它很難成為一家長期公司的全部收入來源。

尤其是大模型推理本身仍然消耗算力、電力、帶寬和運維，價格越低，調用量越大，對基礎設施的壓力也越大。

低價可以是入口，卻不應該成為終點。

DeepSeek的目標，是成為中國AI開發者的“默認底座”。

只要足夠多的應用和agent以DeepSeek作為基座模型開發，那么DeepSeek就掌握了入口。

API收入只是第一層，模型標準、開發者生態、企業部署、算力適配、云廠商合作，才是梁文鋒想要的商業化空間。

DeepSeek更大的商業化機會，可能在企業私有化部署。

對于金融、政務、制造、能源這些行業來說，價格不是唯一問題，數據安全可控才是核心問題。

它們未必會長期使用公共API，但會愿意為一套能部署在自己機房、自己云環境里的模型系統付費。

梁文鋒可以把開源模型作為入口，把企業級部署、調優、運維、安全、權限管理、知識庫接入變成真正的收費服務。

如果DeepSeek長期只停留在模型層，它仍然會被卷入無休止的價格戰。模型能力會被追趕，API價格會繼續下降，開發者也會在不同模型之間切換。

真正能提高商業化上限的，是應用層產品，比如agent和CLI。

所以我始終認為，DeepSeek的低價API，應該不是梁文鋒心里所想的商業化答案，更像是一個入口。

它先用價格打穿市場，再用開源建立生態，再用企業服務、私有化部署、云廠商合作和應用產品去承接價值。

這才能把“底座”的價值最大化。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

DeepSeek用V4重畫了坐標系

鈦媒體APP 2026-05-01 09:52:15
1 跟貼 1
有人只用API就猜出了GPT、Claude、Gemini的參數量？社區吵翻了

機器之心Pro 2026-05-01 19:56:22
0 跟貼 0

DeepSeek“開眼”背后的技術，公開了！

智東西 2026-04-30 22:35:23
11 跟貼 11

阿里QoderWake上崗：有身份、有記憶、有紅線，先給它一版“職業行為指南“

智東西 2026-04-30 14:41:58
0 跟貼 0
華為算力“開鏈”

經濟觀察報 2026-05-01 18:26:46
0 跟貼 0

老黃秘密武器曝光：AI一夜設計芯片，頂人類頂級工程師10個月！

新智元 2026-05-01 09:02:13
26 跟貼 26

L4落地前夜，英偉達吳新宙詳解物理AI

汽車觀察AUTO 2026-05-01 20:37:48
0 跟貼 0
英偉達推出全新開源模型 Nemotron 3 Nano Omni，效率提升至競品9倍

每日經濟新聞 2026-04-29 12:45:47
0 跟貼 0

剛下飛機就被扣！意大利把中國芯片專家送給美國，比孟晚舟更狠！

萬物科普菌 2026-04-30 14:48:39
16 跟貼 16
不只是DeepSeek V4，還有個萬億級大模型，訓推全程國產芯片

機器之心Pro 2026-04-30 16:02:50
6 跟貼 6
谷歌“歷史最大漲幅”、英偉達反而大跌！高盛資深半導體分析師建議“做多云、減持芯片”

華爾街見聞官方 2026-05-01 11:21:30
1 跟貼 1
形勢大變！西方媒體改口：中國無需再向世界證明什么

指忘崖 2026-05-01 16:59:37
2 跟貼 2
車展逛完，我發現了車企藏最深的秘密

薛定諤的BUG 2026-05-01 10:36:59
0 跟貼 0
Robotaxi的成本局怎么破？中國玩家亮出“生態共建”新招

億歐 2026-04-30 06:35:07
0 跟貼 0
從Token、算力到智能體：數字中國建設峰會上的AI進化論

財聯社 2026-05-01 12:26:30
0 跟貼 0
廣西平陸運河建240米動物通道橋，供豹貓等動物通行

星視頻 2026-05-01 11:08:08
86 跟貼 86
比亞迪漲價背后的真相

大佬灼見 2026-04-30 17:20:21
1 跟貼 1
黃仁勛全世界穿皮衣，唯獨在中國換上了大花襖

雷科技 2026-01-27 17:19:30
0 跟貼 0
車展季·大咖說丨芯擎科技CEO汪凱：座艙芯片比智駕芯片更復雜，艙駕融合價值在中低端市場

每日經濟新聞 2026-04-30 20:04:19
0 跟貼 0
硬核拆解：GPT-5、Claude和Gemini是如何訓練和推理的？

華爾街見聞官方 2026-04-30 11:17:51
0 跟貼 0
銷量跌了，漲價卻來了，為啥？

你笑的好甜美 2026-05-01 15:44:29
1 跟貼 1
杰發科技：車規芯片“隱形冠軍”的逆周期擴張

TheCars車的名義 2026-05-01 09:00:40
0 跟貼 0
愛芯元智的雙輪驅動：車載放量，邊緣爆發

雷峰網 2026-04-30 18:52:04
0 跟貼 0
韓網熱議：該如何遏制中國芯片的發展？

超超說影視 2026-05-01 12:19:14
1 跟貼 1
孟晚舟事件重演，意大利將把中國芯片工程師徐澤偉引渡到美國

河洛有話說 2026-04-30 17:47:31
1 跟貼 1
逛完地平線展臺，我終于知道車有多“懂人”了

明鏡pro 2026-05-01 10:56:32
0 跟貼 0
這個Harness普通人可用！

機器之心Pro 2026-04-21 15:47:04
0 跟貼 0
上海迪士尼回應游客勸阻吸煙被打：園區沒有禁煙；被打男子發聲：對方已賠錢和解

中國新聞周刊 2026-04-27 14:25:00
15250 跟貼 15250
地平線扔出三大王炸！融合芯片讓車真正“長腦子”

科技視訊 2026-05-01 12:02:58
0 跟貼 0
英偉達開源個量子AI

機器之心Pro 2026-04-15 12:05:50
0 跟貼 0
如果梁文鋒、王興興繼續讀博，還會有今天的成就嗎？

觀察者網 2026-05-01 13:34:27
5 跟貼 5
中國電信開始賣“國產Token”了

鈦媒體APP 2026-04-30 19:32:07
31 跟貼 31
99美元先賣"空殼"：V社把沒內存的遙控器拆出來單飛

碼上閑敘 2026-04-29 17:25:33
1 跟貼 1
美國急了，折騰數月放開芯片出口，中國竟然一塊都不買

幽默狂歡營 2026-04-30 14:49:03
0 跟貼 0
【美股盤前】谷歌市值逼近英偉達，美股總市值首次突破75萬億美元；創史上最佳同期季度表現，蘋果漲超2.7%；西部數據跌超7%，閃迪跌超6%；Anthrop

每日經濟新聞 2026-05-01 18:30:13
1 跟貼 1
2026北京車展看英特爾酷睿Ultra平臺如何賦能汽車全場景智能化

方向對了 2026-04-29 16:22:29
1 跟貼 1
都是車！第一批離深“大聰明”已堵路上

魯中晨報 2026-04-30 21:39:23
221 跟貼 221
小米這次真成了！玄戒芯片出貨百萬顆，未來汽車也能用

極果酷玩 2026-04-29 07:49:56
17 跟貼 17
孫楊博士入學資格受質疑上體研招辦：正調查跟進

大風新聞 2026-05-01 07:42:24
8718 跟貼 8718
GPT-5.6現身后，下一個Claude Sonnet 4.8又曝光了！

新智元 2026-05-01 19:06:33
0 跟貼 0

字母榜

讓未來不止于大。

2430文章數 8062關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

時尚

健康

藝術

本地

家居要聞

手機 / 數碼

房產 / 家居

20萬字不到1分錢，梁文鋒把token價格打骨折了

DeepSeek發布多模態論文又連夜刪除

74歲老人郵輪旅行登船次日突發急癥離世 家屬索賠90萬

74歲老人郵輪旅行登船次日突發急癥離世 家屬索賠90萬

無奈！約基奇：這要在塞爾維亞 全隊早被炒了

馬筱梅產后身材恢復超好 現身戶外直播

GPU神話松動，AI真正的戰場變了

限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

態度原創

靈動實用 生活藝術場

她們看起來氣血好足，每套搭配我都想抄

干細胞治燒燙傷面臨這些“瓶頸”

Nikolai Vryasov：當代俄羅斯畫家

用青花瓷的方式，打開西溪濕地

74歲老人郵輪旅行登船次日突發急癥離世家屬索賠90萬

74歲老人郵輪旅行登船次日突發急癥離世家屬索賠90萬

無奈！約基奇：這要在塞爾維亞全隊早被炒了

馬筱梅產后身材恢復超好現身戶外直播

限時9.67萬起吉利星越L/星瑞i-HEV智擎混動上市

靈動實用生活藝術場