網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

兩天兩降價(jià)，Token打骨折！DeepSeek的價(jià)格戰(zhàn)目標(biāo)究竟是誰？

2026-04-29 18:12:35　來源: 速途網(wǎng)

北京舉報(bào)

分享至

DeepSeek-V4發(fā)布僅四天，就連出三記重拳：

4月25日，DeepSeek-V4-Pro宣布限時(shí)2.5折，原活動(dòng)持續(xù)至5月5日。
4月26日，全系A(chǔ)PI輸入緩存命中價(jià)格直接降至首發(fā)價(jià)的1/10。
4月28日，官網(wǎng)“悄悄”更新API文檔，將V4-Pro的2.5折限時(shí)優(yōu)惠由原定的5月5日延長至5月31日。

疊加限時(shí)折扣后，V4-Pro的緩存輸入直降40倍，低至每百萬token僅 0.025元，V4-Flash則降至每百萬token 0.02元，創(chuàng)下全球大模型價(jià)格新低。

這個(gè)價(jià)格已經(jīng)打到對(duì)手的零頭。同樣處理100萬token緩存輸入，才剛上線不久的GPT-5.5 Pro要花約217元，用DeepSeek-V4-Pro只要0.025元，價(jià)差近8700倍。

事實(shí)上，速途網(wǎng)認(rèn)為，這遠(yuǎn)非表面的“價(jià)格戰(zhàn)”這么簡(jiǎn)單，背后是深度求索的一場(chǎng)長期戰(zhàn)役。

一、從“追趕者”到“規(guī)則定義者”

要理解這輪降價(jià)的深意，必須先看清DeepSeek在行業(yè)中的真實(shí)位置。

過去一年，DeepSeek改變了中國大模型行業(yè)的定價(jià)方式。V3和R1發(fā)布后，國內(nèi)外模型廠商被迫重新計(jì)算API價(jià)格、訓(xùn)練成本和商業(yè)化路徑。而跑分領(lǐng)先從來不是DeepSeek的核心追求，反而在精益求精地“把高性能模型的使用門檻繼續(xù)往下壓”。

但從V4開始，DeepSeek的角色正在發(fā)生質(zhì)變——它不再只是“價(jià)格屠夫”，而是開始定義AI基礎(chǔ)設(shè)施的成本錨點(diǎn)。高盛Ronald Keung團(tuán)隊(duì)在最新研報(bào)中評(píng)價(jià)：“V4的核心意義在于以更低成本支持更復(fù)雜的智能體應(yīng)用落地，從而打開AI應(yīng)用規(guī)模化的新空間。”

更關(guān)鍵的是，DeepSeek V4是全球關(guān)注的焦點(diǎn)，中國AI的代表之一。

這從OpenClaw對(duì)V4的迅速反應(yīng)就可以看出。在OpenClaw發(fā)布的4.24版本中，已正式將DeepSeek-V4-Flash設(shè)為系統(tǒng)默認(rèn)推理模型，V4-Pro同步上線模型庫，可以說牌面很足了。

這似乎是一場(chǎng)互利共贏的雙向奔赴：OpenClaw獲得了更強(qiáng)、更便宜的中文推理能力，DeepSeek獲得了千萬級(jí)開發(fā)者流量的黃金入口。

事實(shí)上，這同時(shí)代表了最強(qiáng)Agent對(duì)于中國大模型超高性價(jià)比的持續(xù)肯定，讓開發(fā)者覺得“夠用且便宜”是最重要的，這相比此前的唯性能論，是完全不同的邏輯。要知道，DeepSeek調(diào)用成本僅為OpenAI的1/50至1/70。

二、降價(jià)底氣是？源于技術(shù)的三重突破

那么，梁文鋒的真正用意是什么？在此之前，我們先看下DeepSeek為什么總能在成本端搞事情？

第一重：記憶的工業(yè)化

在百萬token上下文下，V4的KV Cache占用僅為前代V3.2的10%。這其中涉及兩項(xiàng)創(chuàng)新：壓縮稀疏注意力（CSA）將緩存體積縮減75%；重度壓縮注意力（HCA）壓縮率達(dá)128倍，一整頁內(nèi)容濃縮成幾個(gè)關(guān)鍵詞。

緩存壓縮90%后，V4可將這些條目直接存入廉價(jià)固態(tài)硬盤，用戶發(fā)起請(qǐng)求時(shí)從硬盤拉取，跳過了昂貴的GPU預(yù)填充計(jì)算。這是“白菜價(jià)”的真正秘密。

第二重：算力的結(jié)構(gòu)性瘦身

在1M長上下文下，V4 Pro的單token推理算力僅為前代的27%，V4-Flash降至10%。這其中核心是一套動(dòng)態(tài)稀疏選擇機(jī)制：每次生成token時(shí)只檢索得分最高的1024個(gè)壓縮KV條目，將傳統(tǒng)線性增長的計(jì)算復(fù)雜度強(qiáng)制截?cái)酁槌?shù)級(jí)。同時(shí)，V4將專家權(quán)重量化為FP4精度，吞吐量是FP8的兩倍，且維持99.7%的檢索召回率。

第三重：國產(chǎn)算力開辟成本第二曲線

V4定價(jià)說明中還藏著一行關(guān)鍵信息：“預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后，Pro版價(jià)格將大幅下調(diào)。”這說明DeepSeek的低價(jià)邏輯正從“模型優(yōu)化驅(qū)動(dòng)”轉(zhuǎn)向“模型+算力體系驅(qū)動(dòng)”。V4已在英偉達(dá)GPU和華為昇騰NPU兩套體系上完成驗(yàn)證，實(shí)現(xiàn)1.5-1.73倍加速。V4發(fā)布當(dāng)日，華為昇騰等8家國產(chǎn)AI芯片品牌集體宣布Day-0適配。

三、降價(jià)背后真正目標(biāo)：將Agent時(shí)代的定價(jià)權(quán)帶入中國節(jié)奏

回到那個(gè)問題，DeepSeek降價(jià)的真正目的是什么？

市場(chǎng)普遍將此解讀為針對(duì) OpenAI、Anthropic 等巨頭的價(jià)格戰(zhàn)，但深入分析會(huì)發(fā)現(xiàn)，DeepSeek的真正目標(biāo)并非某一個(gè)特定對(duì)手，而是要在大模型產(chǎn)業(yè)從 "對(duì)話時(shí)代" 向 "Agent 時(shí)代" 躍遷的歷史關(guān)口，將全球 AI 基礎(chǔ)設(shè)施的定價(jià)權(quán)從硅谷手中奪過來，帶入中國節(jié)奏。

定價(jià)權(quán)從來不是簡(jiǎn)單的價(jià)格高低，而是定義一個(gè)時(shí)代商業(yè)規(guī)則的權(quán)力。在對(duì)話式 AI時(shí)代，OpenAI憑借先發(fā)優(yōu)勢(shì)在早期建立了 "按能力定價(jià)" 的行業(yè)標(biāo)準(zhǔn)：GPT-4級(jí)別的模型就應(yīng)該賣10美元/百萬Token以上，Claude Opus甚至可以賣到20美元以上。這種定價(jià)體系建立在 "模型能力是稀缺資源" 的前提之上，讓硅谷巨頭能夠賺取超額利潤，同時(shí)將絕大多數(shù)開發(fā)者擋在規(guī)模化應(yīng)用的門外。

但 Agent 時(shí)代徹底改變了游戲規(guī)則。智能體執(zhí)行任務(wù)時(shí)，Token消耗不再是線性的，而是呈指數(shù)級(jí)增長。一個(gè)簡(jiǎn)單的代碼編寫任務(wù)可能需要數(shù)萬Token的自我糾錯(cuò)和工具調(diào)用，一個(gè)復(fù)雜的企業(yè)級(jí)工作流甚至?xí)纳蟽|Token。在這種場(chǎng)景下，硅谷的高溢價(jià)定價(jià)體系直接宣判了Agent商業(yè)化的死刑 —— 哪怕是最有前景的應(yīng)用，也會(huì)可能被高昂的推理成本拖垮。

速途網(wǎng)認(rèn)為，梁文鋒正是看到了這一點(diǎn)，才主動(dòng)出手擊穿價(jià)格底線。他將V4-Flash的緩存輸入價(jià)格壓至0.02元/ 百萬Token，V4-Pro限時(shí)優(yōu)惠后僅0.025元，這個(gè)價(jià)格不到 GPT-5.5 Pro 的1/8000，不到Claude Opus 4.7 的1/1400。

更關(guān)鍵的是，這個(gè)價(jià)格不是燒錢補(bǔ)貼的結(jié)果，而是建立在真實(shí)成本優(yōu)勢(shì)之上的。梁文鋒曾經(jīng)坦言他們的定價(jià)原則："我們的原則是不貼錢，也不賺取暴利。這個(gè)價(jià)格也是在成本之上稍微有點(diǎn)利潤。"

"搶用戶并不是我們的主要目的。我們降價(jià)一方面是因?yàn)槲覀冊(cè)谔剿飨乱淮Ｐ偷慕Y(jié)構(gòu)中，成本先降下來了；另一方面也覺得無論是API還是AI都應(yīng)該是普惠的，人人可以用得起的東西"，梁文鋒曾在采訪中表示。

當(dāng)然，這種成本自信不是偶然的，而是中國 AI 產(chǎn)業(yè)全產(chǎn)業(yè)鏈協(xié)同的必然結(jié)果。從西部綠電，到華為昇騰、寒武紀(jì)的國產(chǎn)AI芯片，再到PUE逼近1.1的液冷數(shù)據(jù)中心，中國已經(jīng)構(gòu)建了全球最具競(jìng)爭(zhēng)力的 "能源 - 算力 - 模型" 價(jià)值鏈。這種結(jié)構(gòu)性的成本差異，決定了Agent時(shí)代的定價(jià)權(quán)必然會(huì)向中國轉(zhuǎn)移。

市場(chǎng)已經(jīng)用腳投票給出了答案。OpenRouter 數(shù)據(jù)顯示，截至 2026 年 4 月中旬，中國模型在 OpenRouter 平臺(tái)的周調(diào)用量已是美國的 4.3 倍。降價(jià)首日，DeepSeek V4-Pro的調(diào)用量就飆升近四倍，想必其中很多新增用戶來自原OpenAI和Anthropic的客戶。當(dāng)越來越多的Agent應(yīng)用基于DeepSeek 的價(jià)格體系構(gòu)建時(shí)，它就會(huì)成為事實(shí)上的行業(yè)標(biāo)準(zhǔn)，迫使所有廠商要么跟進(jìn)降價(jià)，要么被邊緣化。

同時(shí)，我們也要清醒地看到，定價(jià)權(quán)的爭(zhēng)奪是一場(chǎng)長期戰(zhàn)役。硅谷巨頭仍然掌握著頂尖模型的技術(shù)優(yōu)勢(shì)，OpenAI在DeepSeek降價(jià)前發(fā)布GPT-5.5，試圖用技術(shù)代差來維持高溢價(jià)。DeepSeek等中國AI新貴們要真正掌握定價(jià)權(quán)，還需要在模型穩(wěn)定性、工具調(diào)用能力和生態(tài)建設(shè)上持續(xù)投入。

速途網(wǎng)始終認(rèn)為，AI最終是普惠的全球基礎(chǔ)設(shè)施，而不是某幾家巨頭的盈利工具。當(dāng)Agent時(shí)代的全球定價(jià)權(quán)進(jìn)入中國節(jié)奏，受益的將是全世界的開發(fā)者和企業(yè)，整個(gè)AI產(chǎn)業(yè)的創(chuàng)新速度也將因此大大提速。

（文/言飛）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.