![]()
DeepSeek-V4發(fā)布僅四天,就連出三記重拳:
4月25日,DeepSeek-V4-Pro宣布限時(shí)2.5折,原活動(dòng)持續(xù)至5月5日。
4月26日,全系A(chǔ)PI輸入緩存命中價(jià)格直接降至首發(fā)價(jià)的1/10。
4月28日,官網(wǎng)“悄悄”更新API文檔,將V4-Pro的2.5折限時(shí)優(yōu)惠由原定的5月5日延長至5月31日。
![]()
疊加限時(shí)折扣后,V4-Pro的緩存輸入直降40倍,低至每百萬token僅 0.025元,V4-Flash則降至每百萬token 0.02元,創(chuàng)下全球大模型價(jià)格新低。
這個(gè)價(jià)格已經(jīng)打到對(duì)手的零頭。同樣處理100萬token緩存輸入,才剛上線不久的GPT-5.5 Pro要花約217元,用DeepSeek-V4-Pro只要0.025元,價(jià)差近8700倍。
事實(shí)上,速途網(wǎng)認(rèn)為,這遠(yuǎn)非表面的“價(jià)格戰(zhàn)”這么簡(jiǎn)單,背后是深度求索的一場(chǎng)長期戰(zhàn)役。
一、從“追趕者”到“規(guī)則定義者”
要理解這輪降價(jià)的深意,必須先看清DeepSeek在行業(yè)中的真實(shí)位置。
過去一年,DeepSeek改變了中國大模型行業(yè)的定價(jià)方式。V3和R1發(fā)布后,國內(nèi)外模型廠商被迫重新計(jì)算API價(jià)格、訓(xùn)練成本和商業(yè)化路徑。而跑分領(lǐng)先從來不是DeepSeek的核心追求,反而在精益求精地“把高性能模型的使用門檻繼續(xù)往下壓”。
但從V4開始,DeepSeek的角色正在發(fā)生質(zhì)變——它不再只是“價(jià)格屠夫”,而是開始定義AI基礎(chǔ)設(shè)施的成本錨點(diǎn)。高盛Ronald Keung團(tuán)隊(duì)在最新研報(bào)中評(píng)價(jià):“V4的核心意義在于以更低成本支持更復(fù)雜的智能體應(yīng)用落地,從而打開AI應(yīng)用規(guī)模化的新空間。”
![]()
更關(guān)鍵的是,DeepSeek V4是全球關(guān)注的焦點(diǎn),中國AI的代表之一。
這從OpenClaw對(duì)V4的迅速反應(yīng)就可以看出。在OpenClaw發(fā)布的4.24版本中,已正式將DeepSeek-V4-Flash設(shè)為系統(tǒng)默認(rèn)推理模型,V4-Pro同步上線模型庫,可以說牌面很足了。
這似乎是一場(chǎng)互利共贏的雙向奔赴:OpenClaw獲得了更強(qiáng)、更便宜的中文推理能力,DeepSeek獲得了千萬級(jí)開發(fā)者流量的黃金入口。
事實(shí)上,這同時(shí)代表了最強(qiáng)Agent對(duì)于中國大模型超高性價(jià)比的持續(xù)肯定,讓開發(fā)者覺得“夠用且便宜”是最重要的,這相比此前的唯性能論,是完全不同的邏輯。要知道,DeepSeek調(diào)用成本僅為OpenAI的1/50至1/70。
二、降價(jià)底氣是?源于技術(shù)的三重突破
那么,梁文鋒的真正用意是什么?在此之前,我們先看下DeepSeek為什么總能在成本端搞事情?
第一重:記憶的工業(yè)化
在百萬token上下文下,V4的KV Cache占用僅為前代V3.2的10%。這其中涉及兩項(xiàng)創(chuàng)新:壓縮稀疏注意力(CSA)將緩存體積縮減75%;重度壓縮注意力(HCA)壓縮率達(dá)128倍,一整頁內(nèi)容濃縮成幾個(gè)關(guān)鍵詞。
緩存壓縮90%后,V4可將這些條目直接存入廉價(jià)固態(tài)硬盤,用戶發(fā)起請(qǐng)求時(shí)從硬盤拉取,跳過了昂貴的GPU預(yù)填充計(jì)算。這是“白菜價(jià)”的真正秘密。
![]()
第二重:算力的結(jié)構(gòu)性瘦身
在1M長上下文下,V4 Pro的單token推理算力僅為前代的27%,V4-Flash降至10%。這其中核心是一套動(dòng)態(tài)稀疏選擇機(jī)制:每次生成token時(shí)只檢索得分最高的1024個(gè)壓縮KV條目,將傳統(tǒng)線性增長的計(jì)算復(fù)雜度強(qiáng)制截?cái)酁槌?shù)級(jí)。同時(shí),V4將專家權(quán)重量化為FP4精度,吞吐量是FP8的兩倍,且維持99.7%的檢索召回率。
第三重:國產(chǎn)算力開辟成本第二曲線
V4定價(jià)說明中還藏著一行關(guān)鍵信息:“預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后,Pro版價(jià)格將大幅下調(diào)。”這說明DeepSeek的低價(jià)邏輯正從“模型優(yōu)化驅(qū)動(dòng)”轉(zhuǎn)向“模型+算力體系驅(qū)動(dòng)”。V4已在英偉達(dá)GPU和華為昇騰NPU兩套體系上完成驗(yàn)證,實(shí)現(xiàn)1.5-1.73倍加速。V4發(fā)布當(dāng)日,華為昇騰等8家國產(chǎn)AI芯片品牌集體宣布Day-0適配。
三、降價(jià)背后真正目標(biāo):將Agent時(shí)代的定價(jià)權(quán)帶入中國節(jié)奏
回到那個(gè)問題,DeepSeek降價(jià)的真正目的是什么?
市場(chǎng)普遍將此解讀為針對(duì) OpenAI、Anthropic 等巨頭的價(jià)格戰(zhàn),但深入分析會(huì)發(fā)現(xiàn),DeepSeek的真正目標(biāo)并非某一個(gè)特定對(duì)手,而是要在大模型產(chǎn)業(yè)從 "對(duì)話時(shí)代" 向 "Agent 時(shí)代" 躍遷的歷史關(guān)口,將全球 AI 基礎(chǔ)設(shè)施的定價(jià)權(quán)從硅谷手中奪過來,帶入中國節(jié)奏。
定價(jià)權(quán)從來不是簡(jiǎn)單的價(jià)格高低,而是定義一個(gè)時(shí)代商業(yè)規(guī)則的權(quán)力。在對(duì)話式 AI時(shí)代,OpenAI憑借先發(fā)優(yōu)勢(shì)在早期建立了 "按能力定價(jià)" 的行業(yè)標(biāo)準(zhǔn):GPT-4級(jí)別的模型就應(yīng)該賣10美元/百萬Token以上,Claude Opus甚至可以賣到20美元以上。這種定價(jià)體系建立在 "模型能力是稀缺資源" 的前提之上,讓硅谷巨頭能夠賺取超額利潤,同時(shí)將絕大多數(shù)開發(fā)者擋在規(guī)模化應(yīng)用的門外。
但 Agent 時(shí)代徹底改變了游戲規(guī)則。智能體執(zhí)行任務(wù)時(shí),Token消耗不再是線性的,而是呈指數(shù)級(jí)增長。一個(gè)簡(jiǎn)單的代碼編寫任務(wù)可能需要數(shù)萬Token的自我糾錯(cuò)和工具調(diào)用,一個(gè)復(fù)雜的企業(yè)級(jí)工作流甚至?xí)纳蟽|Token。在這種場(chǎng)景下,硅谷的高溢價(jià)定價(jià)體系直接宣判了Agent商業(yè)化的死刑 —— 哪怕是最有前景的應(yīng)用,也會(huì)可能被高昂的推理成本拖垮。
![]()
速途網(wǎng)認(rèn)為,梁文鋒正是看到了這一點(diǎn),才主動(dòng)出手擊穿價(jià)格底線。他將V4-Flash的緩存輸入價(jià)格壓至0.02元/ 百萬Token,V4-Pro限時(shí)優(yōu)惠后僅0.025元,這個(gè)價(jià)格不到 GPT-5.5 Pro 的1/8000,不到Claude Opus 4.7 的1/1400。
更關(guān)鍵的是,這個(gè)價(jià)格不是燒錢補(bǔ)貼的結(jié)果,而是建立在真實(shí)成本優(yōu)勢(shì)之上的。梁文鋒曾經(jīng)坦言他們的定價(jià)原則:"我們的原則是不貼錢,也不賺取暴利。這個(gè)價(jià)格也是在成本之上稍微有點(diǎn)利潤。"
"搶用戶并不是我們的主要目的。我們降價(jià)一方面是因?yàn)槲覀冊(cè)谔剿飨乱淮P偷慕Y(jié)構(gòu)中,成本先降下來了;另一方面也覺得無論是API還是AI都應(yīng)該是普惠的,人人可以用得起的東西",梁文鋒曾在采訪中表示。
當(dāng)然,這種成本自信不是偶然的,而是中國 AI 產(chǎn)業(yè)全產(chǎn)業(yè)鏈協(xié)同的必然結(jié)果。從西部綠電,到華為昇騰、寒武紀(jì)的國產(chǎn)AI芯片,再到PUE逼近1.1的液冷數(shù)據(jù)中心,中國已經(jīng)構(gòu)建了全球最具競(jìng)爭(zhēng)力的 "能源 - 算力 - 模型" 價(jià)值鏈。這種結(jié)構(gòu)性的成本差異,決定了Agent時(shí)代的定價(jià)權(quán)必然會(huì)向中國轉(zhuǎn)移。
市場(chǎng)已經(jīng)用腳投票給出了答案。OpenRouter 數(shù)據(jù)顯示,截至 2026 年 4 月中旬,中國模型在 OpenRouter 平臺(tái)的周調(diào)用量已是美國的 4.3 倍。降價(jià)首日,DeepSeek V4-Pro的調(diào)用量就飆升近四倍,想必其中很多新增用戶來自原OpenAI和Anthropic的客戶。當(dāng)越來越多的Agent應(yīng)用基于DeepSeek 的價(jià)格體系構(gòu)建時(shí),它就會(huì)成為事實(shí)上的行業(yè)標(biāo)準(zhǔn),迫使所有廠商要么跟進(jìn)降價(jià),要么被邊緣化。
同時(shí),我們也要清醒地看到,定價(jià)權(quán)的爭(zhēng)奪是一場(chǎng)長期戰(zhàn)役。硅谷巨頭仍然掌握著頂尖模型的技術(shù)優(yōu)勢(shì),OpenAI在DeepSeek降價(jià)前發(fā)布GPT-5.5,試圖用技術(shù)代差來維持高溢價(jià)。DeepSeek等中國AI新貴們要真正掌握定價(jià)權(quán),還需要在模型穩(wěn)定性、工具調(diào)用能力和生態(tài)建設(shè)上持續(xù)投入。
速途網(wǎng)始終認(rèn)為,AI最終是普惠的全球基礎(chǔ)設(shè)施,而不是某幾家巨頭的盈利工具。當(dāng)Agent時(shí)代的全球定價(jià)權(quán)進(jìn)入中國節(jié)奏,受益的將是全世界的開發(fā)者和企業(yè),整個(gè)AI產(chǎn)業(yè)的創(chuàng)新速度也將因此大大提速。
(文/言飛)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.