![]()
摘要:
DeepSeek與國產算力合力,實現token成本的大幅降低后,又會反向利好AI應用市場,催生更大的市場空間。
鳳凰網科技 出品
作者|Dale、姜凡
編輯|董雨晴
![]()
兩天兩次降價,效率成了DeepSeek最深護城河
2026年4月的最后一個周末,中國AI產業被一連串消息徹底點燃,而消息背后的主角只有一個,DeepSeek。
4月24日,DeepSeek正式發布V4系列預覽版,同步開源Pro與Flash兩款模型,均支持百萬token超長上下文。緊接著的25日與26日,DeepSeek連續兩晚出手降價——先是V4-Pro限時2.5折,再是全系API輸入緩存命中價格永久降至首發價的十分之一。兩天兩次調價之后,V4-Flash每百萬tokens輸入緩存命中價格僅為0.02元,V4-Pro為0.025元,創下全球大模型價格新低。
![]()
這樣一場精心策劃的閃電戰,背后是DeepSeek長達一年的艱難求索。
但如果依舊將目光放在“價格戰”的淺層敘事,就低估了DeepSeek此番出手的深意。V4的降價已經無關于燒錢換市場,其更大的意義是底層架構效率革命帶來的成本變化。正如高盛Ronald Keung團隊在最新研報中所指出的,“V4的核心意義在于以更低成本支持更復雜的智能體應用落地,從而打開AI應用規模化的新空間”。
在DeepSeek-V4的技術報告里,效率是極致的。
V4-Pro在100萬token上下文場景下,單token推理所需浮點運算量僅為V3.2的27%,KV緩存占用僅為10%;V4-Flash更為激進——FLOPs降至10%,KV緩存壓縮至7%。這意味著什么?通俗地說,過去跑一條百萬字上下文需要三臺機器的算力,現在一臺機器就能從容應對,而且內存開銷僅是過去的十分之一。
效率飛躍背后,有V4在架構層面的三項關鍵創新:混合注意力機制(CSA/HCA)、流形約束超連接(mHC),以及Muon優化器。其中最核心的突破在于混合注意力——CSA(壓縮稀疏注意力)沿序列維度壓縮KV緩存后執行稀疏注意力計算,每m個token的KV緩存被壓縮為一條記錄;HCA(重度壓縮注意力)則施加更激進的壓縮策略,將m'個token的KV緩存合并為單條記錄,但仍保留稠密注意力。這套組合拳在幾乎不影響模型性能的前提下,將長上下文場景的計算與存儲成本砍掉了一個數量級。
更精妙的設計體現在細節處:對KV條目采用混合存儲格式,旋轉位置編碼維度保持BF16精度,其余維度使用FP8精度,這一項便將KV緩存容量壓縮近半。閃電索引器內部的注意力計算以FP4精度執行,進一步加速長上下文下的注意力運算。
技術壓縮效率,效率兌現成本。這才是DeepSeek敢于連續降價的真正底牌。
理解了這一邏輯,便能看穿此次降價的產業含義:相比于其他AI大模型降價拼命上桌,這一次DeepSeek直接用技術優勢主動構建了成本壁壘。V4-Flash以0.02元/百萬tokens的價格橫掃市場背后,每一分錢的降價都有底層架構優化作為支撐,而不是資本燒錢補貼的邏輯。競爭對手要跟進,首先得在技術上追平這份效率——而這顯然不是一朝一夕之功。
![]()
從模型等芯片,到芯片靠模型
與兩次降價幾乎同步發生的,是國產芯片陣營的集體“起立”。
V4發布當日,華為昇騰、寒武紀、海光信息、摩爾線程、沐曦股份、昆侖芯、平頭哥真武、天數智芯8家國產AI芯片品牌,以及英偉達,均宣布完成對DeepSeek-V4的適配。尤其值得注意的是,這是大模型產業首次實現“Day 0”級別的全棧適配:模型發布即適配上線,芯片廠商不再需要數月的“追逐式”調試周期。
這里有一個細節必須拆解清楚。DeepSeek官方在技術報告中表示,“我們在英偉達GPU和華為昇騰NPU兩個平臺上驗證了細粒度EP(專家并行)方案,在通用推理任務中實現1.50至1.73倍加速;在延遲敏感場景下最高達到1.96倍”。這是DeepSeek歷史上首次將國產芯片與英偉達GPU并列寫入硬件驗證清單,確立對等地位。
華為昇騰的反應也十分迅猛。昇騰官方在B站直播中稱,在推理部署層面,昇騰950PR平臺針對V4實現了多項深度適配。量化方面,原生的硬件加速精度明確支持MXFP8與MXFP4等低精度數據格式,兼顧模型精度與內存占用優化。算子層面,華為官方宣布昇騰950通過融合kernel與多流并行技術,大幅降低了混合注意力機制的計算和訪存開銷,顯著提升了推理性能。而MoE模塊中路由專家與共享專家的計算重疊等深度優化,則進一步確保了萬億參數模型在國產硬件上的高效平穩運行。
![]()
圖|昇騰直播間截圖
寒武紀則在基于自研NeuWare軟件生態與vLLM框架上,完成了對V4的“Day 0”適配并同步開源自研算子庫。這已是寒武紀連續第二次在DeepSeek新模型發布首日便推出適配方案,其技術迭代速度同樣不容小覷。
![]()
更有說服力的信號來自財務上的持續好轉,國產開源大模型的極速發展,正在把中國算力產業拉入良性發展的通道里。
4月26日晚,摩爾線程發布2026年一季報:一季度營業收入7.38億元,同比增長155.35%;歸母凈利潤2935.92萬元,同比扭虧為盈。這家被稱為“中國英偉達”的國產GPU廠商,此前因研發投入高達營收86.68%而備受市場質疑,如今終于交出了一份逆轉的答卷。與此同時,摩爾線程還與某客戶簽訂了金額達6.6億元的夸娥智算集群銷售合同。
寒武紀此前發布的年度業績快報亦顯示已率先實現盈利,沐曦股份則呈現出虧損持續收窄的態勢。三家國產AI芯片代表企業同步進入業績改善通道,已經是十分有力的回應。
![]()
國產算力生態臨界點的到來
當DeepSeek的技術效率革命與國產芯片的產能釋放在同一時間窗口交匯,一條完整的產業閉環開始浮出水面。
中銀國際在4月26日發布的研報中判斷:“DeepSeek V4的發布標志著國產大模型已基本跑通全棧國產化,理論上已形成從底層硬件、基礎軟件、平臺服務到上層應用、安全體系的完整技術鏈條,國產算力板塊或迎來自己的質變臨界點。”
反過來看,DeepSeek與國產算力實現合力,在大幅降低token成本后,又會反向利好AI應用市場,催生更大的市場空間。
據華泰證券表述,“市場容易將V4理解為‘降本壓低算力、存儲需求’,但更重要的邊際變化在于長上下文成本下降后,復雜Agent、多文檔分析、長周期任務、在線學習等場景可用性提升,推理調用量與存儲訪問頻次有望擴張。”換句話說,降價不會縮減蛋糕,還會做大蛋糕——越便宜用得越兇,總調用量反而會暴增。
同樣在4月24日,新版本OpenClaw 發布,直接接入了最新的DeepSeek V4雙版本,并將V4 Flash設置為了默認大模型。
![]()
據OpenRouter平臺數據,DeepSeek V4 flash今日調用量較前一天上漲了62%。
值得一提的是,DeepSeek已明確將華為昇騰950超節點量產納入其商業路徑,并預告下半年實現大規模供貨后API定價將迎來顯著下降。這意味著當前的降價可能只是一個預告,真正的主菜還在后面。
資本市場已作出熱烈反應。4月27日早盤,A股算力芯片概念延續強勢,CPU方向領漲,海光信息、摩爾線程等跟漲;港股半導體板塊領漲,瀾起科技漲超6%,中芯國際漲近5%。產業鏈上下游——從芯片設計到服務器整機,從算力租賃到AI應用——都在重新定價這一歷史性的產業變局。
這個4月,DeepSeek以一組硬核效率數據為矛、以兩次精準降價為鼓,打出明牌——AI的長上下文時代已經到來,而它的“高速公路”將由國產算力鋪就。對那些剛剛登陸科創板的國產芯片企業而言,這個春天確實比往年都暖。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.