網易首頁 > 網易號 > 正文申請入駐

DeepSeek和國產算力下了好大一盤棋

2026-04-27 15:47:59　來源: 鳳凰網科技

北京舉報

分享至

摘要：

DeepSeek與國產算力合力，實現token成本的大幅降低后，又會反向利好AI應用市場，催生更大的市場空間。

鳳凰網科技出品

作者｜Dale、姜凡

編輯｜董雨晴

兩天兩次降價，效率成了DeepSeek最深護城河

2026年4月的最后一個周末，中國AI產業被一連串消息徹底點燃，而消息背后的主角只有一個，DeepSeek。

4月24日，DeepSeek正式發布V4系列預覽版，同步開源Pro與Flash兩款模型，均支持百萬token超長上下文。緊接著的25日與26日，DeepSeek連續兩晚出手降價——先是V4-Pro限時2.5折，再是全系API輸入緩存命中價格永久降至首發價的十分之一。兩天兩次調價之后，V4-Flash每百萬tokens輸入緩存命中價格僅為0.02元，V4-Pro為0.025元，創下全球大模型價格新低。

這樣一場精心策劃的閃電戰，背后是DeepSeek長達一年的艱難求索。

但如果依舊將目光放在“價格戰”的淺層敘事，就低估了DeepSeek此番出手的深意。V4的降價已經無關于燒錢換市場，其更大的意義是底層架構效率革命帶來的成本變化。正如高盛Ronald Keung團隊在最新研報中所指出的，“V4的核心意義在于以更低成本支持更復雜的智能體應用落地，從而打開AI應用規模化的新空間”。

在DeepSeek-V4的技術報告里，效率是極致的。

V4-Pro在100萬token上下文場景下，單token推理所需浮點運算量僅為V3.2的27%，KV緩存占用僅為10%；V4-Flash更為激進——FLOPs降至10%，KV緩存壓縮至7%。這意味著什么？通俗地說，過去跑一條百萬字上下文需要三臺機器的算力，現在一臺機器就能從容應對，而且內存開銷僅是過去的十分之一。

效率飛躍背后，有V4在架構層面的三項關鍵創新：混合注意力機制（CSA/HCA）、流形約束超連接（mHC），以及Muon優化器。其中最核心的突破在于混合注意力——CSA（壓縮稀疏注意力）沿序列維度壓縮KV緩存后執行稀疏注意力計算，每m個token的KV緩存被壓縮為一條記錄；HCA（重度壓縮注意力）則施加更激進的壓縮策略，將m'個token的KV緩存合并為單條記錄，但仍保留稠密注意力。這套組合拳在幾乎不影響模型性能的前提下，將長上下文場景的計算與存儲成本砍掉了一個數量級。

更精妙的設計體現在細節處：對KV條目采用混合存儲格式，旋轉位置編碼維度保持BF16精度，其余維度使用FP8精度，這一項便將KV緩存容量壓縮近半。閃電索引器內部的注意力計算以FP4精度執行，進一步加速長上下文下的注意力運算。

技術壓縮效率，效率兌現成本。這才是DeepSeek敢于連續降價的真正底牌。

理解了這一邏輯，便能看穿此次降價的產業含義：相比于其他AI大模型降價拼命上桌，這一次DeepSeek直接用技術優勢主動構建了成本壁壘。V4-Flash以0.02元/百萬tokens的價格橫掃市場背后，每一分錢的降價都有底層架構優化作為支撐，而不是資本燒錢補貼的邏輯。競爭對手要跟進，首先得在技術上追平這份效率——而這顯然不是一朝一夕之功。

從模型等芯片，到芯片靠模型

與兩次降價幾乎同步發生的，是國產芯片陣營的集體“起立”。

V4發布當日，華為昇騰、寒武紀、海光信息、摩爾線程、沐曦股份、昆侖芯、平頭哥真武、天數智芯8家國產AI芯片品牌，以及英偉達，均宣布完成對DeepSeek-V4的適配。尤其值得注意的是，這是大模型產業首次實現“Day 0”級別的全棧適配：模型發布即適配上線，芯片廠商不再需要數月的“追逐式”調試周期。

這里有一個細節必須拆解清楚。DeepSeek官方在技術報告中表示，“我們在英偉達GPU和華為昇騰NPU兩個平臺上驗證了細粒度EP（專家并行）方案，在通用推理任務中實現1.50至1.73倍加速；在延遲敏感場景下最高達到1.96倍”。這是DeepSeek歷史上首次將國產芯片與英偉達GPU并列寫入硬件驗證清單，確立對等地位。

華為昇騰的反應也十分迅猛。昇騰官方在B站直播中稱，在推理部署層面，昇騰950PR平臺針對V4實現了多項深度適配。量化方面，原生的硬件加速精度明確支持MXFP8與MXFP4等低精度數據格式，兼顧模型精度與內存占用優化。算子層面，華為官方宣布昇騰950通過融合kernel與多流并行技術，大幅降低了混合注意力機制的計算和訪存開銷，顯著提升了推理性能。而MoE模塊中路由專家與共享專家的計算重疊等深度優化，則進一步確保了萬億參數模型在國產硬件上的高效平穩運行。

圖｜昇騰直播間截圖

寒武紀則在基于自研NeuWare軟件生態與vLLM框架上，完成了對V4的“Day 0”適配并同步開源自研算子庫。這已是寒武紀連續第二次在DeepSeek新模型發布首日便推出適配方案，其技術迭代速度同樣不容小覷。

更有說服力的信號來自財務上的持續好轉，國產開源大模型的極速發展，正在把中國算力產業拉入良性發展的通道里。

4月26日晚，摩爾線程發布2026年一季報：一季度營業收入7.38億元，同比增長155.35%；歸母凈利潤2935.92萬元，同比扭虧為盈。這家被稱為“中國英偉達”的國產GPU廠商，此前因研發投入高達營收86.68%而備受市場質疑，如今終于交出了一份逆轉的答卷。與此同時，摩爾線程還與某客戶簽訂了金額達6.6億元的夸娥智算集群銷售合同。

寒武紀此前發布的年度業績快報亦顯示已率先實現盈利，沐曦股份則呈現出虧損持續收窄的態勢。三家國產AI芯片代表企業同步進入業績改善通道，已經是十分有力的回應。

國產算力生態臨界點的到來

當DeepSeek的技術效率革命與國產芯片的產能釋放在同一時間窗口交匯，一條完整的產業閉環開始浮出水面。

中銀國際在4月26日發布的研報中判斷：“DeepSeek V4的發布標志著國產大模型已基本跑通全棧國產化，理論上已形成從底層硬件、基礎軟件、平臺服務到上層應用、安全體系的完整技術鏈條，國產算力板塊或迎來自己的質變臨界點。”

反過來看，DeepSeek與國產算力實現合力，在大幅降低token成本后，又會反向利好AI應用市場，催生更大的市場空間。

據華泰證券表述，“市場容易將V4理解為‘降本壓低算力、存儲需求’，但更重要的邊際變化在于長上下文成本下降后，復雜Agent、多文檔分析、長周期任務、在線學習等場景可用性提升，推理調用量與存儲訪問頻次有望擴張。”換句話說，降價不會縮減蛋糕，還會做大蛋糕——越便宜用得越兇，總調用量反而會暴增。

同樣在4月24日，新版本OpenClaw 發布，直接接入了最新的DeepSeek V4雙版本，并將V4 Flash設置為了默認大模型。

據OpenRouter平臺數據，DeepSeek V4 flash今日調用量較前一天上漲了62%。

值得一提的是，DeepSeek已明確將華為昇騰950超節點量產納入其商業路徑，并預告下半年實現大規模供貨后API定價將迎來顯著下降。這意味著當前的降價可能只是一個預告，真正的主菜還在后面。

資本市場已作出熱烈反應。4月27日早盤，A股算力芯片概念延續強勢，CPU方向領漲，海光信息、摩爾線程等跟漲；港股半導體板塊領漲，瀾起科技漲超6%，中芯國際漲近5%。產業鏈上下游——從芯片設計到服務器整機，從算力租賃到AI應用——都在重新定價這一歷史性的產業變局。

這個4月，DeepSeek以一組硬核效率數據為矛、以兩次精準降價為鼓，打出明牌——AI的長上下文時代已經到來，而它的“高速公路”將由國產算力鋪就。對那些剛剛登陸科創板的國產芯片企業而言，這個春天確實比往年都暖。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.