文 | 影子備忘錄
此前,DeepSeek宣布API降價,緊接著,小米也宣布其大模型永久降價,最高可達99%。
時間線上看,5月22日,DeepSeek宣布V4-Pro模型API價格永久降價75%,緩存命中輸入低至每百萬Tokens 0.025元人民幣。
僅過了5天,5月27日,小米就祭出殺招:MiMo-V2.5系列API永久降價,最高降幅99%,Pro版緩存命中輸入降到與DeepSeek相同的0.025元/百萬Tokens,標準版甚至更低——0.02元/百萬Tokens。
同一價位、甚至更低,前后腳宣布。這不是跟風,是實實在在的“對標”。
如果你是一名開發者,5月27日這天,你在小米和DeepSeek之間已經不需要再做選擇題,因為兩邊一樣便宜。
但如果拉長時間線,我們看到的不只是一場簡單的價格戰——這是一場關于技術路線、生態戰略與AI普惠模式的中國式博弈。
小米與DeepSeek,一個是硬件巨頭轉型AI的追趕者,一個是純血AI技術派的破局者。看似都打著“降價”這張牌,但牌桌下面,拼的卻是完全不同的底牌。
![]()
為什么降價能“永久”?
在拆解雙方的技術底牌之前,先問一個更尖銳的問題:憑什么能永久降價?
大模型API的定價,本質上由三部分構成:算力成本+運營成本+合理的利潤空間。算力成本是最大的變量,它取決于芯片采購、集群效率和模型本身的推理開銷。
DeepSeek敢降價的底氣,來自技術底層的顛覆性創新。其V3模型以約600萬美元的訓練成本實現了對標GPT-4級別的性能——這一數字僅為同類模型訓練成本的數十分之一。
DeepSeek自研的稀疏注意力機制使V4系列在處理百萬級Token長上下文時,算力消耗僅為上代產品的27%,KV Cache占用降至10%。
它不是用資本換市場,而是用技術換成本。
小米呢?5月26日,雷軍宣布未來三年在AI領域投入600億元。一季度研發投入90億元,同比增長33.4%,全年研發預計超400億元。600億真金白銀砸下去,做的是兩件事:
一是追趕技術差距,二是攤薄推理成本,靠規模效應和端側優勢把單位成本打下來。
兩者的底層邏輯截然不同。
小米真的能打了嗎?
在談論價格之前,先說能力——大模型的核心競爭力,終究是技術本身。
DeepSeek的壁壘是MoE(混合專家)架構的極致工程化。
DeepSeek-V3總參數671B,單Token僅激活約37B參數,激活占比僅約5.5%。加上MLA(多頭潛在注意力)機制,KV緩存壓縮至傳統注意力的幾分之一,長文本推理內存大幅降低。
這是從根源上砍算力的能力。
小米追趕的速度超乎很多人預期。MiMo-V2.5系列于2026年4月發布,包含兩款核心模型。
MiMo-V2.5-Pro采用MoE架構,總參數1.02T(激活42B),預訓練使用27萬億Token,原生序列32K后擴展至1M。
MiMo-V2.5為全模態模型,310B總參數(激活15B),支持文本、圖像、視頻、音頻全模態理解。
在Artificial Analysis綜合智能指數和Agent指數上,MiMo-V2.5-Pro均為全球開源模型并列第一。
SWE-bench Pro得分57.2%,超越DeepSeek V4 Pro的55.4%和Gemini 3.1 Pro的54.2%。
Agent任務上,ClawEval得分63.8%,全球開源第一。
在ClawEval測試中,小米表示“每條軌跡僅消耗約7萬Token,與GPT-5.4等同等能力水平下相比,Token消耗減少約40%-60%”。
就技術而言,MiMo-V2.5-Pro的推理成本本來就有結構性優勢——Token效率做得好,同樣的任務消耗更少資源。
降價是能力提升的結果,而非單純的定價策略調整。
兩種技術路線在底層趨同(都走MoE稀疏激活),但能力側重點不同。
DeepSeek主打通用知識深度與推理能力,MiMo-V2.5-Pro在長上下文Agent任務和多模態領域相對占優。
小米還有一張DeepSeek不具備的王牌:軟硬協同的端側落地。
在小米“人車家全生態”戰略下,MiMo大模型正在全面滲透手機、汽車、智能家居。
一季度小米在AI領域研發投入90億元,小米正在用AI重塑旗下全部終端產品。
AGI研究者羅福莉去年底加盟小米擔任MiMo大模型負責人后,團隊快速迭代多代模型,完成了從語言到多模態到語音的全矩陣布局。
如果你認為小米只是想賣API賺錢,那就看錯了一家硬件巨頭的大模型戰略。
![]()
DeepSeek VS小米,兩種降價邏輯的較量
2025年11月,一則人事變動震動AI圈:曾任職DeepSeek的95后AI技術人才羅福莉正式加盟小米,出任MiMo大模型負責人。雷軍被傳以千萬年薪力邀其加入。
在羅福莉的統籌下,小米MiMo大模型快速完成多代迭代,僅用幾個月就從MiMo-V2-Pro迭代到V2.5系列,補齊了高性能推理、輕量化通用交互、語音合成等全場景能力。
從DeepSeek到小米,羅福莉帶來的不僅是個人能力,更是一種工程師驅動的文化——強調效率、追求低成本高回報的技術路線。
這或許解釋了為什么小米的降價邏輯在某種程度上與DeepSeek高度相似:不是補貼戰,而是效率戰。
此外,據北京商報記者統計,2026年以來小米以密集節奏發布和更新多款模型,從VLA大模型到移動端Agent產品Xiaomi miclaw,從MiMo-V2系列到V2.5系列的全模態模型矩陣,再到語音合成與識別、自動駕駛模型等,覆蓋面之廣、迭代速度之快,在業界罕見。
這種速度和節奏,在很多企業看來可能是“戰略性投入”,但對小米來說,更像是一種“補課”——好在,它補得很快。
回到價格本身,小米此番降價細節值得拆解。
MiMo-V2.5-Pro:輸入緩存命中從2.80元降至0.025元/百萬Tokens(降99%),輸出從42元降至6元(降86%);MiMo-V2.5標準版:輸入緩存命中從1.12元降至0.02元(降98%),輸出從28元降至2元(降93%)。
同時,小米取消上下文窗口長度的區分定價,優化Token Plan計費,同等價格下Token用量提升5至8倍。
這場降價大戰其實分兩個階段:第一階段,DeepSeek于4月25日在兩天內兩次降價,將V4-Pro緩存命中價格降至0.025元,打破了行業價格天花板。
在推理端調用量激增、算力和存儲成本高漲的背景下,多數大模型公司選擇漲價,部分漲幅甚至高達463%。
DeepSeek逆市降價以技術驅動的成本下降打破行業“AI理應越來越貴”的預期。
第二階段,小米卡位跟進,價格直接對標DeepSeek,甚至更低。這既是價格戰,更是信號戰——表明小米在大模型API市場已有規模化的底氣和爭奪份額的決心。
同樣掛著“降價”的招牌,兩者邏輯天差地別:
DeepSeek是“技術溢出”:架構創新和工程優化降低了單位推理成本,將部分技術紅利直接回饋給市場。它不需要靠降價維持用戶,而是降價本身就是技術優勢的證明。
小米是“生態卡位”:用硬件利潤反哺AI研發,通過降價搶奪開發者用戶。
一旦開發者習慣使用MiMo,那開發者在小米IoT生態中開發應用、用AI賦能汽車和手機,都將更加順暢。API降價不僅是價格戰,更是小米構建AI生態的前期投入。
對小米來說,大模型API短期不急于賺錢。小米總裁盧偉冰在財報電話會上明確表示,AI商業化仍處于起步階段,當前核心戰略聚焦于強化基座模型能力,并以自研基座模型賦能“人車家全生態”。
這背后是一條清晰的路徑:降價→拉開發者→建生態→反哺硬件→形成閉環。DeepSeek走的是純技術降本路線,小米走的是生態降本路線。殊途同歸,都指向同一個方向:讓AI真正便宜下來。
1美元API時代來臨了嗎?
如果說2025年是中國AI大模型的“百模大戰”之年,那么2026年就是“價格戰終結之戰”。
DeepSeek將緩存命中價格打到0.025元/百萬Tokens——調用百萬級Token的成本甚至低于通話費。現在小米跟進入場,價格體系基本見底。
小米此番降價背后還有一個值得關注的細節:
2010年代的中國云計算行業,也是經過一輪慘烈的價格戰后,加速了企業級客戶的上云速度,催生了整個生態的成熟。
如今這一幕正在AI行業重演。
大模型API的極端低價會產生怎樣的化學反應?
首先,開發者的門檻被徹底擊穿。當一個創業團隊只需要幾塊錢就能跑完模型的整個MVP測試周期,試錯成本幾乎為零。
AI原生應用的春天可能真的要來了。
其次,大模型的競爭從性能戰爭升級為“性價比戰爭”。未來衡量大模型好壞的標準,不只是MMLU、HumanEval這些Benchmark分數,更包括“完成一次實際任務需要花多少錢”。
DeepSeek和小米已經在用行動重新定義競爭規則。
最后,大模型行業加速洗牌。有技術優勢的玩家通過降價快速占領市場,缺乏底層技術支撐的廠商要么被迫出局,要么轉型走高端定制路線。
行業分析也印證了這一趨勢:阿里通義、字節豆包等相繼下調API價格,智譜GLM、騰訊混元等主打企業定制服務的則維持穩定甚至小幅上調,形成“通用模型降價走量、高端模型溢價保值”的新格局。
尾聲
如果我們只把目光聚焦于小米和DeepSeek的價格廝殺,格局就太小了。
DeepSeek代表著開源AI的崛起。其V4系列不僅價格低,且采用MIT License開源,全球開發者都可自由下載、微調、商用部署。在DeepSeek之前,開源力量從未如此強大。
斯坦福AI指數2026指出,開源模型與閉源模型的性能差距已從17.5個百分點驟降至0.3%。而小米的MiMo-V2.5系列同樣采用MIT協議全系開源。
而頂尖模型的開源,正在將AI應用開發的門檻降至歷史最低點,行業壁壘從模型本身轉向應用場景和數據。
降價不是終點。當API價格趨近于運營成本,大模型公司必須尋找新的價值增長點。
小米已經找到了自己的答案:AI賦能“人車家全生態”。雷軍表示小米未來三年600億AI投入,目標是將AI融入小米的所有核心產品中。
目前小米大模型已登頂OpenRouter平臺日榜、周榜雙第一,成為全球增長最快的開源智能體首選推理引擎。
對DeepSeek而言,降價本身就是商業邏輯的延續。DeepSeek的開源模型+收費API模式,可能成為中國AI走向全球的另一條路徑。
說到這里,我們不禁要問,小米大模型是在對標DeepSeek嗎?
答案是肯定的——至少從定價策略上看,小米幾乎復刻了DeepSeek的降價打法。但兩者之間的“對標”,并不局限于誰能把價格打得更低。
小米對標的是DeepSeek對整個行業發起的挑戰:推動API價格逼近成本線,推動模型從閉源走向開源,推動行業競爭從堆算力、拼參數轉向比效率、比生態、比落地。
在這場競賽中,小米找到了一條屬于自己的路——不靠純技術降本一步登天,而是靠生態規模和端側落地的獨特壁壘構筑護城河。
而DeepSeek,則用極致的架構創新證明了——即使是硬件資源受限的中國企業,也能用算法和工程能力做出世界級的模型,并以此撬動整個行業的成本結構。
這場降價對戰的終點,不是一個勝利者的加冕,而是AI普惠的起點。
當百萬級Token的調用成本低于通話費,當頂尖開源模型向所有開發者免費開放權重,從大公司到初創企業再到個人開發者,AI應用的天花板正被無限推高。
而DeepSeek和小米,恰恰是這場變革中最關鍵的兩大推手。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.