這兩天,投資圈徹底炸了。
有知情人士爆料,AI明星公司DeepSeek正式啟動成立以來的首次外部融資——目標估值不低于100億美元,計劃募集至少3億美元資金。
而眾所周知,就在一年前梁文鋒還明確拒絕過VC投資,并對外表示“DeepSeek暫無融資計劃”。
當時,有知名投資者找了三撥人想約見,被拒絕;甚至與DeepSeek北京辦公室同樓辦公的百度風投也沒能投進去。
那個曾經把所有投資人擋在門外的梁文鋒,為什么突然要錢了?
![]()
“從不融資”已是過去
消息一出,討論立刻分成了兩派。
一種說,完了,連DeepSeek都頂不住AI燒錢的壓力;另一種說,AI圈要變天了,梁文鋒這是要憋個大的。
但如果你只看到“缺錢”兩個字,就把梁文鋒和這件事看小了。
![]()
圖源:知乎
據悉,2023年7月,當DeepSeek正式成立之時,梁文鋒從第一天就給這家公司劃了一條清晰的紅線:不接受外部融資,不稀釋股權,不被任何人的商業化時間表綁架。
他確實有這個底氣。梁文鋒是幻方量化的創始人,而幻方是國內頂級的量化對沖基金,管理規模超700億元,2025年平均收益率高達56.6%。
早在2019年,他就花2億元自研了深度學習訓練平臺螢火一號,兩年后又砸10億元建螢火二號,大批采購英偉達A100,把幻方做成了國內屈指可數的萬卡集群公司。
有量化基金從業者估算,僅2025年一年,幻方就為梁文鋒帶來了超過7億美元的收入。
有錢、有卡、有人,這就是DeepSeek長期拒絕融資的底氣。梁文鋒說得也很直白:VC都是幫LP管錢,都得賺錢,所以就談不到一塊去。
然而,在過去一年里,這個防火墻似乎被逐漸擊穿了。
當下,AI大模型的競賽,已經到了決勝期或決勝期前夜。
3月31日,OpenAI剛以8520億美元的估值完成了1220億美元的融資。Anthropic在2月以3800億美元估值完成300億美元融資。
國內同樣在加速,智譜AI已于1月登陸港股,IPO前完成8輪融資、累計募資超83億元。月之暗面Kimi更是在短短數月內先后完成多輪融資,估值已突破100億美元。
當身邊的競品都在用市場化手段綁定人才、儲備算力,梁文鋒還能堅持多久?
![]()
圖源:X
半導體研究機構SemiAnalysis曾估算,DeepSeek的服務器總資本支出接近16億美元,其中9億多直接和運行計算集群相關。而越往頂尖走,每往前追一步,邊際成本就越高。
從15秒跑到13秒,多練練就行;但從10秒跑到9秒9,每提升0.1秒,都要付出幾倍的努力和成本。這不是靠一家量化基金的利潤就能無限支撐的。
此外,不少人認為DeepSeek曾經的優勢,在于對英偉達芯片的深度綁定和調教。
與多數依賴規模堆疊的大模型不同,DeepSeek是從“效率”入手,通過一系列算法與工程優化,實現了接近SOTA水平的性能,同時大幅壓低成本。
但這種效率,一方面建立在梁文鋒早年量化交易積累的大量英偉達GPU資源之上,另一方面也深度依賴英偉達的CUDA生態。
一旦出現供應鏈限制,整個公司的研發、訓練、推理都可能受到嚴重影響。而當前美國對高端芯片的出口管制持續收緊,英偉達最新一代Blackwell芯片的獲取存在一定限制。
多重壓力疊加之下,不是梁文鋒想通了,是他不得不通。
![]()
DeepSeek V4背后,梁文鋒的野心徹底暴露
很多人盯著融資的數字,卻忽略了這次事件里最影響行業格局的一件事:DeepSeek即將發布的V4模型,正在全力從英偉達的CUDA生態向華為昇騰芯片遷移。
結合前面所說,V4的技術野心,遠超外界想象。
根據目前披露的信息,V4的參數規模躍升至萬億級別。它采用MoE架構,總參數約1萬億,但每個token僅激活約370億參數,推理成本幾乎與V3持平——這個設計思路延續了DeepSeek一貫的效率優先哲學。
上下文窗口擴展到100萬token,并引入了一套名為Engram的條件記憶架構,實現超長上下文的恒定時間檢索。據內部測試,在100萬token長度下的信息召回率達到97%,遠超V3在128K上下文時的表現。
更重要的是,V4將是DeepSeek首個原生多模態模型,支持文本、圖像和視頻生成。此前DeepSeek的模型一直以純文本為主,而其他旗艦模型早已擁抱多模態。
據悉,該模型代碼能力也被大幅強化,內部benchmark顯示SWE-bench成績超過80%,HumanEval達到90%,據稱V4能處理整個代碼倉庫級別的復雜bug修復。
此外,V4預計將分兩個版本發布:完整版超萬億參數,面向華為昇騰芯片;輕量版約2000億參數,面向通用對話和API服務。
![]()
圖源:抖音
當然,行業的關注點不會停留在模型本身。
DeepSeek V4對華為昇騰算力生態的深度適配,大幅降低了對英偉達生態的依賴。這件事的意義之大,以至于英偉達創始人黃仁勛在近期采訪中公開表達了關注。
外媒爆料,黃仁勛私下表示,“如果有一天DeepSeek先在華為芯片上發布,那對我們來說將是一個可怕的結果”。
當然,這條路并不好走。與英偉達CUDA生態的深度綁定,使得切換國產芯片需要“重寫”大量核心代碼,遷移成本高昂。
據多家行業媒體報道,DeepSeek原計劃今年2月發布V4,但因工程問題多次推遲,團隊正在投入大量精力進行適配遷移工作。這也是DeepSeek已有15個月沒有大版本更新的重要原因之一。
然而,這件事一旦做成,意義將遠遠超出DeepSeek自身。
它將成為全球第一個不依賴英偉達的頂尖AI大模型,為中國AI產業鏈的自主可控提供一個重要的技術支點。
從這個角度看,梁文鋒的融資,買的是算力,更是一個生態自主的機會。
![]()
融資的深層邏輯
那么,除了這些,融資的真正意義是什么?
首先,融資解決了期權定價的問題。
DeepSeek此前一直沒有進行大規模市場化融資,公司估值沒有明確的市場標尺,團隊成員手里的期權價值缺少清晰的參照。
這次融資,通過市場化方式給公司定了估值,本質上就是給團隊搭建了合理的長期激勵體系。這比給員工漲工資更重要——在AI這個高度依賴頂級人才的行業,沒有市場化的激勵機制,留人就是一句空話。
其次,融資為V4的研發和部署提供了彈藥。
V4要實現萬億參數、適配國產芯片、做到原生多模態,每一項都是燒錢的大工程。雖然幻方量化持續為DeepSeek供血,但AI大模型競賽的本質已經變了——這不是接下來一兩年可以結束的,未來三年有可能爭出個分曉。
梁文鋒這次啟動融資,核心就是為了長期研發儲備充足的算力彈藥。
第三,融資開啟了商業化的通道。
DeepSeek的開源路線決定了它的商業化路徑必須走差異化。閉源玩家的商業化路徑更清晰,但DeepSeek必須通過API調用和企業定制來變現。
而企業級客戶,尤其是政府客戶和大型國企,選擇AI供應商時,看的不是技術指標,而是資質和背景。
本輪融資如果引入國有資本,意味著DeepSeek可能獲得政府AI項目的優先供應商資格;美元基金入場,則為國際化擴張鋪平了資質道路。
但融資也帶來了一個無法回避的問題:DeepSeek正在從一家“例外”走向一家正常的商業公司。
過去DeepSeek最特殊的地方,恰恰在于它不像一家典型AI公司。它背后有幻方量化供血,梁文鋒不急著融資,也不急著把公司推上估值、商業化和資本退出的流水線。
DeepSeek對自己的定位,與其說是一家商業公司,不如說更像是一個完全獨立于資本市場而運作的開源研究機構。
但今天的AI競爭已經不是單點模型能力的競爭了。
字節有豆包、有即夢,阿里和騰訊開始把世界模型推到臺前,智譜、MiniMax已經登陸港股。
如果只看DeepSeek至少100億美元的估值,它當然還是一家很貴的AI公司。可放在今天的中國AI坐標系里,智譜、MiniMax在港股高點的市值都曾突破3000億港元,月之暗面最新估值已經達到了180億美元。
DeepSeek過去可以靠技術理想和開源聲望行走江湖。但當行業從技術競賽轉向生態和商業化競爭,一家公司終究需要治理結構、估值體系、薪酬激勵、商業化收入和長期預算。
研究理想可以繼續存在,但公司終究要面對現實。
不是理想不好,是現實太貴。算力成本在漲,人才價格在漲,競爭對手的估值在漲——當所有生產要素都在漲價,技術理想主義本身也在漲價。
梁文鋒用三年時間證明了一件事:用更少的錢可以做出很好的模型。但現在他需要證明另一件事:用市場化的方式,能不能讓這家公司走得更遠。
畢竟,AGI不是靠理想就能抵達的。
作者| 劉峰
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.