網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

剛剛，梁文鋒被曝史上首次融資！DeepSeek V4徹底擺脫英偉達(dá)

2026-04-18 11:40:48　來源: 純潔的微笑

陜西舉報(bào)

分享至

新智元報(bào)道

編輯：Aeneas 好困

【新智元導(dǎo)讀】今早AI圈炸了！從不融資的DeepSeek首度開口：尋求100億美元估值，籌集3億美元。V4即將來襲，萬億參數(shù)+華為昇騰加持，連老黃都慌了！

今早，AI圈都被這個(gè)消息震撼了。

外媒The Information曝出，DeepSeek正尋求首次外部融資！

打破「從不融資」鐵律的DeepSeek，這次尋求以不低于100億美元的估值，籌集至少3億美元的資金。

在極其燒錢的AI大模型開發(fā)競賽中，DeepSeek也需要充實(shí)資金彈藥庫了。

曾經(jīng)的DeepSeek，堅(jiān)決不融資

對沖基金巨頭幻方量化旗下的DeepSeek，在R1引起硅谷和華爾街軒然大波后，多次拒絕了國內(nèi)頂級風(fēng)投和科技巨頭的投資意向。

DeepSeek這次選擇啟動(dòng)融資，意味著梁文鋒終于做出了巨大的轉(zhuǎn)變。

此前，作為技術(shù)理想主義者的他，一直希望保持DeepSeek的獨(dú)立性，不受商業(yè)壓力的干擾。

上一次發(fā)布新一代模型，還是在2025年DeepSeek R1爆火時(shí)。如今，DeepSeek已經(jīng)讓全行業(yè)等了一年半。

如果此次融資成功，DeepSeek就可以擁有更多算力，同時(shí)還能開出更高薪酬，防止頂尖研究者流失。

不過，由于DeepSeek「中國初創(chuàng)公司」的身份，一些美國風(fēng)險(xiǎn)投資人態(tài)度會(huì)比較謹(jǐn)慎。

DeepSeek V4的發(fā)布時(shí)間一再推遲，同時(shí)AI圈的競爭環(huán)境已經(jīng)大變樣。

如今全球的各大頂尖模型都在快速迭代，中美兩國的科技巨頭們正憑借財(cái)大氣粗的優(yōu)勢不斷占領(lǐng)高位。

或許，這種壓力終于促使DeepSeek轉(zhuǎn)變了融資策略。

V4，一場萬億參數(shù)的硬仗

按照The Information的說法，V4原定今年2月亮相，但已跳票多次。

路透在4月初給出的最新時(shí)間窗口是「未來幾周內(nèi)」。

從目前已知信息來看，V4的規(guī)模和野心遠(yuǎn)超前代。

參數(shù)量躍升至萬億級別。

V4采用MoE架構(gòu)，總參數(shù)約1萬億，但每個(gè)token僅激活約370億參數(shù)，推理成本與V3持平。這個(gè)設(shè)計(jì)思路延續(xù)了DeepSeek一貫的效率優(yōu)先哲學(xué)。

來源網(wǎng)絡(luò)的爆料圖

上下文窗口擴(kuò)展到100萬token。

V4引入了一套名為Engram的條件記憶架構(gòu)，實(shí)現(xiàn)了對超長上下文的恒定時(shí)間檢索。據(jù)內(nèi)部測試，在100萬token長度下的信息召回率達(dá)到97%，遠(yuǎn)超V3在128K上下文時(shí)的表現(xiàn)。

原生多模態(tài)。

據(jù)FT報(bào)道，V4將是DeepSeek首個(gè)原生多模態(tài)模型，支持文本、圖像和視頻生成。此前DeepSeek的模型一直以純文本為主，而其他旗艦?zāi)Ｐ驮缫褤肀Ф嗄B(tài)。

代碼能力大幅強(qiáng)化。

V4從立項(xiàng)之初就以代碼生成為核心目標(biāo)。內(nèi)部benchmark顯示SWE-bench成績超過80%，HumanEval達(dá)到90%。據(jù)稱V4能處理整個(gè)代碼倉庫級別的復(fù)雜bug修復(fù)，在長上下文代碼推理上的表現(xiàn)將超越Claude和GPT系列。

此外，還有爆料稱，V4預(yù)計(jì)將分兩個(gè)版本發(fā)布。

完整版超萬億參數(shù)，針對高級推理和復(fù)雜代碼任務(wù)優(yōu)化，面向華為昇騰芯片；輕量版約2000億參數(shù)，面向通用對話和API服務(wù)，可在其他國產(chǎn)芯片上運(yùn)行。

開源方面，V4計(jì)劃以Apache 2.0協(xié)議開放權(quán)重，延續(xù)DeepSeek一貫的開源策略。

什么時(shí)候能用上？多個(gè)信源指向4月底。

3月9日，一個(gè)名為「V4 Lite」的版本曾短暫出現(xiàn)在DeepSeek平臺(tái)上隨后被撤下。

4月初，又有開發(fā)者發(fā)現(xiàn)API節(jié)點(diǎn)上出現(xiàn)了V4 Lite的測試版本，推理速度提升30%，128K上下文的信息召回率從45%跳到了94%。

DeepSeek近日還在內(nèi)蒙古烏蘭察布發(fā)布了服務(wù)器運(yùn)維工程師和交付經(jīng)理的招聘崗位，這是該公司首次公開招聘算力基礎(chǔ)設(shè)施相關(guān)的駐場人員。

種種跡象表明，V4已經(jīng)不在實(shí)驗(yàn)室里了，而是在為大規(guī)模部署做最后準(zhǔn)備。

老黃最不想看到的事正在發(fā)生

V4延期的核心原因，跟模型本身關(guān)系不大。真正的難點(diǎn)，是一場底層硬件的大遷移。

DeepSeek之前所有模型都基于英偉達(dá)芯片訓(xùn)練。但V4走了一條不同的路。

據(jù)路透報(bào)道，V4將運(yùn)行在華為最新的昇騰芯片上。

DeepSeek的工程師們花了大量時(shí)間解決V4對華為芯片的適配問題，重寫核心代碼，從英偉達(dá)的CUDA生態(tài)遷移到華為的CANN架構(gòu)。

這是一個(gè)技術(shù)決策，也是一個(gè)戰(zhàn)略信號。

DeepSeek刻意沒有給英偉達(dá)和AMD提前提供V4做優(yōu)化適配，而是將早期訪問權(quán)限獨(dú)家給了國產(chǎn)芯片廠商。

如果V4在華為芯片上跑出有競爭力的性能，它將是全球第一個(gè)不依賴英偉達(dá)的前沿AI模型。

老黃本人對此也不淡定。

他在近期采訪中直言，DeepSeek基于華為平臺(tái)的新模型「對美國來說將是一個(gè)糟糕的結(jié)果」。

言下之意是，一旦AI模型被優(yōu)化為在中國硬件上跑得最好，美國芯片的護(hù)城河就不再牢固。

3億美元，脫離英偉達(dá)生態(tài)？

如今，即便是以「花小錢辦大事」著稱的DeepSeek，也無法僅靠一家持續(xù)輸血。

據(jù)斯坦福大學(xué)2026年度AI指數(shù)報(bào)告，截至今年3月，美國頂級模型與中國最強(qiáng)競品之間的性能差距僅剩2.7個(gè)百分點(diǎn)。差距越小，每一步追趕的邊際成本越高。

就在本月，OpenAI剛以3000億美元估值完成400億美元融資，相比之下，3億美元也算不得天文數(shù)字。

V4真正的賭注，在于它要證明前沿AI可以完全脫離英偉達(dá)生態(tài)獨(dú)立運(yùn)轉(zhuǎn)。

3億美元，押的就是這一把。

參考資料：

https://www.theinformation.com/articles/chinas-deepseek-raising-money-first-time-10-billion-plus-valuation?rc=epv9gi

如果你：不想打工，但沒方向；想做副業(yè)，但一直賺不到錢；那這次，別再錯(cuò)過了。

我去年All in AI跨境，砸了幾十萬、跑了半年，把整條鏈路跑通；往期學(xué)員90%以上拿到了結(jié)果，為了讓更多朋友了解這個(gè)項(xiàng)目。

我們決定開放一場：《3天AI跨境實(shí)操訓(xùn)練營》，這3天，你能學(xué)到的是：

從0開店的完整流程
AI選品 + 上架實(shí)操
跑通第一單的完整路徑

重點(diǎn)不是聽課，而是：帶你親手跑一遍閉環(huán)。

【注意】

這個(gè)訓(xùn)練營，后續(xù)是正常收費(fèi)99元的，這一次是首次對外開放，限時(shí)免費(fèi)。

而且只開放一批名額，滿了就關(guān)。按照我們往期的經(jīng)驗(yàn)：執(zhí)行力強(qiáng)的人，3天就可以把店鋪開起來，甚至跑出第一單。

通過后回復(fù)：【訓(xùn)練營】

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.