![]()
新智元報(bào)道
編輯:Aeneas 好困
【新智元導(dǎo)讀】今早AI圈炸了!從不融資的DeepSeek首度開口:尋求100億美元估值,籌集3億美元。V4即將來襲,萬億參數(shù)+華為昇騰加持,連老黃都慌了!
今早,AI圈都被這個(gè)消息震撼了。
外媒The Information曝出,DeepSeek正尋求首次外部融資!
打破「從不融資」鐵律的DeepSeek,這次尋求以不低于100億美元的估值,籌集至少3億美元的資金。
在極其燒錢的AI大模型開發(fā)競賽中,DeepSeek也需要充實(shí)資金彈藥庫了。
![]()
曾經(jīng)的DeepSeek,堅(jiān)決不融資
對沖基金巨頭幻方量化旗下的DeepSeek,在R1引起硅谷和華爾街軒然大波后,多次拒絕了國內(nèi)頂級風(fēng)投和科技巨頭的投資意向。
DeepSeek這次選擇啟動(dòng)融資,意味著梁文鋒終于做出了巨大的轉(zhuǎn)變。
此前,作為技術(shù)理想主義者的他,一直希望保持DeepSeek的獨(dú)立性,不受商業(yè)壓力的干擾。
上一次發(fā)布新一代模型,還是在2025年DeepSeek R1爆火時(shí)。如今,DeepSeek已經(jīng)讓全行業(yè)等了一年半。
如果此次融資成功,DeepSeek就可以擁有更多算力,同時(shí)還能開出更高薪酬,防止頂尖研究者流失。
不過,由于DeepSeek「中國初創(chuàng)公司」的身份,一些美國風(fēng)險(xiǎn)投資人態(tài)度會(huì)比較謹(jǐn)慎。
DeepSeek V4的發(fā)布時(shí)間一再推遲,同時(shí)AI圈的競爭環(huán)境已經(jīng)大變樣。
如今全球的各大頂尖模型都在快速迭代,中美兩國的科技巨頭們正憑借財(cái)大氣粗的優(yōu)勢不斷占領(lǐng)高位。
或許,這種壓力終于促使DeepSeek轉(zhuǎn)變了融資策略。
V4,一場萬億參數(shù)的硬仗
按照The Information的說法,V4原定今年2月亮相,但已跳票多次。
路透在4月初給出的最新時(shí)間窗口是「未來幾周內(nèi)」。
從目前已知信息來看,V4的規(guī)模和野心遠(yuǎn)超前代。
參數(shù)量躍升至萬億級別。
V4采用MoE架構(gòu),總參數(shù)約1萬億,但每個(gè)token僅激活約370億參數(shù),推理成本與V3持平。這個(gè)設(shè)計(jì)思路延續(xù)了DeepSeek一貫的效率優(yōu)先哲學(xué)。
![]()
來源網(wǎng)絡(luò)的爆料圖
上下文窗口擴(kuò)展到100萬token。
V4引入了一套名為Engram的條件記憶架構(gòu),實(shí)現(xiàn)了對超長上下文的恒定時(shí)間檢索。據(jù)內(nèi)部測試,在100萬token長度下的信息召回率達(dá)到97%,遠(yuǎn)超V3在128K上下文時(shí)的表現(xiàn)。
![]()
原生多模態(tài)。
據(jù)FT報(bào)道,V4將是DeepSeek首個(gè)原生多模態(tài)模型,支持文本、圖像和視頻生成。此前DeepSeek的模型一直以純文本為主,而其他旗艦?zāi)P驮缫褤肀Ф嗄B(tài)。
代碼能力大幅強(qiáng)化。
V4從立項(xiàng)之初就以代碼生成為核心目標(biāo)。內(nèi)部benchmark顯示SWE-bench成績超過80%,HumanEval達(dá)到90%。據(jù)稱V4能處理整個(gè)代碼倉庫級別的復(fù)雜bug修復(fù),在長上下文代碼推理上的表現(xiàn)將超越Claude和GPT系列。
此外,還有爆料稱,V4預(yù)計(jì)將分兩個(gè)版本發(fā)布。
完整版超萬億參數(shù),針對高級推理和復(fù)雜代碼任務(wù)優(yōu)化,面向華為昇騰芯片;輕量版約2000億參數(shù),面向通用對話和API服務(wù),可在其他國產(chǎn)芯片上運(yùn)行。
開源方面,V4計(jì)劃以Apache 2.0協(xié)議開放權(quán)重,延續(xù)DeepSeek一貫的開源策略。
什么時(shí)候能用上?多個(gè)信源指向4月底。
3月9日,一個(gè)名為「V4 Lite」的版本曾短暫出現(xiàn)在DeepSeek平臺(tái)上隨后被撤下。
4月初,又有開發(fā)者發(fā)現(xiàn)API節(jié)點(diǎn)上出現(xiàn)了V4 Lite的測試版本,推理速度提升30%,128K上下文的信息召回率從45%跳到了94%。
DeepSeek近日還在內(nèi)蒙古烏蘭察布發(fā)布了服務(wù)器運(yùn)維工程師和交付經(jīng)理的招聘崗位,這是該公司首次公開招聘算力基礎(chǔ)設(shè)施相關(guān)的駐場人員。
種種跡象表明,V4已經(jīng)不在實(shí)驗(yàn)室里了,而是在為大規(guī)模部署做最后準(zhǔn)備。
老黃最不想看到的事正在發(fā)生
V4延期的核心原因,跟模型本身關(guān)系不大。真正的難點(diǎn),是一場底層硬件的大遷移。
DeepSeek之前所有模型都基于英偉達(dá)芯片訓(xùn)練。但V4走了一條不同的路。
據(jù)路透報(bào)道,V4將運(yùn)行在華為最新的昇騰芯片上。
DeepSeek的工程師們花了大量時(shí)間解決V4對華為芯片的適配問題,重寫核心代碼,從英偉達(dá)的CUDA生態(tài)遷移到華為的CANN架構(gòu)。
這是一個(gè)技術(shù)決策,也是一個(gè)戰(zhàn)略信號。
DeepSeek刻意沒有給英偉達(dá)和AMD提前提供V4做優(yōu)化適配,而是將早期訪問權(quán)限獨(dú)家給了國產(chǎn)芯片廠商。
如果V4在華為芯片上跑出有競爭力的性能,它將是全球第一個(gè)不依賴英偉達(dá)的前沿AI模型。
老黃本人對此也不淡定。
他在近期采訪中直言,DeepSeek基于華為平臺(tái)的新模型「對美國來說將是一個(gè)糟糕的結(jié)果」。
言下之意是,一旦AI模型被優(yōu)化為在中國硬件上跑得最好,美國芯片的護(hù)城河就不再牢固。
![]()
3億美元,脫離英偉達(dá)生態(tài)?
如今,即便是以「花小錢辦大事」著稱的DeepSeek,也無法僅靠一家持續(xù)輸血。
據(jù)斯坦福大學(xué)2026年度AI指數(shù)報(bào)告,截至今年3月,美國頂級模型與中國最強(qiáng)競品之間的性能差距僅剩2.7個(gè)百分點(diǎn)。差距越小,每一步追趕的邊際成本越高。
就在本月,OpenAI剛以3000億美元估值完成400億美元融資,相比之下,3億美元也算不得天文數(shù)字。
V4真正的賭注,在于它要證明前沿AI可以完全脫離英偉達(dá)生態(tài)獨(dú)立運(yùn)轉(zhuǎn)。
3億美元,押的就是這一把。
參考資料:
https://www.theinformation.com/articles/chinas-deepseek-raising-money-first-time-10-billion-plus-valuation?rc=epv9gi
![]()
如果你:不想打工,但沒方向;想做副業(yè),但一直賺不到錢;那這次,別再錯(cuò)過了。
我去年All in AI跨境,砸了幾十萬、跑了半年,把整條鏈路跑通;往期學(xué)員90%以上拿到了結(jié)果,為了讓更多朋友了解這個(gè)項(xiàng)目。
我們決定開放一場:《3天AI跨境實(shí)操訓(xùn)練營》,這3天,你能學(xué)到的是:
從0開店的完整流程
AI選品 + 上架實(shí)操
跑通第一單的完整路徑
重點(diǎn)不是聽課,而是:帶你親手跑一遍閉環(huán)。
【注意】
這個(gè)訓(xùn)練營,后續(xù)是正常收費(fèi)99元的,這一次是首次對外開放,限時(shí)免費(fèi)。
而且只開放一批名額,滿了就關(guān)。按照我們往期的經(jīng)驗(yàn):執(zhí)行力強(qiáng)的人,3天就可以把店鋪開起來,甚至跑出第一單。
通過后回復(fù):【訓(xùn)練營】
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.