網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

DeepSeek梁文鋒的大動作，黃仁勛慌了！

2026-04-18 23:09:02　來源: 筆記俠

北京舉報(bào)

分享至

內(nèi)容來源：筆記俠（Notesman）。

責(zé)編| 柒排版| 沐言

第 9561篇深度好文：4855字 | 11分鐘閱讀

商業(yè)思維

筆記君說：

最近AI圈炸鍋了，此前一直以低融資節(jié)奏、強(qiáng)自主可控著稱的DeepSeek，被曝出新一輪融資計(jì)劃——估值不低于100億美元，計(jì)劃募集至少3億美元。

消息一出，各種討論聲音立刻分成了兩派：

一種說，完了，連DeepSeek都頂不住AI燒錢的壓力；另一種說，AI圈要變天了，梁文鋒這是要憋個(gè)大的。

說實(shí)話，如果你只看到“缺錢”，就把梁文鋒和這件事，徹底看小了。

一、融資3億美金，

從來不是單純填窟窿

DeepSeek缺不缺短期運(yùn)營的錢？

它背后是國內(nèi)對沖基金巨頭幻方量化，創(chuàng)始人梁文鋒在量化領(lǐng)域深耕多年，早已實(shí)現(xiàn)財(cái)富自由。

2023年DeepSeek成立時(shí)，由幻方量化及創(chuàng)始團(tuán)隊(duì)提供了充足的初始研發(fā)資金支持，核心投入全部聚焦大模型底層技術(shù)研發(fā)。

所以，顯然不缺。

過去兩年，AI大模型融資潮洶涌，數(shù)億美元的融資單一輪接一輪，唯獨(dú)DeepSeek是個(gè)異類。

那問題來了：之前一直嚴(yán)控融資節(jié)奏，現(xiàn)在為什么要啟動新一輪融資？

顯然，大模型之爭，不是接下來一兩年可以結(jié)束的，未來三年有可能爭出個(gè)分曉，現(xiàn)在進(jìn)入了決戰(zhàn)期，或者決戰(zhàn)期前夜。

因此，必須算算財(cái)務(wù)賬。

第一筆，是算力的賬。

AI大模型的競賽，已經(jīng)到了貼身肉搏的階段。

根據(jù)斯坦福大學(xué)2026年度AI指數(shù)報(bào)告，2025-2026年，中美頭部大模型在核心能力基準(zhǔn)上的差距持續(xù)收窄，在多個(gè)垂直賽道已實(shí)現(xiàn)持平甚至反超。

但越往頂尖走，每往前追一步，邊際成本就越高。就像跑步，你從15秒跑到13秒，多練練就行；但你要從10秒跑到9秒9，每提升0.1秒，都要付出幾倍的努力和成本。

就在3月31日，OpenAI剛以8520億美元的估值完成了1220億美元的融資。梁文鋒這次啟動融資，核心就是為長期研發(fā)儲備充足的算力彈藥。

第二筆，是人才的賬。

過去半年，DeepSeek有幾位核心研發(fā)成員陸續(xù)離職，被國內(nèi)大廠挖走了。不是這些人不認(rèn)同梁文鋒的技術(shù)理想，是外面給的條件，實(shí)在太有誘惑力了。

據(jù)財(cái)經(jīng)媒體晚點(diǎn)了解，前DeepSeek研究員郭達(dá)雅近億元入職字節(jié)跳動負(fù)責(zé)大模型研發(fā)的組織Seed，但需要滿足一定條件才能拿全。

更別說，同期智譜、MiniMax這些同行紛紛上市，股價(jià)一路上漲，人家手里的期權(quán)，有了明確的市場化財(cái)富錨點(diǎn)。

而DeepSeek此前一直沒有進(jìn)行大規(guī)模市場化融資，公司估值沒有明確的市場標(biāo)尺，團(tuán)隊(duì)成員手里的期權(quán)價(jià)值，也缺少清晰的參照。

這次融資，通過市場化方式給公司定了估值，本質(zhì)上就是給團(tuán)隊(duì)搭建了合理的長期激勵(lì)體系：我不會讓相信長期價(jià)值的人，吃虧。

二、真正的行業(yè)變量，

是國產(chǎn)算力生態(tài)的深度適配

很多人盯著融資的數(shù)字，卻忽略了這次事件里，最影響行業(yè)格局的一件事：

據(jù)國內(nèi)多家行業(yè)媒體爆料，DeepSeek即將發(fā)布的V4模型，核心完成了對華為昇騰算力生態(tài)的深度適配，大幅降低了對英偉達(dá)生態(tài)的依賴。

這件事，也正是英偉達(dá)創(chuàng)始人黃仁勛在近期采訪中公開表達(dá)關(guān)注的核心原因。

過去全球絕大多數(shù)主流AI大模型，從OpenAI的GPT，到Anthropic的Claude，核心訓(xùn)練與部署都深度綁定英偉達(dá)的生態(tài)：

訓(xùn)練靠英偉達(dá)GPU，底層算子（是深度學(xué)習(xí)框架與硬件之間的關(guān)鍵橋梁），是模型執(zhí)行的最小可計(jì)算單元適配依賴英偉達(dá)的CUDA生態(tài)，相當(dāng)于整個(gè)行業(yè)的核心算力命脈，很大程度上攥在老黃手里。

一旦出現(xiàn)供應(yīng)鏈限制，整個(gè)公司的研發(fā)、訓(xùn)練、推理都可能受到嚴(yán)重影響，這就是我們常說的“卡脖子”風(fēng)險(xiǎn)。

但DeepSeek這次，在主流開源大模型的國產(chǎn)適配這件事上，邁出了關(guān)鍵一步。

據(jù)行業(yè)爆料，V4將深度適配華為最新的昇騰芯片。

DeepSeek的工程師們花了大量時(shí)間，完成了算子層兼容、通信庫適配、訓(xùn)練框架底層優(yōu)化，實(shí)現(xiàn)了模型從英偉達(dá)CUDA生態(tài)到華為昇騰CANN架構(gòu)的深度遷移。

如果V4能在昇騰芯片上跑出有競爭力的性能，它將成為國內(nèi)少數(shù)實(shí)現(xiàn)從底層算力到模型層全棧國產(chǎn)適配的通用大模型之一。

要知道，華為盤古大模型從2020年立項(xiàng)起，就基于昇騰芯片+CANN計(jì)算架構(gòu)+MindSpore框架的全棧國產(chǎn)生態(tài)開發(fā)，是國內(nèi)最早實(shí)現(xiàn)完全不依賴英偉達(dá)CUDA生態(tài)的前沿大模型。

更早的悟道2.0、紫東太初等大模型，也早已實(shí)現(xiàn)了純國產(chǎn)芯片的落地部署。

而DeepSeek的核心突破，是把一款全球開發(fā)者廣泛使用的主流開源大模型，完成了對國產(chǎn)算力生態(tài)的深度適配，這會大幅降低整個(gè)行業(yè)對英偉達(dá)芯片的依賴。

這也是黃仁勛直言這件事“對美國來說將是一個(gè)糟糕的結(jié)果”的核心原因：一旦主流開源大模型在國產(chǎn)算力生態(tài)上實(shí)現(xiàn)了規(guī)模化落地，美國芯片在AI領(lǐng)域的護(hù)城河，就會被徹底打開一個(gè)缺口。

那這個(gè)讓行業(yè)高度關(guān)注的V4，到底有哪些值得期待的能力？

根據(jù)目前的行業(yè)爆料，核心有三個(gè)核心方向的升級。

1.極致的效率優(yōu)化，延續(xù)花小錢辦大事的核心思路

據(jù)行業(yè)爆料信息顯示，V4將采用MoE（混合專家）架構(gòu)，總參數(shù)規(guī)模達(dá)到萬億級別。

你可以把MoE混合專家架構(gòu)，理解成一個(gè)分工明確的專家團(tuán)隊(duì)：

遇到不同的問題，系統(tǒng)只會調(diào)用最擅長解決這個(gè)問題的幾位專家，而不是讓所有專家一起上，這樣就能在大幅提升模型總能力上限的同時(shí)，有效控制住單次推理的算力消耗。

2.長上下文能力的大幅突破

據(jù)行業(yè)爆料，V4引入了名為Engram的條件記憶架構(gòu)，目標(biāo)上下文窗口達(dá)100萬token，在內(nèi)部測試中實(shí)現(xiàn)了較高的信息召回率。

你可能對這個(gè)數(shù)字沒概念，我給你舉個(gè)例子：100萬token的上下文窗口，相當(dāng)于你可以一次性把幾十本長篇小說、整個(gè)公司的全年業(yè)務(wù)文檔全喂給它，它能精準(zhǔn)定位到你需要的任意細(xì)節(jié)信息。

而目前全球公開商用的頭部模型中，Claude 3.7 Opus已開放200萬token上下文窗口，行業(yè)長上下文能力的競爭已進(jìn)入白熱化階段。

3.代碼能力的針對性強(qiáng)化

V4從立項(xiàng)之初，就把代碼生成與長上下文代碼推理作為核心優(yōu)化目標(biāo)。

據(jù)內(nèi)部測試爆料，V4在SWE-bench、HumanEval等行業(yè)通用代碼能力基準(zhǔn)上的表現(xiàn)，已接近甚至部分追平全球頭部模型，核心優(yōu)化方向是整個(gè)代碼倉庫級別的復(fù)雜bug修復(fù)、長鏈路代碼推理。

三、DeepSeek除了贏在技術(shù)，

其實(shí)它還贏在獨(dú)特的組織邏輯

為什么DeepSeek能在短短幾年里，從一眾大模型公司里殺出重圍，成為全球開發(fā)者都關(guān)注的標(biāo)桿？

很多人會說，因?yàn)榱何匿h是天才，因?yàn)樗麄兗夹g(shù)牛。但我告訴你，技術(shù)只是最終的結(jié)果，真正讓它能站穩(wěn)腳跟的，是它3個(gè)和行業(yè)主流打法完全不同的組織邏輯。

第一個(gè)反常識：全球最卷的AI行業(yè)，它靠“拒絕無效加班”守住了研發(fā)效率

現(xiàn)在AI行業(yè)卷成什么樣，你應(yīng)該有所耳聞。

全球頂尖的AI公司，從OpenAI到谷歌，再到國內(nèi)的大廠，核心研發(fā)人員一周工作70-80小時(shí)是常態(tài)，996只能算基礎(chǔ)配置，甚至007連軸轉(zhuǎn)，咖啡當(dāng)水喝、睡在公司都是家常便飯。

但DeepSeek，卻在這個(gè)卷到極致的行業(yè)里，保持了相對寬松的工作節(jié)奏。

它不強(qiáng)制打卡，不推行996，沒有所謂的“奮斗者協(xié)議”，平日里公司的多數(shù)員工，下午6-7點(diǎn)就可以準(zhǔn)時(shí)收拾東西離開公司。

甚至，公司還給員工免費(fèi)提供下班后的球類課程，運(yùn)動場地可以報(bào)銷，明著鼓勵(lì)大家下班別耗在公司，多去運(yùn)動、多休息。

核心管理團(tuán)隊(duì)有一個(gè)共識：一個(gè)人一天能高質(zhì)量輸出的時(shí)間，很難超過6-8小時(shí)。

DeepSeek用結(jié)果證明了：真正的創(chuàng)新，從來不是靠熬時(shí)間熬出來的，是靠高質(zhì)量的專注堆出來的。

第二個(gè)反常識：不搞繁瑣層級，它用極致扁平化干掉了內(nèi)耗

很多人都好奇，據(jù)DeepSeek2025年公開采訪披露，其團(tuán)隊(duì)規(guī)模超300人，其中核心研發(fā)團(tuán)隊(duì)超200人，怎么能干出大廠幾千人都未必能做好的成果？

核心就在于，它保持了極致扁平化的組織架構(gòu)，最大程度干掉了溝通內(nèi)耗。

DeepSeek的核心研發(fā)團(tuán)隊(duì)，采用了弱層級、強(qiáng)協(xié)同的管理模式，沒有大廠常見的層層匯報(bào)的繁瑣流程，也沒有涇渭分明的部門墻。

做基礎(chǔ)模型的團(tuán)隊(duì)、做底層基建的團(tuán)隊(duì)、做數(shù)據(jù)的團(tuán)隊(duì)，不是各干各的，而是交叉分工、深度協(xié)同——模型還在定版階段，三個(gè)團(tuán)隊(duì)就全鏈路參與進(jìn)來了，徹底避免了大廠里常見的“內(nèi)部乙方”的低效內(nèi)耗。

更難得的是，它沒有僵化的分工限制，沒有強(qiáng)制的年度計(jì)劃，給了研發(fā)人員極高的創(chuàng)新自由度。

一個(gè)新方向的啟動，往往就是三五個(gè)人湊在一起，覺得一個(gè)技術(shù)方向有價(jià)值，就可以組隊(duì)開干；如果這個(gè)idea跑出了潛力，公司就會自上而下調(diào)配資源，全力支持。

所有的精力、所有的資源，全都砸在了技術(shù)創(chuàng)新本身。這就是它最核心的競爭力：用極致扁平的組織，把創(chuàng)新的效率，拉到了最高。

第三個(gè)反常識：不唯“大廠經(jīng)驗(yàn)論”，它給了年輕人足夠的創(chuàng)新空間

DeepSeek的人才體系，走了一條不一樣的路：它既不排斥資深專家，也給了年輕人足夠的成長和創(chuàng)新空間。

一方面，它通過社招引入了大量擁有數(shù)十年行業(yè)經(jīng)驗(yàn)的資深專家，包括首席科學(xué)家劉群、CTO林通等核心管理團(tuán)隊(duì)成員，均擁有深厚的行業(yè)積累，官方招聘頁面也長期開放大量要求3-10年行業(yè)經(jīng)驗(yàn)的社招崗位，絕非外界傳言的“幾乎不社招”。

但另一方面，它也通過校招吸納了大量頂尖院校的年輕研發(fā)人才，核心研發(fā)團(tuán)隊(duì)里，有大量本科、碩士學(xué)歷的年輕從業(yè)者，他們沒有被固化思維束縛，敢想敢干，反而做出了很多原創(chuàng)性的技術(shù)突破。

梁文鋒的人才觀，特別值得所有創(chuàng)業(yè)者學(xué)習(xí)：創(chuàng)新需要的，是不知天高地厚的探索精神。

AI是一個(gè)全新的行業(yè)，沒有成熟的路徑可走，沒有固定的經(jīng)驗(yàn)可復(fù)用。這些年輕人，沒有包袱，沒有固化的思維，反而能在無人區(qū)里，走出一條新的路。

四、梁文鋒的底牌，

是穿透本質(zhì)的認(rèn)知

我給你拆解三個(gè)最核心的認(rèn)知，也是他所有決策的底層邏輯，不管你是創(chuàng)業(yè)者還是管理者，都能用得上。

第一，第一性原理：所有的創(chuàng)新，都始于對本質(zhì)的追問

梁文鋒團(tuán)隊(duì)從一開始，就抓住了最核心的本質(zhì)：他們認(rèn)為，語言是通用智能的核心載體，因此在成立初期，就把核心資源聚焦于語言大模型的底層突破，沒有盲目跟風(fēng)分散精力。

但同時(shí)，他們也并未放棄多模態(tài)賽道的布局，已于2025年3月官方發(fā)布了DeepSeek-VL2多模態(tài)大模型，實(shí)現(xiàn)了圖文理解、視覺問答等多模態(tài)能力的落地，做到了“核心聚焦，多點(diǎn)布局”。

還有他一直堅(jiān)持的“效率優(yōu)先”，本質(zhì)也是第一性原理的應(yīng)用。

他沒有跟著行業(yè)堆算力、堆參數(shù)，而是死磕模型效率優(yōu)化，用遠(yuǎn)低于行業(yè)頭部玩家的投入，做出了全球開發(fā)者都認(rèn)可的頂尖模型。

這就是第一性原理的力量：

不跟著別人的規(guī)則卷，回到事物的本質(zhì)，重新制定游戲規(guī)則。

你跟著別人的跑道跑，永遠(yuǎn)只能拿第二；只有你自己開一條新跑道，你才有可能成為領(lǐng)跑者。

第二，長期主義：拒絕短期誘惑，才能拿到長期的最大回報(bào)

他之前嚴(yán)控融資節(jié)奏，是長期主義：他想保持DeepSeek的獨(dú)立性，不被短期商業(yè)變現(xiàn)的壓力干擾，能安安心心做長期的、看不到短期回報(bào)的原創(chuàng)研究，不用為了短期財(cái)報(bào)，去做不符合長期目標(biāo)的事。

他現(xiàn)在選擇啟動新一輪融資，依然是長期主義。

他看清了行業(yè)終局，AI競賽已經(jīng)到了生死關(guān)頭，想要實(shí)現(xiàn)通用人工智能的底層突破，想要打造自主可控的AI技術(shù)生態(tài)，必須要有充足的彈藥儲備，必須要給團(tuán)隊(duì)搭建合理的長期激勵(lì)體系，才能打贏這場長期的硬仗。

真正的長期主義，是目標(biāo)不變，路徑隨時(shí)調(diào)整。

第三，終局思維：你能走多遠(yuǎn)，取決于你眼里的終局是什么

梁文鋒眼里的終局，從來不是做一家短期賺錢的上市公司，而是兩個(gè)核心目標(biāo)：

第一，實(shí)現(xiàn)通用人工智能的底層技術(shù)突破，做出真正有原創(chuàng)性的技術(shù)成果；

第二，打造自主可控的AI技術(shù)生態(tài)，徹底擺脫核心技術(shù)被卡脖子的困境，讓中國AI有自己的根。

為什么他堅(jiān)持開源？因?yàn)橹挥虚_源，才能建立起繁榮的開發(fā)者生態(tài)，才能讓更多人參與到AI技術(shù)的創(chuàng)新中來，實(shí)現(xiàn)真正的技術(shù)普惠；

為什么他死磕國產(chǎn)芯片適配？因?yàn)橹挥邪迅趪a(chǎn)硬件上，才不會被人卡脖子，才能真正實(shí)現(xiàn)全鏈路的自主可控；

為什么他愿意投入長期看不到回報(bào)的原創(chuàng)研究？因?yàn)橹挥性瓌?chuàng)，才能真正實(shí)現(xiàn)技術(shù)突圍，跟著別人的路走，永遠(yuǎn)只能當(dāng)老二。

當(dāng)然，我們也要客觀地說，DeepSeek能取得今天的行業(yè)地位，核心離不開創(chuàng)始團(tuán)隊(duì)在高性能計(jì)算、AI算法領(lǐng)域的多年積累，幻方量化多年沉淀的算力基建與工程化能力，以及巨額的研發(fā)投入，而獨(dú)特的組織管理模式，則為技術(shù)創(chuàng)新提供了良好的土壤，二者缺一不可。

結(jié)語

這個(gè)時(shí)代，從來都不缺聰明的跟風(fēng)者，缺的是敢走無人區(qū)、敢啃硬骨頭、敢堅(jiān)持長期主義的理想主義者。

中國科技的突圍，從來不是靠一個(gè)天才，而是靠一群愿意沉下心來，做底層創(chuàng)新、做長期研究的人。

梁文鋒是我們眼中的第五代企業(yè)家佼佼者。

第五代企業(yè)家具備AI化、全球化、數(shù)智化、新興產(chǎn)業(yè)化的典型特征。

為此，我們專門為這類新生代企業(yè)家創(chuàng)立了筆記俠PPE（政經(jīng)哲）書院，為了把握AI時(shí)代和未來3年的決策底牌，穿越周期。

筆記俠PPE課程26級招生即將截止，5月16日開課，現(xiàn)僅剩最后7個(gè)名額。

好文閱讀推薦：

“子彈筆記”是筆記俠的矩陣公眾號，聚焦職場效率追求、人際關(guān)系與高潛成長者，幫你3分鐘吃透核心觀點(diǎn)和方法論。歡迎關(guān)注～

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.