![]()
內(nèi)容來源:筆記俠(Notesman)。
責(zé)編| 柒排版| 沐言
第 9561篇深度好文:4855字 | 11分鐘閱讀
商業(yè)思維
筆記君說:
最近AI圈炸鍋了,此前一直以低融資節(jié)奏、強(qiáng)自主可控著稱的DeepSeek,被曝出新一輪融資計(jì)劃——估值不低于100億美元,計(jì)劃募集至少3億美元。
消息一出,各種討論聲音立刻分成了兩派:
一種說,完了,連DeepSeek都頂不住AI燒錢的壓力;另一種說,AI圈要變天了,梁文鋒這是要憋個(gè)大的。
說實(shí)話,如果你只看到“缺錢”,就把梁文鋒和這件事,徹底看小了。
一、融資3億美金,
從來不是單純填窟窿
DeepSeek缺不缺短期運(yùn)營的錢?
它背后是國內(nèi)對沖基金巨頭幻方量化,創(chuàng)始人梁文鋒在量化領(lǐng)域深耕多年,早已實(shí)現(xiàn)財(cái)富自由。
2023年DeepSeek成立時(shí),由幻方量化及創(chuàng)始團(tuán)隊(duì)提供了充足的初始研發(fā)資金支持,核心投入全部聚焦大模型底層技術(shù)研發(fā)。
所以,顯然不缺。
過去兩年,AI大模型融資潮洶涌,數(shù)億美元的融資單一輪接一輪,唯獨(dú)DeepSeek是個(gè)異類。
那問題來了:之前一直嚴(yán)控融資節(jié)奏,現(xiàn)在為什么要啟動新一輪融資?
顯然,大模型之爭,不是接下來一兩年可以結(jié)束的,未來三年有可能爭出個(gè)分曉,現(xiàn)在進(jìn)入了決戰(zhàn)期,或者決戰(zhàn)期前夜。
因此,必須算算財(cái)務(wù)賬。
第一筆,是算力的賬。
AI大模型的競賽,已經(jīng)到了貼身肉搏的階段。
根據(jù)斯坦福大學(xué)2026年度AI指數(shù)報(bào)告,2025-2026年,中美頭部大模型在核心能力基準(zhǔn)上的差距持續(xù)收窄,在多個(gè)垂直賽道已實(shí)現(xiàn)持平甚至反超。
但越往頂尖走,每往前追一步,邊際成本就越高。就像跑步,你從15秒跑到13秒,多練練就行;但你要從10秒跑到9秒9,每提升0.1秒,都要付出幾倍的努力和成本。
就在3月31日,OpenAI剛以8520億美元的估值完成了1220億美元的融資。 梁文鋒這次啟動融資,核心就是為長期研發(fā)儲備充足的算力彈藥。
第二筆,是人才的賬。
過去半年,DeepSeek有幾位核心研發(fā)成員陸續(xù)離職,被國內(nèi)大廠挖走了。不是這些人不認(rèn)同梁文鋒的技術(shù)理想,是外面給的條件,實(shí)在太有誘惑力了。
據(jù)財(cái)經(jīng)媒體晚點(diǎn)了解,前DeepSeek研究員郭達(dá)雅近億元入職字節(jié)跳動負(fù)責(zé)大模型研發(fā)的組織Seed,但需要滿足一定條件才能拿全。
更別說,同期智譜、MiniMax這些同行紛紛上市,股價(jià)一路上漲,人家手里的期權(quán),有了明確的市場化財(cái)富錨點(diǎn)。
而DeepSeek此前一直沒有進(jìn)行大規(guī)模市場化融資,公司估值沒有明確的市場標(biāo)尺,團(tuán)隊(duì)成員手里的期權(quán)價(jià)值,也缺少清晰的參照。
這次融資,通過市場化方式給公司定了估值,本質(zhì)上就是給團(tuán)隊(duì)搭建了合理的長期激勵(lì)體系:我不會讓相信長期價(jià)值的人,吃虧。
二、真正的行業(yè)變量,
是國產(chǎn)算力生態(tài)的深度適配
很多人盯著融資的數(shù)字,卻忽略了這次事件里,最影響行業(yè)格局的一件事:
據(jù)國內(nèi)多家行業(yè)媒體爆料,DeepSeek即將發(fā)布的V4模型,核心完成了對華為昇騰算力生態(tài)的深度適配,大幅降低了對英偉達(dá)生態(tài)的依賴。
這件事,也正是英偉達(dá)創(chuàng)始人黃仁勛在近期采訪中公開表達(dá)關(guān)注的核心原因。
過去全球絕大多數(shù)主流AI大模型,從OpenAI的GPT,到Anthropic的Claude,核心訓(xùn)練與部署都深度綁定英偉達(dá)的生態(tài):
訓(xùn)練靠英偉達(dá)GPU,底層算子( 是深度學(xué)習(xí)框架與硬件之間的關(guān)鍵橋梁 ),是模型執(zhí)行的最小可計(jì)算單元適配依賴英偉達(dá)的CUDA生態(tài),相當(dāng)于整個(gè)行業(yè)的核心算力命脈,很大程度上攥在老黃手里。
一旦出現(xiàn)供應(yīng)鏈限制,整個(gè)公司的研發(fā)、訓(xùn)練、推理都可能受到嚴(yán)重影響,這就是我們常說的“卡脖子”風(fēng)險(xiǎn)。
但DeepSeek這次,在主流開源大模型的國產(chǎn)適配這件事上,邁出了關(guān)鍵一步。
據(jù)行業(yè)爆料,V4將深度適配華為最新的昇騰芯片。
DeepSeek的工程師們花了大量時(shí)間,完成了算子層兼容、通信庫適配、訓(xùn)練框架底層優(yōu)化,實(shí)現(xiàn)了模型從英偉達(dá)CUDA生態(tài)到華為昇騰CANN架構(gòu)的深度遷移。
如果V4能在昇騰芯片上跑出有競爭力的性能,它將成為國內(nèi)少數(shù)實(shí)現(xiàn)從底層算力到模型層全棧國產(chǎn)適配的通用大模型之一。
要知道,華為盤古大模型從2020年立項(xiàng)起,就基于昇騰芯片+CANN計(jì)算架構(gòu)+MindSpore框架的全棧國產(chǎn)生態(tài)開發(fā),是國內(nèi)最早實(shí)現(xiàn)完全不依賴英偉達(dá)CUDA生態(tài)的前沿大模型。
更早的悟道2.0、紫東太初等大模型,也早已實(shí)現(xiàn)了純國產(chǎn)芯片的落地部署。
![]()
而DeepSeek的核心突破,是把一款全球開發(fā)者廣泛使用的主流開源大模型,完成了對國產(chǎn)算力生態(tài)的深度適配,這會大幅降低整個(gè)行業(yè)對英偉達(dá)芯片的依賴。
這也是黃仁勛直言這件事“對美國來說將是一個(gè)糟糕的結(jié)果”的核心原因:一旦主流開源大模型在國產(chǎn)算力生態(tài)上實(shí)現(xiàn)了規(guī)模化落地,美國芯片在AI領(lǐng)域的護(hù)城河,就會被徹底打開一個(gè)缺口。
那這個(gè)讓行業(yè)高度關(guān)注的V4,到底有哪些值得期待的能力?
根據(jù)目前的行業(yè)爆料,核心有三個(gè)核心方向的升級。
1.極致的效率優(yōu)化,延續(xù)花小錢辦大事的核心思路
據(jù)行業(yè)爆料信息顯示,V4將采用MoE(混合專家)架構(gòu),總參數(shù)規(guī)模達(dá)到萬億級別。
你可以把MoE混合專家架構(gòu),理解成一個(gè)分工明確的專家團(tuán)隊(duì):
遇到不同的問題,系統(tǒng)只會調(diào)用最擅長解決這個(gè)問題的幾位專家,而不是讓所有專家一起上,這樣就能在大幅提升模型總能力上限的同時(shí),有效控制住單次推理的算力消耗。
2.長上下文能力的大幅突破
據(jù)行業(yè)爆料,V4引入了名為Engram的條件記憶架構(gòu),目標(biāo)上下文窗口達(dá)100萬token,在內(nèi)部測試中實(shí)現(xiàn)了較高的信息召回率。
![]()
你可能對這個(gè)數(shù)字沒概念,我給你舉個(gè)例子:100萬token的上下文窗口,相當(dāng)于你可以一次性把幾十本長篇小說、整個(gè)公司的全年業(yè)務(wù)文檔全喂給它,它能精準(zhǔn)定位到你需要的任意細(xì)節(jié)信息。
而目前全球公開商用的頭部模型中,Claude 3.7 Opus已開放200萬token上下文窗口,行業(yè)長上下文能力的競爭已進(jìn)入白熱化階段。
3.代碼能力的針對性強(qiáng)化
V4從立項(xiàng)之初,就把代碼生成與長上下文代碼推理作為核心優(yōu)化目標(biāo)。
據(jù)內(nèi)部測試爆料,V4在SWE-bench、HumanEval等行業(yè)通用代碼能力基準(zhǔn)上的表現(xiàn),已接近甚至部分追平全球頭部模型,核心優(yōu)化方向是整個(gè)代碼倉庫級別的復(fù)雜bug修復(fù)、長鏈路代碼推理。
三、DeepSeek除了贏在技術(shù),
其實(shí)它還贏在獨(dú)特的組織邏輯
為什么DeepSeek能在短短幾年里,從一眾大模型公司里殺出重圍,成為全球開發(fā)者都關(guān)注的標(biāo)桿?
很多人會說,因?yàn)榱何匿h是天才,因?yàn)樗麄兗夹g(shù)牛。但我告訴你,技術(shù)只是最終的結(jié)果,真正讓它能站穩(wěn)腳跟的,是它3個(gè)和行業(yè)主流打法完全不同的組織邏輯。
第一個(gè)反常識:全球最卷的AI行業(yè),它靠“拒絕無效加班”守住了研發(fā)效率
現(xiàn)在AI行業(yè)卷成什么樣,你應(yīng)該有所耳聞。
全球頂尖的AI公司,從OpenAI到谷歌,再到國內(nèi)的大廠,核心研發(fā)人員一周工作70-80小時(shí)是常態(tài),996只能算基礎(chǔ)配置,甚至007連軸轉(zhuǎn),咖啡當(dāng)水喝、睡在公司都是家常便飯。
但DeepSeek,卻在這個(gè)卷到極致的行業(yè)里,保持了相對寬松的工作節(jié)奏。
它不強(qiáng)制打卡,不推行996,沒有所謂的“奮斗者協(xié)議”,平日里公司的多數(shù)員工,下午6-7點(diǎn)就可以準(zhǔn)時(shí)收拾東西離開公司。
甚至,公司還給員工免費(fèi)提供下班后的球類課程,運(yùn)動場地可以報(bào)銷,明著鼓勵(lì)大家下班別耗在公司,多去運(yùn)動、多休息。
核心管理團(tuán)隊(duì)有一個(gè)共識: 一個(gè)人一天能高質(zhì)量輸出的時(shí)間,很難超過6-8小時(shí)。
DeepSeek用結(jié)果證明了:真正的創(chuàng)新,從來不是靠熬時(shí)間熬出來的,是靠高質(zhì)量的專注堆出來的。
第二個(gè)反常識:不搞繁瑣層級,它用極致扁平化干掉了內(nèi)耗
很多人都好奇,據(jù)DeepSeek2025年公開采訪披露,其團(tuán)隊(duì)規(guī)模超300人,其中核心研發(fā)團(tuán)隊(duì)超200人,怎么能干出大廠幾千人都未必能做好的成果?
核心就在于,它保持了極致扁平化的組織架構(gòu),最大程度干掉了溝通內(nèi)耗。
DeepSeek的核心研發(fā)團(tuán)隊(duì),采用了弱層級、強(qiáng)協(xié)同的管理模式,沒有大廠常見的層層匯報(bào)的繁瑣流程,也沒有涇渭分明的部門墻。
做基礎(chǔ)模型的團(tuán)隊(duì)、做底層基建的團(tuán)隊(duì)、做數(shù)據(jù)的團(tuán)隊(duì),不是各干各的,而是交叉分工、深度協(xié)同——模型還在定版階段,三個(gè)團(tuán)隊(duì)就全鏈路參與進(jìn)來了,徹底避免了大廠里常見的“內(nèi)部乙方”的低效內(nèi)耗。
更難得的是,它沒有僵化的分工限制,沒有強(qiáng)制的年度計(jì)劃,給了研發(fā)人員極高的創(chuàng)新自由度。
一個(gè)新方向的啟動,往往就是三五個(gè)人湊在一起,覺得一個(gè)技術(shù)方向有價(jià)值,就可以組隊(duì)開干;如果這個(gè)idea跑出了潛力,公司就會自上而下調(diào)配資源,全力支持。
所有的精力、所有的資源,全都砸在了技術(shù)創(chuàng)新本身。這就是它最核心的競爭力:用極致扁平的組織,把創(chuàng)新的效率,拉到了最高。
第三個(gè)反常識:不唯“大廠經(jīng)驗(yàn)論”,它給了年輕人足夠的創(chuàng)新空間
DeepSeek的人才體系,走了一條不一樣的路:它既不排斥資深專家,也給了年輕人足夠的成長和創(chuàng)新空間。
一方面,它通過社招引入了大量擁有數(shù)十年行業(yè)經(jīng)驗(yàn)的資深專家,包括首席科學(xué)家劉群、CTO林通等核心管理團(tuán)隊(duì)成員,均擁有深厚的行業(yè)積累,官方招聘頁面也長期開放大量要求3-10年行業(yè)經(jīng)驗(yàn)的社招崗位,絕非外界傳言的“幾乎不社招”。
但另一方面,它也通過校招吸納了大量頂尖院校的年輕研發(fā)人才,核心研發(fā)團(tuán)隊(duì)里,有大量本科、碩士學(xué)歷的年輕從業(yè)者,他們沒有被固化思維束縛,敢想敢干,反而做出了很多原創(chuàng)性的技術(shù)突破。
梁文鋒的人才觀,特別值得所有創(chuàng)業(yè)者學(xué)習(xí): 創(chuàng)新需要的,是不知天高地厚的探索精神。
AI是一個(gè)全新的行業(yè),沒有成熟的路徑可走,沒有固定的經(jīng)驗(yàn)可復(fù)用。這些年輕人,沒有包袱,沒有固化的思維,反而能在無人區(qū)里,走出一條新的路。
四、梁文鋒的底牌,
是穿透本質(zhì)的認(rèn)知
我給你拆解三個(gè)最核心的認(rèn)知,也是他所有決策的底層邏輯,不管你是創(chuàng)業(yè)者還是管理者,都能用得上。
第一,第一性原理:所有的創(chuàng)新,都始于對本質(zhì)的追問
梁文鋒團(tuán)隊(duì)從一開始,就抓住了最核心的本質(zhì):他們認(rèn)為,語言是通用智能的核心載體,因此在成立初期,就把核心資源聚焦于語言大模型的底層突破,沒有盲目跟風(fēng)分散精力。
但同時(shí),他們也并未放棄多模態(tài)賽道的布局,已于2025年3月官方發(fā)布了DeepSeek-VL2多模態(tài)大模型,實(shí)現(xiàn)了圖文理解、視覺問答等多模態(tài)能力的落地,做到了“核心聚焦,多點(diǎn)布局”。
還有他一直堅(jiān)持的“效率優(yōu)先”,本質(zhì)也是第一性原理的應(yīng)用。
他沒有跟著行業(yè)堆算力、堆參數(shù),而是死磕模型效率優(yōu)化,用遠(yuǎn)低于行業(yè)頭部玩家的投入,做出了全球開發(fā)者都認(rèn)可的頂尖模型。
這就是第一性原理的力量:
不跟著別人的規(guī)則卷,回到事物的本質(zhì),重新制定游戲規(guī)則。
你跟著別人的跑道跑,永遠(yuǎn)只能拿第二;只有你自己開一條新跑道,你才有可能成為領(lǐng)跑者。
第二,長期主義:拒絕短期誘惑,才能拿到長期的最大回報(bào)
他之前嚴(yán)控融資節(jié)奏,是長期主義:他想保持DeepSeek的獨(dú)立性,不被短期商業(yè)變現(xiàn)的壓力干擾,能安安心心做長期的、看不到短期回報(bào)的原創(chuàng)研究,不用為了短期財(cái)報(bào),去做不符合長期目標(biāo)的事。
他現(xiàn)在選擇啟動新一輪融資,依然是長期主義。
他看清了行業(yè)終局,AI競賽已經(jīng)到了生死關(guān)頭,想要實(shí)現(xiàn)通用人工智能的底層突破,想要打造自主可控的AI技術(shù)生態(tài),必須要有充足的彈藥儲備,必須要給團(tuán)隊(duì)搭建合理的長期激勵(lì)體系,才能打贏這場長期的硬仗。
真正的長期主義,是目標(biāo)不變,路徑隨時(shí)調(diào)整。
第三,終局思維:你能走多遠(yuǎn),取決于你眼里的終局是什么
梁文鋒眼里的終局,從來不是做一家短期賺錢的上市公司,而是兩個(gè)核心目標(biāo):
第一,實(shí)現(xiàn)通用人工智能的底層技術(shù)突破,做出真正有原創(chuàng)性的技術(shù)成果;
第二,打造自主可控的AI技術(shù)生態(tài),徹底擺脫核心技術(shù)被卡脖子的困境,讓中國AI有自己的根。
為什么他堅(jiān)持開源?因?yàn)橹挥虚_源,才能建立起繁榮的開發(fā)者生態(tài),才能讓更多人參與到AI技術(shù)的創(chuàng)新中來,實(shí)現(xiàn)真正的技術(shù)普惠;
為什么他死磕國產(chǎn)芯片適配?因?yàn)橹挥邪迅趪a(chǎn)硬件上,才不會被人卡脖子,才能真正實(shí)現(xiàn)全鏈路的自主可控;
為什么他愿意投入長期看不到回報(bào)的原創(chuàng)研究?因?yàn)橹挥性瓌?chuàng),才能真正實(shí)現(xiàn)技術(shù)突圍,跟著別人的路走,永遠(yuǎn)只能當(dāng)老二。
當(dāng)然,我們也要客觀地說,DeepSeek能取得今天的行業(yè)地位,核心離不開創(chuàng)始團(tuán)隊(duì)在高性能計(jì)算、AI算法領(lǐng)域的多年積累,幻方量化多年沉淀的算力基建與工程化能力,以及巨額的研發(fā)投入,而獨(dú)特的組織管理模式,則為技術(shù)創(chuàng)新提供了良好的土壤,二者缺一不可。
結(jié)語
這個(gè)時(shí)代,從來都不缺聰明的跟風(fēng)者,缺的是敢走無人區(qū)、敢啃硬骨頭、敢堅(jiān)持長期主義的理想主義者。
中國科技的突圍,從來不是靠一個(gè)天才,而是靠一群愿意沉下心來,做底層 創(chuàng)新、做長期研究的人。
梁文鋒是我們眼中的第五代企業(yè)家佼佼者。
第五代企業(yè)家具備AI化、全球化、數(shù)智化、新興產(chǎn)業(yè)化的典型特征。
為此,我們專門為這類新生代企業(yè)家創(chuàng)立了筆記俠PPE(政經(jīng)哲)書院,為了把握AI時(shí)代和未來3年的決策底牌,穿越周期。
筆記俠PPE課程26級招生即將截止,5月16日開課,現(xiàn)僅剩最后7個(gè)名額。
![]()
好文閱讀推薦:
“子彈筆記”是筆記俠的矩陣公眾號,聚焦職場效率追求、人際關(guān)系與高潛成長者,幫你3分鐘吃透核心觀點(diǎn)和方法論。歡迎關(guān)注~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.