![]()
文|董文
編輯|宋辰
當(dāng)DeepSeek核心AI研究員郭達(dá)雅,以年薪億元的身價(jià)正式入職字節(jié)跳動(dòng)Seed團(tuán)隊(duì)的消息落地,整個(gè)大模型圈的目光再次聚焦到這家曾經(jīng)風(fēng)光無限的創(chuàng)業(yè)公司身上。
這位95后技術(shù)核心的離職與再就業(yè),本是行業(yè)人才流動(dòng)中的尋常一幕,卻因?yàn)樘煳臄?shù)字般的薪水,以及發(fā)生在DeepSeek新一代旗艦?zāi)P蚔4遲遲未能面世的關(guān)鍵節(jié)點(diǎn),而被賦予了更多神秘的意味。
郭達(dá)雅并非近期DeepSeek離職的首個(gè)技術(shù)大牛。在他之前,王炳宣、魏浩然、阮翀等核心技術(shù)人員也已離開,四人覆蓋了DeepSeek 最核心的四條技術(shù)主線——多模態(tài)、推理/代碼、基座大模型、OCR(文本識(shí)別)。
![]()
當(dāng)技術(shù)天才接連離去、新一代旗艦?zāi)P蚔4數(shù)次跳票、線上平臺(tái)突發(fā)長時(shí)間宕機(jī),這家曾被寄予厚望的大模型明星公司,站到了技術(shù)理想與商業(yè)現(xiàn)實(shí)、人才流失與戰(zhàn)略轉(zhuǎn)型的十字路口。
從橫空出世到陷入困局,僅僅兩年時(shí)間,DeepSeek經(jīng)歷了從國產(chǎn)AI之光到爭(zhēng)議纏身的劇烈轉(zhuǎn)折。DeepSeek的困境,折射出中國大模型行業(yè)在狂飆突進(jìn)后,集體面臨的成長陣痛與深層危機(jī)。
大咖科技
Tech Chic
突如其來的“技術(shù)地震”
2023年成立的DeepSeek,依托幻方量化的資金實(shí)力與頂尖科學(xué)家團(tuán)隊(duì),迅速成為國產(chǎn)大模型賽道上的一匹黑馬。
從初代模型驚艷亮相,到R1在推理上比肩國際頂尖水平,DeepSeek一度被視作對(duì)抗GPT-4的重要力量,資本與市場(chǎng)關(guān)注度一路走高。
但2025年下半年開始,DeepSeek驟然陷入沉寂。
原定密集發(fā)布的新一代模型頻頻跳票。比進(jìn)度滯后更引人關(guān)注的是核心技術(shù)團(tuán)隊(duì)的大規(guī)模流失,多位從V1模型到R1模型全程參與的頂尖人才相繼離職,有的被大廠高薪挖走,有的轉(zhuǎn)向其他賽道創(chuàng)業(yè)。
最新離開的郭達(dá)雅深度參與了從V系列模型到R1等關(guān)鍵版本的研發(fā)工作,尤其在推理、代碼能力等DeepSeek賴以成名的技術(shù)方向上扮演了關(guān)鍵設(shè)計(jì)者的角色。
對(duì)于高度依賴頂層架構(gòu)設(shè)計(jì)與核心算法突破的大模型項(xiàng)目而言,郭達(dá)雅這樣的人才一旦離開,帶來的不僅是人員空缺,更是技術(shù)路線、工程經(jīng)驗(yàn)與研發(fā)節(jié)奏的斷層,是公司一次難以快速彌補(bǔ)的技術(shù)損失。而這樣的人才,DeepSeek半年內(nèi)就走了四個(gè)。
大模型研發(fā)并非簡單的流水線工程,一個(gè)核心人物的思路、判斷與經(jīng)驗(yàn),往往貫穿訓(xùn)練、微調(diào)、對(duì)齊、工程優(yōu)化等全流程。新人接手,不僅需要時(shí)間熟悉代碼與架構(gòu),更要重新理解模型設(shè)計(jì)的底層邏輯,這直接導(dǎo)致了關(guān)鍵項(xiàng)目的節(jié)奏被打亂。
![]()
對(duì)一家高度依賴核心技術(shù)天才的AI初創(chuàng)公司而言,這樣的人員動(dòng)蕩幾乎等同于“技術(shù)地震”。人才出走不僅帶走了關(guān)鍵研發(fā)經(jīng)驗(yàn),也直接打亂了模型迭代節(jié)奏,外界對(duì)其技術(shù)穩(wěn)定性與內(nèi)部管理的質(zhì)疑聲隨之四起。
屋漏偏逢連夜雨,敏感時(shí)期DeepSeek線上服務(wù)又出現(xiàn)長時(shí)間宕機(jī),大量企業(yè)客戶受影響,進(jìn)一步加劇了市場(chǎng)擔(dān)憂。曾經(jīng)一路高歌的明星公司,突然走到了輿論的風(fēng)口浪尖。
DeepSeek的核心人才流失,并非簡單的行業(yè)挖角,而是理想主義與現(xiàn)實(shí)壓力碰撞后的必然結(jié)果。
這群年輕的技術(shù)天才,最初被DeepSeek純粹的科研氛圍吸引。公司一度推行極簡管理、弱化KPI,梁文峰希望打造一個(gè)不受商業(yè)干擾的技術(shù)理想國,讓科學(xué)家專注于沖擊AGI與全球頂尖模型性能。這種環(huán)境在早期激發(fā)出驚人創(chuàng)造力,也讓團(tuán)隊(duì)對(duì)技術(shù)本身抱有極高期待。
但變化來得猝不及防。一方面,國內(nèi)互聯(lián)網(wǎng)大廠開出數(shù)倍薪資與豐厚期權(quán),對(duì)核心人才形成難以抗拒的吸引力。同等強(qiáng)度的工作,在大廠能獲得更明確的職業(yè)路徑與更確定的收益,情懷在懸殊的價(jià)碼面前逐漸失去說服力。
更深層的矛盾來自公司戰(zhàn)略的突然轉(zhuǎn)向。
隨著外部芯片環(huán)境收緊與自主可控要求提升,DeepSeek放棄成熟的英偉達(dá)架構(gòu),全面轉(zhuǎn)向國產(chǎn)算力適配。
據(jù)悉,DeepSeek V4模型將首次實(shí)現(xiàn)與華為昇騰等國產(chǎn)芯片的深度適配。這標(biāo)志著中國AI產(chǎn)業(yè)在擺脫對(duì)國外技術(shù)生態(tài)依賴、推進(jìn)去CUDA化進(jìn)程中邁出了具有里程碑意義的關(guān)鍵一步。
但這同時(shí)也意味著DeepSeek核心團(tuán)隊(duì)此前大量研發(fā)成果需要推翻重訓(xùn)。對(duì)于追求技術(shù)巔峰的科學(xué)家而言,這不僅僅是工作量的陡增。當(dāng)理想中的AGI探索變成繁重的適配工程,離開或許也就成了意料之中的選擇。
大咖科技
Tech Chic
公司組織與戰(zhàn)略之困
產(chǎn)品延期疊加核心人才變動(dòng),外界很自然地將兩者關(guān)聯(lián),進(jìn)而對(duì)DeepSeek的持續(xù)研發(fā)能力產(chǎn)生懷疑。對(duì)比同期崛起的競(jìng)品,DeepSeek的這種“落差”顯得更為明顯。
智譜AI今年1月8日完成公開上市后,在資本市場(chǎng)的加持下持續(xù)加大研發(fā)投入,模型能力與商業(yè)化同步推進(jìn);Kimi在長文本理解與專業(yè)場(chǎng)景體驗(yàn)上建立了鮮明壁壘,用戶粘性與商業(yè)變現(xiàn)路徑日漸清晰。
這些AI大模型公司有的登陸資本市場(chǎng)獲得充足“彈藥”,有的在垂直場(chǎng)景賺得盆滿缽滿,而DeepSeek卻仍在模型迭代與人才穩(wěn)定的泥潭中掙扎。這種對(duì)比,讓市場(chǎng)上出現(xiàn)了“DeepSeek是否曇花一現(xiàn)”的討論。
模型迭代速度就是生命線,一旦長期沒有重磅產(chǎn)品面世,用戶注意力與行業(yè)關(guān)注度就會(huì)迅速被競(jìng)品吸引,技術(shù)口碑也會(huì)隨之淡化。早期依靠驚艷表現(xiàn)建立起來的領(lǐng)先優(yōu)勢(shì),如果不能持續(xù)通過新版本鞏固,很容易在激烈競(jìng)爭(zhēng)中被稀釋甚至反超。
深層剖析V4模型的屢次跳票,表面是技術(shù)進(jìn)度問題,本質(zhì)是DeepSeek在戰(zhàn)略切換與組織管理上的系統(tǒng)性困境。
為了實(shí)現(xiàn)代際突破,同時(shí)適配全新的國產(chǎn)算力平臺(tái),DeepSeek選擇對(duì)模型架構(gòu)進(jìn)行激進(jìn)升級(jí),從參數(shù)規(guī)模到上下文窗口再到多模態(tài)能力,都提出極高目標(biāo)。
這相當(dāng)于在高速推進(jìn)中徹底重構(gòu)模型,訓(xùn)練難度、工程復(fù)雜度成倍上升,再加上國產(chǎn)芯片生態(tài)尚不完善,適配、集群穩(wěn)定性還需時(shí)間,直接導(dǎo)致V4的發(fā)布時(shí)間一推再推。
![]()
比技術(shù)挑戰(zhàn)更棘手的是組織能力的脫節(jié)。DeepSeek長期依賴高度扁平化的管理模式,創(chuàng)始人梁文鋒一人主導(dǎo)關(guān)鍵技術(shù)決策,項(xiàng)目推進(jìn)高度依賴核心天才。
小團(tuán)隊(duì)階段,這種模式高效靈活;但隨著公司擴(kuò)張、人才流失、攻堅(jiān)任務(wù)加重,組織立刻暴露出短板。核心人員缺位后,技術(shù)方向難以快速統(tǒng)一,決策鏈條拉長,原本順暢的研發(fā)節(jié)奏可能會(huì)被打亂。
DeepSeek的困境,也是許多中國AI創(chuàng)業(yè)公司的縮影:依靠天才與資本快速起量,卻在規(guī)模擴(kuò)張、外部環(huán)境劇變時(shí),暴露出短板。
中國大模型在經(jīng)歷兩年狂飆后,正從單純比拼模型參數(shù)、追求速度,轉(zhuǎn)向更務(wù)實(shí)的自主可控、商業(yè)落地與組織建設(shè)。
天才出走、模型難產(chǎn),讓DeepSeek從巔峰驟然承壓。對(duì)它來說,V4模型不僅是一次版本升級(jí),更是一場(chǎng)重建市場(chǎng)信心的背水一戰(zhàn)。
最新消息是,梁文鋒在內(nèi)部會(huì)議確認(rèn)4月下旬將發(fā)布V4模型,希望這一次不再跳票。V4模型的表現(xiàn)究竟會(huì)怎樣,也將直接決定這家明星公司的下一程。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.