![]()
撰文|畫畫
騰訊混元Hy3 preview發布了。這是姚順雨加入騰訊后交出的第一款產品。
MoE架構,總參數295B,激活參數21B,最大支持256K上下文長度,1月底開訓,不到三個月發布。
這樣一個體量的模型放在今天,很容易被淹沒。
但如果把這件事放在三個月前的背景下看,就有意思了。
這次發布看起來是模型升級,真正變化發生在模型之外,騰訊開始用AI反過來重寫自己的組織方式。
今年1月26日,騰訊年會現場,騰訊總裁劉熾平在臺上做了一件高管很少做的事,公開復盤混元大模型為什么不行。
他用了一個比喻:高中生背題應考。成績單好看,但真正上了考場就露餡。盤點之后發現,每個關鍵模塊都有缺失。
馬化騰的措辭更直接:太慢了。慢了9個月到1年。
從那場年會到今天 Hy3 preview上線,88天。
一、背題拿不了真分
騰訊混元的故事要從2023年9月說起,騰訊在全球數字生態大會上正式發布混元大模型,大廠入場,聲勢不小。
然后就開始進入一種自證的邏輯。
不是缺投入,不是缺人。問題出在路徑上。
劉熾平在年會上的復盤給了最清晰的診斷。底模能力有限,團隊選了捷徑,用SFT(監督微調)去打榜。效果立竿見影,成績單漂亮,但一進真實業務場景就暴露,泛化能力差,模型能力無法復用到產品上。
再往下挖,每一層都有裂縫。數據做得不夠多,預訓練不穩定,AI Infra無法規模化,強化學習缺因子和目標,底座模型撐不起上層應用。
這直接導致了產品端的困局。元寶,騰訊的AI助手應用,今年一季度月活約5700萬。聽起來在漲,但同期豆包月活3.45億,千問1.66億,差距不是在縮小,是在拉大。
差距已經不在規模層面,而是在入口的定義權。
更麻煩的是內部。騰訊體系內的業務線,微信、游戲、廣告、企業服務,需要AI能力,但過去的混元接不住。不是業務不想用,是用了效果不達標。一些核心業務甚至不敢接混元,寧可繞開自己找方案。
一個大廠自研的大模型,在自己家里都坐不上主桌,這是混元過去困境最直接的寫照。
彼時,騰訊的組織也并沒有跟上大模型發展步伐。騰訊長期以產品工程為核心,AI團隊是配角。先做產品,再讓AI適配。用劉熾平的話說,騰訊的AI開發像是產品里沒有產品經理,研發團隊沒人把控方向,很多工作做了等于白做。
而同一時期,字節僅AI芯片采購一項就砸了約900億元,DeepSeek用極致效率的小團隊做出R1震動全球,阿里千問的全球API調用量攀上前列。
混元不是輸給了某一個對手,是組織結構本身,讓它上不了戰場。
二、先借一條命
2025年春節前后,DeepSeek R1爆火,全球AI行業的注意力被這家杭州公司劫持。
騰訊做了一個極其務實且討巧的決定。2月13日,元寶全面接入DeepSeek-R1滿血版,免費開放。
元寶日活在一個月內暴漲超過20倍,2月22日超越豆包登上蘋果中國區免費App下載榜第二,一度還拿下榜單第一。
騰訊在那個窗口期的反應速度,整個行業都在看。微信搜索、QQ瀏覽器、搜狗輸入法、ima,一整套產品矩陣密集接入DeepSeek。甚至手游《和平精英》都把DeepSeek塞進了數字代言人。
全行業都在圍觀DeepSeek的時候,騰訊是第一個全方位把它接進自家生態的大廠。
但騰訊比誰都清楚,這次機遇是借來的。
DeepSeek幫元寶拉來了用戶,但留存是另一回事。搜索鏈路被割裂,一部分走混元一部分走DeepSeek,體驗不統一。
簡單來說,擁抱DeepSeek的本質,是在混元自己還沒準備好的時候,用外部能力把用戶先接住、把場景先撐起來。
但問題在于,騰訊的微信生態、企業服務、游戲AI、廣告智能投放,這些核心業務需要深度定制、可控可調的AI能力,一個通用API解決不了。
混元必須自己站起來。問題是怎么站。
三、拆房子的人
2025 年 9 月,一位 27 歲的年輕人低調入職騰訊。
姚順雨,清華姚班本科、普林斯頓大學博士,師從 GPT 開山論文核心作者之一 Karthik Narasimhan。博士期間,他提出ReAct 框架與思維樹(Tree of Thoughts),二者均為全球 AI Agent 領域的奠基性工作。
2024 年博士畢業后,他加入 OpenAI,深度參與Operator、Deep Research兩大核心智能體項目研發。
但履歷并非關鍵,更重要的是他入職后帶來的架構級變革。
2025 年 12 月,騰訊發布內部組織架構調整公告,正式任命姚順雨為CEO /總裁辦公室首席 AI 科學家,同時兼任全新設立的AI Infra 部、大語言模型部雙部門負責人,實行雙線匯報,直接向騰訊總裁劉熾平、TEG 技術工程事業群負責人盧山匯報。
27 歲直通騰訊二號人物、執掌兩大 AI 核心部門,這樣的晉升與權限,在騰訊發展史上都極其罕見。
有媒體報道,入職后他做的第一件事是逐個模塊排查混元長期表現不佳的原因,經常和同事、實習生交流到半夜。診斷結果上報劉熾平,直接推動了后續一連串的組織手術。
他接手的不是一個模型優化任務,而是一整套需要被推翻的工作方式。
2025 年 12 月,騰訊一口氣新設AI Infra 部、AI Data 部、數據計算平臺部三大核心部門,基建先行、推倒重打底層技術地基。與此同時,公司全面加速全球頂尖 AI 人才引進,補齊技術短板。
今年3 月 20 日,成立整整十年的騰訊 AI Lab 正式撤銷。核心研發人員全部并入大語言模型部,歸入混元大模型研發主線,統一向姚順雨匯報。
自此,騰訊不再保留獨立于大模型體系之外的專屬 AI 研究機構,所有 AI 研究力量全部收攏,聚焦混元單一主線。
這是一次全鏈路的重建,從底層Infra到數據管線到訓練流程到組織架構,不是修補舊系統,是拆了重來,從頭搭建完整研發閉環。
用姚順雨團隊的話說,Hy3 preview是混元大語言模型從讀萬卷書到行萬里路的開端。
對照過去兩年混元讀了書但做不了題的現實,這句話的指向很明確,不在測試集里自嗨了,去真實世界做事。
四、Preview,不是Answer
回到產品本身。
快慢思考融合的MoE架構,總參數295B,激活參數21B,最大支持256K上下文。2026年1月底啟動訓練,4月上線。
不到三個月,從零到可用。這本身是混元研發加速演進的一個重要信號。
業界的模型研發通常包括高質量數據準備、預訓練、后訓練和強化學習/精調,如果算上前期架構探索和后期評測優化,從0到1做一個完整的大版本周期大約6-12個月。
騰訊反其道而行,沒有去扎堆追求同質化模型,結合騰訊在社交、游戲、廣告等核心業務場景需求進行Co-design設計,這樣的好處是騰訊對AI的巨額投入能得到市場的快速驗證。
和過去的混元完全反過來。 過去是先打榜再找場景,找到場景發現用不了。現在是先進場景,再給外界看。
而在發布之前,Hy3 preview已經在元寶、WorkBuddy、CodeBuddy、ima、QQ等騰訊核心產品里完成了實測和協同適配,模型和產品從設計階段就同步推進。
這就是Co-design,邊訓邊用,讓產品反饋來倒逼模型迭代。
某種意義上,這是對劉熾平那句"產品里沒有產品經理"的直接回應。
對騰訊內部來說,Hy3 preview帶來的變化可能比外界感知到的更大。過去的混元,業務線不敢接、不想接,各找各的出路,模型團隊和產品團隊之間隔著一堵墻。
這一次混元真正成了騰訊內部業務的模型底座,不再是一個需要業務線配合打榜的面子工程。
當內部業務愿意把自己的產品體驗押在混元上的時候,這件事本身就是信號。
但Preview就是Preview。意思很坦誠,這是第一版,拿到真實用戶和業務里去磨,用反饋來迭代。
態度對了,方向有了,產品上線了。至于結果,考試才剛開始。
五、龍蝦是橋,混元才是地基
事實上,在Hy3 preview上線之前,騰訊還做了一件容易被忽略的事。
今年初OpenClaw爆火,龍蝦熱潮席卷整個AI行業。騰訊的反應速度又一次讓人意外,幾乎是最早、最全面擁抱龍蝦的大廠。
WorkBuddy、QClaw、Lighthouse,一系列基于龍蝦協議的產品密集上線,騰訊的產品矩陣在短時間內全面接入。
現在回頭看,龍蝦熱潮雖然慢慢退燒。但對騰訊來說,這件事的價值不在龍蝦本身,更像一個過渡裝置。
它做了兩件事。一是讓騰訊散落在各條業務線的產品力重新形成合力,微信、元寶、企業服務、開發者工具,在龍蝦這個公共協議層上第一次真正協同起來。二是更關鍵的,它為混元爭取了時間。
當用戶通過各種Agent入口涌進來的時候,騰訊用龍蝦生態先接住了他們,而混元在幕后完成了從Infra到模型的重建。
Agent的入口可以有很多個。但最終決定用戶留不留下來的,是底層模型的能力。龍蝦是橋,混元才是地基。橋搭好了,地基也終于跟上了。
六、窗口期不會等人
今年4月,可能是中國AI歷史上最擁擠的一個月。
阿里在72小時內連發三款戰略級模型,Kimi發布并開源Kimi K2.6模型,通用Agent、代碼、視覺理解等綜合能力全面提升,字節Seed持續迭代,豆包生態擴張不停。DeepSeek V4也傳言定于4月下旬發布。(參考閱讀:)
混元選在這個窗口交卷,要面對的不只是技術競賽,更是一個現實問題:窗口期還有多長?
騰訊有全中國最大的社交生態、最多的用戶觸點、最豐富的應用場景。微信月活超過14億,QQ、騰訊會議、騰訊文檔、企業微信,都是天然的AI落地入口。
但這些資源要發揮作用,前提是底層模型能撐得住。
過去一年多,混元產品能力乏力,騰訊不得不借DeepSeek的熱度和力量,不得不看著豆包在用戶端把自己甩開。
Hy3 preview說明姚順雨聽到了馬化騰的批評。聽到了,而且動手了。
不到90天,拆掉舊流水線,重建Infra,撤掉AI Lab,并入團隊,挖來核心人才,和產品Co-design,交出一個可用的版本。
這個速度本身就是組織效率改變的證據。
但聽到了和做到了之間,還有距離。
混元追上來的速度夠不夠快,最終不取決于一次Preview的參數量,取決于這次重建的組織效率能不能持續。
這一次姚順雨的答卷上寫著Preview。顯然,后面還有大招。
【版面之外】的話:
混元過去最大的問題,不是模型不夠大,是組織不夠對。
一個自家業務都不愿意接的大模型,參數再多也是自嗨。
Hy3 preview最重要的變化,不是參數變了,是墻拆了,模型和產品之間的墻,研究和工程之間的墻,混元和騰訊生態之間的墻。
拆墻這件事,比堆參數難得多。
但這件事的意義,也不只在騰訊。在大模型這場競爭里,參數、算法、人才都可以被追趕。
真正難以復制的,是一家公司有沒有決心為AI重寫自己。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.