<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      騰訊新模型發布,姚順雨交卷了

      0
      分享至



      新眸原創·作者 | 李小東

      大模型的牌局上,騰訊終于甩出了一張新牌。

      4月23日,騰訊混元Hy3 preview語言模型正式發布并開源。這是一款快慢思考融合的混合專家(MoE)模型,總參數295B(2950億),激活參數21B,最大支持256K上下文長度。官方給它的定義干脆利落:“混元重建后訓練的第一個模型”,以及“混元迄今最智能的模型”。

      如果把目光往回拉四個月,騰訊AI的日子并不好過。今年年會上,馬化騰親口承認“動作慢了”,慢了9個月到1年。劉熾平復盤,混元像高中生背題應考,成績單好看,一上真實考場就露餡。與此同時,字節豆包月活已達3.45億,阿里千問1.66億,而元寶約5700萬,差距不僅沒縮小還在拉大。

      所以當28歲的姚順雨——前OpenAI研究員、清華姚班出身、中國互聯網最受矚目的天才少年,在去年被正式任命為騰訊“CEO/總裁辦公室”首席AI科學家時,外界解讀只有一個意思:騰訊要動真格了。

      四個月后,Hy3 preview上線。交卷時刻似乎到了。

      01

      一場“推倒重來”式的重建

      Hy3 preview不是一次常規迭代。用騰訊自己的話說,這是一場底層工程的重構。2月,混元重建了預訓練和強化學習的基礎設施,原有的訓練框架沒有沿用,姚順雨到任后在一個月內完成了整個基礎設施的重建。

      重建的方向很明確,三個原則:能力體系化、評測真實性、性價比追求。翻譯一下就是,不做“偏科生”,不刷榜,不讓模型變成燒錢的無底洞。

      “不做偏科生”這條尤其值得展開。Hy3 preview從研發之初就圍繞智能體場景做了針對性設計,而姚順雨的判斷是,即便是代碼智能體的單一應用,也涉及推理、長文、指令、對話、代碼、工具等多種能力的深度協同。你不能讓模型只會寫代碼卻看不懂文檔,或者能聊天但調不了API。

      同時,姚順雨指出,過去的混元過度追逐榜單成績,將打榜語料放入訓練集導致數據被污染,影響了真實場景表現。他要求團隊“以后不要打榜”,主動跳出易被刷榜的公開榜單,通過自建題目、最新考試、人工評測、產品眾測等多種方式來評估模型的“真實戰斗力”。

      從研發節奏來看,Hy3 preview于2026年1月底正式啟動訓練,從訓練到上線用了不到三個月,被騰訊內部定義為混元大模型從“讀萬卷書”走向“行萬里路”、嘗試解決真實世界復雜問題的開端。

      不到三個月,重建基礎設施、定方向、訓模型、開源發布。這個速度放在大廠體系里,相當激進。

      Hy3 preview最核心的技術理念是“快慢思考融合”。

      這個概念對應的是認知科學中的雙系統理論:系統1(快思考)是快速、自動、直覺式的反應;系統2(慢思考)是緩慢、深度、需要調用大量計算資源的推理。傳統大模型在設計時通常兩條路只能選一條,要么快但能力有限,要么強但響應慢。

      Hy3 preview的做法是讓模型根據任務難度自動選擇思考模式:簡單任務用快思考,復雜任務切換到慢思考,在速度和能力之間找一個最優平衡點。

      工程上,這套機制依賴MoE架構來實現。295B的總參數中,每次推理只激活21B,激活占比約7.1%。這意味著實際計算量遠小于一個2950億的稠密模型。

      慢思考任務會激活更多專家、調用更多計算資源,快思考任務則只激活少數專家、節省算力??炻伎嫉那袚Q不是簡單疊加兩個模型,而是在一個模型內部根據任務自適應用分配計算量。

      這個設計思路并不新鮮,但能在不到三個月里完成架構選型、訓練和上線,背后的工程能力確實不容小覷。

      對騰訊這種手握微信、QQ、騰訊文檔等海量用戶產品的公司來說,推理成本的可控性很大程度上決定了模型能否真正進入產品,Hy3 preview的架構選擇也正因如此具備了現實的商業考量。

      02

      不刷榜的底氣是什么?

      既然說“不打榜”,評估體系就得自己建。

      騰訊混元提出了CL-bench和CL-bench-Life兩套評測框架,重點考察模型在長而雜亂的上下文中理解信息、遵循復雜規則并完成任務的能力。這兩套框架對應的正是許多真實生產和生活場景里最常見、也最難被傳統榜單覆蓋的問題。

      在具體性能表現上,Hy3 preview在幾個關鍵基準測試中取得了有競爭力的結果。在編程基準SWE-Bench Verified中,Hy3 preview得分74.4%,相比前代Hy2的53.0%提升超過40%,已接近GLM-4.7的水平。

      在復雜推理任務上,Hy3 preview在FrontierScience-Olympiad、IMOAnswerBench等高難度理工科推理任務中表現突出,全國中學生生物學聯賽(CHSBO 2025)等高難度推理任務中,Hy3 preview同樣取得優異成績,展現了其在復雜邏輯推理上的泛化能力。

      雖然沒有刻意追求任何單一維度的“SOTA”,但Hy3 preview在各個方向上都展現出了相當均衡的競爭力。這種選擇恰好印證了姚順雨在AGI-Next峰會上傳遞的信號,行業需要跳出“打榜”束縛,核心聚焦在真實用戶價值。

      不過也要看到,Hy3 preview的某些實測表現并不完美。

      有機構一手測試顯示,在一個覆蓋數據抓取、數值計算、可視化生成和文本分析的全鏈路綜合任務中,Hy3 preview在數據獲取階段反復受阻,接口認證失敗后接連切換多個數據源,部分數據因速率限制缺失而被迫用模擬數據替代;

      最關鍵的是,提示詞明確要求輸出500字的跨市場資產配置Memo,模型卻只給出了幾行Bullet point式的簡略配置比例,沒有成文的分析段落。

      這表明Hy3 preview在真實復雜場景下的交付完整性仍有不小提升空間。當然,作為一款preview版本,這些瑕疵大致在預期之內。

      除此以外,價格層面可能也是現在最受關注的問題之一,Hy3 preview在騰訊云大模型服務平臺TokenHub上的定價是:輸入價格最低1.2元/百萬tokens,輸入命中緩存價格0.4元/百萬tokens,輸出價格最低4元/百萬tokens。同時,騰訊云聯合混元推出的定制Token Plan套餐,個人版定價最低28元/月。

      放在當前的市場坐標系里,Hy3 preview的價格并不算激進。

      作為對比,DeepSeek-V4-Flash的輸入價格為0.2元/百萬tokens,V4-Pro在限時優惠后輸入緩存命中價格更是低至0.025元/百萬tokens。在OpenRouter平臺上,DeepSeek-V4-Flash每百萬Token的平均輸出價僅為GPT-5.5 Pro的1.55‰。

      但在“百模大戰”進入Agent時代的當下,騰訊的價格邏輯是清晰的:不拼絕對低價,追求“能力-成本-場景”的三角平衡。

      21B的激活參數本身就是一張成本牌的底,結合MoE架構的高效推理,它為Agent場景中高頻次、長鏈路的調用提供了一個相對可控的成本底座。

      換句話說,摸到了Agent落地的門檻。

      03

      騰訊AI的底牌仍然是自有生態

      模型的真正價值在于用起來。

      Hy3 preview目前在騰訊云、元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享等首發上線,微信公眾號、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個主線產品也在陸續接入中。

      值得留意的是開源生態的接入:Hy3 preview支持接入OpenClaw、OpenCode、KiloCode等流行開源智能體產品。這意味著騰訊不僅在用自己的模型武裝自家的產品矩陣,也在試圖進入更廣泛的開源智能體生態。

      但產品側的挑戰同樣直接。元寶此前接入DeepSeek-R1后日活暴漲超20倍,但搜索鏈路分走混元和DeepSeek兩套系統,體驗不統一,留存轉化始終是難題。Hy3 preview全面接入后,能否解決這個“分流”問題,將是檢驗模型真實戰斗力的第一次試金。

      目前,騰訊旗下最大的AI應用元寶已全面接入Hy3 preview。從微信到QQ,從騰訊文檔到和平精英,騰訊的產品矩陣正在圍繞一個統一的模型底座進行集結。這種“自有生態+自有模型”的打法,和字節豆包依托火山引擎的路徑形成了有趣的對比。

      回到Hy3 preview,發布當天,同一天晚上,OpenAI發布GPT-5.5。不到24小時,DeepSeek V4預覽版跟著上線。

      這是一個縮影。今年大模型牌局,對手們出牌的速度遠比外界想象的快。

      Meta前段時間憑Muse Spark打了個翻身仗,股價當日大漲;Google的Gemini 3.1系列繼續保持強勢,AI聊天機器人市場份額已從不到6%攀升至約20%以上。國內方面,阿里的Qwen3.6-Max-Preview,月之暗面的Kimi K2.6。更早之前,豆包大模型2.0首次大版本跨代升級,百度也發了2.4萬億參數的原生全模態文心大模型5.0正式版。

      至于DeepSeek,V4-Pro在Agent能力、世界知識和推理性能上達到開源模型最佳水平,并在兩天內連續降價,部分價格降至原價的四十分之一,V4-Flash每百萬tokens輸入緩存命中價格僅為0.02元。

      行業里有了共識,跟DeepSeek拼價格,對任何廠商都不是劃算的買賣。

      在這一背景下,騰訊按自己的節奏走“實用主義+生態落地”的路線。正如湯道生此前判斷的,主流大模型的能力差距正在縮小,企業的核心需求已不再是擁有最好的模型,而是如何通過系統工程把模型的能力最大程度發揮出來,真正拉開差距的是“工程化交付能力”。

      04

      姚順雨:從“定義下半場”到“交出模型”

      整件事最特別的地方在于一個人:姚順雨。

      2025年4月,還在OpenAI的姚順雨發表了一篇博客《The Second Half》,提出AI已經從上半場走到下半場,重點不再是訓練出更強的模型,而是如何定義值得解決的問題,用更接近真實世界的方式評估模型。

      這篇博客讓他獲得了“定義AI下半場的人”這樣的標簽。

      加入騰訊后,他需要從提出判斷走向落地判斷。四個月,一套新的基礎設施,一個新模型,一次開源。對于外界來說,Hy3 preview是一個答案的開頭。

      姚順雨自己的表態很清醒:“Hy3 preview是混元大模型重建的第一步。我們希望通過這次開源和發布,獲得來自開源社區和用戶的真實反饋,幫助我們提升Hy3正式版的實用性”。

      這番話沒有任何夸口的成分,倒更像一個階段性的項目匯報。

      公開信息顯示,除了姚順雨,騰訊在過去一年從微軟、阿里、DeepSeek等頂尖團隊引入了不下10位AI大牛,包括前微軟亞洲研究院視覺計算組首席研究員胡瀚、微軟WizardLM項目創建者徐燦等。騰訊在AI人才上的投入力度,從薪資、職級到職責范圍,都給了候選人能在業內拿到的幾乎最高水平。

      Hy3 preview不是一個天才少年單槍匹馬的成果,而是一個重新集結后的團隊,在一個被重建的基礎上做出的第一款產品。

      對于騰訊而言,Hy3 preview本質上是在回答一個問題:騰訊大模型到底還行不行?從參數、架構、評測數據和產品落地來看,這份答卷至少在及格線之上。

      但一個preview版本只是起點。在這樣一個對手環伺、節奏加速的牌局里,騰訊需要的是一個能持續迭代、真正在自有生態里扎根、并最終跑出差異化價值的模型體系。

      這才是接下來真正值得關注的問題:Hy3正式版何時到來,騰訊的產品矩陣能否圍繞它形成一套真正自洽的“模型-應用-商業”閉環,元寶能否在混元自己的基座上跑出留存和增長,以及,在Agent時代真正到來時,騰訊的生態縱深能否轉化為實際的競爭優勢。

      四個月前,姚順雨拿到了一張新牌桌。四個月后,Hy3 preview是第一張牌。接下來怎么打,才是看功力的地方。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      14歲神童手搓發動機被曝造假!漏洞百出吹上天,普通人拿什么比?

      14歲神童手搓發動機被曝造假!漏洞百出吹上天,普通人拿什么比?

      社會日日鮮
      2026-05-08 04:18:01
      三亞皮皮蝦事件升級!43歲老板身亡,多人威脅店鋪,顧客還有惡行

      三亞皮皮蝦事件升級!43歲老板身亡,多人威脅店鋪,顧客還有惡行

      不寫散文詩
      2026-05-08 15:19:45
      伊朗駐華大使法茲里:我們不會忘記中國的幫助,絕不會向我們朋友的船只開火,是有國家在“挑撥離間”

      伊朗駐華大使法茲里:我們不會忘記中國的幫助,絕不會向我們朋友的船只開火,是有國家在“挑撥離間”

      每日經濟新聞
      2026-05-09 17:48:51
      郵輪暴發漢坦病毒,中國乘客發聲:在陽性乘客登船前一天下船,離開已37天,沒出現任何身體不適;專家稱此次毒株可人傳人

      郵輪暴發漢坦病毒,中國乘客發聲:在陽性乘客登船前一天下船,離開已37天,沒出現任何身體不適;專家稱此次毒株可人傳人

      大風新聞
      2026-05-08 11:17:05
      多地號召,公職人員帶頭繳納物業費

      多地號召,公職人員帶頭繳納物業費

      中國新聞周刊
      2026-05-09 12:51:13
      誰都不敢相信,打了四年的俄烏戰爭,居然會以這種方式停戰了!

      誰都不敢相信,打了四年的俄烏戰爭,居然會以這種方式停戰了!

      別人都叫我阿腈
      2026-05-08 10:57:36
      因惡意退貨太多,整條街道被商家“拉黑”!網友:還是低估了羊毛黨...

      因惡意退貨太多,整條街道被商家“拉黑”!網友:還是低估了羊毛黨...

      品牌新
      2026-05-09 09:25:01
      菲方滋擾中國科考船畫面公開

      菲方滋擾中國科考船畫面公開

      環球網資訊
      2026-05-09 21:31:47
      峨眉山推猴男子社會性死亡!正臉照被扒,官方追責,工作或受牽連

      峨眉山推猴男子社會性死亡!正臉照被扒,官方追責,工作或受牽連

      阿傖說事
      2026-05-08 14:22:01
      張蘭飛灣灣為箖箖慶生,一句話透露孫子現狀,小S卻發文談大S和狗

      張蘭飛灣灣為箖箖慶生,一句話透露孫子現狀,小S卻發文談大S和狗

      凡知
      2026-05-09 16:44:42
      19歲戀老渣男同居7年,46歲臉腫發福似蔡明

      19歲戀老渣男同居7年,46歲臉腫發福似蔡明

      楓塵余往逝
      2026-05-09 13:43:55
      搶了個寂寞!那不勒斯黑幫搶劫中國游客,到手“40萬歐”名表竟是地攤貨

      搶了個寂寞!那不勒斯黑幫搶劫中國游客,到手“40萬歐”名表竟是地攤貨

      意大利華人網0039
      2026-05-09 00:10:14
      平陸運河挖出的土石方達3.15億m3,是三峽3倍,它們都去哪兒了?

      平陸運河挖出的土石方達3.15億m3,是三峽3倍,它們都去哪兒了?

      全城探秘
      2026-05-09 14:27:24
      日本航空拿下宇樹科技,轟動全球!

      日本航空拿下宇樹科技,轟動全球!

      新零售參考Pro
      2026-05-07 17:31:09
      上海申花2-2重慶銅梁龍,賽后評分:上海申花5號排第一

      上海申花2-2重慶銅梁龍,賽后評分:上海申花5號排第一

      俯身沖頂
      2026-05-09 21:35:43
      上海地鐵兩名老人撕扯年輕女孩,并向其頭部吐口水,上海地鐵回應:相關部門已介入處理

      上海地鐵兩名老人撕扯年輕女孩,并向其頭部吐口水,上海地鐵回應:相關部門已介入處理

      揚子晚報
      2026-05-09 22:14:07
      第二大!緬甸驚現四斤四兩巨型紅寶石,這片土地為何獨得寶石眷顧

      第二大!緬甸驚現四斤四兩巨型紅寶石,這片土地為何獨得寶石眷顧

      有范又有料
      2026-05-09 16:41:33
      同樣“糊弄消費者”的套路,在國外直接挨捶了

      同樣“糊弄消費者”的套路,在國外直接挨捶了

      走讀新生
      2026-05-09 11:21:16
      美股要崩了嗎?復盤一下2000年互聯網泡沫破滅

      美股要崩了嗎?復盤一下2000年互聯網泡沫破滅

      公子豹
      2026-05-09 11:51:17
      理想新車突然官宣:5月15日,全新上市

      理想新車突然官宣:5月15日,全新上市

      科技堡壘
      2026-05-08 11:10:56
      2026-05-09 23:08:49
      新眸深度 incentive-icons
      新眸深度
      看見商業另一面。
      1494文章數 2479關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      毛焦爾當選匈牙利總理 此前曾表示有意訪問北京

      頭條要聞

      毛焦爾當選匈牙利總理 此前曾表示有意訪問北京

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      多地號召,公職人員帶頭繳納物業費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      手機
      時尚
      家居
      房產
      本地

      手機要聞

      華為鴻蒙7暫定6月發布!撞車蘋果WWDC,這波你站誰?

      伊姐周六熱推:電視劇《喀什戀歌》;電視劇《低智商犯罪》......

      家居要聞

      菁英人居 全能豪宅

      房產要聞

      低價甩賣!海口這個地標商業,無人接盤!

      本地新聞

      用蘇繡的方式,打開江西婺源

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产激情一区二区三区 | 国产精品露脸视频| 成 人 色综合 综合网站| 久久香蕉国产线看观看精品yw| 1024国产欧美日韩精品| 国产高欧美性情一线在线| 亚洲AV永久无码精品秋霞电影影院 | 国产三级视频在线播放线观看| 久久精品人人做人人综合试看| 漂亮人妻中文字幕丝袜| 成人做爰A片100部免费| 欧美3p两根一起进高清免费视频 | 国产露脸150部国语对白| 国产一区二区av天堂热| 亚洲乱码精品乱码精品中文| 国产福利姬喷水福利在线观看| 国产一区韩国主播| 国产综合精品一区二区三区 | 亚洲18禁| 精品熟人妻一区二区三区四区不卡| 免费看黄片一区二区三区| 99成人福利免费视频| 国产二级一片内射视频播放| 精品久久久久久无码人妻热| 亚洲天堂中文字幕| 国产精品久久久久久亚洲毛片| 欧美bt亚洲bt777| 免费观看全黄做爰大片| 久久亚洲国产精品久久| 久艹在线| 精品人妻二区中文字幕| 少妇无码av无码专区线y| 国产精品久久| 五月天国产成人av免费观看| аⅴ天堂国产最新版在线中文| 成人精品一区日本无码网| 亚洲精品日本久久久中文字幕| 91免费高清网站| 欧美韩国精品另类综合| 国产精品9999久久久久| 国产精品尤物午夜福利|