<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      混元重建后首發并開源 Hy3 preview:Agent能力大幅提升

      0
      分享至

      4 月 23 日,騰訊混元 Hy3 preview 語言模型發布并開源。這是一個快慢思考融合的混合專家模型,總參數 295B,激活參數 21B,最大支持 256K 上下文長度。這是混元重建后訓練的第一個模型,也是混元迄今最智能的模型,在復雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅的提升。

      2026 年2月,騰訊混元重建了預訓練和強化學習的基礎設施,以及模型追求實用性的三個原則:

      1、能力體系化: 不推崇“偏科”,因為即使是代碼智能體的單一應用,也涉及推理、長文、指令、對話、代碼、工具等多種能力的深度協同。

      2、評測真實性: 主動跳出易被“刷榜”的公開榜單,通過自建題目、最新考試、人工評測、產品眾測等多種方式評估和改進模型的“真實戰斗力”。

      3、性價比追求:實用性離不開商業合理性,深度協同模型架構和推理框架的設計,大幅降低任務成本,讓智能用得起、用得好。

      Hy3 preview可以視為混元快速探索實用性大模型、解決真實世界問題的一個開端。

      騰訊首席AI科學家姚順雨表示,Hy3 preview是混元大模型重建的第一步。我們希望通過這次開源和發布,獲得來自開源社區和用戶的真實反饋,幫助我們提升 Hy3 正式版的實用性。與此同時,我們也在繼續擴大預訓練和強化學習的規模,提升模型的智能上限,并通過與騰訊眾多產品的深度Co-Design,持續提升模型在真實場景中的綜合表現,并開始探索特色模型能力。

      目前,Hy3 preview 已在騰訊云、元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享等首發上線,微信公眾號、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個主線產品也在陸續上線。另外,Hy3 preview 支持接入流行的開源智能體產品,如 OpenClaw、OpenCode、KiloCode 等,并已上架騰訊云大模型服務平臺 TokenHub。

      Hy3 preview 主打全面實用性,Agent能力大幅提升

      多個測評結果顯示,Hy3 preview 模型能力全面提升。

      1、出色的上下文學習和指令遵循能力

      在各種真實的生產與生活場景,理解雜亂冗長的上下文并遵從復雜多變的規則是模型的首要挑戰。基于騰訊業務場景的靈感,騰訊混元提出了 CL-bench和 CL-bench-Life 來創新性地評估模型的上下文學習能力,并在 Hy3 preview 顯著地提升了模型上下文學習和指令遵循能力。



      2、復雜推理能力突出,清華數學博士資格考試國內分數最高

      復雜推理能力是模型解決各種問題的基礎。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高難度理工科推理任務中表現突出,并在最新的清華大學求真書院數學博資考(26春) 和 全國中學生生物學聯賽(CHSBO 2025) 中取得優異成績,展現了可泛化的強推理能力。



      3、代碼與智能體提升最為顯著,展現出高性價比

      代碼和智能體是 Hy3 preview 提升最為顯著的方向。得益于預訓練及強化學習框架的重建和強化學習任務規模的提升,騰訊混元以較快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代碼智能體基準以及 BrowseComp、WideSearch 等主流搜索智能體基準中取得了有競爭力的結果。



      在數字世界中,代碼關注的是模型在開發環境中的執行能力,搜索則聚焦于開放信息空間中的檢索、篩選與整合能力,兩者共同決定了模型在復雜智能體場景(例如 OpenClaw)中是否真正具備可用性。Hy3 preview 在 ClawEval 和 WildClawBench 等評測中表現突出,表明我們的智能體能力正在穩步走向全面與實用。



      除了公開榜單,騰訊混元還進一步構建了多個內部的評測集,對模型在真實開發場景中的表現進行評估。結果表明,無論是在后端工程任務集 Hy-Backend,貼近真實用戶開發交互的 Hy-Vibe Bench,還是高難度軟件工程開發任務集 Hy-SWE Max 上,Hy3 preview 均體現出了強競爭力。



      比較各個開源模型的大小與智能體綜合表現,Hy3 preview 展現出高性價比。



      騰訊核心業務已全面接入,多主線AI 產品驗證收益明顯

      正式上線之前,Hy3 preview在騰訊主要AI 業務進行了產品測試,獲得明顯正收益。

      在元寶端,混元與元寶進行了深度Co-Design。一方面,針對性地提升了模型在意圖理解精準度、文本創作質量、深度搜索等硬核指標上的表現;另一方面,對文風、文筆、情商、內容組織和內容專業度上進行了精細化調優。模型與產品的深度協同,為用戶帶來了更智能且更具“活人感”的交互體驗。

      在ima知識庫問答和通用問答兩個場景下,測試結果顯示,Hy3 preview 處理長文的能力出色,特別是檢索類任務,在回答信息的準確性、覆蓋度和全面性上表現較好。

      在CodeBuddy、WorkBuddy產品上,Hy3 preview 首 token 延遲降低 54%、端到端時長降低 47%、成功率提升至 99.99%+。實際用戶環境中,Hy3 preview 已穩定驅動最長 495 步的復雜 Agent 工作流,覆蓋文檔處理、數據分析、知識檢索、MCP 工具鏈編排等多樣化辦公場景。

      在公眾號AI分身和AI客服的場景專項評測中,Hy3 preview展現出相比Hy2 更全面的能力升級。新模型在用戶意圖理解、復雜上下文承接和知識信息組織方面表現更成熟,面對模糊提問、短句追問和多輪對話時,能夠更準確地把握用戶訴求,并輸出更清晰、更穩定的回復。結合知識庫、用戶記憶與上下文生成回答時更貼合AI分身和AI客服的角色,過度腦補、主觀代入和情緒化表達顯著減少,使整體交互體驗更貼近“可信、自然、高效”的回復目標。

      在和平精英AINPC場景評測中,和平精英團隊第一時間在Hy3 preview上線后基于AINPC場景中完成接入并開展評測,整體表現令人印象深刻。在游戲局外的人設扮演場景中,Hy3Preview不僅能夠精準理解角色設定,還能針對開放性問題輸出高度關聯、富有增量價值的內容,帶來了更加真實、自然、沉浸的對話體驗。而在游戲局內的復雜對戰場景中,模型回復節奏貼近真實玩家聊天體驗,展現出優秀的穩定性與出色的擬人化扮演能力,整體效果表現亮眼。

      在騰訊文檔AI PPT場景,較上一版本(Hy2)取得了顯著進步:生成成功率提升20%,評測得分提升10%,同時生成耗時縮短20%。整體而言,新模型在評測場景中表現優異,在模版選擇,色彩匹配,生成大綱,補充內容多個階段,均體現出優秀的表現,無幻覺,契合主題,視覺效果好。

      在QQAI助手小Q產品評測中,較上一版本,在長文本首字節時延、整體響應速度與流式輸出效率方面顯著優化;核心能力上,數學推理表現提升尤為明顯,多場景指令遵循與泛化能力進一步增強;在工具調用推理及多輪指代消解方面表現更穩定高效,在OpenClaw官方PinchBenchQQ智能體場景測試中取得突出效果,綜合體驗實現明顯躍升。

      推理效率提升40%,同等成本智能密度最優

      得益于模型和推理框架上的深度協同,以及在推理框架、算子性能、量化算法等全方面優化,整體推理效率提升40%,Hy3 preview的成本相比上一代模型大幅下降。

      在騰訊云大模型服務平臺 TokenHub 上,Hy3 preview 輸入價格最低1.2元/百萬tokens,輸入命中緩存價格0.4元/百萬tokens,輸出價格最低4元/百萬tokens。同時,騰訊云聯合混元推出定制的 Hy3 preview Token Plan 套餐,個人版定價最低28元/月,為Agent開發和打造“龍蝦”應用的提供更具性價比選擇。





      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      臺灣回歸后,第一任省長由誰擔任最合適?五人上榜,一人脫穎而出

      臺灣回歸后,第一任省長由誰擔任最合適?五人上榜,一人脫穎而出

      蜉蝣說
      2026-05-12 11:10:26
      外交部:中美經貿關系的本質是互利共贏

      外交部:中美經貿關系的本質是互利共贏

      界面新聞
      2026-05-12 15:34:36
      松島輝空這是多么嫌棄張本智和!在頒獎典禮上,張本智別提多高興了,但松島輝空卻是一臉的不高興

      松島輝空這是多么嫌棄張本智和!在頒獎典禮上,張本智別提多高興了,但松島輝空卻是一臉的不高興

      乒乓樂園
      2026-05-12 08:31:34
      40億索賠壓頂!國際足聯高管計劃訪華,中國贊助商5億投入或打水漂

      40億索賠壓頂!國際足聯高管計劃訪華,中國贊助商5億投入或打水漂

      安珈使者啊
      2026-05-12 09:41:41
      盧比奧來不了中國了?不是中國不讓他進,是他根本不配進!

      盧比奧來不了中國了?不是中國不讓他進,是他根本不配進!

      嘆為觀止易
      2026-05-12 00:34:15
      騎士垃圾時間太丟人!主力都脫鞋休息了 硬是被活塞替補打回場上!

      騎士垃圾時間太丟人!主力都脫鞋休息了 硬是被活塞替補打回場上!

      舟望停云
      2026-05-12 13:49:14
      油頭粉面就別演窮人!看張嘉益劇中的表現,才知道真窮人是什么樣

      油頭粉面就別演窮人!看張嘉益劇中的表現,才知道真窮人是什么樣

      不似少年游
      2026-05-11 19:25:59
      “公司一切向錢看!”王暖暖回應與無憂傳媒正式解約:出院后先休養身體,再做打算

      “公司一切向錢看!”王暖暖回應與無憂傳媒正式解約:出院后先休養身體,再做打算

      新民周刊
      2026-05-11 16:27:40
      訪華團落地不到7天,巴外長便公開質問中國:嘴上尊重,骨頭很硬

      訪華團落地不到7天,巴外長便公開質問中國:嘴上尊重,骨頭很硬

      素衣讀史
      2026-05-11 21:54:32
      黃一鳴新男友正式露臉!直播撒狗糧、掰著臉硬親,閃閃和他非常像

      黃一鳴新男友正式露臉!直播撒狗糧、掰著臉硬親,閃閃和他非常像

      阿鳧愛吐槽
      2026-05-12 15:57:00
      穆帥:再說一遍我沒和皇馬談過;進不進歐冠不會影響我的未來

      穆帥:再說一遍我沒和皇馬談過;進不進歐冠不會影響我的未來

      懂球帝
      2026-05-12 07:05:06
      國乒男團不顧反對死用梁靖崑!絕處逢生!

      國乒男團不顧反對死用梁靖崑!絕處逢生!

      西門吹灰2020
      2026-05-11 14:20:49
      女學霸發明“咯噔字體”,老師低分警告:別用個性挑戰考試底線

      女學霸發明“咯噔字體”,老師低分警告:別用個性挑戰考試底線

      蝴蝶花雨話教育
      2026-05-07 00:05:04
      破防了!石家莊27歲美女凋謝,丈夫代筆寫下告別信,全網徹底淚目

      破防了!石家莊27歲美女凋謝,丈夫代筆寫下告別信,全網徹底淚目

      火山詩話
      2026-05-12 08:55:32
      連扳兩場,騎士拖進天王山!超越詹姆斯,沒有了,沒有橫掃了

      連扳兩場,騎士拖進天王山!超越詹姆斯,沒有了,沒有橫掃了

      Haviven聊球
      2026-05-12 15:39:41
      20多天就認慫!印尼對中企舉的鎳礦大刀,先砍到了自己腳趾頭

      20多天就認慫!印尼對中企舉的鎳礦大刀,先砍到了自己腳趾頭

      鍋鍋愛歷史
      2026-05-12 07:13:02
      越南談中越戰爭:大戰前一天全軍“休假”,文進勇出賣了越南

      越南談中越戰爭:大戰前一天全軍“休假”,文進勇出賣了越南

      老謝談史
      2026-05-12 12:10:13
      解放臺灣,難上加難?中國解放臺灣,到底存在哪些困難和阻礙?

      解放臺灣,難上加難?中國解放臺灣,到底存在哪些困難和阻礙?

      靜夜史君
      2026-05-11 23:59:39
      禁止所有中國外交官入境,不讓兩岸統一,這個國家比美囂張多了

      禁止所有中國外交官入境,不讓兩岸統一,這個國家比美囂張多了

      共工之錨
      2026-05-03 00:08:08
      小寶與王某雷,誰探訪花的數量更多?

      小寶與王某雷,誰探訪花的數量更多?

      挪威森林
      2026-01-31 12:15:26
      2026-05-12 16:24:49
      前沿在線 incentive-icons
      前沿在線
      前沿在線官方賬號,關注AI、機器人、智能車等前沿領域;
      202文章數 1235關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      女子立遺囑遺產歸弟弟 其女起訴兩人返還857萬及房產

      頭條要聞

      女子立遺囑遺產歸弟弟 其女起訴兩人返還857萬及房產

      體育要聞

      總是掉鏈子的“倒霉蛋”,闖進了歐戰決賽

      娛樂要聞

      劉濤曬媽祖誕辰活動照 評論區變許愿池

      財經要聞

      黃仁勛真是被白宮徹底封殺了

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      家居
      房產
      游戲
      教育
      數碼

      家居要聞

      極簡主義下的居住場域與空間

      房產要聞

      50億資本布局!寧德時代,突然重倉三亞!

      任天堂官方貼心提醒!購買會員需注意 很快漲價

      教育要聞

      正確率5%的解方程

      數碼要聞

      雷軍曬小米電競鼠標2拆解圖:是不是很高級

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲日本韩国| 亚洲熟妇无码爱v在线观看| 福利导航在线视频| 国产aⅴ爽av久久久久久| 国产一区在线播放av| 亚洲成人AV| 亚洲熟妇无码av在线播放| 思思99思思久久最新精品| 五月综合网亚洲乱妇久久| 国产精品无码av不卡顿| 精品久久久久久综合日本| 国产午夜51tv福利在线 | 免费毛片在线| 67194熟妇在线观看线路1| 中文字幕在线日韩一区| 秋霞无码久久一区二区| 91娇喘视频| 成人免费播放视频777777| 国产精品va在线观看无码不卡| 亚洲精品人成网线在播放VA | 亚洲热视频这里只有精品| 日韩精品极品视频在线观看蜜桃| 欧美中文一区| 亚洲丁香五月激情综合| 日韩精品人妻中文字幕有| 国产精品中文第一字幕| 亚洲欧美综合精品成人导航| 日韩亚av无码一区二区三区| 国内永久福利在线视频图片| 久久免费看少妇高潮v片特黄| 麻豆成人久久精品综合网址| 人妻系列无码专区免费视频| 国产片一区二区三区视频| 亚洲中文字幕一区二区| 亚洲成人大香蕉| 国产三级精品三级专区| 99青青青精品视频在线| 亚洲国产精品羞羞| 成人另类小说| 欧美饥渴熟妇高潮喷水| 日韩免费毛片|