<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Hy3 preview發布并開源:混元重建后首個模型,Agent能力大幅提升 | 前沿在線

      0
      分享至



      編輯:騰訊混元

      4月23日,騰訊混元 Hy3 preview 語言模型發布并開源。這是一個快慢思考融合的混合專家模型,總參數 295B,激活參數 21B,最大支持 256K 上下文長度。

      今年 2 月,我們重建了預訓練和強化學習的基礎設施,以及模型追求實用性的三個原則:

      能力體系化:我們不推崇“偏科”,因為即使是代碼智能體的單一應用,也涉及推理、長文、指令、對話、代碼、工具等多種能力的深度協同。

      評測真實性:我們主動跳出易被“刷榜”的公開榜單,通過自建題目、最新考試、人工評測、產品眾測等多種方式評估和改進模型的“真實戰斗力”。

      性價比追求:實用性離不開商業合理性,我們深度協同模型架構和推理框架的設計,大幅降低任務成本,讓智能用得起、用得好。

      Hy3 preview 是我們重建后訓練的第一個模型,也是混元迄今最智能的模型,在復雜推理、指令遵循、上下文學習、代碼、智能體等能力及推理性能上實現了大幅的提升。

      ·詳細Bench數據和Case可訪問混元博客(https://hy.tencent.com/hy3-preview)了解更多。

      復雜推理

      推理能力是模型解決各種問題的基礎。Hy3 preview 在FrontierScience Olympiad、IMO Answer Bench 等高難度理工科推理任務中表現突出,并在最新的清華大學求真書院數學博資考(26春)和全國中學生生物學聯賽(CHSBO 2025)中取得優異成績,展現出可泛化的強推理能力。


      上下文學習和指令遵循

      在各種真實的生產與生活場景,理解雜亂冗長的上下文并遵從復雜多變的規則是模型的首要挑戰。基于我們多種業務場景的靈感,我們提出了 CL-bench 和 CL-bench-Life 來創新性地評估模型的上下文學習能力,并在 Hy3 preview 顯著地提升了模型上下文學習和指令遵循能力。


      · 更多Case可訪問混元博客(https://hy.tencent.com/hy3-preview)了解。

      代碼和智能體

      代碼和智能體是 Hy3 preview 提升最為顯著的方向。得益于預訓練及強化學習框架的重建和強化學習任務規模的提升,我們以較快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代碼智能體基準以及 BrowseComp、WideSearch 等主流搜索智能體基準中取得了強競爭力的結果。


      在數字世界中,代碼關注的是模型在開發環境中的執行能力,搜索則聚焦于開放信息空間中的檢索、篩選與整合能力,兩者共同決定了模型在復雜智能體場景(例如OpenClaw)中是否真正具備可用性。Hy3 preview 在 ClawEval 和 WildClawBench 等評測中表現突出,進一步表明我們的智能體能力的全面與實用性。


      除了公開榜單,我們進一步構建了多個內部的評測集,對模型在真實開發場景中的表現進行評估。結果表明,無論是在后端工程任務集 Hy-Backend,貼近真實用戶開發交互的 Hy-Vibe Bench,還是高難度軟件工程開發任務集 Hy-SWE Max上,Hy3 preview 均體現出了強競爭力。


      比較各個開源模型的大小與智能體綜合表現,Hy3 preview 展現出高性價比。


      Case

      prompt:請幫我使用微信小程序原生框架(或指定框架)開發一個完整、可直接編譯運行的徒步路線與旅游計劃推薦小程序,請一次性輸出包含 app.json 等全局配置、所有頁面(WXML/WXSS/JS/JSON)以及完整的 Mock數據,核心需求包括:一個帶有精美圖片輪播、‘當季推薦’及‘路線難度’分類導航的首頁;一個包含行程時間軸、精美沿途圖庫、適宜季節與裝備建議的路線詳情頁;以及一個支持本地緩存收藏功能的個人中心頁,UI設計需清新自然、圖文并茂,請確保代碼邏輯閉環、無缺失文件或引用錯誤,生成后我可以直接導入微信開發者工具成功預覽并體驗完整交互。

      模型輸出


      自然對話和用戶理解

      在探索智能上限的同時,我們始終關注模型與人的交互和對人的理解。為此,我們與元寶團隊進行了深度的合作,使用 URM (User-Feedback RM) 對用戶的真實反饋進行建模,并結合 RLHF 技術進行了細粒度的優化。結合推理、長文、指令、智能體等能力的優化,這帶來了用戶體驗的大幅提升:Hy3 preview 的事實性錯誤顯著降低,能更精準理解用戶的模糊意圖和碎片化的輸入,回復風格更加共情,內容更具深度。在元寶的灰度測試上,我們看到 Hy3 preview 在元寶用戶活躍度上較之前模型實現了大幅增長。

      · 更多Case可訪問混元博客(https://hy.tencent.com/hy3-preview)了解。

      產品的上線和初步反饋

      Hy3 preview 已在元寶、CodeBuddy、WorkBuddy、QQ、ima、QQ瀏覽器、騰訊文檔、騰訊樂享上線,并在微信公眾號、騰訊新聞、騰訊自選股、和平精英、騰訊客服等多個產品陸續上線中。另外,Hy3 preview 已支持流行的開源智能體產品,如 OpenClaw、OpenCode、KiloCode 等。


      元寶產品經理 Logan 表示,Hy3 preview 研發過程中,混元與元寶進行了深度Co-Design。一方面針對性地提升了模型在意圖理解精準度、文本創作質量、深度搜索等硬核指標上的表現;另一方面對文風、文筆、情商、內容組織和內容專業度上進行了精細化調優。模型與產品的深度協同,為用戶帶來了更智能且更具“活人感”的交互體驗。


      ima 產品經理 kaycee 表示,目前 ima 已經接入Hy3 Preview,在 ima 知識庫問答和通用問答兩個場景下,測試結果顯示,Hy3 preview 處理長文的能力出色,特別是檢索類任務,在回答信息的準確性、覆蓋度和全面性上表現較好。


      在CodeBuddy、WorkBuddy 產品上,Hy3 preview 首 token 延遲降低 54%、端到端時長降低 47%、成功率提升至 99.99%+。實際用戶環境中,Hy3 preview 已穩定驅動最長 495 步的復雜 Agent 工作流,覆蓋文檔處理、數據分析、知識檢索、MCP 工具鏈編排等多樣化辦公場景。


      微信公眾號產品經理 Astrid 表示,在公眾號AI 分身和 AI 客服的場景專項評測中,Hy3 preview 展現出相比 Hy2更全面的能力升級。新模型在用戶意圖理解、復雜上下文承接和知識信息組織方面表現更成熟,面對模糊提問、短句追問和多輪對話時,能夠更準確地把握用戶訴求,并輸出更清晰、更穩定的回復。結合知識庫、用戶記憶與上下文生成回答時更貼合AI 分身和 AI 客服的角色,過度腦補、主觀代入和情緒化表達顯著減少,使整體交互體驗更貼近“可信、自然、高效”的回復目標。


      和平精英AI玩法負責人jessexue表示,Hy3 preview 模型上線后,和平精英第一時間在 AI NPC 場景中完成接入并開展評測,整體表現令人印象深刻。在游戲局外的人設扮演場景中,Hy3 preview 不僅能夠精準理解角色設定,還能針對開放性問題輸出高度關聯、富有增量價值的內容,帶來了更加真實、自然、沉浸的對話體驗。而在游戲局內的復雜對戰場景中,模型回復節奏貼近真實玩家聊天體驗,展現出優秀的穩定性與出色的擬人化扮演能力,整體效果表現亮眼。


      騰訊文檔AI Agent 研發負責人 Johnny 表示,Hy3 preview 模型上線后,騰訊文檔 Agent 團隊圍繞核心場景開展綜合評測,以 AI PPT 場景為例,Hy3 preview模型較上一版本(Hy2)取得了顯著進步:生成成功率提升 20%,評測得分提升 10%,同時生成耗時縮短 20%。整體而言,新模型在評測場景中表現優異,在模版選擇,色彩匹配,生成大綱,補充內容多個階段,均體現出優秀的表現,無幻覺,契合主題,視覺效果好,展現了明顯的技術突破,后續應用值得期待。


      QQ AI助手 小Q產品負責人Tea表示,Hy3 preview 相較上一代Hy2,在小Q助手場景上,新模型在長文本首字節時延、整體響應速度與流式輸出效率方面顯著優化;核心能力上,數學推理表現提升尤為明顯,多場景指令遵循與泛化能力進一步增強;在工具調用推理及多輪指代消解方面表現更穩定高效,在 OpenClaw官方 PinchBench QQ智能體場景測試中取得突出效果,綜合體驗實現明顯躍升。

      開源、API、Token Plan

      Hy3 preview 的模型權重、代碼已在 GitHub、HuggingFace、ModelScope、GitCode 等平臺開源,支持 vLLM、SGLang 等主流推理框架,開發者可以直接下載使用。(詳細鏈接見文末)

      得益于模型架構和推理框架的深度協同,以及我們在推理框架、算子性能、量化算法等方面的優化,Hy3 preview 的成本相比上一代模型大幅下降。在騰訊云上,我們推出了有競爭力的 API 價格以及定制化的 Token Plan,個人版定價最低28元/月。



      Hy3 preview 是我們重建的第一步。雖然模型效果已經取得了巨大進步,但仍存在一些已知問題,我們希望通過這次開源和發布,獲得來自開源社區和用戶的真實反饋,幫助我們提升 Hy3 正式版的實用性。與此同時,我們也在繼續擴大預訓練和強化學習的規模,提升模型的智能上限,并通過與騰訊更多產品的深入協同,持續改進模型在真實場景中的實用性并探索差異化能力。

      歡迎大家體驗并給我們反饋。

      附:開源和 API & Token Plan 鏈接

      • Github:https://github.com/Tencent-Hunyuan/Hy3-preview

      • Hugging Face:https://huggingface.co/tencent/Hy3-preview

      • ModelScope:https://modelscope.cn/models/Tencent-Hunyuan/Hy3-preview

      • GitCode:https://ai.gitcode.com/tencent_hunyuan/Hy3-preview

      • 騰訊云TokenPlan接入地址:https://console.cloud.tencent.com/tokenhub/tokenplan/hy?regionId=1

      • 騰訊云API接入地址:

        https://console.cloud.tencent.com/tokenhub/models/detail?modelId=hy3-preview&regionId=1

      前沿動態前沿大會
      前沿人物

      「在看」,給前前加雞腿

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      49 歲馬伊琍爆炸頭官宣新狀態!文章攜新歡亮相,兩人各自安好

      49 歲馬伊琍爆炸頭官宣新狀態!文章攜新歡亮相,兩人各自安好

      橙星文娛
      2026-05-14 10:09:49
      阿森納迷惑操作!19 歲天才剛坐穩主力,就要被 7000萬先生擠走?

      阿森納迷惑操作!19 歲天才剛坐穩主力,就要被 7000萬先生擠走?

      奶蓋熊本熊
      2026-05-15 01:10:37
      多地村鎮理發店被起訴商標侵權 “標榜”“東尼”商標使用權為何到了一家英國公司之手|紅星調查

      多地村鎮理發店被起訴商標侵權 “標榜”“東尼”商標使用權為何到了一家英國公司之手|紅星調查

      紅星新聞
      2026-05-14 18:01:16
      國家發改委、國家糧食和物資儲備局、財政部、交通運輸部、農業農村部、中國人民銀行、國家市場監督管理總局等聯合印發重要通知

      國家發改委、國家糧食和物資儲備局、財政部、交通運輸部、農業農村部、中國人民銀行、國家市場監督管理總局等聯合印發重要通知

      農民日報
      2026-05-14 16:45:33
      特朗普來了,成都也火了

      特朗普來了,成都也火了

      城市財經
      2026-05-14 11:36:41
      賣不動了,日系車集體退守中國

      賣不動了,日系車集體退守中國

      21世紀經濟報道
      2026-05-13 23:28:25
      他帶了一個轟動全球的豪華天團訪華,卻唯獨把老婆留在了美國?

      他帶了一個轟動全球的豪華天團訪華,卻唯獨把老婆留在了美國?

      菁菁子衿
      2026-05-13 22:15:32
      全球最毒的十大垃圾食品榜單,泡面未上榜,“真兇”很多人喜歡吃

      全球最毒的十大垃圾食品榜單,泡面未上榜,“真兇”很多人喜歡吃

      小談食刻美食
      2026-05-14 08:01:03
      Model Y降價到24.99萬仍是智商稅?三電、空間遭國產車降維打擊!

      Model Y降價到24.99萬仍是智商稅?三電、空間遭國產車降維打擊!

      阿芒娛樂說
      2026-05-14 11:16:01
      沒給日本的,中方都給了特朗普,除了21響禮炮,還有一個重要承諾

      沒給日本的,中方都給了特朗普,除了21響禮炮,還有一個重要承諾

      顧蔡衛
      2026-05-15 02:35:49
      5月13日向太終于發聲!向佐郭碧婷分居真相,根本不是婚變

      5月13日向太終于發聲!向佐郭碧婷分居真相,根本不是婚變

      小椰的奶奶
      2026-05-14 00:14:20
      馬卡:伯納烏安保清除反弗洛倫蒂諾橫幅,現場仍顯緊張

      馬卡:伯納烏安保清除反弗洛倫蒂諾橫幅,現場仍顯緊張

      懂球帝
      2026-05-15 04:13:11
      中美會晤結束,特朗普松開中方的手,鄰國總統:中美穩定利好全球

      中美會晤結束,特朗普松開中方的手,鄰國總統:中美穩定利好全球

      鐵甲觀
      2026-05-14 17:10:40
      特朗普:美國最高法院門楣上刻著孔子雕像!

      特朗普:美國最高法院門楣上刻著孔子雕像!

      看看新聞Knews
      2026-05-14 21:28:04
      當你見過的人夠多了就會懂:越是骨子里帶著狠勁和匪氣,敢硬剛,敢擺態度,不退縮的,才是真正能成事的狠人,能翻盤,能扛事

      當你見過的人夠多了就會懂:越是骨子里帶著狠勁和匪氣,敢硬剛,敢擺態度,不退縮的,才是真正能成事的狠人,能翻盤,能扛事

      心理觀察局
      2026-05-14 09:29:14
      教你一個玄學法則:當你的孩子主動給你買衣服、買吃的,或者主動給你發紅包,不管你缺不缺錢,有多心疼孩子賺錢辛苦,你都要欣然的收下

      教你一個玄學法則:當你的孩子主動給你買衣服、買吃的,或者主動給你發紅包,不管你缺不缺錢,有多心疼孩子賺錢辛苦,你都要欣然的收下

      心理觀察局
      2026-05-13 09:18:07
      徹底涼透!偷稅網紅白冰復出賣慘翻車,哭訴被陷害,結局大快人心

      徹底涼透!偷稅網紅白冰復出賣慘翻車,哭訴被陷害,結局大快人心

      喜歡歷史的阿繁
      2026-05-15 02:54:49
      馬斯克攜幼子現身北京人民大會堂 外國網友:孩子那身新中式簡直太棒

      馬斯克攜幼子現身北京人民大會堂 外國網友:孩子那身新中式簡直太棒

      快科技
      2026-05-14 19:00:09
      哎,上海人在公共場合豪橫地用上海話聊天,似乎已經成了一種常態

      哎,上海人在公共場合豪橫地用上海話聊天,似乎已經成了一種常態

      上海云河
      2026-05-13 19:55:38
      川普來了也得提一杯,這曲”懂王破陣曲“絕了!

      川普來了也得提一杯,這曲”懂王破陣曲“絕了!

      談芯說科技
      2026-05-14 23:23:31
      2026-05-15 05:08:49
      前沿在線 incentive-icons
      前沿在線
      前沿在線官方賬號,關注AI、機器人、智能車等前沿領域;
      206文章數 1235關注度
      往期回顧 全部

      科技要聞

      馬斯克說會談很順利 黃仁勛點贊 庫克比耶

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國造

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國造

      體育要聞

      爭議抽象天王山,和季后賽最穩定中鋒

      娛樂要聞

      何九華官宣當爸!全程不提孩子媽

      財經要聞

      李強會見美國工商界代表

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      家居
      游戲
      教育
      本地
      公開課

      家居要聞

      精神奢享 對話塔尖需求

      《極限競速地平線6》畫面對比 最佳游玩平臺在PC

      教育要聞

      老師的績效也隨工資發了,領導好像不太能拿捏老師們了!

      本地新聞

      用蘇繡的方式,打開江西婺源

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 偷拍av网| 国产精品久久久久久福利| 亚洲中文字幕无码av| 亚洲已满18点击进入在线看片| 无码射肉在线播放视频| 韩国无码AV片午夜福利| 无码簧片| 一夜七次郎最新网站| 国产av国片精品| 精品国产一区二区三区不卡在线 | 国产伦精品一区二区三区照片91| 谁有老熟女网站| 久久动漫精品| 国产精品熟女视频一区二区| 熟女乱一区二区三区四区| 伊人久久大香线蕉av一区| 日韩国产亚洲三区在线| 久久无码精品一一区二区三区 | 精品无码国产污污污免费网站国产| 国产成人久久综合第一区| 毛片无遮挡高清免费| 99久久机热/这里只有精品| 在线观看亚洲天堂| 亚洲激情av| 朋友的丰满人妻hd| 久久精品这里热有精品| 亚洲第一精品一二三区| 中文字幕乱码亚洲无线码在线日噜噜| 国产亚洲欧美另类第一页| 久久精品国产精品亚洲色婷婷| 成人免费无码大片a毛片抽搐色欲| 日韩av影院在线观看| 久久影院一区二区h| 亚洲性影院| 一女被多男玩喷潮3p免费视频 | 精品国产一区二区三区蜜殿| 国产精品9999| 2018亚洲а∨天堂| 自拍偷在线精品自拍偷无码专区| 新狼窝色av性久久久久久 | 丰满少妇在线观看网站|