<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      訓練從數周壓到數小時:他們把通用原子勢訓練帶入Exascale時代

      0
      分享至



      作者 | 論文團隊

      編輯丨ScienceAI

      在材料發現、催化設計、能源體系模擬、藥物研發等方向,原子尺度模擬一直都是底層工具,但傳統 DFT 計算成本極高,很難支撐大規模篩選。過去幾年,機器學習原子間勢雖然發展很快,但要真正做到「一個模型覆蓋材料、分子、催化、MOF 等多個領域」,并不容易。

      原因很直接:這類模型訓練不僅要預測能量,還要通過自動微分嚴格求出原子力和應力,訓練中需要二階導數;同時,為了保證分子動力學的穩定性,又往往必須堅持 FP32 精度。二階訓練、高精度要求、超大原子圖,這三重約束疊加在一起,讓十億級通用原子勢的訓練長期停留在「理論上可擴、工程上難訓」的狀態。

      最近,來自中國科學院計算技術研究所的研究團隊把通用機器學習原子間勢(uMLIP)的訓練規模推到了一個新量級,提出了十億級通用原子勢模型 MatRIS-MoE,以及配套的分布式訓練框架 Janus,在兩臺 Exascale 超算上實現了 1.2/1.0 EFLOPS 的單精度峰值性能,并把原本需要數周的訓練過程壓縮到數小時。



      研究論文:Breaking the Training Barrier of Billion-Parameter Universal Machine Learning Interatomic Potentials

      論文地址:https://arxiv.org/pdf/2604.15821v1

      兼顧物理先驗與擴展性的模型架構

      MatRIS-MoE 建立在 MatRIS 的不變架構之上,將原子體系表示為圖結構,模型對原子、成對距離和三體角度進行嵌入外,還加入任務嵌入、charge/spin 嵌入和全局特征嵌入,將不同數據集、DFT 泛函和體系類型對齊到統一表示空間中。相比原始 MatRIS,它不再只是單任務勢函數,而是面向多域統一建模的 universal MLIP。



      更關鍵的是,作者沒有簡單堆大參數,而是引入了 MoE。在 MatRIS-MoE 中,MoE 層被插入到注意力前后,分別處理消息構造和特征更新。其一個重要設計是:路由不依賴瞬時坐標,而是按元素類型進行 Top-K 專家激活。這樣既能讓不同專家學習不同元素和化學環境下的規律,提升跨域表達能力,也能保持專家激活穩定,從而有助于維持連續、平滑的勢能面。

      訓練上,這項工作依然堅持「保守式」路線:模型先預測總能量,再通過自動微分得到力和應力,而不是單獨開力頭直接擬合,這對保證物理一致性很重要。同時,作者還設計了 multi-task robust loss,在每個任務內部統計 batch loss 的均值和方差,并對離群樣本做平滑降權,以減輕異構任務之間的干擾。

      兼顧 MoE 稀疏執行與二階反傳的訓練框架

      如果說模型解決的是「怎么表達」,那么 Janus 解決的就是「怎么訓練」。

      Janus 的核心是一個叫 FS-3D 的統一執行單元,把 FSDP、FSGP 和 FSEP 三種并行機制揉到了一起。簡單說,FSDP 負責切參數,降低模型參數、梯度和優化器狀態的靜態顯存占用;FSGP 負責切圖,把一個大原子圖劃分到多張卡上,降低激活開銷;FSEP (以 LAER-MoE 為基礎) 則專門面向 MoE,把專家參數分布到不同設備上,只在需要時恢復活躍專家。對于既有超大圖、又有 MoE、還要做 double backward 的 uMLIP 來說,這種三維統一分片的設計,是這篇工作的關鍵工程創新之一。

      為了進一步解決 MoE 的低效問題,作者還提出了 JIT planning。傳統 MoE 訓練往往會保留很多當前 step 根本用不到的專家;作者利用體系靜態屬性決定專家激活的特點,在每個訓練 step 開始前,先對所有 MoE 層做批量路由,統計各專家 token 負載,再基于負載做局部規劃和全局合并,只恢復當前真正活躍的專家,并按負載盡量均衡地放到不同 rank 上。

      更難的是,uMLIP 訓練不是普通的一次前向一次反向,而是包含 前向、一次反向、二次反向三個階段。Janus 為此專門實現了一個「二階訓練大模型」的運行時系統:參數按需恢復,前向階段記錄執行順序,后續階段復用順序做 prefetch 和 overlap,梯度同步則延遲到最終反向再進行。



      結果與展望

      結果也確實夠亮眼。論文使用了覆蓋分子、材料、催化表面、分子晶體和 MOF 的 4.73 億個原子構型,對應約 3.6 萬億條邊;最大模型規模達到 11.5B 參數,2.89B active parameters,支持處理多個領域的科學任務。最終,在兩臺 Exascale 平臺上,系統實現了超過 90% 的弱擴展并行效率,峰值達到 1.2 EFLOPS,把十億級通用原子勢訓練第一次真正推到了超算級可用的階段。



      從這個角度看,這篇工作真正重要的地方,不只是「把一個模型訓到了 11.5B」,也不只是「跑到了 1.2 EFLOPS」,而是它證明了一件事:通用原子勢也可以像大模型一樣,被系統化地擴展、訓練和部署。

      對 AI for Science 來說,這可能比單點精度提升更重要。因為從這里開始,通用原子勢不再只是論文里的 benchmark 選手,而是在向真正的科學基礎設施靠近。



      作者介紹

      中國科學院計算技術研究所及中國科學院大學周遠昌、王宏宇、杜奕明、汪焱、李明真、胡思宇為本文共同第一作者;中國科學院計算技術研究所賈偉樂研究員為本文通訊作者。賈偉樂 2020 年獲國際高性能計算應用領域最高獎戈登貝爾獎,2022 年再次入圍該獎項;相關成果入選兩院院士評選國內十大科技進展新聞,并獲得中國超算年度最佳應用獎及中國計算機學會高性能計算青年科技人才獎等多項榮譽。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      卡戴珊名媛再傳新戀情!同框撒糖太甜了,布克復合的心可以死了!

      卡戴珊名媛再傳新戀情!同框撒糖太甜了,布克復合的心可以死了!

      籃球神吐槽
      2026-05-20 22:01:08
      普京、特朗普訪華為什么都選在夜間抵京?

      普京、特朗普訪華為什么都選在夜間抵京?

      朋筆生輝
      2026-05-20 23:16:04
      “碳水臉”引爭議,網友:令人不適的網絡詞!

      “碳水臉”引爭議,網友:令人不適的網絡詞!

      環球網資訊
      2026-05-21 13:16:30
      豆瓣9.7分,零差評,它才是真正的美劇天花板

      豆瓣9.7分,零差評,它才是真正的美劇天花板

      天天美劇吧
      2026-05-20 20:11:36
      他們倆,是真愛。

      他們倆,是真愛。

      劉娜
      2026-05-20 20:46:05
      大量戶外mini露營車流入閑魚!來自農夫山泉,全新30元拿走

      大量戶外mini露營車流入閑魚!來自農夫山泉,全新30元拿走

      閑搞機
      2026-05-20 11:04:52
      中俄聯合聲明:必須在充分、完整、全面遵循《聯合國憲章》原則基礎上消除烏克蘭危機根源

      中俄聯合聲明:必須在充分、完整、全面遵循《聯合國憲章》原則基礎上消除烏克蘭危機根源

      界面新聞
      2026-05-20 23:30:50
      U17晉級決賽紀錄片:球隊在肇慶就進行過專項耐熱適應訓練

      U17晉級決賽紀錄片:球隊在肇慶就進行過專項耐熱適應訓練

      懂球帝
      2026-05-21 17:25:56
      為何逝去的親人不托夢給我們?城隍爺:不是不愿來,而是魂歸各處

      為何逝去的親人不托夢給我們?城隍爺:不是不愿來,而是魂歸各處

      阿鄭的讀書日常
      2025-02-07 08:50:46
      山東103歲醫生免費給人看病,臨終前告訴妻子:其實我是一名日軍

      山東103歲醫生免費給人看病,臨終前告訴妻子:其實我是一名日軍

      興趣知識
      2026-05-18 00:49:57
      日韓股市集體大漲!日本股市漲超1500點,韓國綜指漲超300點,觸發熔斷,三星電子漲超6%,SK海力士漲超4%

      日韓股市集體大漲!日本股市漲超1500點,韓國綜指漲超300點,觸發熔斷,三星電子漲超6%,SK海力士漲超4%

      每日經濟新聞
      2026-05-21 11:11:05
      1990年林青霞與親姐河南相認,對方一貧如洗,她有沒有幫幫姐姐?

      1990年林青霞與親姐河南相認,對方一貧如洗,她有沒有幫幫姐姐?

      飄飄然的娛樂匯
      2026-05-21 21:30:06
      泡藥楊梅,豈止是大膽!

      泡藥楊梅,豈止是大膽!

      鳳眼論
      2026-05-21 11:53:11
      國補價4299元起!小米17 Max正式發布:6.9英寸大直屏、小米最強續航

      國補價4299元起!小米17 Max正式發布:6.9英寸大直屏、小米最強續航

      快科技
      2026-05-21 19:36:29
      罕見撕破臉!波蘭前總理突然公開爆粗口,怒罵兩個女人害慘了歐盟

      罕見撕破臉!波蘭前總理突然公開爆粗口,怒罵兩個女人害慘了歐盟

      風雨與陽光
      2026-05-21 17:07:05
      15名志愿軍敵后打游擊,靠搶美韓物資挖山洞過冬,整整熬過300天

      15名志愿軍敵后打游擊,靠搶美韓物資挖山洞過冬,整整熬過300天

      鶴羽說個事
      2026-05-20 22:56:16
      終于有人發聲了:11年前買入騰訊股票持有到2026年,單單分紅就足以嚇人,誰會是下一只“騰訊”?

      終于有人發聲了:11年前買入騰訊股票持有到2026年,單單分紅就足以嚇人,誰會是下一只“騰訊”?

      新浪財經
      2026-05-17 16:30:36
      絕密會議強逼周恩來交權!24名高層無記名表決,為何18人寧可當場抗命也要力保他?

      絕密會議強逼周恩來交權!24名高層無記名表決,為何18人寧可當場抗命也要力保他?

      史海孤雁
      2026-05-14 16:02:24
      踩踏式出逃!

      踩踏式出逃!

      金牛遠望號
      2026-05-21 20:25:56
      俄烏轉折:烏軍進攻次數首次超過俄軍!摧毀車臣特種部隊基地

      俄烏轉折:烏軍進攻次數首次超過俄軍!摧毀車臣特種部隊基地

      項鵬飛
      2026-05-21 20:03:57
      2026-05-21 23:00:49
      ScienceAI incentive-icons
      ScienceAI
      關注人工智能與其他前沿技術
      1307文章數 227關注度
      往期回顧 全部

      科技要聞

      小米YU7 GT正式發布:售價38.99萬元

      頭條要聞

      男子網購719元女士睡衣做520禮物 調包成男士睡衣退貨

      頭條要聞

      男子網購719元女士睡衣做520禮物 調包成男士睡衣退貨

      體育要聞

      常住人口7000的小鎮,擁有了一支德甲球隊

      娛樂要聞

      反轉!金秀賢與金賽綸未成年時交往不實

      財經要聞

      潮水退去,裸泳的一定不止五糧液

      汽車要聞

      后驅+閃充+激光雷達 第三代元PLUS上市售11.99萬元起

      態度原創

      教育
      藝術
      手機
      健康
      公開課

      教育要聞

      一個方法讓孩子擁有解決問題能力

      藝術要聞

      崔雪冬 2026年油畫新作

      手機要聞

      4299元起!小米17 Max 2億徠卡太炸裂,穿戴新品壓軸登場

      外泌體與干細胞竟是“快遞”與“工廠”的關系?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 波多野结衣初尝黑人| 精品国产人妻一区二区三区免费| 欧美黑人又粗又大高潮喷水| 久久久中文| 在线观看视频一区二区三区| 中文字幕2区| 午夜一区二区三区| 亚洲最大无码中文字幕网站 | 色色看片| 日韩欧美视频第一区在线观看| 中文字幕av无码不卡| 日本免费一区二区三区四区五六区 | 亚洲男女在线| 欧美同性三人交| 国产亚洲人成在线播放| 读书| 在线观看免费人成视频| 午夜天堂一区人妻| 国产亚洲高清在线精品不卡| av动态| 久久99精品国产麻豆婷婷| 欧美人与动另类在线| 日本 欧美 制服 中文 国产| 激情综合亚洲色婷婷五月app| 一本无码久本草在线中文字幕dvd| 久久久国产精品人人片| 麻豆国产尤物av尤物在线观看| 日韩精品久久久久久久电影蜜臀| 国产精品久久久久高潮| 色噜噜狠狠色综合网图区| 国产麻豆精品精东影业av网站| 精品一区二区三区四区色| 成人日本有码在线| 无码一| 日韩美女啪啪不卡视频| 国产欧美丝袜在线二区| 人人超碰在线| jzzijzzij亚洲成熟少妇| 精品美女少妇内射毛片| 怡春院欧美一区二区三区免费| 美女自卫慰黄网站|