<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      清華大學(xué)發(fā)布ProteinOPD:面向蛋白質(zhì)設(shè)計(jì)高效多目標(biāo)偏好對(duì)齊框架

      0
      分享至



      作者 | 論文團(tuán)隊(duì)

      編輯丨ScienceAI

      當(dāng)前,蛋白質(zhì)語(yǔ)言模型正從「生成合理蛋白序列」逐步走向「按需生成具有特定性質(zhì)的蛋白序列」。在合成生物學(xué)和藥物發(fā)現(xiàn)等場(chǎng)景中,研究者往往不只希望模型生成結(jié)構(gòu)合理的蛋白,還希望候選序列同時(shí)具備更高折疊性、更好溶解性、更強(qiáng)熱穩(wěn)定性等多種屬性。然而,多目標(biāo)蛋白質(zhì)偏好對(duì)齊長(zhǎng)期面臨核心挑戰(zhàn):在提升目標(biāo)屬性的同時(shí),模型容易遺忘預(yù)訓(xùn)練階段獲得的蛋白設(shè)計(jì)能力,并且難以在多個(gè)相互競(jìng)爭(zhēng)的偏好目標(biāo)之間取得穩(wěn)定平衡。

      近日,清華大學(xué)高子琪團(tuán)隊(duì)聯(lián)合 IDEA AI4S 團(tuán)隊(duì)提出 ProteinOPD,該工作的主要貢獻(xiàn)如下:

      1. 解決蛋白質(zhì)偏好對(duì)齊中的多目標(biāo)難點(diǎn)。ProteinOPD 是一個(gè)面向蛋白質(zhì)設(shè)計(jì)的高效多目標(biāo)偏好對(duì)齊框架,在提升目標(biāo)屬性的同時(shí),保留蛋白語(yǔ)言模型原有的設(shè)計(jì)能力與生成分布質(zhì)量。

      2. 提出多教師 OPD 的一種有效實(shí)現(xiàn)形式。該方法將預(yù)訓(xùn)練蛋白語(yǔ)言模型適配為多個(gè)偏好專(zhuān)屬教師,并通過(guò) normalized Product-of-Experts 構(gòu)造幾何共識(shí)分布,使學(xué)生模型能夠在自身生成軌跡上接受 token-level on-policy distillation,從而將 OPD 從單教師、單目標(biāo)設(shè)置擴(kuò)展到多教師、多目標(biāo)偏好對(duì)齊場(chǎng)景。

      3. 提供較完整的開(kāi)源支持。項(xiàng)目已開(kāi)放論文、代碼、項(xiàng)目主頁(yè)和 Colab 體驗(yàn)入口,覆蓋無(wú)條件生成與條件生成兩類(lèi)設(shè)置,并提供教師構(gòu)建、ProteinOPD 訓(xùn)練、序列生成和推理體驗(yàn)等關(guān)鍵流程,便于社區(qū)復(fù)現(xiàn)與后續(xù)擴(kuò)展。



      論文地址:https://arxiv.org/abs/2605.10189

      開(kāi)源地址:https://github.com/THU-AI4S/ProteinOPD

      Colab 鏈接:https://colab.research.google.com/github/THU-AI4S/ProteinOPD/blob/main/notebooks/proteinopd_inference.ipynb

      在模型表現(xiàn)方面,ProteinOPD 在多目標(biāo)場(chǎng)景下取得了最優(yōu)偏好對(duì)齊表現(xiàn),同時(shí)對(duì)設(shè)計(jì)能力造成的損傷最小。以 ProtGPT2 為基礎(chǔ)模型時(shí),ProteinOPD 分別將 foldability、solubility 和 thermostability 提升 14.8%、16.9% 與 54.2%;同時(shí),其偏好對(duì)齊性能可在約 1/8 的訓(xùn)練時(shí)間內(nèi)達(dá)到 RL 方法的水平。

      方法設(shè)計(jì)

      ProteinOPD 的思路是將「偏好獲取」和「偏好組合」解耦。首先,針對(duì)折疊性、溶解性、熱穩(wěn)定性等目標(biāo)偏好,框架使用屬性 oracle 對(duì)蛋白序列進(jìn)行打分,并選取少量高分樣本構(gòu)建偏好專(zhuān)屬訓(xùn)練集。隨后,通過(guò)輕量化適配,將預(yù)訓(xùn)練蛋白語(yǔ)言模型轉(zhuǎn)化為多個(gè)偏好專(zhuān)屬教師。每個(gè)教師負(fù)責(zé)提供一種偏好的生成方向,而不是要求單個(gè)模型同時(shí)承擔(dān)全部目標(biāo)。

      在學(xué)生訓(xùn)練階段,ProteinOPD 不采用傳統(tǒng)離線(xiàn)模仿方式,而是在學(xué)生模型自己的生成軌跡上進(jìn)行 on-policy distillation。具體而言,學(xué)生模型先生成當(dāng)前會(huì)訪(fǎng)問(wèn)的蛋白序列前綴,教師模型再基于這些前綴給出下一 token 的概率分布。相比只在固定數(shù)據(jù)集上訓(xùn)練,這種機(jī)制能夠讓學(xué)生在自身實(shí)際訪(fǎng)問(wèn)的狀態(tài)空間中獲得糾正信號(hào),從而緩解訓(xùn)練階段與生成階段的分布不一致問(wèn)題。同時(shí),token-level 分布監(jiān)督也比序列級(jí)獎(jiǎng)勵(lì)更密集,有助于提升訓(xùn)練效率和穩(wěn)定性。



      對(duì)于多目標(biāo)偏好對(duì)齊,ProteinOPD 的關(guān)鍵設(shè)計(jì)是多教師 OPD。研究團(tuán)隊(duì)將多個(gè)偏好教師的 next-token 分布通過(guò) normalized Product-of-Experts 進(jìn)行組合,形成一個(gè)幾何共識(shí)目標(biāo)。與算術(shù)平均不同,幾何共識(shí)更強(qiáng)調(diào)多個(gè)教師共同支持的 token:只有當(dāng)多個(gè)偏好教師都傾向于某個(gè)氨基酸選擇時(shí),該 token 才會(huì)在共識(shí)分布中獲得更高權(quán)重。這一設(shè)計(jì)使模型更傾向于尋找多種偏好之間的交集,而不是被某一個(gè)目標(biāo)單獨(dú)牽引。

      這一機(jī)制還帶來(lái)一個(gè)重要性質(zhì):歸一化項(xiàng)可以反映教師之間的分歧程度。當(dāng)多個(gè)教師在某個(gè)序列前綴上意見(jiàn)一致時(shí),目標(biāo)偏好之間沖突較小;當(dāng)教師分布明顯不一致時(shí),沖突程度增大。因此,ProteinOPD 不僅提供了多教師偏好組合的訓(xùn)練目標(biāo),也為觀察多屬性之間的內(nèi)部競(jìng)爭(zhēng)提供了一個(gè)無(wú)需額外計(jì)算的信號(hào)。

      模型性能

      1. 多目標(biāo)偏好對(duì)齊取得帕累托最優(yōu)。(1) 相比評(píng)估中最強(qiáng)的跨范式參考方法 MoMPNN,ProteinOPD 的 HV 提升 34.8%。(2) 與基礎(chǔ)模型 ProtGPT2 相比,ProteinOPD 分別將蛋白可折疊性、溶解性和熱穩(wěn)定性提升 14.8%、16.9% 與 54.2%。



      論文主表:無(wú)條件設(shè)置下多目標(biāo)偏好對(duì)齊性能對(duì)比。

      2. 單目標(biāo)實(shí)驗(yàn)顯示 ProteinOPD 能夠轉(zhuǎn)移 SFT 教師的偏好能力同時(shí)緩解直接微調(diào)造成的蛋白設(shè)計(jì)能力的下降。(1) 在無(wú)條件生成中,ProteinOPD 在保留大部分屬性收益的同時(shí),將新穎性損失控制在更低水平。(2) 在條件生成中,ProteinOPD 還提升了 ProTrek Score,說(shuō)明模型在偏好對(duì)齊過(guò)程中沒(méi)有破壞原有條件一致性。



      3. 訓(xùn)練成本大幅降低。(1) ProteinOPD 相比 RL 類(lèi)方法可以更快提升熱穩(wěn)定性,并取得約 8 倍訓(xùn)練加速。 (2) 教師構(gòu)建只需要少量經(jīng) oracle 篩選的高質(zhì)量樣本,使整體流程更適合實(shí)際蛋白設(shè)計(jì)中的快速迭代需求。



      樣例研究

      論文進(jìn)一步給出了 ProteinOPD 與 ASPO 的生成樣例對(duì)比。為確保比較集中在多屬性對(duì)齊能力上,作者選取熱穩(wěn)定性均超過(guò) 0.95 的樣例,并要求生成序列與 UniRef 的最大序列一致性低于 5%。在可視化結(jié)果中,ProteinOPD 生成樣例的 pLDDT 達(dá)到 0.73,高于 ASPO 的 0.49;溶解性得分達(dá)到 0.69,高于 ASPO 的 0.43。這表明 ProteinOPD 不僅能提升單一屬性,還能在保持新穎性的同時(shí)實(shí)現(xiàn)更有效的多屬性對(duì)齊。



      ProteinOPD 為蛋白質(zhì)偏好對(duì)齊提供了一條高效路徑:用輕量教師學(xué)習(xí)單一偏好,用多教師幾何共識(shí)處理目標(biāo)沖突,再通過(guò)學(xué)生自身軌跡上的 token-level OPD 完成穩(wěn)定遷移。該工作將 OPD 從語(yǔ)言模型偏好對(duì)齊拓展到蛋白質(zhì)設(shè)計(jì)場(chǎng)景,并進(jìn)一步推進(jìn)到多目標(biāo)、多教師設(shè)置,為生成式蛋白設(shè)計(jì)中的高效偏好對(duì)齊提供了新的技術(shù)參考。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      俞灝明罕見(jiàn)520親口認(rèn)了有小家庭!主持人小心翼翼,女方會(huì)不會(huì)又否認(rèn)?

      俞灝明罕見(jiàn)520親口認(rèn)了有小家庭!主持人小心翼翼,女方會(huì)不會(huì)又否認(rèn)?

      今古深日?qǐng)?bào)
      2026-05-21 09:58:19
      小米汽車(chē)官宣發(fā)布YU7標(biāo)準(zhǔn)版:售價(jià)23.35萬(wàn)元,雷軍:再次挑戰(zhàn)特斯拉Model Y銷(xiāo)量,不是青春版,不是丐版,真的是標(biāo)準(zhǔn)版

      小米汽車(chē)官宣發(fā)布YU7標(biāo)準(zhǔn)版:售價(jià)23.35萬(wàn)元,雷軍:再次挑戰(zhàn)特斯拉Model Y銷(xiāo)量,不是青春版,不是丐版,真的是標(biāo)準(zhǔn)版

      極目新聞
      2026-05-21 20:28:32
      確認(rèn)不打了!男籃第一控衛(wèi)身價(jià)大暴跌,加盟廣東隊(duì)成首選?

      確認(rèn)不打了!男籃第一控衛(wèi)身價(jià)大暴跌,加盟廣東隊(duì)成首選?

      緋雨兒
      2026-05-21 08:30:23
      艾司唑侖立大功!老人吃艾司唑侖,不止助眠,還有5大獲益

      艾司唑侖立大功!老人吃艾司唑侖,不止助眠,還有5大獲益

      健康之光
      2026-05-19 16:58:40
      河北一小學(xué)LED屏火了!網(wǎng)友喊話(huà)全國(guó)推廣,供應(yīng)商:2000多名學(xué)生放學(xué)只需十幾分鐘

      河北一小學(xué)LED屏火了!網(wǎng)友喊話(huà)全國(guó)推廣,供應(yīng)商:2000多名學(xué)生放學(xué)只需十幾分鐘

      封面新聞
      2026-05-21 21:08:10
      全香港欠他一個(gè)影帝,6次提名全輸,觀眾怒批:金像獎(jiǎng)不配

      全香港欠他一個(gè)影帝,6次提名全輸,觀眾怒批:金像獎(jiǎng)不配

      一盅情懷
      2026-05-19 15:10:52
      小學(xué)老師被扎眼球:同事曝更多隱情,眼睛毀了,工作也可能不保

      小學(xué)老師被扎眼球:同事曝更多隱情,眼睛毀了,工作也可能不保

      削桐作琴
      2026-05-21 20:58:08
      尼日爾是真缺錢(qián)了!跟中國(guó)鬧了一年多,如今還是得老實(shí)請(qǐng)回中石油

      尼日爾是真缺錢(qián)了!跟中國(guó)鬧了一年多,如今還是得老實(shí)請(qǐng)回中石油

      青青子衿
      2026-05-21 02:48:35
      科學(xué)院院士方岱寧猝死國(guó)外:事發(fā)80天后官宣,學(xué)生披露內(nèi)幕

      科學(xué)院院士方岱寧猝死國(guó)外:事發(fā)80天后官宣,學(xué)生披露內(nèi)幕

      青梅侃史啊
      2026-05-21 11:39:05
      《鏢人》下映,登頂全球武俠片票房冠軍:江湖再見(jiàn)|創(chuàng)意海報(bào)

      《鏢人》下映,登頂全球武俠片票房冠軍:江湖再見(jiàn)|創(chuàng)意海報(bào)

      新京報(bào)
      2026-05-21 15:15:45
      懷化學(xué)院招收100多名印度留學(xué)生?當(dāng)?shù)乇僦{

      懷化學(xué)院招收100多名印度留學(xué)生?當(dāng)?shù)乇僦{

      新京報(bào)
      2026-05-21 20:35:34
      對(duì)于明天周五A股,我只說(shuō)三句話(huà):第一,4077點(diǎn)或許只是個(gè)半山腰!

      對(duì)于明天周五A股,我只說(shuō)三句話(huà):第一,4077點(diǎn)或許只是個(gè)半山腰!

      趨勢(shì)清風(fēng)俠
      2026-05-21 18:10:07
      私吞獎(jiǎng)金又有猛料!男生發(fā)帖曝光后,樊同學(xué)曾找人洗白,真過(guò)分了

      私吞獎(jiǎng)金又有猛料!男生發(fā)帖曝光后,樊同學(xué)曾找人洗白,真過(guò)分了

      社會(huì)日日鮮
      2026-05-21 07:59:04
      小米YU7 GT正式發(fā)布:38.99萬(wàn)元起售,雷軍稱(chēng)銷(xiāo)量輸給特斯拉不丟人

      小米YU7 GT正式發(fā)布:38.99萬(wàn)元起售,雷軍稱(chēng)銷(xiāo)量輸給特斯拉不丟人

      澎湃新聞
      2026-05-21 21:12:26
      美國(guó)國(guó)防部正式宣布終止與擁有86年歷史的加拿大聯(lián)合防御機(jī)制!

      美國(guó)國(guó)防部正式宣布終止與擁有86年歷史的加拿大聯(lián)合防御機(jī)制!

      AI商業(yè)論
      2026-05-19 08:21:33
      北師大剩飯&北科大插排:都是老師把“重女輕男”的雙標(biāo)日常發(fā)上網(wǎng),然后被輿論上了一課

      北師大剩飯&北科大插排:都是老師把“重女輕男”的雙標(biāo)日常發(fā)上網(wǎng),然后被輿論上了一課

      少爺寫(xiě)春秋
      2026-05-20 18:40:28
      38歲希拉里·達(dá)芙登泳裝封面,拒穿比基尼原因曝光

      38歲希拉里·達(dá)芙登泳裝封面,拒穿比基尼原因曝光

      追星雷達(dá)站
      2026-05-21 00:31:33
      A股:今天沖到4198后突然跳水,種種跡象表明,A股反彈浪已接近尾聲?

      A股:今天沖到4198后突然跳水,種種跡象表明,A股反彈浪已接近尾聲?

      趨勢(shì)清風(fēng)俠
      2026-05-21 11:13:14
      上海啟動(dòng)"進(jìn)場(chǎng)必查"!5天銷(xiāo)毀不合格楊梅1641公斤

      上海啟動(dòng)"進(jìn)場(chǎng)必查"!5天銷(xiāo)毀不合格楊梅1641公斤

      看看新聞Knews
      2026-05-21 23:03:04
      全球股市集體跳水,原油跳漲!伊朗最高領(lǐng)袖下令:嚴(yán)禁高濃縮鈾外運(yùn)

      全球股市集體跳水,原油跳漲!伊朗最高領(lǐng)袖下令:嚴(yán)禁高濃縮鈾外運(yùn)

      中國(guó)基金報(bào)
      2026-05-21 21:41:49
      2026-05-22 01:15:00
      ScienceAI incentive-icons
      ScienceAI
      關(guān)注人工智能與其他前沿技術(shù)
      1307文章數(shù) 227關(guān)注度
      往期回顧 全部

      科技要聞

      小米YU7 GT正式發(fā)布:售價(jià)38.99萬(wàn)元

      頭條要聞

      叔侄倆將溺亡男子送回家離開(kāi) 3天后男子被發(fā)現(xiàn)已腐爛

      頭條要聞

      叔侄倆將溺亡男子送回家離開(kāi) 3天后男子被發(fā)現(xiàn)已腐爛

      體育要聞

      常住人口7000的小鎮(zhèn),擁有了一支德甲球隊(duì)

      娛樂(lè)要聞

      反轉(zhuǎn)!金秀賢與金賽綸未成年時(shí)交往不實(shí)

      財(cái)經(jīng)要聞

      潮水退去,裸泳的一定不止五糧液

      汽車(chē)要聞

      專(zhuān)訪(fǎng)雷軍:YU7標(biāo)準(zhǔn)版回歸對(duì)特斯拉更有競(jìng)爭(zhēng)力

      態(tài)度原創(chuàng)

      時(shí)尚
      健康
      旅游
      家居
      軍事航空

      今年夏天最流行的4組搭配,誰(shuí)穿誰(shuí)好看!

      外泌體與干細(xì)胞竟是“快遞”與“工廠(chǎng)”的關(guān)系?

      旅游要聞

      入彌第一站!彌勒市全域旅游服務(wù)中心點(diǎn)亮旅居新名片

      家居要聞

      風(fēng)格碰撞 個(gè)性與藝術(shù)

      軍事要聞

      伊朗警告:任何新襲擊將促使戰(zhàn)場(chǎng)擴(kuò)大到中東以外

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产免费av片在线观看麻豆 | 成人精品视频在线观看播放| 亚洲欧洲日韩久久狠狠爱| 国产美女自慰在线观看| 免费超爽大片黄| 2021国产在线观看| 亚洲精品高清av在线播放| 亚洲人成色77777在线观看| 免费无码av片在线观看| 国产精品视频资源| 成人免费ā片在线观看| 韩国人妻中文字幕一区二区| 一区二区韩国福利网站| 中文字幕有码高清日韩| 国产精品乱码一区二区三区| 国产免费一级在线观看| 国产 日韩 另类 视频一区 | 久久99精品一区二区三区| 国产麻豆精品sm调教视频网站| 国产aⅴ激情无码久久久无码 | 中文字幕av国产精品| 中文字幕日韩精品亚洲一区| 午夜射精日本三级| 狠狠综合久久久久尤物| 国产精品综合| 在线看国产精品三级在线| 日本一区二区在线免费观看| 精品无码国产自产拍在线观看| 经典国产乱子伦精品视频| 亚洲熟妇一区二区三个区| 啊啊国产高清| 孕妇怀孕高潮潮喷视频孕妇| 在线 国产 欧美 专区| 欧美日本精品一本二本三区| 亚洲愉拍自拍欧美精品| 狠狠躁夜夜躁人人爽天天天天| av国产在线被下药迷网站| 91视频污| 中文字幕天无码久久精品视频免费| 日韩少妇内射免费播放| 亚洲欧美国产国产一区二区|