<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      智源多模態大模型登Nature,生成式人工智能路線統一到自回歸

      0
      分享至



      編輯丨&

      在 AI 開發領域,多模態學習——讓模型同時理解圖像、視頻和文本——已經是當代研究的核心方向之一。長期以來,該領域的主要技術路線還是較為依賴擴散模型或者組合架構。雖然這些方法在特定任務上表現卓越,但它們也帶來結構復雜、推理成本高、跨模態統一性不足的深層次問題。

      關于這個問題,2026 年 1 月 28 日,由智源帶來的多模態大模型成果以「Multimodal learning with next-token prediction for large multimodal models」為題刊登于《Nature》。

      智源這項成果表明,只采用自回歸路線,就可以統一多模態學習,訓練出優秀的原生多模態大模型,對于確立自回歸成為生成式人工智能統一路線具有重大意義。



      論文鏈接:https://www.nature.com/articles/s41586-025-10041-x

      Emu3 模型

      Emu3 模型是在該研究中,研究團隊所提出的一套全新的多模態模型,為解答「單一的預測下一個詞元框架是否能夠作為通用的多模態學習范式」而誕生。Emu3 的核心邏輯并不追求「更復雜的架構」,而是回歸到最基本的序列建模目標:預測序列中的下一個標記,而不是分別設計不同模態的子系統



      圖 1:Emu3 框架。

      不同于傳統的自回歸建模方法,Emu3 認為:如果僅憑下一個詞元預測就能在所有模態上完成生成與理解任務,那就無需這些繁雜的模塊設計。它將圖像、文本和視頻統一離散化到同一個表示空間中,并從零開始,在多模態序列混合數據上聯合訓練一個單一的 Transformer

      這樣的設計將本來需要多個子網絡甚至多個訓練目標的問題,整合成一個極簡而統一的下一個詞元的預測任務。換言之,Emu3 并沒有為每種模態設計獨立的損失或生成機制,而是把所有模態看成一個整體序列,并讓模型以統一的概率分布來進行預測。



      圖 2:以 token為中心的多模態基礎設施及與擴散模型和編碼器+LLM 組合范式的架構比較。

      團隊還進一步提出了以 token 為中心的多模態基礎設施愿景。在該框架下,數據 token 化直接在邊緣設備上進行,只有所得的離散 token ID 會傳輸到大規模服務器,進行統一的多模態訓練和推斷。

      評估與啟示

      據各項實現的結果數據顯示,Emu3 在生成與感知任務上的整體表現可與多種成熟的任務專用模型相媲美。一方面,在圖像生成任務中,與依賴擴散機制的模型相比,Emu3 能夠生成高質量圖像,且樣式和語義一致性接近那些專用視覺生成架構。

      另一方面,在視覺理解與視覺問答等任務上,它也能與組合模型(例如視覺編碼 + LLM 的設計)達到相當的表現水平。這說明這種預測模式不僅能統一不同模態的生成任務,還能在理解側保持強泛化能力。

      表 1:多模態任務的評估。



      區別于 Sora 的擴散式視頻生成,Emu3采用純自回歸方式逐詞元生成視頻,能夠在給定上下文下進行視頻延展與未來預測,并在文本引導下生成高保真視頻。此外,Emu3 還可拓展至視覺語言交錯生成,例如圖文并茂的菜譜生成;也可拓展至視覺語言動作建模,如機器人操作VLA等,進一步體現了「預測下一個詞元」的通用性。

      該框架的成功核心在于,Transformer 解碼器具備極強的序列模式捕獲能力,與統一 token 表示、下一個詞元目標讓模型在跨模態訓練中共享底層表征,增強不同模態之間的協同效應。

      持續引領大模型技術演進

      Emu3 證明了其實僅靠下一個詞元預測就能大規模統一多模態學習,其在感知與生成方面均達到了成熟的任務特定模型的性能,匹配旗艦系統,同時消除了擴散或合成架構的需求。

      Emu 系列模型自 2022 年啟動研發以來,圍繞「原生多模態」這一核心技術主線持續迭代。盡管如論文中所言,當下模型還存在著譯碼策略效率不足、壓縮比與重建保真度權重平衡等問題,但其表現出的統合能力與發展潛質,無疑可以認為它在可擴展和統一多模態智能中邁出了關鍵一步。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      富時中國A50指數期貨漲幅擴大至1%

      富時中國A50指數期貨漲幅擴大至1%

      界面新聞
      2026-05-21 09:50:05
      振奮人心!歐盟聯合起來打中國,想制裁中國卻被反將一手,真解氣

      振奮人心!歐盟聯合起來打中國,想制裁中國卻被反將一手,真解氣

      地球記
      2026-05-21 23:48:25
      U17晉級決賽紀錄片:球隊在肇慶就進行過專項耐熱適應訓練

      U17晉級決賽紀錄片:球隊在肇慶就進行過專項耐熱適應訓練

      懂球帝
      2026-05-21 17:25:56
      寧德時代:25萬以上用磷酸鐵鋰是減配!比亞迪:你沒資格定義高端

      寧德時代:25萬以上用磷酸鐵鋰是減配!比亞迪:你沒資格定義高端

      混沌錄
      2026-05-20 18:16:09
      3年8700萬美金!聯盟第1!NBA新惡人把話挑明,文班亞馬沒有退路

      3年8700萬美金!聯盟第1!NBA新惡人把話挑明,文班亞馬沒有退路

      世界體育圈
      2026-05-21 21:58:43
      樊同學的“超能力”!

      樊同學的“超能力”!

      梳子姐
      2026-05-21 11:18:38
      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      健康科普365
      2026-05-09 21:05:04
      公開亮相,亞馬爾攜新女友參加巴薩賽季慶功宴

      公開亮相,亞馬爾攜新女友參加巴薩賽季慶功宴

      懂球帝
      2026-05-21 03:17:06
      巨嬰!孫楊采訪中途突然打斷主持人說到飯點了,直接拿手機點起外賣

      巨嬰!孫楊采訪中途突然打斷主持人說到飯點了,直接拿手機點起外賣

      818體育
      2026-05-19 17:52:24
      電車會不會替代油車還不知道,但不得不承認,油混車“快完蛋了”

      電車會不會替代油車還不知道,但不得不承認,油混車“快完蛋了”

      原來仙女不講理
      2026-05-20 22:10:29
      3批禁足名單匯總:201人被罰!133人遭終身禁足 13隊扣分+梅州2次

      3批禁足名單匯總:201人被罰!133人遭終身禁足 13隊扣分+梅州2次

      我愛英超
      2026-05-21 16:00:37
      上海高校男生發飆喊殺后續:室友連夜發帖,知情人爆料,透露隱情

      上海高校男生發飆喊殺后續:室友連夜發帖,知情人爆料,透露隱情

      李晚書
      2026-05-20 16:23:46
      于娜節目公開胖到230斤的原因,和媽媽同住,不吃主食一頓吃5個菜

      于娜節目公開胖到230斤的原因,和媽媽同住,不吃主食一頓吃5個菜

      大魚簡科
      2026-05-21 19:33:49
      看了許利民抽象的賽后采訪,才知道,北京慘敗趙睿為啥敢笑得出來

      看了許利民抽象的賽后采訪,才知道,北京慘敗趙睿為啥敢笑得出來

      后仰大風車
      2026-05-21 08:15:09
      穆里尼奧還沒上任就炸鍋!皇馬更衣室徹底分裂!姆巴佩被無視

      穆里尼奧還沒上任就炸鍋!皇馬更衣室徹底分裂!姆巴佩被無視

      奶蓋熊本熊
      2026-05-21 04:41:15
      神舟二十三號女航天員曝光,香港女警司首飛,要太空住一年

      神舟二十三號女航天員曝光,香港女警司首飛,要太空住一年

      至死不渝的愛情
      2026-05-20 11:09:56
      二十多年來首次!普京訪華打破慣例,德媒:中國正在成為世界中心

      二十多年來首次!普京訪華打破慣例,德媒:中國正在成為世界中心

      今墨緣
      2026-05-20 19:47:11
      最兇小三,把原配制作成燒肉出售,當時辦案人員至今不敢吃肉

      最兇小三,把原配制作成燒肉出售,當時辦案人員至今不敢吃肉

      莫地方
      2026-05-21 02:00:03
      今年榴蓮為啥這么便宜?不是商超良心發現,而是東南亞供應鏈崩了

      今年榴蓮為啥這么便宜?不是商超良心發現,而是東南亞供應鏈崩了

      嘴角上翹的弧度
      2026-05-19 03:18:52
      海南發現一山頭長得像毛主席,孔令華跪地流淚,李訥也都感嘆很像

      海南發現一山頭長得像毛主席,孔令華跪地流淚,李訥也都感嘆很像

      青史煙雨
      2026-05-21 00:26:06
      2026-05-22 00:39:00
      ScienceAI incentive-icons
      ScienceAI
      關注人工智能與其他前沿技術
      1307文章數 227關注度
      往期回顧 全部

      科技要聞

      小米YU7 GT正式發布:售價38.99萬元

      頭條要聞

      叔侄倆將溺亡男子送回家離開 3天后男子被發現已腐爛

      頭條要聞

      叔侄倆將溺亡男子送回家離開 3天后男子被發現已腐爛

      體育要聞

      常住人口7000的小鎮,擁有了一支德甲球隊

      娛樂要聞

      反轉!金秀賢與金賽綸未成年時交往不實

      財經要聞

      潮水退去,裸泳的一定不止五糧液

      汽車要聞

      專訪雷軍:YU7標準版回歸對特斯拉更有競爭力

      態度原創

      家居
      旅游
      時尚
      手機
      教育

      家居要聞

      風格碰撞 個性與藝術

      旅游要聞

      入彌第一站!彌勒市全域旅游服務中心點亮旅居新名片

      今年夏天最流行的4組搭配,誰穿誰好看!

      手機要聞

      AYANEO Pocket AIR Mini安卓掌機Arcade Home聯名款發布,739元起

      教育要聞

      高考地理核心題型及“解題密碼”

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲 欧美 影音先锋| 人妻系列av无码专区| 中文字幕第4页| 亚洲激情偷拍| 中文字幕人妻少妇久久| 2021久久超碰国产精品最新| 78竖立的100张照片| 成人亚洲精品一区二区三区| 中文字幕亚洲有码| 国产一级av在线播放| 亚洲国产成人久久综合区| 国产偷国产偷亚洲清高网站| av中文字幕潮喷人妻系列| 日韩网站在线| 亚洲一区自拍| 999久久66久6只有精品| aaa少妇高潮大片免费看| 国产精品无码久久AV不卡| 亚洲精品中文字幕二区| 国产精品中文字幕免费| 国产精品一区在线蜜臀| 少妇高潮无套内谢麻豆传| 精品亚洲欧美中文字幕在线看| 亚洲AV日韩精品久久久久| 高清无码免费不卡视频| 日韩在线1| 少妇尿尿一区二区在线免费| jjzzxxxx| 亚洲精品少妇30p| 操国产美女| 国产精品日韩精品日韩| 狠狠狠色丁香综合婷婷久久| 欧美饥渴熟妇高潮喷水水| 男人添女人囗交做爰视频| 久久综合亚洲色一区二区三区| 伊人久热这里只有精品视频99| 无码AⅤ一区二区三区| 精品视频九九| 边坝县| 久久99精品国产99久久6尤物| 日本高清一区二区在线观看|