<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      不卷參數卷架構,這個開源模型把圖像理解和生成統一了

      0
      分享至

      henry 發自 凹非寺
      量子位 | 公眾號 QbitAI

      這兩天打開朋友圈,10條里有7條都是GPT-Image-2生的圖。

      中文海報、復古雜志封面、直播畫面、社交截圖、連高考試卷都能照著出一張幾乎以假亂真的。

      對此,大家伙的反應也都出奇的一致——

      專業設計師們完了,我又能行了!

      但實際上上手你就會有同感:免費用戶一天幾張,抽卡次數有限,遇到稍微嚴肅點的活,額度馬上到頂,常常是活沒干完,次數沒了。

      針對這一空檔,商湯剛剛開源了一個全新架構的理解生成統一模型SenseNova-U1,雖然小尺寸版本只有8B,卻能復刻不少GPT-Image-2的拿手絕活。

      比如,我們拿它做一張量子位的招聘海報:文字、版式、配色,挑不出毛病。



      太陽系圖解,八大行星各自的軌道、屬性、圖文介紹一應俱全,看著挺像那么回事。



      畫個鋼鐵俠,模型也能自動從輪廓、鋪色、細節、質感、氛圍等多個階段拆解完整的繪畫流程。



      來個馬斯克太空集群的信息圖也審美在線。



      可以說,信息圖(InfoGraph)、文字密集排版、圖文交錯——

      這幾個曾經被公認是AI生圖最難啃的硬骨頭,U1能跟GPT-Image-2擠進一桌。

      在具體的圖像理解與生成的多項指標上,SenseNova-U1也是登頂開源模型的榜首。



      在推理響應速度上也具備相當的優勢,逼近主流商用閉源模型。





      這是怎么做到的,咱往下看。

      連續性圖文創作,這次是原生的

      先說U1這次最有意思的能力,連續性圖文創作

      所謂連續性圖文創作,就是文字和圖片在一段輸出里自然交疊,而不是文字歸文字、圖片歸圖片。

      這聽起來很簡單,但實際上很難。因為文字保留語義、圖片保留像素細節,這兩件事在傳統架構里幾乎是天敵——

      保了語義就丟了像素,保了像素就稀釋了語義。

      U1的做法是讓兩者在同一個表征空間里共享上下文,語義豐富性和像素級視覺保真度第一次同時拿住。

      簡單講,就是模型能像人一樣,邊思考邊畫草圖,文字和圖片在一段輸出里自然交疊。

      比如,我讓它生成一個“煎牛排的操作教學”。它能從食材準備,瀝干水分、調味、煎制和翻面……講到最后裝盤。

      每一步的關鍵操作都有圖,牛排的形象從生肉到五分熟一路保持高度一致,不會畫著畫著變成另一塊肉。



      再比如,我想學一點漫畫分鏡技巧。

      它能直接給我吐出圖文并茂的教材式段落,從準備階段、鏡頭建立、再到引入道具、次要角色一應俱全,比純文字解釋直觀得多。



      這種“始終是同一個主體”的連貫性看起來樸素,但對生成模型卻很難。

      傳統范式得在多個模型之間來回調用,各畫各的,角色形象很容易在第三步就走樣。U1是單次單模型調用直接出全套。

      對一個新模型來說,還有一個值得關注的考驗就是——

      高密度信息圖

      在模型界面中,你可以直接輸入“自己的簡歷信息”,它就能返回你一張手繪風格的海報,信息分布、配色、字體層級都安排得明明白白。



      讓它講“三只小豬蓋房子”,我輸入只有這么“7個字”,輸出就能直接給你一整組連環畫——

      三只小豬、三種材料、三棟房子、最后那只大灰狼,一格一格排好,順序對得上故事。



      炒紅燒肉這類做菜教程圖,也可以一次直出,圖文對應。



      給一句“做杯咖啡的英文流程圖”,圖也直接出來了。



      在講究排版、涉及多種元素的插畫場景中,U1也能實現比較精細的效果,比如這張劃船樂的教學總覽圖。



      最有意思的是這個,扔給它一張路邊常見的“電梯安全”警示牌,讓它換個排版做成一張信息圖。

      它還能直接把這個實現完美遷移,把版式從警示牌切成了科普卡片。





      前段時間火爆的產品爆炸圖,在U1這里也可以做到。一臺相機,被它拆得整整齊齊:

      鏡頭組、反光鏡、快門、傳感器、芯片,電池什么的,統統被它拆得整整齊齊懸浮在空中,標注線一根不少。



      這種程度的玩法,以前是超大參數模型的專屬。更有意思的一點是,SenseNova U1 Lite還在行業首創了圖文交錯的思維鏈。

      這種會推理的能力放到圖像編輯上會更有趣。

      我扔給它一張剛泡好的玻璃杯熱茶,讓它“畫出一小時后的樣子”。它沒有簡單地直接出圖,而是先做了一段推理:

      一是給自己定約束,同一只玻璃杯、同一張原木桌面、同一種側逆光,這樣兩張圖放一起才看得出“是同一杯茶過了一小時”。

      二是推導物理:剛泡時,葉片高速舒展、氣泡從葉脈逸出、蒸汽在杯壁上留下弧形折射;

      一小時后,多酚類擴散均勻,茶湯變深紅褐,葉子完全沉降呈半透明,杯底跟桌面交界處出冷凝痕跡。光影也跟著從“清晨的清冷”過到“午后的慵懶”。



      類似的還有幾個測試。

      給它一個綠色的香蕉,模型會先推理“葉綠素分解+糖化”,從而保證輸出的是一根帶著斑點的成熟香蕉。



      可以說,這款新模型不只是在改圖,還具備了一定的物理常識。

      NEO-unify,一個網絡實現“看”和“畫”

      看到這,你可能想問,這是怎么做到的?

      U1的底層是一套叫NEO-unify的架構。一個模型同時會看、會畫,理解和生成在同一個網絡里完成,中間沒有任何拼接。



      在過去,多模態模型的標配經常是這樣的,視覺編碼器(VE)負責看,變分自編碼器(VAE)負責畫,理解歸理解,生成歸生成,中間靠適配器拼起來。

      NEO-unify把這兩個東西都拿掉了,不需要VE,不需要VAE,模型直接吃像素,直接吐像素。

      具體來說,這一過程分為三步:

      第一步,引入近似無損的視覺接口,把圖像的輸入和輸出統一成同一種表示。

      第二步,用Mixture-of-Transformer做主干,理解和生成共享同一套底層。

      第三步,文本走自回歸,視覺走像素流匹配,兩套目標函數在同一個學習框架里跑完。

      △圖片由SenseNova U1生成

      這套技術架構給了NEO-unify獨門絕活,連續性圖文創作。

      傳統模型要做這件事,得外掛工具或者后處理拼接。U1底層就是統一的,原生支持圖片和文字的交叉排版,所有視覺內容都來自模型自身,不調用外部工具。

      模型在思考一個問題的時候,可以一邊推理一邊生成中間示意圖,把復雜邏輯可視化。

      生成一段教程,可以在恰當的位置自然地插入說明圖。

      落地到模型,兩個規格。SenseNova-U1-8B-MoT,8B參數,端側能跑。SenseNova-U1-3AB-MoT,總參數38B的MoE架構,提供更強的能力,底層都是同一套NEO-unify。

      此外,商湯還給U1配了一套自研推理棧,LightLLM跑理解、LightX2V跑生成,兩條路解耦各管各的。以H100/H200單節點為例,生成一張2048×2048的圖,端到端大概9秒。

      全網開源,即刻可用

      值得一提的是,商湯這次在README里把模型的局限也直接寫了出來:

      上下文最長32K、人物在復雜場景里的細節有時不夠穩、長文字渲染偶爾會出現拼寫或排版錯誤、連續性圖文創作目前還是beta。

      不過這些短板都標了“持續改進中”。換句話說,U1這次開的不是終點,是個起點。

      為了方便大家使用,商湯這次順手開源了一套SenseNova-Skills技能包,把U1做成了Agent里能直接調的工具。

      sn-infographic自帶87種版式、66種風格,自己評分自己挑;掛進OpenClaw,一句 /skill sn-infographic “提示詞”,圖就出來了。

      Skills不只是infographic一個,整套覆蓋圖像生成、PPT制作、Excel數據分析、深度研究、跨平臺搜索。

      目前,SenseNova-U1兩個模型已經全網開源。Hugging Face和GitHub都能下,倉庫地址在https://github.com/OpenSenseNova/SenseNova-U1。

      想直接體驗不動手部署的,現在可以直接進入SenseNova U1 Lite Skill,https://github.com/OpenSenseNova/SenseNova-Skills。

      另外,辦公小浣熊也即將上線U1。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      杜鋒變陣雙大外!胡明軒殺紅眼造21分大勝!廣東一夜蛻變1-1廣州

      杜鋒變陣雙大外!胡明軒殺紅眼造21分大勝!廣東一夜蛻變1-1廣州

      后仰大風車
      2026-05-01 21:37:31
      表妹和表哥偷情大瓜:8年感情歸零,表妹不滿表哥分手曝兩人奸情

      表妹和表哥偷情大瓜:8年感情歸零,表妹不滿表哥分手曝兩人奸情

      江山揮筆
      2026-04-18 20:54:36
      50歲陳坤董潔牽手三月,現狀曝光,兒子生母真相

      50歲陳坤董潔牽手三月,現狀曝光,兒子生母真相

      時光流轉追夢人
      2026-05-01 14:23:48
      34歲男子娶“少女感”新娘,女方懷孕5月,網友:老牛吃嫩草

      34歲男子娶“少女感”新娘,女方懷孕5月,網友:老牛吃嫩草

      辣媒專欄記錄
      2026-04-29 08:34:28
      約翰-阿洛伊西:成都特色就是戰斗到最后;現在談冠軍還太早

      約翰-阿洛伊西:成都特色就是戰斗到最后;現在談冠軍還太早

      懂球帝
      2026-05-02 00:10:14
      中國和美國談妥了

      中國和美國談妥了

      阿振觀點
      2026-05-01 00:26:28
      河南一驢友野線徒步不慎從200米高懸崖墜落,掉落六七米后被樹杈卡住,在附近演練的8支救援隊輪番上陣,4小時成功救下

      河南一驢友野線徒步不慎從200米高懸崖墜落,掉落六七米后被樹杈卡住,在附近演練的8支救援隊輪番上陣,4小時成功救下

      揚子晚報
      2026-05-01 20:50:35
      “我女兒敢這樣,腿給砸斷”,寶媽曬2個女兒出門,裝束讓人怒了

      “我女兒敢這樣,腿給砸斷”,寶媽曬2個女兒出門,裝束讓人怒了

      蝴蝶花雨話教育
      2026-04-10 13:01:09
      馬德里半決賽菲斯惹了最不該惹的人,外媒稱辛納或退羅馬賽

      馬德里半決賽菲斯惹了最不該惹的人,外媒稱辛納或退羅馬賽

      網球之家
      2026-05-01 22:39:21
      明天起廣東暴雨+大暴雨在路上,濕氣加重了!先健脾再祛濕,試試經典“四神”湯

      明天起廣東暴雨+大暴雨在路上,濕氣加重了!先健脾再祛濕,試試經典“四神”湯

      城事特搜
      2026-05-01 19:33:49
      深夜一通電話,美國終于低頭了!中美關系迎來重大轉折

      深夜一通電話,美國終于低頭了!中美關系迎來重大轉折

      小陸搞笑日常
      2026-05-01 21:03:14
      78歲侏羅紀男星宣布抗癌成功:化療失效后,一種新療法救了他

      78歲侏羅紀男星宣布抗癌成功:化療失效后,一種新療法救了他

      娛圈觀察員
      2026-04-29 06:02:11
      無數身價過億的大佬,都在想方設法把國內的錢偷偷轉移到海外

      無數身價過億的大佬,都在想方設法把國內的錢偷偷轉移到海外

      流蘇晚晴
      2026-04-14 19:58:25
      蘇提達王后細節絕了!主動牽手泰王反被緊握,詩妮娜貴妃遺憾出局

      蘇提達王后細節絕了!主動牽手泰王反被緊握,詩妮娜貴妃遺憾出局

      原夢叁生
      2026-04-30 23:58:07
      美國一城市花1.8萬美元拆掉600塊“鄰里守望”牌:理由是帶有種族偏見,不夠包容

      美國一城市花1.8萬美元拆掉600塊“鄰里守望”牌:理由是帶有種族偏見,不夠包容

      華人生活網
      2026-05-01 04:34:17
      女子網購99元化妝品卻收到密碼箱,“掃碼添加顧問”才能獲取密碼,開箱后,1萬多瞬間沒了……

      女子網購99元化妝品卻收到密碼箱,“掃碼添加顧問”才能獲取密碼,開箱后,1萬多瞬間沒了……

      深圳晚報
      2026-04-30 14:10:38
      私人賬戶收款要小心,2026監管新規,普通人必看

      私人賬戶收款要小心,2026監管新規,普通人必看

      芳姐侃社會
      2026-04-24 22:40:35
      兩難啊!兒子月薪6000,兒媳無業,竟要父母拿30多萬養老錢還房貸

      兩難啊!兒子月薪6000,兒媳無業,竟要父母拿30多萬養老錢還房貸

      火山詩話
      2026-04-30 15:03:29
      失眠原因找到了!北京大學研究:睡不好的人,身體缺這種營養物質

      失眠原因找到了!北京大學研究:睡不好的人,身體缺這種營養物質

      路醫生健康科普
      2026-04-30 13:05:07
      兩次遭撤職的開國上將,被譽為“鐵屁股”,毛主席用4個字評價他

      兩次遭撤職的開國上將,被譽為“鐵屁股”,毛主席用4個字評價他

      揚平說史
      2026-05-01 23:01:09
      2026-05-02 02:12:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12567文章數 176459關注度
      往期回顧 全部

      科技要聞

      DeepSeek發布多模態論文又連夜刪除

      頭條要聞

      美軍對伊朗最新打擊方案披露 包含出動地面部隊

      頭條要聞

      美軍對伊朗最新打擊方案披露 包含出動地面部隊

      體育要聞

      無奈!約基奇:這要在塞爾維亞 全隊早被炒了

      娛樂要聞

      馬筱梅產后身材恢復超好 現身戶外直播

      財經要聞

      GPU神話松動,AI真正的戰場變了

      汽車要聞

      限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

      態度原創

      數碼
      教育
      藝術
      房產
      時尚

      數碼要聞

      原相光學鼠標傳感器新品PAW3955將至,VGN、阿斯盾官宣采用

      教育要聞

      高考作文遇見反躺平:提倡奮斗,反對躺平

      藝術要聞

      畫畫的你絕不能錯過!色塊與筆觸的激情之旅!

      房產要聞

      所有戶型全賣爆!海口TOP級豪宅,景觀樣板間五一全線開放!

      這個夏天,彩色褲子又火了!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 免费精品国偷自产在线在线| 99视频在线| 精品亚洲一区二区三区在线观看 | 欧美老人巨大xxxx做受| 日本中文字幕有码在线视频| 亚洲乱码国产乱码精品| 欧洲精品色在线观看| 蜜桃成熟时快播| 国产精品无码专区综合网| 尤物亚洲国产亚综合在线区| 人妻丰满AV无码中文字幕| wwwww黄| 人妻丰满熟妇av无码区不卡| 国产亚洲精品久久久久久大师| 国产精品三级黄色小视频| 人妻精品久久久久中文字幕69| 亚洲欧洲精品中文字幕在线| 尤物视频网站在线观看| 亚洲天堂在线观看完整版| 影音先锋成人网站| 丝袜高潮流白浆潮喷在线播放| wwww在线观看| 欧美视频在线观看第一页| 欧美乱码伦视频免费| 成人做爰视频www网站小优视频| 国产精品资源在线观看网站| 墨竹工卡县| 九九久久人妻精品一区色| 天天做天天爱夜夜爽毛片毛片| 久久久久国产综合av天堂| 亚洲高清最新AV网站| 动漫无遮挡羞视频在线观看| 黄网十三区| chinese性内射高清国产| 无码国产精品一区二区免费97| 久久99热全是成人精品| 丰满的少妇一区二区三区| 女生洗鸡鸡喷尿的视频无马赛克?舒坦直叫的骚货视频?亚洲着九九九视频影院 | 国产精品被熟女| 亚洲VA欧美VA国产VA综合| 四虎最新地址|