<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>

<p id="tp1vn"></p>

<sub id="tp1vn"><p id="tp1vn"></p></sub>

<u id="tp1vn"><rp id="tp1vn"></rp></u>

<meter id="tp1vn"></meter>

<wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>

日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao

^{<sub id="gokmt"></sub>}

<legend id="gokmt"></legend>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

不卷參數卷架構，這個開源模型把圖像理解和生成統一了

2026-04-29 12:24:59　來源: 量子位

北京舉報

0

分享至

henry 發自凹非寺
量子位 | 公眾號 QbitAI

這兩天打開朋友圈，10條里有7條都是GPT-Image-2生的圖。

中文海報、復古雜志封面、直播畫面、社交截圖、連高考試卷都能照著出一張幾乎以假亂真的。

對此，大家伙的反應也都出奇的一致——

專業設計師們完了，我又能行了！

但實際上上手你就會有同感：免費用戶一天幾張，抽卡次數有限，遇到稍微嚴肅點的活，額度馬上到頂，常常是活沒干完，次數沒了。

針對這一空檔，商湯剛剛開源了一個全新架構的理解生成統一模型SenseNova-U1，雖然小尺寸版本只有8B，卻能復刻不少GPT-Image-2的拿手絕活。

比如，我們拿它做一張量子位的招聘海報：文字、版式、配色，挑不出毛病。

太陽系圖解，八大行星各自的軌道、屬性、圖文介紹一應俱全，看著挺像那么回事。

畫個鋼鐵俠，模型也能自動從輪廓、鋪色、細節、質感、氛圍等多個階段拆解完整的繪畫流程。

來個馬斯克太空集群的信息圖也審美在線。

可以說，信息圖（InfoGraph）、文字密集排版、圖文交錯——

這幾個曾經被公認是AI生圖最難啃的硬骨頭，U1能跟GPT-Image-2擠進一桌。

在具體的圖像理解與生成的多項指標上，SenseNova-U1也是登頂開源模型的榜首。

在推理響應速度上也具備相當的優勢，逼近主流商用閉源模型。

這是怎么做到的，咱往下看。

連續性圖文創作，這次是原生的

先說U1這次最有意思的能力，連續性圖文創作

所謂連續性圖文創作，就是文字和圖片在一段輸出里自然交疊，而不是文字歸文字、圖片歸圖片。

這聽起來很簡單，但實際上很難。因為文字保留語義、圖片保留像素細節，這兩件事在傳統架構里幾乎是天敵——

保了語義就丟了像素，保了像素就稀釋了語義。

U1的做法是讓兩者在同一個表征空間里共享上下文，語義豐富性和像素級視覺保真度第一次同時拿住。

簡單講，就是模型能像人一樣，邊思考邊畫草圖，文字和圖片在一段輸出里自然交疊。

比如，我讓它生成一個“煎牛排的操作教學”。它能從食材準備，瀝干水分、調味、煎制和翻面……講到最后裝盤。

每一步的關鍵操作都有圖，牛排的形象從生肉到五分熟一路保持高度一致，不會畫著畫著變成另一塊肉。

再比如，我想學一點漫畫分鏡技巧。

它能直接給我吐出圖文并茂的教材式段落，從準備階段、鏡頭建立、再到引入道具、次要角色一應俱全，比純文字解釋直觀得多。

這種“始終是同一個主體”的連貫性看起來樸素，但對生成模型卻很難。

傳統范式得在多個模型之間來回調用，各畫各的，角色形象很容易在第三步就走樣。U1是單次單模型調用直接出全套。

對一個新模型來說，還有一個值得關注的考驗就是——

高密度信息圖

在模型界面中，你可以直接輸入“自己的簡歷信息”，它就能返回你一張手繪風格的海報，信息分布、配色、字體層級都安排得明明白白。

讓它講“三只小豬蓋房子”，我輸入只有這么“7個字”，輸出就能直接給你一整組連環畫——

三只小豬、三種材料、三棟房子、最后那只大灰狼，一格一格排好，順序對得上故事。

炒紅燒肉這類做菜教程圖，也可以一次直出，圖文對應。

給一句“做杯咖啡的英文流程圖”，圖也直接出來了。

在講究排版、涉及多種元素的插畫場景中，U1也能實現比較精細的效果，比如這張劃船樂的教學總覽圖。

最有意思的是這個，扔給它一張路邊常見的“電梯安全”警示牌，讓它換個排版做成一張信息圖。

它還能直接把這個實現完美遷移，把版式從警示牌切成了科普卡片。

前段時間火爆的產品爆炸圖，在U1這里也可以做到。一臺相機，被它拆得整整齊齊：

鏡頭組、反光鏡、快門、傳感器、芯片，電池什么的，統統被它拆得整整齊齊懸浮在空中，標注線一根不少。

這種程度的玩法，以前是超大參數模型的專屬。更有意思的一點是，SenseNova U1 Lite還在行業首創了圖文交錯的思維鏈。

這種會推理的能力放到圖像編輯上會更有趣。

我扔給它一張剛泡好的玻璃杯熱茶，讓它“畫出一小時后的樣子”。它沒有簡單地直接出圖，而是先做了一段推理：

一是給自己定約束，同一只玻璃杯、同一張原木桌面、同一種側逆光，這樣兩張圖放一起才看得出“是同一杯茶過了一小時”。

二是推導物理：剛泡時，葉片高速舒展、氣泡從葉脈逸出、蒸汽在杯壁上留下弧形折射；

一小時后，多酚類擴散均勻，茶湯變深紅褐，葉子完全沉降呈半透明，杯底跟桌面交界處出冷凝痕跡。光影也跟著從“清晨的清冷”過到“午后的慵懶”。

類似的還有幾個測試。

給它一個綠色的香蕉，模型會先推理“葉綠素分解+糖化”，從而保證輸出的是一根帶著斑點的成熟香蕉。

可以說，這款新模型不只是在改圖，還具備了一定的物理常識。

NEO-unify，一個網絡實現“看”和“畫”

看到這，你可能想問，這是怎么做到的？

U1的底層是一套叫NEO-unify的架構。一個模型同時會看、會畫，理解和生成在同一個網絡里完成，中間沒有任何拼接。

在過去，多模態模型的標配經常是這樣的，視覺編碼器（VE）負責看，變分自編碼器（VAE）負責畫，理解歸理解，生成歸生成，中間靠適配器拼起來。

NEO-unify把這兩個東西都拿掉了，不需要VE，不需要VAE，模型直接吃像素，直接吐像素。

具體來說，這一過程分為三步：

第一步，引入近似無損的視覺接口，把圖像的輸入和輸出統一成同一種表示。

第二步，用Mixture-of-Transformer做主干，理解和生成共享同一套底層。

第三步，文本走自回歸，視覺走像素流匹配，兩套目標函數在同一個學習框架里跑完。

△圖片由SenseNova U1生成

這套技術架構給了NEO-unify獨門絕活，連續性圖文創作。

傳統模型要做這件事，得外掛工具或者后處理拼接。U1底層就是統一的，原生支持圖片和文字的交叉排版，所有視覺內容都來自模型自身，不調用外部工具。

模型在思考一個問題的時候，可以一邊推理一邊生成中間示意圖，把復雜邏輯可視化。

生成一段教程，可以在恰當的位置自然地插入說明圖。

落地到模型，兩個規格。SenseNova-U1-8B-MoT，8B參數，端側能跑。SenseNova-U1-3AB-MoT，總參數38B的MoE架構，提供更強的能力，底層都是同一套NEO-unify。

此外，商湯還給U1配了一套自研推理棧，LightLLM跑理解、LightX2V跑生成，兩條路解耦各管各的。以H100/H200單節點為例，生成一張2048×2048的圖，端到端大概9秒。

全網開源，即刻可用

值得一提的是，商湯這次在README里把模型的局限也直接寫了出來：

上下文最長32K、人物在復雜場景里的細節有時不夠穩、長文字渲染偶爾會出現拼寫或排版錯誤、連續性圖文創作目前還是beta。

不過這些短板都標了“持續改進中”。換句話說，U1這次開的不是終點，是個起點。

為了方便大家使用，商湯這次順手開源了一套SenseNova-Skills技能包，把U1做成了Agent里能直接調的工具。

sn-infographic自帶87種版式、66種風格，自己評分自己挑；掛進OpenClaw，一句 /skill sn-infographic “提示詞”，圖就出來了。

Skills不只是infographic一個，整套覆蓋圖像生成、PPT制作、Excel數據分析、深度研究、跨平臺搜索。

目前，SenseNova-U1兩個模型已經全網開源。Hugging Face和GitHub都能下，倉庫地址在https://github.com/OpenSenseNova/SenseNova-U1。

想直接體驗不動手部署的，現在可以直接進入SenseNova U1 Lite Skill，https://github.com/OpenSenseNova/SenseNova-Skills。

另外，辦公小浣熊也即將上線U1。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Moltbot作者被Claude刁難后：MiniMax M2.1是最優秀的開源模型

量子位 2026-01-29 13:17:17
0 跟貼 0
DeepSeek用V4重畫了坐標系

鈦媒體APP 2026-05-01 09:52:15
10 跟貼 10

有人只用API就猜出了GPT、Claude、Gemini的參數量？社區吵翻了

機器之心Pro 2026-05-01 19:56:22
3 跟貼 3

阿里QoderWake上崗：有身份、有記憶、有紅線，先給它一版“職業行為指南“

智東西 2026-04-30 14:41:58
0 跟貼 0
別急著All-in DeepSeek V4，先看看這10位從業者的真心話

36氪 2026-04-30 01:16:06
17 跟貼 17

GPT-5.6現身后，下一個Claude Sonnet 4.8又曝光了！

新智元 2026-05-01 19:06:33
0 跟貼 0

GPU神話松動，AI真正的戰場變了

虎嗅APP 2026-05-01 01:19:11
24 跟貼 24
廣西平陸運河建240米動物通道橋，供豹貓等動物通行

星視頻 2026-05-01 11:08:08
119 跟貼 119

純靠文本獲得全場爆燈的脫口秀！文本太強大了！

徐醇老表哥 2026-05-01 18:43:40
1 跟貼 1
上海迪士尼回應游客勸阻吸煙被打：園區沒有禁煙；被打男子發聲：對方已賠錢和解

中國新聞周刊 2026-04-27 14:25:00
15252 跟貼 15252
我在OpenAI修中文

機器之心Pro 2026-05-01 20:00:11
0 跟貼 0
鐵液做模型

劉姐愛拉呱 2026-04-30 11:43:18
1 跟貼 1
Monet：賦予多模態大模型如人類一般的抽象視覺思考能力

機器之心Pro 2026-04-20 21:05:03
0 跟貼 0
鳥鳥這種純文本的脫口秀，聽完確實享受！

徐醇老表哥 2026-05-01 18:36:51
3 跟貼 3
這就是最基礎的邏輯了，所以學校不教邏輯學

楊小楊愛看劇 2026-05-01 16:31:16
3465 跟貼 3465
英偉達推出全新開源模型 Nemotron 3 Nano Omni，效率提升至競品9倍

每日經濟新聞 2026-04-29 12:45:47
0 跟貼 0
李世石與哈薩比斯「AlphaGo沖擊」十年后重聚：為AGI時代鋪路

弈客圍棋 2026-05-01 21:39:05
1 跟貼 1
死記硬背困住的不只是學生

晚風也遺憾 2026-05-01 00:31:18
0 跟貼 0
導游稱大熊貓“花花”是殘疾，旅行社致歉

界面新聞 2026-05-01 07:59:04
9444 跟貼 9444
AI能改10萬行代碼，卻讓你走路去洗車！Karpathy戳破「鋸齒狀智能」

新智元 2026-05-01 17:08:00
0 跟貼 0
Karpathy：很多App就不該出生,人類護城河只剩理解,CPU將淪為配角

機器之心Pro 2026-05-01 20:44:49
0 跟貼 0
28178人！中冠聯賽單場觀眾紀錄在江蘇常州誕生

江蘇新聞 2026-05-01 16:26:00
88 跟貼 88
邏輯鬼才劉能裝傻充愣第一名

秦嶺扒娛 2026-04-27 18:20:16
1 跟貼 1
雷科技到底是誰？！！！悟空給出的答案，太抓人了！

雷科技 2026-04-30 23:20:45
0 跟貼 0
《10間敢死隊》《寒戰1994》各看一部，一個昏昏欲睡，一個已上癮

翰飛觀事 2026-05-01 22:01:59
2 跟貼 2
上海醫保新政落地！5月起配藥這部分費用提高了

看看新聞Knews 2026-05-01 13:24:05
282 跟貼 282
搭檔臨時更換項目被調整，陳芋汐賽前連遭變數背后隱藏什么邏輯

最終你成為了過客 2026-05-01 23:05:43
1 跟貼 1
騰訊混元CL-bench續作發布，讓大模型讀懂你的日常生活

機器之心Pro 2026-05-01 19:53:00
0 跟貼 0
蘭州一餐館懸掛錢學森和袁隆平照片，顧客直呼“這才是真正的明星”，老板回應：因為有他們我們才有飯吃

極目新聞 2026-05-01 20:08:28
992 跟貼 992
中超|鄭智被罰下，泰山不滿補時太短，一場火爆德比換回了啥？

齊魯壹點 2026-05-01 23:16:18
10 跟貼 10
外包給陌生人的圣經視頻，誰在批量生產信仰內容

灰度測試中 2026-05-01 22:29:55
0 跟貼 0
高速"手機+"試點：ETC不會消失，但游戲規則變了

字節漫游指南 2026-05-01 22:48:43
0 跟貼 0
天柱山景區“擺渡車問題”被點名后，記者實探

極目新聞 2026-05-01 19:46:05
231 跟貼 231
女子陪兒子玩手雷模型，手雷沒扔出尷尬了，竟被教練一腳踢飛

搞笑熱血青年 2026-05-01 09:24:17
2 跟貼 2
Photoshop能轉3D物體了，這是修圖還是重做？

Ping值焦慮 2026-04-28 21:28:25
0 跟貼 0
OpenAI與微軟正式“分手”，CFO擔心未來算力

每日經濟新聞 2026-04-29 06:30:36
0 跟貼 0
labubu冰箱售價5999元秒沒有平臺掛出22999元價格

新聞坊 2026-05-01 12:27:36
867 跟貼 867
拒絕“出廠即巔峰”！具身訓練系統再進化：LWD讓機器人自主開啟“打怪練級”

智東西 2026-05-01 18:59:28
0 跟貼 0
大國重器集體亮相！人民海軍成功配齊“航母五件套”

環球網資訊 2026-05-01 07:24:23
432 跟貼 432
五月郵票發行計劃（有改期發行）

驛路郵緣 2026-04-29 19:17:22
5 跟貼 5

杜鋒變陣雙大外！胡明軒殺紅眼造21分大勝！廣東一夜蛻變1-1廣州

杜鋒變陣雙大外！胡明軒殺紅眼造21分大勝！廣東一夜蛻變1-1廣州

后仰大風車

2026-05-01 21:37:31

表妹和表哥偷情大瓜：8年感情歸零，表妹不滿表哥分手曝兩人奸情

表妹和表哥偷情大瓜：8年感情歸零，表妹不滿表哥分手曝兩人奸情

江山揮筆

2026-04-18 20:54:36

50歲陳坤董潔牽手三月，現狀曝光，兒子生母真相

50歲陳坤董潔牽手三月，現狀曝光，兒子生母真相

時光流轉追夢人

2026-05-01 14:23:48

34歲男子娶“少女感”新娘，女方懷孕5月，網友：老牛吃嫩草

34歲男子娶“少女感”新娘，女方懷孕5月，網友：老牛吃嫩草

辣媒專欄記錄

2026-04-29 08:34:28

約翰-阿洛伊西：成都特色就是戰斗到最后；現在談冠軍還太早

約翰-阿洛伊西：成都特色就是戰斗到最后；現在談冠軍還太早

懂球帝

2026-05-02 00:10:14

中國和美國談妥了

阿振觀點

2026-05-01 00:26:28

河南一驢友野線徒步不慎從200米高懸崖墜落，掉落六七米后被樹杈卡住，在附近演練的8支救援隊輪番上陣，4小時成功救下

河南一驢友野線徒步不慎從200米高懸崖墜落，掉落六七米后被樹杈卡住，在附近演練的8支救援隊輪番上陣，4小時成功救下

揚子晚報

2026-05-01 20:50:35

“我女兒敢這樣，腿給砸斷”，寶媽曬2個女兒出門，裝束讓人怒了

“我女兒敢這樣，腿給砸斷”，寶媽曬2個女兒出門，裝束讓人怒了

蝴蝶花雨話教育

2026-04-10 13:01:09

馬德里半決賽菲斯惹了最不該惹的人，外媒稱辛納或退羅馬賽

馬德里半決賽菲斯惹了最不該惹的人，外媒稱辛納或退羅馬賽

網球之家

2026-05-01 22:39:21

明天起廣東暴雨+大暴雨在路上，濕氣加重了！先健脾再祛濕，試試經典“四神”湯

明天起廣東暴雨+大暴雨在路上，濕氣加重了！先健脾再祛濕，試試經典“四神”湯

城事特搜

2026-05-01 19:33:49

深夜一通電話，美國終于低頭了！中美關系迎來重大轉折

深夜一通電話，美國終于低頭了！中美關系迎來重大轉折

小陸搞笑日常

2026-05-01 21:03:14

78歲侏羅紀男星宣布抗癌成功：化療失效后，一種新療法救了他

78歲侏羅紀男星宣布抗癌成功：化療失效后，一種新療法救了他

娛圈觀察員

2026-04-29 06:02:11

無數身價過億的大佬，都在想方設法把國內的錢偷偷轉移到海外

無數身價過億的大佬，都在想方設法把國內的錢偷偷轉移到海外

流蘇晚晴

2026-04-14 19:58:25

蘇提達王后細節絕了！主動牽手泰王反被緊握，詩妮娜貴妃遺憾出局

蘇提達王后細節絕了！主動牽手泰王反被緊握，詩妮娜貴妃遺憾出局

原夢叁生

2026-04-30 23:58:07

美國一城市花1.8萬美元拆掉600塊“鄰里守望”牌：理由是帶有種族偏見，不夠包容

美國一城市花1.8萬美元拆掉600塊“鄰里守望”牌：理由是帶有種族偏見，不夠包容

華人生活網

2026-05-01 04:34:17

女子網購99元化妝品卻收到密碼箱，“掃碼添加顧問”才能獲取密碼，開箱后，1萬多瞬間沒了……

女子網購99元化妝品卻收到密碼箱，“掃碼添加顧問”才能獲取密碼，開箱后，1萬多瞬間沒了……

深圳晚報

2026-04-30 14:10:38

私人賬戶收款要小心，2026監管新規，普通人必看

私人賬戶收款要小心，2026監管新規，普通人必看

芳姐侃社會

2026-04-24 22:40:35

兩難啊！兒子月薪6000，兒媳無業，竟要父母拿30多萬養老錢還房貸

兩難啊！兒子月薪6000，兒媳無業，竟要父母拿30多萬養老錢還房貸

火山詩話

2026-04-30 15:03:29

失眠原因找到了！北京大學研究：睡不好的人，身體缺這種營養物質

失眠原因找到了！北京大學研究：睡不好的人，身體缺這種營養物質

路醫生健康科普

2026-04-30 13:05:07

兩次遭撤職的開國上將，被譽為“鐵屁股”，毛主席用4個字評價他

兩次遭撤職的開國上將，被譽為“鐵屁股”，毛主席用4個字評價他

揚平說史

2026-05-01 23:01:09

追蹤人工智能動態

12567文章數 176459關注度

往期回顧全部

科技要聞

DeepSeek發布多模態論文又連夜刪除

頭條要聞

美軍對伊朗最新打擊方案披露包含出動地面部隊

頭條要聞

美軍對伊朗最新打擊方案披露包含出動地面部隊

體育要聞

無奈！約基奇：這要在塞爾維亞全隊早被炒了

娛樂要聞

馬筱梅產后身材恢復超好現身戶外直播

財經要聞

GPU神話松動，AI真正的戰場變了

汽車要聞

限時9.67萬起吉利星越L/星瑞i-HEV智擎混動上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

教育

藝術

房產

時尚

數碼要聞

原相光學鼠標傳感器新品PAW3955將至，VGN、阿斯盾官宣采用

教育要聞

高考作文遇見反躺平：提倡奮斗，反對躺平

藝術要聞

畫畫的你絕不能錯過！色塊與筆觸的激情之旅！

房產要聞

所有戶型全賣爆！海口TOP級豪宅，景觀樣板間五一全線開放！

這個夏天，彩色褲子又火了！

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：免费精品国偷自产在线在线| 99视频在线| 精品亚洲一区二区三区在线观看 | 欧美老人巨大xxxx做受| 日本中文字幕有码在线视频| 亚洲乱码国产乱码精品| 欧洲精品色在线观看| 蜜桃成熟时快播| 国产精品无码专区综合网| 尤物亚洲国产亚综合在线区| 人妻丰满AV无码中文字幕| wwwww黄| 人妻丰满熟妇av无码区不卡| 国产亚洲精品久久久久久大师| 国产精品三级黄色小视频| 人妻精品久久久久中文字幕69| 亚洲欧洲精品中文字幕在线| 尤物视频网站在线观看| 亚洲天堂在线观看完整版| 影音先锋成人网站| 丝袜高潮流白浆潮喷在线播放| wwww在线观看| 欧美视频在线观看第一页| 欧美乱码伦视频免费| 成人做爰视频www网站小优视频| 国产精品资源在线观看网站| 墨竹工卡县| 九九久久人妻精品一区色| 天天做天天爱夜夜爽毛片毛片| 久久久久国产综合av天堂| 亚洲高清最新AV网站| 动漫无遮挡羞视频在线观看| 黄网十三区| chinese性内射高清国产| 无码国产精品一区二区免费97| 久久99热全是成人精品| 丰满的少妇一区二区三区| 女生洗鸡鸡喷尿的视频无马赛克?舒坦直叫的骚货视频?亚洲着九九九视频影院 | 国产精品被熟女| 亚洲VA欧美VA国产VA综合| 四虎最新地址|

<u id="h6dw1"></u>

<tr id="h6dw1"><dfn id="h6dw1"></dfn></tr><meter id="h6dw1"></meter>