![]()
速途網消息,北京時間4月22日凌晨,OpenAI 在毫無征兆的情況下,甩出了一張王炸——ChatGPT Images 2.0。
![]()
上線不到24小時,它就在大模型競技場(LMArena)的文本生圖任務中,以斷層式的評分差距登頂全球第一,領先第二名Nano Banana 2高達241分(1512分 vs 1271分)。
![]()
在以前,AI生圖最大的痛點是——不可控。但Images 2的邏輯不是直接“畫”,而是先“思考”,分析任務本身。當你在ChatGPT中啟用Thinking模型時,Images 2.0會做以下幾步:聯網檢索信息 → 規劃圖像結構 → 推理布局 → 最后下筆。
OpenAI創始人山姆·奧爾曼在直播中直言:“從gpt-image-1到gpt-image-2的飛躍,相當于從GPT-3跳到GPT-5。”
![]()
目前,GPT Images 2 在所有 7 個文本轉圖像類別中均排名第一,全面超越了排名第二、帶有網絡搜索功能的 Nano banana 2。
即使是同樣的提示詞,在GPT Images 2和Nano Banana 2上的表現也完全不同,比如我們給出“多米諾骨牌活動,練習乘法”。下圖中左側為Nano Banana 2的輸出,右側為GPT Images 2的輸出。
![]()
可以看出,GPT Images 2精準理解了“練習”這個詞指向的教育場景,需要的是教學材料。而Nano Banana 2給出的畫面是一堆小孩圍坐在桌子旁,手里拿著帶點數的骨牌,整體氛圍像在玩桌游。它捕捉到了“骨牌”和“活動”這兩個表層元素。
然而,GPT Images 2的可怕之處遠不止文字渲染,它對數字世界視覺規律的掌握才真正夸張。速途網將Images 2與Gemini Nano Banana 2 進行了一些場景的對比。具體如下:
對比案例一:老相片風格
提示詞:幫我生成一張,爺爺奶奶在看報紙的樣子,2000年前后的畫風。
對比:左圖為Nano Banana 2生成,雖然清晰但AI創作、潤色的比重極高,不像是長輩們在過去會拍出來的真實照片;右圖為Images 2生成,照片整體風更有年代感,人物狀態、環境都高度還原。
![]()
對比案例二:物理試卷生成
提示詞:生成一張中國的物理試題圖片,要有作答、批改痕跡,有對有錯,試卷也可以有一些折疊痕跡。有鉛筆寫的試卷主人的碎碎念。
對比:左圖為Nano Banana 2生成,但試卷的折疊痕跡不明顯、碎碎念筆記跳脫出圖,擺在課桌上的協調性欠佳;右圖為Images 2生成,試卷的痕跡、碎碎念的鉛筆筆跡、給大家一種秒回“學生時代”的感覺。
![]()
對比案例三:名作古詩板書
提示詞:生成一張李白的《行路難》在教室黑板上的粉筆書寫圖片。字體為普通人的工整風格。
對比:左圖為Nano Banana 2生成,文字更偏向打印體、周邊微露的教室和課桌反而降低了真實性,與實際擺置完全相反;右圖為Images 2生成,粉筆痕跡、黑板光影等,更像是實拍的感覺。
![]()
可以看出,Images 2的效果整體上遠超于Nano Banana 2,當用戶輸入的提示詞文本有限時,更貼近用戶的真實意圖,場景更逼近真實、更像是取自一張手機拍照/截屏。
過去幾個月,外界吐槽OpenAI擠牙膏、Sora關閉、被Gemini壓制……仿佛那個不可一世的AI霸主真的變菜了。
但今天 GPT Images 2.0 的出現,是一次響亮的回擊。它把Nano Banana最引以為傲的文字渲染能力直接碾壓,把“思考能力”首次引入圖像生成,把多圖一致性這個行業難題徹底解決。
目前,GPT Images 2.0 基礎功能對所有ChatGPT免費用戶開放,這意味著每個人現在都可以去體驗這款“登頂第一”的生圖模型。
可以說,“全民藝術家”的時代正式來臨,而當一個AI能隨手生成一張以假亂真的數學試卷、能完整復刻抖音直播間的每一個UI按鈕時,我們也不得不承認:那個“有圖有真相”的年代,是真的回不去了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.