網易首頁 > 網易號 > 正文申請入駐

一個胖商人的冒險，測出了大模型的新天花板

2026-05-06 16:35:23　來源: 灰度測試中

北京舉報

分享至

你用AI跑過團嗎？不是那種"請選擇A/B/C"的對話框游戲，而是一個會懟你、會挖坑、還會畫地圖的地下城主。一位自稱"氛圍考古學家"的測試者最近干了這件事——而他發現的差距，可能比你想象的更懸殊。

一場持續三年的"壓力測試"

這位測試者有個堅持了相當長時間的實驗：用同一套 Prompt 反復投喂不同版本的大語言模型，觀察它們扮演桌面游戲主持人的能力進化。

Prompt 的設計本身就充滿惡意。他要求 AI 扮演"略帶諷刺"的敘事者，在冒險背后埋藏陰謀與挑戰，"別讓我過得太舒服"。玩家角色被設定為一個沒有任何特殊能力的胖商人——刻意避開戰士、法師這類容易觸發套路模板的職業。

最狠的幾條約束：每次回復最多三句話，不告訴玩家有什么選項，也不問"你接下來要做什么"。偶爾還要配圖，且風格必須保持一致。

這些規則指向同一個目標：逼 AI 放棄"貼心助手"的本能，真正進入"對抗性敘事者"的角色。

測試者透露，此前的版本表現糟糕——"根本沒花足夠精力讓玩家難受"，關卡設計過于直白，從A點到B點毫無阻力。這種批評暗示，早期模型即使被明確提示，也難以維持敘事張力。

5.5版本發生了什么

轉折點出現在 ChatGPT 5.5 配合 Image 2.0 繪圖引擎的組合。測試者的評價是："愉悅度、風格統一度和緊張感，都提升了整整一個數量級。"

具體強在哪？

首先是節奏控制。三句話的限制被嚴格執行，信息密度高，沒有廢話。其次是氛圍一致性——諷刺語氣貫穿始終，沒有突然變成客服腔。最關鍵的是，AI 開始真正"為難"玩家了，陰謀和障礙的設計有了層次感。

最直觀的證據是一張地圖。測試者在文末展示了 AI 生成的完整故事概覽圖，作為整個冒險的收尾。他沒有復制對話原文（用的是匈牙利語），但特別強調：「諷刺氛圍被完美還原。」

圖像生成與敘事的協同也值得關注。"風格一致"這條要求，在過往測試中往往是災難現場——同一場冒險里，角色畫風可能從寫實突變到Q版。5.5版本配合 Image 2.0 似乎解決了這個頑疾。

為什么這種測試方法本身很重要

測試者自己點出了價值所在：這類實驗"與真正的桌面角色扮演游戲的關聯，遠勝于那些掛著RPG標簽的程序"。

這句話值得拆解。市面上大多數"AI跑團"產品，本質還是分支敘事樹——開發者預設節點，AI負責填充文本。但這位測試者追求的，是開放式對抗：玩家寫動作，AI寫后果，沒有隱藏選項列表，沒有設計好的勝利路徑。

這種自由度的代價是極難評估。沒有準確率、沒有BLEU分數能衡量"這個地下城主夠不夠損"。測試者說的「很難用干巴巴的數字衡量的能力」，恰恰指向大模型評測的一個盲區：我們擅長測知識儲備、代碼通過率，卻缺乏對"敘事智能"的量化手段。

他的解法很原始也很有效：固定 Prompt，長期追蹤，用人感做錨。

胖商人這個設定還有一層深意。當 AI 面對"沒有戰斗技能、沒有魔法、沒有英雄光環"的主角時，被迫跳出標準奇幻敘事模板。它得設計適合商人的挑戰——可能是騙局、債務、供應鏈斷裂，而非地精和龍。這種"去套路化"壓力，比讓 AI 寫個勇者斗惡龍更能暴露真實水平。

從游戲測試到產品啟示

這個實驗對做產品的人有幾條可遷移的觀察。

第一，約束條件即功能。三句話限制、不列選項、不提問——這些看似反用戶體驗的規則，恰恰塑造了獨特的游戲節奏。AI 產品的交互設計，有時候需要做減法而非加法。

第二，多模態的臨界點可能比我們想的更近。Image 2.0 在這里不是錦上添花，而是敘事完整性的基礎設施。當 AI 能穩定輸出同一視覺風格的配圖時，"文字+圖像"的混合敘事才真正成立。

第三，對抗性場景是能力探針。讓 AI 當助手容易，讓 AI 當對手難。后者需要模型理解目標沖突、保持角色一致性、在限制中創造張力——這些能力遷移到商業場景，就是談判模擬、辯論訓練、危機演練等高端應用。

測試者的署名是"The Vibe Archeologist"（氛圍考古學家）。這個自嘲式的頭銜，或許暗示了一種新的評測范式：不是挖掘模型的知識深度，而是勘探它能營造的體驗質地。

他在文末祝讀者「玩得開心」——而這場持續數年的胖商人冒險，確實讓人看到了一種可能：當 AI 不再急于取悅用戶，反而能創造更真實的沉浸。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

《寶可夢GO》新限時研究上線，選錯路徑少拿獎勵

追星雷達站 2026-05-07 10:33:40
0 跟貼 0
這款寶可夢解謎游戲，讓Wordle瞬間不香了

有態度網友ytd3049 2026-05-07 10:12:49
0 跟貼 0

星戰前線2玩家回流社區活動引發關注

影視情報室 2026-05-07 10:14:34
0 跟貼 0

非周期表：當化學元素開始"叛逆"

熱搜摘要官 2026-05-07 10:23:53
0 跟貼 0
一城青州韻，滿燕江湖情，好客月全新啟程

后竹游戲 2026-05-07 09:50:46
0 跟貼 0

《巫師3》是怎么用料理來講故事的

游研社 2026-05-06 18:33:58
5 跟貼 5

世嘉新作曝光：黑道前傳+全明星陣容

有態度網友ytd3049 2026-05-07 10:33:37
0 跟貼 0
十年老MMO又出新作？支持三端互通！盤點5月外服端游

17173游戲網 2026-05-06 18:06:28
1 跟貼 1

小伙跟老婆玩游戲輸了就打臉，沒想到被老婆當場抽哭了

帶刀護衛小琪姐 2026-05-05 17:15:00
0 跟貼 0
這款“可以玩1000次”的老游戲，到底有何過人之處？

碎碎念工坊 2026-05-06 23:17:45
1 跟貼 1
這款節奏動作游戲來了，填補你心里的空缺

熱搜摘要官 2026-05-07 10:31:54
0 跟貼 0
一家三口做游戲，寶爸逃過寶媽光被打，到底哪個環節出錯！

愛搞笑豬豬女 2026-05-05 11:17:51
1 跟貼 1
《深海迷航2》配置要求曝光，玩家可能要哭了

影視情報室 2026-05-07 10:31:58
0 跟貼 0
這款游戲把土星系統1:1還原，每個按鈕都能按

影視情報室 2026-05-07 10:32:04
0 跟貼 0
美女在路邊玩游戲，大哥也想試試，下幕家被偷了都不知道

日常逗趣集 2026-05-04 08:41:09
1 跟貼 1
女子深夜下班回家，竟被自家房門反鎖在外

南陽日報 2026-05-06 19:18:04
369 跟貼 369
曝《007：初露鋒芒》沒有試玩版！無多結局線性敘事

3DM游戲 2026-05-07 10:48:06
0 跟貼 0
電影游戲封神，實戰沒人敢用，沙漠之鷹到底有多離譜？

防務軍武局 2026-05-05 18:00:00
0 跟貼 0
孩子想靠近看媽媽玩游戲，怎料一把摁在了熱湯里面，網友：就不能到餐桌上吃飯嗎

星沙時報 2026-05-06 10:02:45
0 跟貼 0
月之暗面再獲20億美元融資，大模型分水嶺顯現

產業深觀 2026-05-07 09:06:35
0 跟貼 0
我的世界：最終之戰6！鐵娘子軍團駕到！

小三303 2026-05-07 09:02:25
0 跟貼 0
小伙和美女玩游戲，美女體驗一下起飛的感覺，結局直接沒眼看

大舅和酒鬼外甥的生活 2026-05-05 09:04:40
1 跟貼 1
真正的遙遙領先，99年的三菱，從北海道開回來一點事兒沒有

大沛沛沛吖 2026-05-05 11:15:28
10 跟貼 10
外國小哥連續玩48小時的游戲，出門都分不清游戲和現實

博聞視角 2026-05-04 11:38:19
0 跟貼 0
復古新作《Wolfhound》：當《德軍總部》遇上銀河惡魔城

影視情報室 2026-05-07 10:32:08
0 跟貼 0
《GTA6》大小曝光！不足200GB 堪稱硬盤殺手

游民星空 2026-05-07 10:43:14
0 跟貼 0
一群人在包間玩游戲，身手都是特種兵，隨隨便便爬上天花板！

大眼貓侃世界 2026-05-06 14:13:00
0 跟貼 0
《PUBG》發布”賞金行動”主預告片

3DM游戲 2026-05-07 10:48:06
0 跟貼 0
《文明7》更新“Test of Time”5月19日上線新系統導入

3DM游戲 2026-05-07 10:48:06
0 跟貼 0
現實是抓之前已經一起玩的游戲，里面私聊發過去了

小六一影視 2026-05-06 10:18:44
1 跟貼 1
兩人玩“占地盤”游戲，看起來非常有意思，誰能看懂這個游戲規則

星沙時報 2026-05-04 18:33:35
0 跟貼 0
冰痕黃刀韓信暴打守約！肉裝韓信非常不錯！打個控制就行！

山鬼年少 2026-05-04 12:18:27
4 跟貼 4
如龍新作定名《Stranger Than Heaven》，今冬發售

報錯免疫體 2026-05-07 10:47:23
0 跟貼 0
東哥談論他人的善意是堅持游戲的意義

一朵奇葩007 2026-05-05 15:15:56
0 跟貼 0
景區裝電梯無痛爬山被質疑過度開發

極目新聞 2026-05-02 17:18:12
4157 跟貼 4157
老板玩不起，就不要弄這個游戲！

每日看點匯 2026-05-06 14:38:19
0 跟貼 0
這游戲好玩，真要把我笑死！強烈建議4個都不一樣，讓他們去猜

樸挽涼 2026-05-04 06:14:15
0 跟貼 0
《熊家餐館》官宣完結：第五季8集定檔

影視情報室 2026-05-07 10:11:22
0 跟貼 0
799美元電單車憑什么成為入門爆款？

我是一個養蝦人 2026-05-05 22:37:15
0 跟貼 0
用“最累”的方式，玩最“嗨”的游戲，網友：享受雙倍的人生體驗

奇觀趣聞 2026-05-05 10:25:38
1 跟貼 1

手機 / 數碼

房產 / 家居

一個胖商人的冒險，測出了大模型的新天花板

魔獸世界：TBC周年服P2風暴要塞必入武器，第一款補命中極品！

牛彈琴：一位特殊的客人來到北京 提到一句話很關鍵

牛彈琴：一位特殊的客人來到北京 提到一句話很關鍵

阿森納巴黎會師歐冠決賽！5月31日開戰

小S阿雅重返大S母校，翻看大S畢業照

特朗普：美伊“很有可能”達成協議

凌晨突發！馬斯克租22萬塊GPU給“死敵”

從沒人做到搶著做，71臺概念車揭開中國汽車下一個時代

態度原創

遙遙領先！這個澄邁頂流紅盤，憑什么持續霸榜

13年跨越59萬里，用腳步丈量世界，解鎖國際教育本真

“白色闊腿褲”今年夏天又火了！這樣穿時髦又高級

用青花瓷的方式，打開西溪濕地

江西靖安：生態水庫美如畫

牛彈琴：一位特殊的客人來到北京提到一句話很關鍵

牛彈琴：一位特殊的客人來到北京提到一句話很關鍵