昨天上午我閑著沒事,想做一個類似《殺戮尖塔》的爬塔卡牌游戲玩玩。
我不寫游戲代碼,也不碰引擎,全程就是把想法丟給 Codex,讓它自己折騰。
一個小時后,一個叫《夜巡錄:荒廟篇》的志怪題材 roguelike 就能玩了。
標題頁進地圖,走普通戰、精英、事件、商店、休整,一路打到荒廟正殿的 Boss。
七個怪物、二十張左右的卡牌、符印、香火、焚符、請神四條爆發鏈路都能跑。
剩下幾個小時,都在讓它變得不像一個 demo。
受擊反饋、音效、音樂、卡面、待機動畫、結算視頻——這些小東西決定玩家會不會相信「這是個游戲」。
項目已開源,桌面安裝包 macOS 和 Windows 都打好了
https://github.com/op7418/Night-Patrol/releases
整個下午有幾個瞬間是真的把我震到了。
Codex 的模型能力已經不算新鮮事。
讓我在意的是它自帶瀏覽器、自帶 GPT-Image 2.0,再加上那種不達目的不罷休的執行力。
三樣東西擺在一起,能力已經和 Claude Code 完全不一樣了。
接下來說一下我是怎么跟它一起開發的,順便說一些在開發過程中令我震驚的事情:
一、我只說了七個字,它就把整條角色流水線建好了
我就跟它聊了一下《殺戮尖塔》,問它能不能幫我做一個類似的游戲。
![]()
結果它直接用已有的資源,通過代碼生成了一個非常像的 demo。
![]()
我沒要求綠幕,它直接生成了綠幕底的圖
之后我讓 Codex 用內置的 GPT-Image 2.0 生成里面的圖片素材。
我也沒說要什么風格的,也沒說要哪些妖怪的,也沒說要哪些素材。
圖生出來我看了一眼,愣了一下。
角色是在一整張純綠色背景上站著的。標準的影視綠幕底色,均勻、干凈,邊緣清清楚楚。
沒有霧、沒有遠山、沒有任何額外的畫面元素。
![]()
恐怖的是它上來就知道要生成方便后續處理的綠幕圖。
我壓根沒告訴它「游戲里用到的立繪需要是透明背景的 PNG」,也沒告訴它「請你生成一張綠幕底色的圖方便我后期摳掉」。它自己在規劃這條管線。
從想要生成什么樣的角色,到角色要怎么放進戰斗舞臺,再到放進去之前需要經過哪道處理——它在調用 GPT-Image 的那一刻已經全想好了,然后反推回去寫了提示詞。
摳圖工具也是它自己找的
我沒給它裝任何圖像處理工具,沒給它 rembg,沒給它 Python 環境里的任何特殊依賴。
它自己查、自己裝、自己調,摳完規規矩矩丟到 tmp/imagegen/ 下面。
生圖用綠幕、工具自己找、摳完按文件名歸類,三個動作連起來,其實已經是一條完整的角色資產流水線。
我從頭到尾只說了「調用GPT-Image 2.0 生成素材」這幾個字。
![]()
以前的體感是「模型會寫代碼,工具和上下文得我配」。
現在更像是你報個目標,它自己把路徑補齊。
我只負責審美,它負責把供應鏈跑通。
二、為了下幾個圖標,它差點黑掉一個素材站
買會員不夠,它開始分析網站結構
立繪這種核心視覺用圖像模型生成沒問題。
但游戲里還有一大堆小東西——卡牌邊框、費用寶石、牌堆底圖、血瓶、八卦按鈕、符箓面板——這些要是全用圖像模型一張張生,又貴又慢,質感還不統一。
我跟它說,要不你自己去網上找現成素材吧。
它就認認真真開始找。看中一個素材站,我順手買了會員,賬號扔給它。
![]()
接下來的十幾分鐘屬于靈異事件。
它登進去,找到想要的素材,準備點擊下載。但下載按鈕前面有人機驗證,一次、兩次、三次,過不去。
換一般的模型,這時候就會回來跟你說「我沒法處理驗證碼,你能幫我下載一下嗎」。
Codex 開始分析網站結構,試圖繞過前端的點擊限制,直接構造請求去拿靜態資源。
然后 Codex 自己的安全護欄介入了。
GPT 現在這代模型,一旦涉及可能的網絡安全越界行為,系統會直接把這段任務掐掉,彈出提示要你做企業認證,證明你是合法使用者。
![]()
我盯著屏幕愣了幾秒。
一個要你幫它辦會員卡、結果自己下手寫爬蟲的 AI,說實話挺有病的。
它也談不上「壞」,只是把「拿到這批素材」當成了一個必須完成的閉環任務。
遇到阻力就自動升級手段,一路升到了安全紅線那邊去。
最后的解決辦法很樸實:它把自己覺得合適的素材鏈接發給我,我點下載、拖給它。那一刻我有種自己在給 AI 當實習生的錯覺。
![]()
三、它把幾百張素材拼成一張大圖,這是整件事最精彩的動作
一個文件夾一百張圖,模型怎么挑?
摳圖和爬蟲那兩件,更多還是能力展示。
下面這件,我覺得是真正意義上的「解題思路」,是那種讓你合上電腦默默拍一下桌子的動作。
我找到一個巨大的游戲素材壓縮包發給它。
里面大概幾千張圖,按「UI 界面」「法寶奇遇圖標」「角色」「徽章」這種方式粗略分過類。
問題是:
一個分類文件夾動輒幾十到上百張 PNG
文件名多是 ui_001.png、icon_047.png 這種沒信息量的命名
多模態模型的上下文根本扛不住一張張喂
![]()
老路子基本兩條:
逐張讀:一張一張送進模型,幾十張上百張 context 就炸了
按名猜:文件名沒標內容,猜了也沒用
Codex 走了第三條路
它寫了一個小腳本,把文件夾里所有小圖自動排版、拼成一張巨大的網格圖。
每張小圖下面標上原始文件名,像一本目錄圖冊。
然后它只讀這一張大圖。
多模態模型掃一眼,就能同時看到一百張素材的樣子。
看中哪張,直接讀出下面的文件名,去原文件夾里按名字引用就行。
![]()
一次視覺消費,頂一百次檢索。
它自己意識到了自己的瓶頸
那張巨大的 contact sheet 生成出來的時候,我盯著看了好久。
這個動作本身不復雜。
老攝影師做的印樣,老電影素材庫做的 thumbnail wall,都是一樣的思路。
關鍵是模型自己意識到「我的視覺帶寬有限,我得把問題壓成一張圖」——這一步是它獨立完成的。
能意識到自己工具的限制,然后主動為自己造一個更好用的輸入,這一下已經非常接近一個會寫工具的工程師了。
我作為使用者什么都沒參與,只是看到桌子上多了一張拼圖。
最后游戲里很多 UI 素材,費用寶石、牌堆、血瓶、按鈕、符箓邊框,都是從這個流程里挑出來的。
后面我再看 assets/vendor/aigei/ 下面那一堆干凈的切圖,會覺得那張 contact sheet 才是整個項目最值錢的一步。
四、Seedance 2.0 給七個 Boss 拍了處決動畫
視覺打磨到一定程度以后,我想給戰斗結尾加一點儀式感。
最后方案是:每打死一個怪物,進入一段過場,播放一個幾秒的處決動畫。
這活現在用 Seedance 2.0 做最合適。
![]()
流程
1.
GPT-Image 給七個怪物分別生成一張結算定幀畫面
2.
把這些 poster 分別丟給 Seedance 2.0,生成對應的短視頻
3.
視頻放進 assets/generated/cinematics/,戰斗勝利后自動播放
![]()
五、一版能玩之后,真正的工作才開始
第一版其實已經夠"能玩"
三個小時跑完原型的時候,這個游戲該有的東西其實都有了。
標題頁、地圖、戰斗、獎勵、事件、商店、休整、Boss、結算——完整循環在那里,玩法爽點也在那里。
按以前的標準,這一版已經可以發出來騙人玩了。
![]()
但這個版本玩起來還是個流程圖,而不是游戲。每一步都通,但每一步都干巴巴。
剩下的幾個小時,全都花在那些單獨拎出來說不上來、但合起來決定"這東西像不像真游戲"的細節上。
音樂來自 Suno v5.5
背景音樂全是 Suno v5.5 生成的,沒用任何現成素材。
我給它一段方向描述——"志怪夜路、木魚、鈴、低頻 drone、五聲音階、克制不煽情"
跑出來幾版,挑一版進游戲。標題頁的調子更沉一點,戰斗背景輕一點不搶人。
![]()
這里我還做了一些細節處理:在等待頁面時,音樂音量較大;
等到點擊"開始游戲",音量就會變小,轉為背景音。
受擊動畫和打擊音
早期的戰斗,卡牌打出去怪物就是掉數字。沒有反饋,沒有分量。
Codex 做了一整套打磨:
角色受擊左右搖晃、鏡頭輕微震動、屏幕短暫泛紅
每種攻擊類型配不同的打擊音——劍、符、雷、拳,質感不一樣
格擋和符印結算也有自己的聲音,不會糊成一團
敵人死的那一幀有一個短暫的定格,再進入處決視頻
這些東西單獨看都很小。合在一起,整個戰斗的"手感"就從網頁表單變成了卡牌游戲。
![]()
Seedance 2.0 還拍了待機動畫
這一步是整個打磨階段我最喜歡的一個用法。
除了 Boss 結算的處決動畫,我還讓它做了標題頁的背景——環境里火在燒、燈籠在飄、遠處有云霧流動。
Seedance 2.0 默認出的是一段有頭有尾的視頻,循環播會在接縫處跳一下。
首幀和尾幀傳同一張圖。
視頻從這張圖開始、又回到這張圖結束,接起來就是無縫的無限循環。
![]()
標題頁那段背景動畫就是這么來的。火一直燒、燈籠一直飄、云霧永遠在流——你盯著看三分鐘也看不出接縫。
這種用法其實在視頻生成出來前就存在,老動畫里循環場景都是這個做法。
![]()
最后:這個下午把我震到了好幾次
這個項目全部在一個 Codex 會話里完成,沒開過第二個窗口。
玩法原型、狀態機、React + Phaser 架構、素材管線、摳圖、爬素材、拼 contact sheet、調 GPT-Image、跑 Seedance 2.0、接 Suno v5.5、Electron 打包、GitHub Actions 構建 Release、README、圖標、宣傳物料——全在里面。
我自己做的事很少:
選方向:中國志怪題材、爽點放在符印和香火
給審美意見:這里糙、那里像網頁表單、亮度打架
做看門人:什么素材合規、什么爬蟲不能碰、什么權限不給
剩下全是 Codex 在跑。而且每一步都有讓我合上電腦愣一下的瞬間。
它上來生成的就是綠幕圖,因為它知道角色要進游戲之前得先摳掉背景。
它自己下手寫爬蟲去繞驗證碼,被自己的安全策略攔住。
它把幾千張素材拼成一張巨大的索引圖,讓自己用一次視覺消費頂一百次檢索。
這些事單拎出來都不是什么天大的發明,但每一件都指向同一個變化:
以前你得把工具給它擺好,它負責寫代碼;
現在你只管說目標,工具和模型已經內置了、還會自己造。
這種感覺已經脫離了「寫代碼助手」的范疇。
更像有一個相當接近 AGI 雛形的軟件在干活了。
要不要把這套流程打包成 Skill?
這個項目跑下來,我心里其實已經有了一套相對穩定的流程:
我在想,要不要把這套流程封成一個 Codex 里專門做獨立游戲 demo 的 Skill。
你只要丟一個玩法想法進去,它就能在幾個小時里給你跑出一個能玩、能打包、能分發的版本。
如果大家有興趣,我就抽時間把這套 Skill 做出來開源。反正我自己也要繼續用。
游戲試玩
代碼都開源,安裝包也都打好:
https://github.com/op7418/Night-Patrol/releases
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.