一個倫敦開發(fā)者用3.5MB做出了能在瀏覽器里跑的第一人稱射擊游戲。沒有下載,沒有安裝,點開即玩。而傳統(tǒng)3A游戲的安裝包動輒100GB起步。
這中間的體積差距,不是魔法,是一項叫"高斯濺射"的新技術(shù)。它正在悄悄改寫3D內(nèi)容的存儲和傳輸規(guī)則。
![]()
誰做了這件事
Iakov Sumygin,倫敦獨立開發(fā)者。他的新作沒有名字,界面極簡:WASD移動,鼠標轉(zhuǎn)向,點擊射擊。場景是一個室內(nèi)走廊,目標靶子會隨機出現(xiàn)。打完收工。
游戲性幾乎為零。但技術(shù)社區(qū)的反應(yīng)很真實——GitHub倉庫短時間內(nèi)獲得大量關(guān)注,討論焦點全在"怎么做到的"而非"好不好玩"。
Sumygin的核心武器是高斯濺射(Gaussian Splatting,簡稱3DGS)。這不是他發(fā)明的技術(shù),但他可能是第一批把它完整塞進瀏覽器游戲的人。
高斯濺射的本質(zhì)是一種3D場景表示方法。傳統(tǒng)3D游戲用多邊形網(wǎng)格(mesh)構(gòu)建世界:每個物體由成千上萬個三角形面片拼接,需要存儲頂點坐標、法線、紋理貼圖、光照信息。一個復(fù)雜場景的模型文件輕松突破數(shù)GB。
高斯濺射走完全不同的路。它不建模型,而是直接記錄"光的樣子"。
技術(shù)原理:從照片到可交互場景
制作流程出奇簡單。拿手機或相機圍繞真實空間拍攝一圈,得到幾十到幾百張照片。把這些照片扔進一個叫"運動恢復(fù)結(jié)構(gòu)"(Structure-from-Motion)的算法,它自動算出每張照片的拍攝位置和角度,同時生成一個稀疏點云——三維空間里的一堆彩色小點。
接下來是關(guān)鍵步驟:場景優(yōu)化。每個點被替換成一個"三維高斯分布"——數(shù)學(xué)上就是一個橢球形的概率云,中心最濃、邊緣漸淡。算法調(diào)整每個橢球的位置、大小、旋轉(zhuǎn)、顏色和透明度,讓它們疊加后的視覺效果盡可能匹配原始照片。
最終成果是一個.splat文件,包含數(shù)百萬個高斯橢球的參數(shù)。渲染時,GPU把這些橢球按深度排序,從遠到近一層層"濺射"到屏幕上,形成完整畫面。
高斯濺射的核心優(yōu)勢在這里顯現(xiàn):它用極小的存儲代價換來了照片級的真實感。Sumygin的整個游戲包只有3.5MB,其中場景數(shù)據(jù)占大頭,代碼量微乎其微。
對比傳統(tǒng)管線:同樣的室內(nèi)場景若用攝影測量建模,需要高面數(shù)網(wǎng)格+4K紋理貼圖+光照烘焙,文件體積可能膨脹到500MB以上。高斯濺射直接跳過了"建模型"這一步,用原始光學(xué)信息本身作為渲染基礎(chǔ)。
為什么現(xiàn)在才火
高斯濺射的概念源頭可以追溯到1990年代早期。Lee Westover在1991年的博士論文中首次提出用體積渲染技術(shù)表示3D場景,當時叫"足跡法"(footprint method)。但受限于算力,這個想法沉寂了三十年。
2023年,法國研究團隊發(fā)表了一篇關(guān)鍵論文,把現(xiàn)代AI優(yōu)化引入這個老框架。他們證明:用可微分渲染+梯度下降,可以從照片集中快速擬合出高質(zhì)量的高斯場景。訓(xùn)練時間在消費級GPU上只需幾分鐘到幾小時。
這篇論文引爆了學(xué)術(shù)和工業(yè)界。2023年下半年到2024年,高斯濺射的渲染速度提升了10倍以上,瀏覽器端的WebGL實現(xiàn)成熟,工具鏈(如Polycam、Luma AI)讓非技術(shù)用戶也能一鍵生成場景。
Sumygin的游戲出現(xiàn)在這個技術(shù)成熟的節(jié)點。他不是第一個做高斯濺射渲染的人,但把"可交互性"和"零門檻訪問"結(jié)合到位——打開網(wǎng)頁就能玩,這對技術(shù)傳播的效果遠超論文和演示視頻。
體積暴政的終結(jié)?
游戲行業(yè)有個長期痛點:內(nèi)容體積膨脹速度遠超帶寬和存儲的提升速度。2013年的《GTA V》安裝包約65GB,2023年的《博德之門3》超過150GB,2024年的《最終幻想7重生》PS5版需要近150GB預(yù)留空間。
體積膨脹的驅(qū)動力是視覺保真度競爭。更高分辨率紋理、更復(fù)雜的幾何細節(jié)、更真實的光照模擬,全部轉(zhuǎn)化為數(shù)據(jù)量的指數(shù)增長。玩家被迫購買更大硬盤,等待更久下載,開發(fā)商承擔更高的CDN分發(fā)成本。
高斯濺射提供了一條逃逸路徑。它的存儲效率來自信息論層面的優(yōu)勢:照片是場景的"壓縮感知",高斯濺射直接利用這種壓縮,而非像傳統(tǒng)管線那樣先解壓再重建。
具體數(shù)字對比很直觀。一個100平方米的真實室內(nèi)空間,用手機拍攝50張照片,生成的高斯場景約10-50MB。同等視覺質(zhì)量的網(wǎng)格模型+紋理,可能需要2-5GB。壓縮比達到100:1量級。
更關(guān)鍵的是渲染端的效率。高斯濺射的渲染復(fù)雜度與屏幕像素數(shù)大致線性相關(guān),與場景幾何復(fù)雜度基本無關(guān)。這意味著你可以把無限細節(jié)塞進場景,只要它在屏幕上的投影面積不大,渲染成本就不會爆炸。
這對開放世界游戲有深遠影響。傳統(tǒng)LOD(細節(jié)層次)系統(tǒng)需要人工制作多版模型,遠處用低模,近處切高模。高斯濺射天然自帶LOD——遠處的高斯點投影變小,自動合并計算;近處的高斯點分散,呈現(xiàn)豐富細節(jié)。一套數(shù)據(jù),自適應(yīng)所有距離。
瀏覽器游戲的第二春
Sumygin選擇瀏覽器作為發(fā)布平臺,不是偷懶,是精準的技術(shù)演示。
WebGL和新興的WebGPU標準讓瀏覽器獲得了接近原生的圖形能力。但傳統(tǒng)3D游戲移植到網(wǎng)頁仍面臨體積障礙:用戶沒有耐心等待500MB的加載,尤其是在移動端。
3.5MB改變了這個等式。它小于一張高清圖片,小于大多數(shù)網(wǎng)頁的JavaScript依賴包。用戶從點擊鏈接到進入游戲,時間以秒計,而非分鐘。
這重新打開了瀏覽器游戲的可能性空間。2000年代末的Flash游戲黃金時代,正是建立在"即點即玩"的體驗上。HTML5時代,這個優(yōu)勢被體積問題抵消,輕量級游戲轉(zhuǎn)向2D,3D體驗讓位于原生應(yīng)用。
高斯濺射可能扭轉(zhuǎn)這個趨勢。它的渲染質(zhì)量足夠支撐沉浸式3D體驗,體積又足夠小,讓瀏覽器重新成為3D內(nèi)容的合理載體。
更激進的想象是云游戲的替代方案。Google Stadia和Amazon Luna試圖用視頻流解決體積問題,但延遲和成本始終難解。高斯濺射走另一條路:把輕量級場景數(shù)據(jù)傳到本地,用用戶設(shè)備的GPU實時渲染。延遲更低,成本更可控,畫質(zhì)反而更優(yōu)——本地渲染沒有視頻壓縮的 artifacts。
技術(shù)邊界與未解問題
高斯濺射不是萬能藥。Sumygin的演示刻意回避了它的弱點。
首先是動態(tài)物體。高斯濺射的場景是靜態(tài)的,從照片優(yōu)化而來。游戲里的移動靶子是怎么做的?Sumygin沒有公開技術(shù)細節(jié),但合理推測是用傳統(tǒng)網(wǎng)格或簡單幾何疊加在高斯場景之上。純高斯濺射的角色動畫、物理交互,目前仍是開放問題。
其次是編輯難度。高斯場景是"烘焙"的結(jié)果,不像網(wǎng)格模型那樣可以方便地選中、刪除、修改單個物體。想要把場景里的桌子移個位置?可能需要重新采集照片、重新訓(xùn)練。這對游戲開發(fā)的工作流是重大挑戰(zhàn)。
第三是遠景表現(xiàn)。高斯濺射在近景和中等距離表現(xiàn)驚艷,但極遠處的細節(jié)會退化為模糊色塊。傳統(tǒng)游戲用天空盒、霧效、低模遠景掩蓋這個問題,高斯濺射的融合方案還在探索中。
最后是硬件依賴。雖然渲染效率提升,但高斯濺射仍需要現(xiàn)代GPU的算力。低端手機和舊款筆記本可能跑不動,這與"瀏覽器即玩"的普適性愿景存在張力。
商業(yè)邏輯的重新校準
從產(chǎn)品經(jīng)理視角看,高斯濺射的價值不只是技術(shù)參數(shù),它可能重塑幾個核心商業(yè)假設(shè)。
內(nèi)容生產(chǎn)成本。傳統(tǒng)攝影測量需要專業(yè)設(shè)備、專業(yè)團隊、漫長的后期清理。高斯濺射把門檻降到"拿手機轉(zhuǎn)一圈"。房地產(chǎn)、電商、文旅等行業(yè)的內(nèi)容化成本可能大幅下降。
分發(fā)渠道重構(gòu)。3.5MB的游戲可以通過任何渠道傳播——社交媒體、即時通訊、郵件附件。不需要應(yīng)用商店審核,沒有30%的平臺稅。這對獨立開發(fā)者是結(jié)構(gòu)性利好。
用戶體驗重新定義。"下載"這個動作本身正在成為摩擦。高斯濺射讓3D體驗回歸網(wǎng)頁的鏈接邏輯:看到,點擊,體驗。這對轉(zhuǎn)化率的影響可能超過畫質(zhì)提升。
但風險同樣真實。技術(shù)太新,工具鏈不成熟,人才儲備稀缺。大廠可以觀望,小團隊押注可能踩坑。高斯濺射的專利格局也不清晰,核心論文的引用和衍生技術(shù)的知識產(chǎn)權(quán)歸屬,可能影響商業(yè)應(yīng)用的自由度。
行業(yè)信號與跟進者
Sunygin的實驗不是孤立事件。技術(shù)社區(qū)正在快速跟進。
GitHub上高斯濺射相關(guān)倉庫數(shù)量在2024年呈指數(shù)增長。Unity和Unreal Engine都有第三方插件支持高斯場景導(dǎo)入。NVIDIA在2024年GTC大會上展示了實時高斯濺射渲染的硬件加速方案。
更值得關(guān)注的是中國廠商的動向。字節(jié)跳動的火山引擎、阿里巴巴的達摩院、騰訊的AI Lab,都在2024年發(fā)布了高斯濺射相關(guān)的研究或產(chǎn)品。應(yīng)用場景集中在虛擬看房、電商展示、數(shù)字文旅——這些領(lǐng)域的核心訴求與Sumygin的游戲演示高度一致:真實感、輕量、易傳播。
游戲行業(yè)的反應(yīng)相對謹慎。EA、Ubisoft、Activision等大廠尚未公開宣布高斯濺射項目。技術(shù)太新,與現(xiàn)有管線的整合成本未知。但獨立游戲和實驗性項目正在涌入這個空間,Sumygin就是典型。
一個可能的未來
想象2026年的游戲發(fā)布形態(tài)。一個開放世界RPG,安裝包不是100GB,而是2GB的高斯場景數(shù)據(jù)+500MB的游戲邏輯。玩家點擊鏈接,瀏覽器在后臺流式加載當前區(qū)域的高斯數(shù)據(jù),本地GPU實時渲染。畫質(zhì)超過2024年的頂級3A,因為場景直接來自真實世界的照片采集。
這個未來有多遠?取決于幾個技術(shù)節(jié)點的突破:動態(tài)物體的實時高斯表示、高斯場景的實時編輯工具、跨平臺渲染的性能優(yōu)化。樂觀估計2-3年,保守估計5年以上。
Sumygin的3.5MB游戲是一個概念驗證,證明這個方向可行。它不是產(chǎn)品,是路標。
結(jié)語
技術(shù)史上有個反復(fù)出現(xiàn)的模式:存儲和傳輸成本的下降,總是催生新的內(nèi)容形態(tài)。MP3讓音樂便攜,H.264讓視頻流式化,現(xiàn)在高斯濺射可能讓3D場景變得像圖片一樣輕量。
Sumygin沒有發(fā)明高斯濺射,但他用最小的可行產(chǎn)品,把這個技術(shù)的商業(yè)潛力翻譯成了開發(fā)者社區(qū)能理解的語言。3.5MB的射擊游戲不會顛覆行業(yè),但它提出的問題值得認真對待:當3D內(nèi)容的體積不再是瓶頸,游戲設(shè)計、分發(fā)渠道、用戶體驗的哪些假設(shè)需要重寫?
下一個用高斯濺射做出爆款的人,可能正在某個城市的公寓里,拿著手機拍攝自己的客廳。而問題留給行業(yè)的是:現(xiàn)有巨頭能否比獨立開發(fā)者更快適應(yīng)這個轉(zhuǎn)變,還是又一次被邊緣創(chuàng)新顛覆?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.