![]()
整理 | 褚杏娟
4 月 16 日,阿里發布可實時構建和交互的世界模型產品 HappyOyster(快樂生蠔)。該產品由阿里 ATH 創新事業部團隊研發,與此前爆火的 同屬一個團隊。
先看下實際效果:
漫游模式暢游世界名畫
HappyOyster 基于原生多模態架構而建,支持多模態理解與音視頻聯合生成。目前產品可實現“漫游(Wander)”和“導演(Direct)”兩大核心能力,用戶可以實時構建可互動、可演繹、可探索的 AI 數字世界。同時,用戶生成的數字世界,不僅能被完整保存,還能開放給其他用戶進行二次創作。
相比大語言模型相對成熟的模型架構和技術范式,世界模型仍屬于前沿探索領域。阿里的 HappyOyster 與谷歌的 Genie3 同屬于世界模擬器流派。
區別于傳統文生視頻模型輸入提示詞、等待渲染、獲得成片的被動流程,這一流派采用長時間跨度上的世界演化建模方式。通過學習海量長視頻數據,以及文本、動作指令、圖像參考等多樣控制信號,模型能夠主動理解空間、物理與因果規律,預測情節和畫面的演變,從而把“被動生成內容”轉變為“主動模擬世界演化”,為構建可交互的通用世界模擬器提供了關鍵技術路徑。
Google DeepMind 團隊在 2024 年提出的一篇世界模型論文中提到,Genie 包含三大部分:
時空視頻 tokenizer,把原始視頻序列壓縮為離散 token,實現高效建模。
自回歸 dynamics 模型,在 token 空間里,按時間步預測未來幀,用類似大語言模型的自回歸方式建模世界演化。
隱式動作(latent action)模型,學習一個低維、離散的“動作空間”,讓智能體的操作在這個空間中被解釋,從而實現“按鍵→畫面變化”的可控交互。
整個系統在訓練階段不需要任何顯式動作標簽或環境規則,只依賴海量未標注視頻,以無監督方式學習“如果這樣動,世界會怎樣變化”的隱含規律。最終,Genie 可以不依賴特定游戲引擎,從多模態提示生成可玩世界,并實現逐幀交互。這些特性使 Genie 被視為早期的世界模擬器。
而這次阿里發布的 HappyOyster 也直指谷歌 Genie 3。官方表示,HappyOyster 采用了時間跨度更長的世界演化建模方式,使得模型能夠保持高保真、長時序的動態場景生成。同時在建模初始就設計了多樣的控制信號,使模型能夠在統一的時序框架下同時實現生成質量、長時序與實時可控性的協同優化。
在產品能力上,HappyOyster 呈現出差異化優勢。不僅能支持 Wander 漫游探索,還獨家提供實時導演功能,用戶可通過自然語言指令隨時介入世界演化、調度角色事件,實現從被動探索到主動創作的跨越。在視覺表現上,HappyOyster 漫游模式的畫面質量更高,風格泛化能力更強,動態性更好。
導演模式可在任意節點改變劇情走向
當前,在漫游模式中,用戶僅需一句話或一張圖,即可生成具備物理一致性的完整空間,物體位置穩定、場景持久存在,視角與光照也能跟隨第一人稱視角持續移動;此外,用戶能自由切換方向與鏡頭運動,突破初始畫框的邊界,體驗無限延展的探索樂趣。目前 Happy Oyster 支持長達 1 分鐘的連續實時位移與鏡頭控制,并支持多樣化的風格切換。
漫游模式控制人物運動
在導演模式下,用戶能夠在視頻的任意節點,通過文字、語音或圖像等多模態輸入,隨時實現鏡頭切換、劇情改寫、角色調度,在充分的交互中生成一個光照、重力、角色動作與場景因果持續演化的世界,并能選擇題材風格。導演模式支持連續生成 3 分鐘以上的 480p 或 720p 實時畫面。
不過,當前漫游與導演兩大模式尚未完全打通,但未來用戶有望在漫游過程中直接與世界深度互動、實時改寫場景規則,真正實現邊探索、邊創造的無縫融合體驗。
會議推薦
QCon 全球軟件開發大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節跳動、小米、百度等一線科技企業與創新團隊的技術專家,圍繞 AI 工程化、系統架構與研發模式演進展開深入探討。更多詳情可掃碼或聯系票務經理 18514549229 進行咨詢。
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.