當整個行業還在爭搶 Agent 、討論 token 更便宜的時候,三個背景截然不同的團隊,把資源壓在了同一個方向。
先是李飛飛團隊,旗下 AI 世界模型公司 World Labs 發布并開源 Spark 2.0,讓任何設備的瀏覽器里流暢運行上億粒子的超大 3D 場景,開始逐漸成為現實。
然后是騰訊,開源混元 3D 世界模型 2.0,輸入一句話,直接生成可走進去、有物理碰撞、能導入游戲引擎的完整 3D 場景。
同一時間,阿里 ATH 創新事業部推出開放式世界模型產品 HappyOyster,支持實時世界創建與交互。
這個巧合值得停下來想一想。
先說騰訊。過去兩年,騰訊混元大模型存在感一直很弱,有聲音稱,前 OpenAI 研究員姚順雨主導的新架構版本將在 4 月亮相。
但騰訊今天發的,偏偏是一個世界模型。
這個選擇讓人意外,但細想又在情理之中。與其在大語言模型賽道和 DeepSeek、豆包、千問繼續打消耗戰,不如在一個新維度上先建起差異化,跑起來再說。
阿里的邏輯則不同。出手的是 ATH 創新事業部,阿里內部一支相對獨立的創新單元。就在4月上旬,ATH 剛憑借視頻生成模型 HappyHorse 登頂全球權威 AI 視頻盲測榜單。從視頻生成到世界模型,沿著同一條空間內容的縱深在推進,節奏很快。但刻意保持了和阿里主品牌的距離,這是一支特種部隊在連續卡位。
把視角拉遠,世界模型賽道現在處于寡頭初現、格局未定的階段。
Google DeepMind 的 Genie 系列有研究深度,但輸出仍然是視頻,好看,拿不走,用不了。World Labs 有李飛飛背書,Spark 解決了一個真實難題,把億級粒子的 3D 場景塞進手機瀏覽器流暢運行,一個鏈接就能分享。但生成端 Marble 已迭代至商用版本,且同樣閉源。
今天三家的入口選擇各不相同。李飛飛守交付,騰訊開源押標準,阿里用特種部隊連續卡位。這本身也說明,這條賽道還沒有標準答案。
過去兩年大模型競爭,本質上是在爭一件事:誰能成為內容生產最好的工具。大語言模型在這個維度上已經打得難分難解,這條賽道正在快速邁向商品化。
世界模型爭的是另一塊地盤:基礎設施。
游戲、具身智能、XR,這幾條正在加速的賽道,都需要一個能低成本、大規模生產物理準確的 3D 世界能力。世界模型,是它們共同的地基。一旦成為底層,就會變成所有東西跑在上面的管道。
語言模型改變了人和信息的關系。世界模型要改變的,是人和現實的關系。
前者已經發生了。
后者,剛剛開始。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.