品玩4月29日訊,據 Arxiv 頁面顯示,微軟研究院與浙江大學聯合團隊正式發布文生視頻模型訓練框架 World-R1。
該框架創新性地利用強化學習技術,使視頻生成模型在無需修改架構且不依賴 3D 數據集的情況下,成功習得 3D 幾何一致性,有效解決了鏡頭大幅移動時物體變形或消失的“幾何幻覺”痛點。
World-R1 的核心機制在于將 3D 一致性約束轉化為強化學習的獎勵信號。系統通過 Depth Anything 3 重建 3DGS 場景并渲染新視角,結合 Qwen3-VL 評分與重建誤差計算獎勵,利用 Flow-GRPO 算法反饋給模型。同時,團隊引入了每 100 步一次的“動態微調”策略,在強化幾何約束的同時,確保人物運動等動態效果的流暢性。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.