4月27日,螞蟻集團(tuán)旗下靈光App正式上線“體驗(yàn)世界模型”功能,成為業(yè)內(nèi)首個(gè)在移動(dòng)端實(shí)現(xiàn)世界模型交互體驗(yàn)的AGI產(chǎn)品。用戶僅需上傳一張圖片,即可在手機(jī)上生成3D場景并以第一人稱自由探索,單次體驗(yàn)最長可達(dá)60秒,從指令觸發(fā)到場景加載僅需秒級(jí),標(biāo)志著世界模型從高算力平臺(tái)走向普通移動(dòng)終端。
![]()
世界模型是通用人工智能的核心方向之一,也是連接數(shù)字與物理世界的關(guān)鍵載體。此前該技術(shù)普遍依賴高性能計(jì)算設(shè)備,移動(dòng)端部署面臨算力不足、延遲過高、適配性差等工程難題。此次靈光App接入螞蟻?zhàn)匝徐`波LingBot-World-Fast世界模型,該模型已同步開源,為行業(yè)輕量化落地提供技術(shù)支撐。
在使用流程上,用戶打開靈光App,通過對話框上傳圖片,選擇“生成圖中世界”或輸入自然語言指令,即可快速啟動(dòng)3D場景生成。為適配移動(dòng)端操作習(xí)慣,產(chǎn)品采用主流手游雙搖桿操控模式,左側(cè)控制角色前后左右移動(dòng),右側(cè)調(diào)節(jié)視角方向,無需學(xué)習(xí)即可上手,實(shí)現(xiàn)零門檻沉浸式探索。
針對端側(cè)部署難點(diǎn),靈光團(tuán)隊(duì)采用高效低延遲流式傳輸技術(shù),將響應(yīng)延遲控制在百毫秒級(jí),突破世界模型“高門檻、高算力、難普及”的限制。這也是業(yè)內(nèi)首次在手機(jī)端實(shí)現(xiàn)世界模型的長時(shí)一致性與實(shí)時(shí)交互能力,刷新AGI產(chǎn)品體驗(yàn)標(biāo)準(zhǔn)。
螞蟻靈光App負(fù)責(zé)人蔡偉表示,此次功能上線是團(tuán)隊(duì)探索智能邊界的又一突破。此前靈光已推出“閃應(yīng)用”,支持普通用戶30秒自然語言生成應(yīng)用,降低開發(fā)門檻。未來靈光將持續(xù)聚焦用戶需求,推動(dòng)AI技術(shù)輕量化、普惠化,讓更前沿的智能體驗(yàn)觸達(dá)大眾。
目前,該功能已正式上線,用戶可在各大應(yīng)用商店下載靈光App,直接體驗(yàn)圖片生成3D世界的全新交互方式。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.