本報記者 孫慶陽
“語言模型是過去,智能體是現(xiàn)在,多模態(tài)原生統(tǒng)一是AI下半場。”2026年4月21日至22日,2026中國生成式AI大會(北京站)召開,大會以“奔赴AGI 重塑未來”為主題,匯聚學(xué)界與產(chǎn)業(yè)界專家,主會場圍繞底層技術(shù)、應(yīng)用落地、行業(yè)基建、商業(yè)與投資四大方向展開探討,直指通用人工智能未來的關(guān)鍵突破。
底層技術(shù)持續(xù)突破是根基
“大模型與多模態(tài)技術(shù)是AI發(fā)展的核心底座。”中國人民大學(xué)高瓴人工智能學(xué)院教授趙鑫指出,大模型能力提升的核心遵循擴展定律,“有效利用大規(guī)模算力,是實現(xiàn)AI研究的長期途徑”。他將模型擴展分為訓(xùn)練時間擴展與測試時間擴展,前者通過放大參數(shù)與數(shù)據(jù)量一次性提升能力,后者以推理時間換取效果。同時,強化學(xué)習(xí)是打通模型能力的關(guān)鍵,但強化學(xué)習(xí)并非萬能,無法將弱模型直接提升至高水平,必須平衡探索與利用,才能讓模型在復(fù)雜任務(wù)中保持高準(zhǔn)確率。此外,趙鑫強調(diào),環(huán)境交互與工具使用是拓展模型能力的重要路徑,代碼解釋器、搜索引擎等工具能讓模型“擁有雙手”,解決原本無法完成的復(fù)雜任務(wù)。
Pine AI 首席科學(xué)家李博杰從Claude Code源碼泄露切入,提出Harness Engineering是Agent工程的下一個范式,他認(rèn)為模型之外的一切,都是Harness,這一體系決定了智能體的能力下限。其核心包括上下文壓縮、結(jié)構(gòu)化記憶、安全校驗與錯誤恢復(fù),放棄純向量數(shù)據(jù)庫,改用Markdown+文件系統(tǒng)管理記憶,能有效避免信息偏差。同時,智能體需搭配專用小模型完成權(quán)限分類、記憶檢索等任務(wù),才能實現(xiàn)生產(chǎn)級穩(wěn)定運行。
北京大學(xué)深圳研究生院助理教授&研究員、博士生導(dǎo)師袁粒提出:“語言模型是過去,智能體是現(xiàn)在,多模態(tài)原生統(tǒng)一是AI下半場”。他認(rèn)為,當(dāng)前割裂式多模態(tài)架構(gòu)存在延遲高、信息損失大的問題,無法落地物理世界,只有實現(xiàn)文本、圖像、視頻、3D的原生統(tǒng)一,才能讓AI真正理解物理規(guī)則。他直言,“沒有多模態(tài)原生統(tǒng)一,就沒有真正的AGI”,未來需攻克模態(tài)定義、建模、架構(gòu)統(tǒng)一等五大挑戰(zhàn)。
VAST CTO梁鼎則聚焦AI 3D技術(shù),提出“突破技術(shù)壁壘,AI 3D將重構(gòu)產(chǎn)業(yè)新范式”,依托大模型實現(xiàn)高效、高精度的3D內(nèi)容生成,打破傳統(tǒng)3D生產(chǎn)的效率瓶頸。
應(yīng)用落地是核心
隨著技術(shù)成熟,AI智能體與多模態(tài)創(chuàng)作進(jìn)入實用階段,成為產(chǎn)業(yè)落地的核心載體。智象未來(HiDream.ai)聯(lián)合創(chuàng)始人兼首席技術(shù)官姚霆指出,AI創(chuàng)作已進(jìn)入Agent自主全鏈路編排時代,人只需定目標(biāo)與標(biāo)準(zhǔn),剩余創(chuàng)作全由AI完成。多媒體創(chuàng)作Agent具備長鏈路創(chuàng)作、一致性可控、行業(yè)化適配三大核心能力,可一站式完成圖文、視頻、營銷文案、影視腳本的生成與編輯。他表示,公司自研的原生統(tǒng)一多模態(tài)模型,能實現(xiàn)IP一致性生成與精準(zhǔn)指令跟隨,在圖像生成、視頻編輯等場景的效果達(dá)到行業(yè)領(lǐng)先水平。
在高端對話中,香港大學(xué)助理教授&博士生導(dǎo)師、Nanbot團隊負(fù)責(zé)人黃超表示,Open Claw走紅讓行業(yè)意識到,智能體的核心是自主完成開放域任務(wù),它像人類助手一樣,能無終點地持續(xù)工作,但當(dāng)前智能體仍存在長任務(wù)中斷、環(huán)境適配差等問題。網(wǎng)易有道LoRAsterAI項目負(fù)責(zé)人、智能硬件研發(fā)負(fù)責(zé)人王寧分享了國產(chǎn)開源Agent產(chǎn)品的研發(fā)經(jīng)驗,團隊僅用二十多天就推出輕量化版本,核心是簡化Agent架構(gòu),通用Agent的核心只有Plan、Use、React三步,無需復(fù)雜設(shè)計。他認(rèn)為,國內(nèi)Agent的機會在于企業(yè)級場景,與辦公、教育、硬件深度結(jié)合,才能實現(xiàn)規(guī)模化落地。
黃超補充道,智能體與模型能力相輔相成,隨著用戶需求提升,未來需要Agent完成金融、科研、醫(yī)療等領(lǐng)域的長周期任務(wù),Harness Engineering將成為突破關(guān)鍵。
行業(yè)基建完善是保障
面對“萬模并行”的行業(yè)現(xiàn)狀,Token流通與統(tǒng)一調(diào)度成為AI產(chǎn)業(yè)的核心基建。清程極智聯(lián)合創(chuàng)始人師天魔提出,當(dāng)前Token服務(wù)存在三大痛點:“同模型不同服務(wù)商,效果、價格、穩(wěn)定性差異巨大;服務(wù)黑盒化,量化降質(zhì)、隱性成本頻發(fā);中小客戶無質(zhì)量保障,響應(yīng)慢、錯誤率高”。針對這些問題,其團隊打造的AI Ping平臺,聚合30余家服務(wù)商、600余個模型,通過7×24小時持續(xù)監(jiān)測,為用戶提供客觀評測數(shù)據(jù)。
師天魔強調(diào),AI Ping的核心價值是智能路由,“根據(jù)用戶需求動態(tài)分配最優(yōu)服務(wù)商,可讓平均成本降低37%以上,穩(wěn)定性提升90%以上”。平臺從真實用戶視角出發(fā)做端到端評測,屏蔽接口差異、錯誤碼等行業(yè)痛點,讓用戶無需復(fù)雜測試,就能用上高性價比的Token服務(wù)。
商業(yè)變現(xiàn)是目標(biāo)
哇瑞資本投資合伙人陳石在對話中直言,AI行業(yè)最大的變化是Agent開始在應(yīng)用層掙錢,而不只是硬件廠商獲利。他對比移動互聯(lián)網(wǎng)時代指出,AI無法依賴廣告模式,用戶消耗的Token成本遠(yuǎn)高于廣告收益,未來必須走前向收費+軟硬件結(jié)合的路徑。他建議創(chuàng)業(yè)者,“做不到付費轉(zhuǎn)化就不要盲目擴張,用中國供應(yīng)鏈優(yōu)勢做軟件硬件化,是差異化競爭的關(guān)鍵”。
關(guān)于國內(nèi)AI發(fā)展機遇,陳石認(rèn)為,中國模型成本僅為海外的十分之一,性價比優(yōu)勢顯著,企業(yè)級場景是國內(nèi)Agent的核心突破口,聚焦辦公、財務(wù)、數(shù)據(jù)安全等剛需,能快速實現(xiàn)商業(yè)閉環(huán)。同時,他判斷2026年是AI生態(tài)爆發(fā)與商業(yè)化起點,行業(yè)從技術(shù)驗證走向?qū)嵱寐涞亍?/p>
智東西聯(lián)合創(chuàng)始人、總編輯張國仁總結(jié)道,Open Claw之后,中國AI不再是技術(shù)追趕者,而是生態(tài)創(chuàng)新者,技術(shù)、開源、應(yīng)用、產(chǎn)業(yè)的深度融合,將開啟智能體時代的中國機會。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.