![]()
智東西
作者 GenAICon 2026
短短8天,全球AI領(lǐng)域發(fā)生的重磅新聞,發(fā)布節(jié)奏之密、信息密度之高、資金體量之大、涉及玩家之廣,堪稱(chēng)驚心動(dòng)魄。
從4月16日到24日,Anthropic Claude Opus 4.7、阿里Qwen3.6-Max、月之暗面Kimi K2.6、OpenAI ChatGPT Images 2.0、螞蟻Ling-2.6-flash、小米MiMo-V2.5-Pro、騰訊Hy3、OpenAI GPT-5.5、DeepSeek-V4等9款前沿模型扎堆發(fā)布。
同一時(shí)期,亞馬遜和谷歌相繼表示分別擬向Anthropic投資250億美元和400億美元,馬斯克SpaceX宣布擬以600億美元收購(gòu)AI編程獨(dú)角獸Cursor,DeepSeek啟動(dòng)外部融資的傳聞亦沸沸揚(yáng)揚(yáng)。
這一周大事串聯(lián)起來(lái),映射出5個(gè)清晰的趨勢(shì):
- AI競(jìng)爭(zhēng)的核心戰(zhàn)場(chǎng)已從“聊天”轉(zhuǎn)向“干活”;
- 中美AI頭部梯隊(duì)基本形成,并在持續(xù)沖鋒;
- 中國(guó)AI在開(kāi)源和成本效率上展現(xiàn)出獨(dú)特競(jìng)爭(zhēng)力;
- 算力基礎(chǔ)設(shè)施將成為影響AI競(jìng)賽節(jié)奏的關(guān)鍵因素;
- “投資+競(jìng)爭(zhēng)+合作”的新型多重產(chǎn)業(yè)關(guān)系正在確立。
值此期間,4月21日至22日,2026中國(guó)生成式AI大會(huì)(北京站)圓滿(mǎn)舉行。
大會(huì)由智東西主辦、智猩猩聯(lián)合主辦,集結(jié)73位產(chǎn)學(xué)研投嘉賓,圍繞“奔赴AGI 重塑未來(lái)”主題,通過(guò)1場(chǎng)開(kāi)幕式、3場(chǎng)專(zhuān)題論壇、6場(chǎng)技術(shù)研討會(huì),全景式解析AI產(chǎn)業(yè)的產(chǎn)業(yè)脈絡(luò)、創(chuàng)新范式、Token經(jīng)濟(jì)與中國(guó)機(jī)會(huì)。
議題跨度很大,從大語(yǔ)言模型、多模態(tài)模型、世界模型、智能體、AI眼鏡等前沿模型與應(yīng)用,到數(shù)據(jù)、芯片、存儲(chǔ)、通信、云服務(wù)等基礎(chǔ)設(shè)施。
嘉賓們各抒己見(jiàn),聊痛點(diǎn),講預(yù)判,立足當(dāng)下,探討未來(lái),分享內(nèi)容之豐富,非常挑戰(zhàn)大腦容量。
一個(gè)明確的共識(shí)是,國(guó)產(chǎn)AI戰(zhàn)場(chǎng),已經(jīng)從模型層擴(kuò)展到生態(tài)層。
我們整理了開(kāi)幕式和3場(chǎng)專(zhuān)題論壇的嘉賓們分享的重點(diǎn)信息,希望能對(duì)你有啟發(fā)。
1、大模型怎么變強(qiáng)?達(dá)到垂域?qū)<宜街皇菚r(shí)間問(wèn)題
2、小心養(yǎng)龍蝦、買(mǎi)token踩坑!聊聊大模型服務(wù)商不會(huì)告訴你的那些事
3、從Claude Code泄露代碼,總結(jié)6個(gè)反共識(shí)觀(guān)點(diǎn)
4、OpenClaw之后,智能體時(shí)代的中國(guó)機(jī)會(huì)在哪里?
5、世界模型的多重路徑:視頻生成、多模態(tài)原生統(tǒng)一、3D生成
6、Token消耗量爆發(fā),國(guó)產(chǎn)AI基礎(chǔ)設(shè)施如何協(xié)同與進(jìn)化?
7、大模型下半場(chǎng),競(jìng)爭(zhēng)焦點(diǎn)變成場(chǎng)景、數(shù)據(jù)、品味
8、從“龍蝦”、AI眼鏡到token管理,拆解國(guó)產(chǎn)智能體落地潮
一、大模型怎么變強(qiáng)?達(dá)到垂域?qū)<宜街皇菚r(shí)間問(wèn)題
在開(kāi)幕式上,中國(guó)人民大學(xué)高瓴人工智能學(xué)院教授趙鑫的演講圍繞一個(gè)根本問(wèn)題:大模型怎么變強(qiáng)?
首先,大尺寸模型仍具有顯著的性能優(yōu)勢(shì),通過(guò)預(yù)測(cè)下一個(gè)詞的預(yù)訓(xùn)練范式能夠建立非常強(qiáng)的基礎(chǔ)能力;在后訓(xùn)練方面,一個(gè)重要方向是RLVR(基于結(jié)果監(jiān)督的強(qiáng)化學(xué)習(xí)),能針對(duì)垂直領(lǐng)域提升模型能力,提供了超越“預(yù)測(cè)下一個(gè)詞監(jiān)督訓(xùn)練”的另一條Scaling路線(xiàn),為復(fù)雜智能體環(huán)境的訓(xùn)練構(gòu)建了可行的訓(xùn)練途徑。
接下來(lái),讓大模型學(xué)會(huì)使用工具,如搜索信息、用編程解決問(wèn)題等。代碼執(zhí)行增強(qiáng)的推理鏈,解題過(guò)程更簡(jiǎn)潔清晰,顯著提升推理效率。
隨著任務(wù)復(fù)雜度提升,模型需要進(jìn)行大量輪次的交互,上下文窗口的管理成為挑戰(zhàn)。有兩種思路:一是通過(guò)模型自主壓縮上下文,二是使用文件來(lái)作為上下文的外部存儲(chǔ)介質(zhì)。
在多模態(tài)深度搜索場(chǎng)景中,圖片、視頻等內(nèi)容若直接token化,會(huì)急劇膨脹上下文。一個(gè)解決方案是搜索結(jié)果先寫(xiě)入本地文件系統(tǒng),同時(shí)生成簡(jiǎn)短摘要進(jìn)入上下文窗口,后續(xù)需要時(shí)再按需加載,從而實(shí)現(xiàn)穩(wěn)定的百輪級(jí)多模態(tài)搜索。
![]()
▲趙鑫
給大模型一臺(tái)虛擬電腦(如終端/沙盒),可在非代碼領(lǐng)域激發(fā)通用能力。
大規(guī)模訓(xùn)練需要大量多樣化的環(huán)境,手動(dòng)創(chuàng)建幾萬(wàn)個(gè)環(huán)境不現(xiàn)實(shí)。近期研究顯著增加了智能體類(lèi)數(shù)據(jù)的引入,比如DeepSeek-V3.2在強(qiáng)化學(xué)習(xí)中顯著增加構(gòu)造的智能體任務(wù)和配套環(huán)境,這些仿真環(huán)境旨在低成本高效合成大規(guī)模訓(xùn)練數(shù)據(jù)。
怎么模擬復(fù)雜環(huán)境呢?大多數(shù)智能體操作僅需輕量的沙盒,如果采用基于Docker環(huán)境訓(xùn)練代碼智能體的方法,可擴(kuò)展瓶頸會(huì)集中在Docker執(zhí)行層。此時(shí)可以用大模型代替Docker提供執(zhí)行反饋,來(lái)減少對(duì)真實(shí)Docker的創(chuàng)建需求。
當(dāng)前多智能體系統(tǒng)的核心挑戰(zhàn)在于長(zhǎng)程任務(wù)的穩(wěn)定性,這需要制定合適的工作流。
對(duì)此,高瓴人工智能學(xué)院開(kāi)源的AiScientist系統(tǒng),將決策層與專(zhuān)家層分開(kāi),編排器專(zhuān)注階段級(jí)決策,專(zhuān)家負(fù)責(zé)復(fù)雜子任務(wù),讓文件成為智能體協(xié)調(diào)“總線(xiàn)”,從而實(shí)現(xiàn)復(fù)雜編排與協(xié)作。
最后,趙鑫教授分享了三點(diǎn)預(yù)判:
1、模型能力擴(kuò)展受限于人的認(rèn)知。目前可利用算力的方式仍然有限,突破需要新的擴(kuò)展范式。
2、大模型達(dá)到垂直領(lǐng)域?qū)<宜街皇菚r(shí)間問(wèn)題,廣義AGI仍然困難。類(lèi)似“下一個(gè)token預(yù)測(cè)”和RLVR這樣的重要訓(xùn)練擴(kuò)展范式,估計(jì)還需要出現(xiàn)1~2次,才能推動(dòng)廣義AGI的實(shí)現(xiàn)。
3、大部分創(chuàng)新是工程創(chuàng)新,AGI需要更多本質(zhì)創(chuàng)新。模型能力與Harness的發(fā)展是螺旋上升、互相適配的,基礎(chǔ)設(shè)施補(bǔ)強(qiáng)模型短板,模型提升后再推動(dòng)基礎(chǔ)設(shè)施演進(jìn);技術(shù)難以形成持久的護(hù)城河,人才、數(shù)據(jù)更為關(guān)鍵。
二、小心養(yǎng)龍蝦、買(mǎi)token踩坑!聊聊大模型服務(wù)商不會(huì)告訴你的那些事
清程極智聯(lián)合創(chuàng)始人師天麾點(diǎn)破了當(dāng)前token行業(yè)亂象——買(mǎi)token藏有很多坑。
同一個(gè)模型,在不同服務(wù)商處購(gòu)買(mǎi),效果不同,最終花費(fèi)不同,服務(wù)質(zhì)量可能差別巨大。
有次評(píng)測(cè),他們發(fā)現(xiàn)某個(gè)服務(wù)商的模型明顯有問(wèn)題,問(wèn)過(guò)后,服務(wù)商承認(rèn)用的是int4。這種量化能把成本壓得非常低,但是模型效果很差。
提供同一個(gè)模型,報(bào)價(jià)便宜的服務(wù)商反而可能用起來(lái)總成本更高,因?yàn)?strong>緩存命中率不一樣。
緩存命中率是一個(gè)非常影響總成本的指標(biāo)。各家服務(wù)商因?yàn)榧夹g(shù)不同,緩存命中率相差很大,好的能超過(guò)80%,差的緩存幾乎跟沒(méi)有一樣。
但服務(wù)商不會(huì)告訴客戶(hù)這件事。
![]()
▲師天麾
AI Ping團(tuán)隊(duì)對(duì)國(guó)內(nèi)30多家服務(wù)商的600個(gè)大模型API服務(wù)進(jìn)行了測(cè)試,服務(wù)商包括模型廠(chǎng)商、互聯(lián)網(wǎng)大廠(chǎng)、云上市公司和MaaS廠(chǎng)商。
根據(jù)他們的測(cè)試,大型服務(wù)商(如云廠(chǎng)商、電信運(yùn)營(yíng)商),在提供相同的模型服務(wù)、價(jià)格相近的情況下,各家服務(wù)性能可能相差5倍甚至更多。
他們觀(guān)察到,近期國(guó)內(nèi)各家服務(wù)商的服務(wù)質(zhì)量,相比去年年底明顯差了很多。許多服務(wù)商不能給中小客戶(hù)保證質(zhì)量,響應(yīng)慢、有明顯性能問(wèn)題。
“養(yǎng)龍蝦”等行業(yè)熱潮火爆,導(dǎo)致token供不應(yīng)求,又貴又慢。token服務(wù)又是黑盒,行業(yè)發(fā)展很快,也很亂,那怎么選對(duì)token服務(wù)商?
師天麾安利了清程極智研發(fā)的AI Ping:它對(duì)用戶(hù)關(guān)心的大模型服務(wù)指標(biāo)做了全面評(píng)測(cè)和匯總,并提供篩選排序和智能路由功能,以便用戶(hù)對(duì)不同大模型API服務(wù)進(jìn)行7×24評(píng)測(cè)和按需調(diào)用服務(wù)。
三、從Claude Code泄露代碼,總結(jié)6個(gè)反共識(shí)觀(guān)點(diǎn)
Pine AI首席科學(xué)家李博杰重點(diǎn)聊了聊從Claude Code泄露代碼中的收獲。
在他看來(lái),Claude Code源碼里的五層權(quán)限判斷、錯(cuò)誤恢復(fù)、安全防護(hù)工具集、反蒸餾防御機(jī)制等設(shè)計(jì),還有用做研究的方法做產(chǎn)品,都非常值得學(xué)習(xí)。
![]()
▲李博杰
李博杰還分享了從中總結(jié)出的6個(gè)反共識(shí)觀(guān)點(diǎn):
1、圖形界面(GUI)的價(jià)值將逐漸降低,軟件價(jià)值正從界面轉(zhuǎn)向數(shù)據(jù)治理,沒(méi)有數(shù)據(jù)壁壘的SaaS大概率被干掉。
智能體閱讀和思考速度遠(yuǎn)超人類(lèi),但操作GUI的速度比人慢,因此GUI對(duì)智能體不友好。
Claude Code就是典型的GUI價(jià)值低、業(yè)務(wù)邏輯與數(shù)據(jù)治理價(jià)值高的產(chǎn)品形態(tài),51萬(wàn)行源碼里沒(méi)有一個(gè)產(chǎn)品級(jí)GUI。
2、上下文是人類(lèi)避免被AI取代的護(hù)城河。
AI能訪(fǎng)問(wèn)的上下文遠(yuǎn)低于一個(gè)人類(lèi)員工,比如吃飯時(shí)聊出來(lái)的設(shè)計(jì)目的、屎山代碼里的坑、沒(méi)表達(dá)出來(lái)的內(nèi)心想法。
告訴AI合適的上下文,也是用好AI的關(guān)鍵。
3、AI原生組織,本質(zhì)是用AI替代傳統(tǒng)的“上傳下達(dá)”層級(jí)結(jié)構(gòu)。
Anthropic、Kimi等公司的中層大幅壓縮,實(shí)現(xiàn)良好的上下文共享,讓高層看到基層信號(hào),讓基層直接看到戰(zhàn)略上下文。
“砍掉高層的手腳,砍掉中層的屁股,砍掉基層的腦袋”,這個(gè)段子在AI原生公司中不成立了。
4、哪些人會(huì)被AI替代?
頭部(高價(jià)值決策與創(chuàng)造)和尾部(與物理世界深度集成的工作)相對(duì)安全,腰部(執(zhí)行型、無(wú)泛化能力的標(biāo)準(zhǔn)化工作)最為危險(xiǎn)。
AI是技術(shù)能力的放大器,推動(dòng)非技術(shù)能力的重要性比重上升。學(xué)習(xí)新知識(shí)、適應(yīng)新場(chǎng)景的能力很關(guān)鍵。
一人公司(OPC)不是一個(gè)人能開(kāi)發(fā)App,大多數(shù)獨(dú)立開(kāi)發(fā)者的瓶頸不是寫(xiě)不出代碼,而是獲客、信任、運(yùn)營(yíng)這些稀缺能力。
5、“模型即Agent”遠(yuǎn)遠(yuǎn)不夠。
真正的智能體里有一堆復(fù)雜的Harness來(lái)兜底解決模型搞不定的部分,代碼量遠(yuǎn)超工具+提示詞本身。只有模型公司同時(shí)控制應(yīng)用層和兜底工程。
Agent= Model x Harness。大模型提供“大腦”,而Harness提供了“手腳”和“韁繩”,包括上下文怎么給、工具怎么調(diào)用、出錯(cuò)怎么恢復(fù)、安全怎么保障、緩存怎么共享、并行怎么協(xié)調(diào)等。
6、應(yīng)用層公司的護(hù)城河在技術(shù)之外。
Harness里的“屎山”反映了模型內(nèi)部模型團(tuán)隊(duì)和應(yīng)用團(tuán)隊(duì)之間的張力,是應(yīng)用層短期的技術(shù)杠桿,但是技術(shù)優(yōu)勢(shì)會(huì)被模型公司的飛輪吃掉。
頂尖模型的差距還會(huì)繼續(xù)拉大,中端模型將趨于商品化。應(yīng)用層公司的長(zhǎng)期護(hù)城河是數(shù)據(jù)、渠道、拍照、用戶(hù)信任、網(wǎng)絡(luò)效應(yīng)等等。
四、高端對(duì)話(huà):OpenClaw之后,智能體時(shí)代的中國(guó)機(jī)會(huì)在哪里?
高端對(duì)話(huà)環(huán)節(jié)由智東西聯(lián)合創(chuàng)始人、總編輯張國(guó)仁主持,三位嘉賓均在智能體領(lǐng)域頗有建樹(shù),分別是香港大學(xué)助理教授&博士生導(dǎo)師、Nanobot團(tuán)隊(duì)負(fù)責(zé)人黃超,網(wǎng)易有道LobsterAI項(xiàng)目負(fù)責(zé)人、智能硬件研發(fā)負(fù)責(zé)人王寧,峰瑞資本投資合伙人陳石。
黃超團(tuán)隊(duì)的Nanobot開(kāi)源項(xiàng)目?jī)H用約4000行代碼,實(shí)現(xiàn)了原版OpenClaw用43萬(wàn)行(現(xiàn)已超百萬(wàn)行)代碼的核心功能。
王寧團(tuán)隊(duì)的LobsterAI是國(guó)內(nèi)大廠(chǎng)第一個(gè)開(kāi)源的桌面級(jí)智能體產(chǎn)品,1周獲得超過(guò)3k star,還被OpenClaw創(chuàng)始人Peter Steinberger發(fā)文夸贊。
陳石有超過(guò)15年的連續(xù)創(chuàng)業(yè)經(jīng)歷,曾任阿里高管,曾經(jīng)是一名快樂(lè)的程序員和用戶(hù)增長(zhǎng)專(zhuān)家,如今也是一位對(duì)AI行業(yè)深入跟蹤觀(guān)察的投資人。
![]()
▲從左到右:張國(guó)仁、黃超、王寧、陳石
1、智能體行業(yè)變化太快,2026年會(huì)是標(biāo)志性一年
黃超:智能體演進(jìn)太快了,去年底MCP普及到現(xiàn)在的Skill和Harness,僅三四個(gè)月。2026年可能是智能體生態(tài)爆發(fā)的一年,智能體的能力邊界擴(kuò)展需要整個(gè)Skill生態(tài)、環(huán)境交互體系的協(xié)同成熟。
王寧:OpenClaw大大加速整個(gè)智能體落地進(jìn)程,各行業(yè)都認(rèn)識(shí)到智能體能幫企業(yè)干活、提效、掙錢(qián)。去年Chat類(lèi)產(chǎn)品一直在找營(yíng)收來(lái)源,比如靠廣告,其實(shí)沒(méi)掙太多錢(qián)。今年可能是Agent產(chǎn)品商業(yè)化爆發(fā)的起點(diǎn),真正能向用戶(hù)和企業(yè)收費(fèi)的Agent產(chǎn)品出現(xiàn)。
陳石:從去年下半年到今年年初,AI行業(yè)最大的變化是智能體開(kāi)始在應(yīng)用層掙錢(qián)了,不再只是英偉達(dá)掙錢(qián)。OpenClaw開(kāi)啟新的智能體范式,今年可能是AI真正能被大眾用起來(lái)的一年。
2、工程粗糙卻范式創(chuàng)新,OpenClaw為何能改變AI行業(yè)?
黃超:它的交互模式是創(chuàng)新的,看似簡(jiǎn)單的設(shè)計(jì),讓社區(qū)感受到智能體更加主動(dòng)。此前的智能體工具感太重,OpenClaw點(diǎn)燃了人們對(duì)”通用個(gè)人助手”的長(zhǎng)期期待。
王寧:類(lèi)比移動(dòng)互聯(lián)網(wǎng)早期,很多App最初都是小團(tuán)隊(duì)做的、很粗糙,但商業(yè)模式和用戶(hù)場(chǎng)景滿(mǎn)足得很好。OpenClaw做了類(lèi)似的事。
陳石:它也許在工程上還比較粗糙,但應(yīng)用范式創(chuàng)新對(duì)行業(yè)影響非常大。
3、OpenClaw降溫了?現(xiàn)象級(jí)產(chǎn)品完成歷史使命
陳石:當(dāng)前OpenClaw本身可能并不是一個(gè)特別優(yōu)質(zhì)的產(chǎn)品,但它是一個(gè)象征意義重大的現(xiàn)象級(jí)產(chǎn)品,它的核心定位是在“開(kāi)放域里做無(wú)終點(diǎn)的事”,這是人類(lèi)歷史上是第一次讓普通用戶(hù)用AI在數(shù)字世界中進(jìn)行不設(shè)限制的探索。之前的智能體產(chǎn)品包括Claude Code、Claude Cowork和Manus都不在這個(gè)定位。OpenClaw更像是普通人心中的“數(shù)字助手”或者“數(shù)字伙伴”的形象。
王寧:DeepSeek 也是大概火了兩個(gè)月,但之后它讓“推理能力”快速滲透到了各行各業(yè)。OpenClaw也有點(diǎn)類(lèi)似,它也加速了Agent產(chǎn)品走向更廣泛的行業(yè)應(yīng)用。熱度會(huì)回落,但能力滲透一旦開(kāi)始,真正的行業(yè)價(jià)值才剛剛開(kāi)始釋放。
黃超:降溫可能是因?yàn)閠oken燒得多,事情做得沒(méi)達(dá)到預(yù)期。OpenClaw完成了它的使命,建立了智能體在用戶(hù)中的心智。熱度下去說(shuō)不定是好事,可以讓大家沉淀下來(lái)思考:什么時(shí)候需要讓OpenClaw變成真正能幫我們搬磚的打工人。
4、高質(zhì)量Skill很少,Harness極其重要
黃超:雖然很多to-use模塊從MCP進(jìn)化到Skill,Skill像MCP工具調(diào)用說(shuō)明書(shū),但MCP存在的問(wèn)題,Skill也存在,比如質(zhì)量控制不好。
Skill很多,但高質(zhì)量的Skill很少,檢索與匹配效率低下。未來(lái)需要專(zhuān)門(mén)的平臺(tái)對(duì)高質(zhì)量Skill進(jìn)行管理和分發(fā)。
Harness與模型能力相輔相成。長(zhǎng)程任務(wù)是一大工程挑戰(zhàn),上下文極度爆炸、實(shí)時(shí)環(huán)境交互復(fù)雜、中斷現(xiàn)象普遍,Harness顯得極其重要。
5、當(dāng)前AI行業(yè)的商業(yè)邏輯與創(chuàng)業(yè)建議
陳石:當(dāng)前AI行業(yè)的商業(yè)邏輯與移動(dòng)互聯(lián)網(wǎng)時(shí)代有根本性差異,不能做線(xiàn)性外推。
移動(dòng)互聯(lián)網(wǎng)時(shí)代有個(gè)著名的商業(yè)模式是“羊毛出在豬身上”,免費(fèi)獲客、廣告變現(xiàn),但其前提是單用戶(hù)使用成本很低。但AI產(chǎn)品用戶(hù)使用越多,Token消耗越大,當(dāng)前的成本遠(yuǎn)高于廣告的eCPM,在商業(yè)上根本跑不通。
未來(lái)AI行業(yè)大部分的收入將被token生產(chǎn)與分發(fā)環(huán)節(jié)的公司收走。智能體能夠獨(dú)立存在的機(jī)會(huì),在于廣泛收集人類(lèi)的上下文(操作軌跡、使用場(chǎng)景、業(yè)務(wù)邏輯、行業(yè)知識(shí)),形成模型廠(chǎng)商搶不走的數(shù)據(jù)壁壘,用戶(hù)用得越多,越依賴(lài),護(hù)城河越深。
建議早期智能體創(chuàng)業(yè)公司優(yōu)先考慮“前向收費(fèi)”,做不到就不要盲目擴(kuò)張,說(shuō)明還沒(méi)拿出能讓用戶(hù)愿意付費(fèi)的產(chǎn)品。另一個(gè)建議是“軟飯硬吃”,利用中國(guó)制造業(yè)供應(yīng)鏈優(yōu)勢(shì),在通過(guò)軟件掌握用戶(hù)需求和產(chǎn)品技術(shù)積累后,做出軟硬件一體的產(chǎn)品,這類(lèi)產(chǎn)品到海外很能打。
6、中國(guó)版下一代智能體框架,機(jī)會(huì)在哪?
王寧:OpenClaw給國(guó)內(nèi)大模型廠(chǎng)商帶來(lái)了新的機(jī)會(huì),國(guó)內(nèi)模型價(jià)格大概只有海外模型的1/10,能力上又相差無(wú)幾,特別適合”龍蝦”場(chǎng)景。
企業(yè)級(jí)Agent也有一些新的機(jī)會(huì)。國(guó)內(nèi)已有不少?lài)?guó)企和私企尋求將智能體產(chǎn)品在公司內(nèi)普及,并與內(nèi)部系統(tǒng)打通,需求涵蓋辦公自動(dòng)化、OA、財(cái)務(wù)、ERP和數(shù)據(jù)安全等場(chǎng)景。
黃超:國(guó)內(nèi)一直有應(yīng)用創(chuàng)新基因,有信心國(guó)內(nèi)機(jī)構(gòu)能打造出下一代真正成為打工人的智能體。
五、世界模型的多重路徑:視頻生成、多模態(tài)原生統(tǒng)一、3D生成
語(yǔ)言只是人類(lèi)感知世界的通道之一,圖像、聲音、3D空間等多模態(tài)才構(gòu)成了物理世界的原始語(yǔ)言。
在世界模型方向,三位嘉賓從不同角度的分享,拼在一起很有意思。
1、智象未來(lái)姚霆:多模態(tài)創(chuàng)作智能體走向全模態(tài),即將發(fā)布HiDream-O1-Image圖像大模型
智象未來(lái)(HiDream.ai)聯(lián)合創(chuàng)始人兼CTO姚霆分享說(shuō),隨著語(yǔ)言模型與多模態(tài)大模型能力飛速躍升,多模態(tài)創(chuàng)作智能體的技術(shù)底座已基本成型,并將走向全模態(tài)世界模型。
![]()
▲姚霆
通用智能體的核心能力是:上下文管理、工具調(diào)用、開(kāi)放域?qū)υ?huà)與任務(wù)自動(dòng)化,典型場(chǎng)景如定鬧鐘、訂外賣(mài)、制定旅行規(guī)劃。
在此基礎(chǔ)上,多媒體創(chuàng)作智能體還需解決專(zhuān)業(yè)性、協(xié)作性、一致性與可控性問(wèn)題。其典型任務(wù)包括圖文內(nèi)容創(chuàng)作、視頻高光時(shí)刻剪輯、從故事到腳本到分鏡再到成片的完整視頻生成鏈路等。
當(dāng)前多模態(tài)生成模型的主流架構(gòu)存在一個(gè)缺陷:文本編碼與視覺(jué)編碼相互獨(dú)立,信息交互單向,且視覺(jué)VAE編碼器會(huì)造成信息損失。
下一代架構(gòu)的核心思路是將所有模態(tài)統(tǒng)一輸入到一個(gè)Unified Transformer,同時(shí)完成理解與生成,實(shí)現(xiàn)無(wú)損編碼+原生交互,走向“原生全模態(tài)”。
基于上述架構(gòu),智象未來(lái)即將發(fā)布HiDream-O1-Image系列模型,并將開(kāi)源一個(gè)8B參數(shù)量的版本,該開(kāi)源模型在6項(xiàng)基準(zhǔn)測(cè)試中達(dá)到與FLUX.2、Qwen-Image同量級(jí)甚至略?xún)?yōu)的水平,并適配本地部署和低代碼智能體調(diào)用場(chǎng)景,同步,智象未來(lái)以此架構(gòu)為基礎(chǔ),逐步構(gòu)建智象下一代世界模型。
圍繞多媒體創(chuàng)作需求,智象未來(lái)提出HiDream Agent OS基礎(chǔ)設(shè)施,分為工具層、Skill層、Harness層,可實(shí)現(xiàn)工具、創(chuàng)意、經(jīng)驗(yàn)可復(fù)用。
該團(tuán)隊(duì)已推出全能創(chuàng)作智能體vivago Agent、視頻剪輯智能體HiClip Agent、影視創(chuàng)作智能體幀贊等智能體工具,其中幀贊已累計(jì)制作AI短劇漫劇超過(guò)5000分鐘。
姚霆認(rèn)為,多媒體創(chuàng)作智能體的終極目標(biāo),是讓創(chuàng)作回歸靈感本身,將重復(fù)性、工具性的工作交給智能體,讓人專(zhuān)注于真正屬于人的創(chuàng)造力。
2、北京大學(xué)袁粒:大語(yǔ)言模型快到頭了,多模態(tài)原生統(tǒng)一才是未來(lái)方向
北京大學(xué)深圳研究生院助理教授&研究員、博士生導(dǎo)師袁粒認(rèn)為,大語(yǔ)言模型已逼近極限,多模態(tài)原生統(tǒng)一才是未來(lái),沒(méi)有多模態(tài)原生統(tǒng)一,就沒(méi)有真正的世界模型。
同時(shí),他認(rèn)為將token翻譯成“詞元”是默認(rèn)大模型以語(yǔ)言為中心,這也是為什么GPT-5數(shù)不清人有幾根手指,大模型只專(zhuān)注語(yǔ)言這一模態(tài),無(wú)視其他物理模態(tài)(比如視覺(jué)),無(wú)法真正讓其走向物理AI。
多模型協(xié)作的方式在數(shù)字世界尚可運(yùn)行,但在物理世界存在兩大致命缺陷——高延遲和信息損失。以機(jī)器人搬水為例,這個(gè)任務(wù)對(duì)人類(lèi)來(lái)說(shuō)很簡(jiǎn)單,當(dāng)前絕大多數(shù)機(jī)器人仍無(wú)法流暢完成。
人類(lèi)大腦構(gòu)建的世界模型天然是多模態(tài)、統(tǒng)一的。當(dāng)前所謂的“世界模型”,本質(zhì)上仍是單模態(tài)模型。只有實(shí)現(xiàn)多模態(tài)原生統(tǒng)一,才能構(gòu)建出真正理解物理世界的世界模型。
![]()
▲袁粒
構(gòu)建多模態(tài)原生統(tǒng)一架構(gòu),面臨五大技術(shù)挑戰(zhàn):如何定義“原生多模態(tài)”、自回歸建模與擴(kuò)散建模融合、多模態(tài)視覺(jué)編碼器統(tǒng)一、消解模態(tài)沖突、訓(xùn)練數(shù)據(jù)清洗和標(biāo)注等。
袁粒團(tuán)隊(duì)在多模態(tài)理解、生成、架構(gòu)與統(tǒng)一方向均有一些代表性工作。例如,其Helios原生實(shí)時(shí)視頻架構(gòu)采用自回歸+擴(kuò)散Transformer,無(wú)需KV Cache等加速技巧,單卡可達(dá)近實(shí)時(shí)生成。
袁粒還展示了由其課題組多模態(tài)統(tǒng)一方法生成的圖像,無(wú)論是現(xiàn)實(shí)復(fù)雜場(chǎng)景生成還是數(shù)學(xué)虛擬生成都遠(yuǎn)超其余同期模型水平。
3、VAST梁鼎:3D+視頻,或許才是世界模型的終態(tài)
VAST CTO梁鼎分享說(shuō),3D生成模型正在從單點(diǎn)能力走向完整的生產(chǎn)管線(xiàn)覆蓋,高模與低模兩條關(guān)鍵技術(shù)路線(xiàn)并行發(fā)展,Tripo大模型在游戲、工業(yè)、家裝、潮玩等行業(yè)已產(chǎn)生實(shí)質(zhì)影響,VR/XR與具身智能仿真環(huán)境的建設(shè)也高度依賴(lài)3D能力。
圍繞這兩條技術(shù)路線(xiàn)和對(duì)應(yīng)生產(chǎn)需求,VAST已經(jīng)推出了行業(yè)SOTA的兩款A(yù)I3D大模型:Trpo H3.1和Tripo P1.0。
Tripo H3.1追求高視覺(jué)質(zhì)量與貼圖精細(xì)度,適用于3D打印、工業(yè)設(shè)計(jì)、實(shí)體制造等對(duì)視覺(jué)還原度要求高、無(wú)需實(shí)時(shí)渲染的場(chǎng)景。
Tripo P1.0專(zhuān)為實(shí)時(shí)渲染引擎設(shè)計(jì),核心優(yōu)勢(shì)包括直接從圖片生成低模、生成速度快、生成結(jié)果具備拓?fù)溆押煤蚒V友好的特性等,適用于游戲管線(xiàn)制作、UGC生成式玩法、移動(dòng)端3D資產(chǎn)生成等。
![]()
▲梁鼎
單個(gè)資產(chǎn)的生成只是起點(diǎn),完整的3D制作管線(xiàn)還涉及部件拆分、貼圖編輯、骨骼綁定等環(huán)節(jié)。目前低模上的拆件與綁骨能力、場(chǎng)景級(jí)別的自動(dòng)化生成、從視頻中提取動(dòng)畫(huà)的能力等仍待突破。
當(dāng)前世界模型的構(gòu)建存在兩派:視頻原生派與3D原生派。這與早年3D生成領(lǐng)域2D升維與3D原生的路線(xiàn)之爭(zhēng)很相似。視頻路線(xiàn)的優(yōu)勢(shì)是生成效果好、訓(xùn)練數(shù)據(jù)充足,但存在長(zhǎng)時(shí)序記憶難、多人一致性難、推理成本高等局限性。3D路線(xiàn)的難點(diǎn)在于制作門(mén)檻與畫(huà)質(zhì)上限。
梁鼎認(rèn)為,兩條路線(xiàn)最終很可能走向融合,世界模型的終態(tài)或許是3D與視頻共同驅(qū)動(dòng)的統(tǒng)一方案,3D在其中將扮演不可或缺的結(jié)構(gòu)性角色。
六、Token消耗量爆發(fā),國(guó)產(chǎn)AI基礎(chǔ)設(shè)施如何協(xié)同與進(jìn)化?
無(wú)論是前沿模型訓(xùn)練,還是蓬勃發(fā)展的AI應(yīng)用推理浪潮,都對(duì)AI基礎(chǔ)設(shè)施中的計(jì)算、存儲(chǔ)、互連架構(gòu)提出更高的協(xié)同要求,算力層也正從成本中心演變?yōu)橐詔oken為計(jì)量維度的利潤(rùn)中心。
如何推動(dòng)token成本持續(xù)下降,是擺在AI基礎(chǔ)設(shè)施供應(yīng)商們面前的共同考題。
在AI算力基礎(chǔ)設(shè)施專(zhuān)題論壇,嘉賓們從計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、云服務(wù)等不同維度,分享推動(dòng)國(guó)產(chǎn)AI算力走向普惠的可行路徑。
具身智能芯片方案如何支撐機(jī)器人集群算力需求?企業(yè)使用算力面臨哪些主要痛點(diǎn)?芯片架構(gòu)設(shè)計(jì)如何提升能效比?誰(shuí)是提升token生產(chǎn)效率的隱形障礙?國(guó)產(chǎn)AI算力生態(tài)怎樣形成聚合?來(lái)聽(tīng)聽(tīng)他們的答案。
1、芯橋張?chǎng)危壕呱碇悄苄枰绻?jié)點(diǎn)算力協(xié)同
芯橋半導(dǎo)體解決方案副總裁張?chǎng)握劦溃S著具身智能機(jī)器人從單點(diǎn)執(zhí)行走向群體智能,算力問(wèn)題也從單點(diǎn)性能提升轉(zhuǎn)向跨節(jié)點(diǎn)協(xié)同與分層調(diào)度。
受制于電池續(xù)航、板卡面積等條件,單臺(tái)機(jī)器人的算力存在物理上限。對(duì)此,芯橋半導(dǎo)體提出了五位一體、軟件協(xié)同的“大腦-小腦-肌肉”架構(gòu),通過(guò)分布式方案來(lái)支撐機(jī)器人集群算力需求。
其中,在決策層,X200芯片提供682TOPS峰值算力、819.2GB/s HBM2E帶寬,支持50-100臺(tái)機(jī)器人協(xié)同作業(yè);在感知層,S200邊緣計(jì)算芯片提供128GB顯存、66W被動(dòng)散熱、4800FPS極速解碼,以便機(jī)器人實(shí)時(shí)處理感知數(shù)據(jù)。
芯橋還提供宏觀(guān)任務(wù)調(diào)度與集群管理、精細(xì)單元控制與實(shí)時(shí)狀態(tài)監(jiān)控等功能。
![]()
▲張?chǎng)?/p>
2、Hammerspace王殿清:別浪費(fèi)了GPU服務(wù)器本地存儲(chǔ)
Hammerspace資深解決方案架構(gòu)師王殿清說(shuō),AI產(chǎn)業(yè)正從模型軍備競(jìng)賽轉(zhuǎn)向推理效率、基礎(chǔ)設(shè)施重構(gòu)的系統(tǒng)性競(jìng)爭(zhēng)。存儲(chǔ)基礎(chǔ)設(shè)施存在數(shù)據(jù)分散、傳輸費(fèi)時(shí)費(fèi)力等不便,GPU服務(wù)器本地存儲(chǔ)一直未得到充分利用。打破存儲(chǔ)孤島是AI走向大規(guī)模落地的關(guān)鍵基礎(chǔ)條件。
高性能存儲(chǔ)設(shè)備的速度遠(yuǎn)超外部存儲(chǔ),卻因?yàn)榇鎯?chǔ)孤島、不受保護(hù)、難以在本地存儲(chǔ)和外部共享存儲(chǔ)間移動(dòng)數(shù)據(jù)等問(wèn)題,一直未被使用。以千節(jié)點(diǎn)集群為例,每節(jié)點(diǎn)數(shù)百TB的本地盤(pán)如果僅作臨時(shí)緩存,浪費(fèi)的存儲(chǔ)空間可達(dá)數(shù)百PB。
Hammerspace Tier 0技術(shù)可將GPU服務(wù)器磁盤(pán)配置為一個(gè)或多個(gè)NFS導(dǎo)出,由軟件統(tǒng)一納管,形成為一個(gè)全局可見(jiàn)、共享的存儲(chǔ)層。Meta便基于標(biāo)準(zhǔn)架構(gòu),利用現(xiàn)有服務(wù)器、網(wǎng)絡(luò)、GPU,節(jié)省了多達(dá)數(shù)百萬(wàn)美元。
![]()
▲王殿清
3、GMI Cloud蔣劍彪:今年算力市場(chǎng)呈四大變化
GMI Cloud中國(guó)區(qū)總裁蔣劍彪分享了2026年AI產(chǎn)業(yè)的4大核心趨勢(shì):1)推理成AI基礎(chǔ)設(shè)施的主要市場(chǎng);2)智能體推動(dòng)token消耗千倍級(jí)增長(zhǎng),主要客戶(hù)普遍提前鎖定算力資源;3)AI編程引爆一人公司(OPC)模式,成AIGC應(yīng)用下一個(gè)關(guān)鍵增長(zhǎng)引擎;4)智算中心從存儲(chǔ)倉(cāng)庫(kù)轉(zhuǎn)向算力工廠(chǎng),追求極致算力密度、能效比與token吞吐量。
GMI Cloud是一家領(lǐng)先的AI Native Cloud服務(wù)商,是全球七大Reference Platform NVIDIA Cloud Partner之一,擁有遍布全球的數(shù)據(jù)中心,為企業(yè)AI應(yīng)用提供最新、最優(yōu)的GPU云服務(wù),為全球新創(chuàng)公司、研究機(jī)構(gòu)和大型企業(yè)提供穩(wěn)定安全、高效經(jīng)濟(jì)的AI云服務(wù)解決方案。
蔣劍彪預(yù)告說(shuō),GMI Cloud面向龍蝦智能體(Claws Agents)的全新生態(tài)產(chǎn)品The GMI Claw Marketplace即將上線(xiàn),將面向企業(yè)用戶(hù)和AI開(kāi)發(fā)者,提供一站式端到端解決方案。
![]()
▲蔣劍彪
4、九章云極張磊:讓算力像水電一樣管夠
九章云極DataCanvas解決方案專(zhuān)家張磊總結(jié)說(shuō),企業(yè)使用算力有三大痛點(diǎn)——買(mǎi)不起、用不滿(mǎn)、管不好。九章云極以AI原生基礎(chǔ)設(shè)施與智算云為核心,希望將算力轉(zhuǎn)化為標(biāo)準(zhǔn)化的普惠AI資源。
作為普惠算力的核心載體,九章云極提出了算力服務(wù)單位“度”,定義1度算力=312TFLOPS*1小時(shí),以便將不同算力卡通過(guò)統(tǒng)一技術(shù)指標(biāo)換算為一個(gè)標(biāo)準(zhǔn)度量單位。用戶(hù)可按需購(gòu)買(mǎi)、秒級(jí)啟用,僅對(duì)有效計(jì)算時(shí)間付費(fèi),徹底避免了硬件資源閑置與浪費(fèi),顯著降低了AI研發(fā)與使用的門(mén)檻與總擁有成本(TCO)。
面向AI原生時(shí)代,九章云極打造的Token Factory將算力從成本中心轉(zhuǎn)化為可創(chuàng)造業(yè)務(wù)價(jià)值的增長(zhǎng)中心,以token吞吐量作為核心效率指標(biāo),直接支撐企業(yè)AI競(jìng)爭(zhēng)力提升。智算云平臺(tái)上打造了AI開(kāi)發(fā)一站式賦能與模型調(diào)用服務(wù)能力,并支持跨區(qū)域、跨廠(chǎng)商的算力資源統(tǒng)一調(diào)度與智能編排,為大模型訓(xùn)練、推理、智能體開(kāi)發(fā)等全場(chǎng)景提供高效、穩(wěn)定、彈性的算力支撐。
![]()
▲張磊
5、DDN李凡:疏通AI算力工廠(chǎng)的數(shù)據(jù)管道
DDN中國(guó)技術(shù)總監(jiān)李凡談道,AI基礎(chǔ)設(shè)施的競(jìng)爭(zhēng)已從單一硬件性能轉(zhuǎn)向系統(tǒng)工程能力,英偉達(dá)從2016年起就在其內(nèi)部集群采用DDN AI數(shù)據(jù)智能平臺(tái)。由DDN提供支持的AI工廠(chǎng),GPU利用率可達(dá)99%,顯著降低電力消耗和空間占用。
KV Cache是當(dāng)前分布式推理場(chǎng)景的存儲(chǔ)熱點(diǎn),對(duì)動(dòng)態(tài)擴(kuò)展性與元數(shù)據(jù)性能的要求超過(guò)峰值吞吐。DDN EXA/Infinia KV cache fabric方案可30倍加速推理和智能體,同時(shí)保障低延遲和低成本。
![]()
▲李凡
DDN雖為美國(guó)公司,但中國(guó)本土研發(fā)團(tuán)隊(duì)已從數(shù)人擴(kuò)展至80人,并深度參與國(guó)產(chǎn)算力生態(tài),正與國(guó)產(chǎn)網(wǎng)絡(luò)、國(guó)產(chǎn)算力、大模型廠(chǎng)商合作,推進(jìn)系統(tǒng)級(jí)工程實(shí)踐。
國(guó)產(chǎn)SSD供應(yīng)商大普微旗下多款大容量QLC產(chǎn)品已完成DDN全平臺(tái)測(cè)試認(rèn)證,支持智能體數(shù)據(jù)大容量存儲(chǔ),提供更快的token響應(yīng)。雙方將繼續(xù)深化合作,推出更強(qiáng)的PCIe 5.0 SSD產(chǎn)品組合。
![]()
▲大普微DapuStor高級(jí)總監(jiān)黃明達(dá)
6、光羽芯辰姜漢:存算一體翻倍提升AI芯片能效比
光羽芯辰產(chǎn)品市場(chǎng)總監(jiān)姜漢認(rèn)為,端側(cè)AI生態(tài)不能由單一價(jià)值鏈玩家獨(dú)立推動(dòng),需聯(lián)合從操作系統(tǒng)層到App層的全棧合作伙伴共同構(gòu)建。作為一家端側(cè)AI大模型芯片創(chuàng)企,光羽芯辰已與頭部手機(jī)廠(chǎng)商、頭部PC廠(chǎng)商達(dá)成商業(yè)合作,未來(lái)還考慮應(yīng)用于具身智能機(jī)器人場(chǎng)景。
光羽芯辰是一家由AI頭部企業(yè)與存儲(chǔ)頭部企業(yè)等合資設(shè)立的公司,已完成多輪融資。該公司提出了將存算一體架構(gòu)與3D異構(gòu)集成技術(shù)相結(jié)合的端側(cè)AI解決方案,并率先將該方案實(shí)現(xiàn)于AI芯片產(chǎn)品中。
相比傳統(tǒng)架構(gòu),其存算一體架構(gòu)可實(shí)現(xiàn)5倍能效比、10倍帶寬,響應(yīng)延遲降至1/10。光羽芯辰也提供硬件級(jí)可信執(zhí)行環(huán)境,并與OpenClaw等框架無(wú)縫集成,以加速端側(cè)AI應(yīng)用落地。
![]()
▲姜漢
7、上海AI Lab蔡政:為國(guó)產(chǎn)AI芯片快速搓出高性能算子
上海人工智能實(shí)驗(yàn)室DeepLink團(tuán)隊(duì)工程師蔡政強(qiáng)調(diào),高性能算子體系是英偉達(dá)生態(tài)的核心護(hù)城河,也是國(guó)際AI競(jìng)爭(zhēng)的核心戰(zhàn)場(chǎng),將各類(lèi)基礎(chǔ)設(shè)施、模型能力、芯片技術(shù)、應(yīng)用場(chǎng)景協(xié)同,關(guān)鍵在于一個(gè)性能好、覆蓋廣、可演進(jìn)的算子體系。
目前國(guó)內(nèi)算子開(kāi)發(fā)面臨門(mén)檻高、調(diào)優(yōu)難、架構(gòu)差異大且迭代快、遷移易損失性能等挑戰(zhàn)。
2025年KernelBench首次系統(tǒng)性評(píng)估了大模型自動(dòng)生成高性能算子的能力,結(jié)論是即使最先進(jìn)的模型在One-shot場(chǎng)景下,首輪算子通過(guò)率(編譯正確+精度正確)普遍不超過(guò)90%,甚至剔除掉生成了但是沒(méi)有實(shí)際運(yùn)行的結(jié)果之后,矯正后的算子通過(guò)率普遍不超過(guò)55%。
對(duì)此,DeepLink團(tuán)隊(duì)提出KernelSwift智能體進(jìn)化架構(gòu),更充分地探索Kernel Search Space和利用Test Time Compute。在KernelBench L1/L2/L3測(cè)評(píng)中,該系統(tǒng)在英偉達(dá)平臺(tái)上整體性能領(lǐng)先,并且生成的算子代碼已經(jīng)應(yīng)用于生產(chǎn)級(jí)推理引擎SGLang和LMDeploy。
KernelSwift通過(guò)DeepLink自研AI編譯器DLCompiler的協(xié)同,實(shí)現(xiàn)了對(duì)華為昇騰、沐曦、寒武紀(jì)、海光、平頭哥、天數(shù)智芯等主流國(guó)產(chǎn)芯片的支持,跨平臺(tái)兼容率達(dá)90%。
![]()
▲蔡政
8、探微芯聯(lián)張羽:打造對(duì)標(biāo)英偉達(dá)NVLink的國(guó)產(chǎn)互聯(lián)方案
探微芯聯(lián)超節(jié)點(diǎn)與推訓(xùn)平臺(tái)技術(shù)專(zhuān)家張羽談道,大模型對(duì)顯存有極致要求,單芯片擴(kuò)展已逼近物理瓶頸,Scale-up超節(jié)點(diǎn)是未來(lái)長(zhǎng)期的主要發(fā)展方向,通過(guò)高性能互聯(lián)突破單GPU計(jì)算容量、存儲(chǔ)容量和訪(fǎng)存容量的限制。
探微芯聯(lián)以scale-up互聯(lián)資源池為核心,通過(guò)自研的ACCSwitch芯片與XPU端的ACCLink,將計(jì)算、內(nèi)存、存儲(chǔ)、CPU四大資源池整合成一個(gè)統(tǒng)一的計(jì)算系統(tǒng),并圍繞芯片提供驅(qū)動(dòng)軟件棧,形成scale-up域互聯(lián)整體解決方案。
其方案可幫助計(jì)算卡廠(chǎng)商、DRAM廠(chǎng)商、存儲(chǔ)廠(chǎng)商構(gòu)建對(duì)標(biāo)英偉達(dá)NVLink生態(tài)的國(guó)產(chǎn)scale-up超節(jié)點(diǎn)系統(tǒng)。
![]()
▲張羽
9、圓桌討論:Token爆發(fā)元年,國(guó)產(chǎn)AI算力如何從可用到好用?
AI算力基礎(chǔ)設(shè)施專(zhuān)題論壇的圓桌討論由千芯智算董事長(zhǎng)陳巍主持,三位嘉賓分別是芯橋半導(dǎo)體解決方案副總裁張?chǎng)巍DN中國(guó)技術(shù)總監(jiān)李凡、探微芯聯(lián)超節(jié)點(diǎn)與推訓(xùn)平臺(tái)技術(shù)專(zhuān)家張羽。
陳巍談道,根據(jù)國(guó)家統(tǒng)計(jì)局的數(shù)據(jù),今年3月,我國(guó)日均token調(diào)用量已突破140萬(wàn)億,較2024年初的1000億增長(zhǎng)超過(guò)1400倍。AI推理已不再是單純的堆卡堆算力,而是進(jìn)入token工廠(chǎng)時(shí)代,每生成一個(gè)token,都在極致考驗(yàn)計(jì)算芯片、存儲(chǔ)、互連架構(gòu)的協(xié)同。
隨著推理時(shí)代到來(lái),傳統(tǒng)基礎(chǔ)設(shè)施已無(wú)法滿(mǎn)足智能體和長(zhǎng)鏈路任務(wù)的需求。站在token爆發(fā)元年的風(fēng)口之上,國(guó)產(chǎn)AI算力如何從可用邁向好用?這個(gè)議題非常具有現(xiàn)實(shí)意義。
![]()
▲從左往右:陳巍、張?chǎng)巍⒗罘病堄?/p>
幾位嘉賓分享的一些共識(shí)觀(guān)點(diǎn)包括:
(1)token成本是國(guó)產(chǎn)算力從可用到好用的關(guān)鍵命題,更低成本、更高token產(chǎn)出效率是前提。
(2)系統(tǒng)工程化協(xié)作是短板。發(fā)展計(jì)算、存儲(chǔ)、互聯(lián)、網(wǎng)絡(luò)、運(yùn)維的一體化工程能力,才能真正釋放token工廠(chǎng)的潛力。
(3)中國(guó)團(tuán)隊(duì)在模型量化等軟件層的能力已接近或超越國(guó)際水平,制程、良率等硬件層差距客觀(guān)存在,場(chǎng)景化需求可能會(huì)抹平部分技術(shù)差距。
(4)Scale-Up超節(jié)點(diǎn)是確定性長(zhǎng)期趨勢(shì),是國(guó)產(chǎn)AI算力生態(tài)整合的關(guān)鍵抓手。
(5)AI下一個(gè)爆發(fā)點(diǎn)尚待觀(guān)望。未來(lái)Agent長(zhǎng)時(shí)序主動(dòng)執(zhí)行將改變計(jì)費(fèi)體系,對(duì)硬件成本、集群效率的要求將更嚴(yán)苛。
計(jì)算方面,張?chǎng)握劦紸I芯片設(shè)計(jì)正向定制化模型需求靠攏,例如針對(duì)矩陣計(jì)算做專(zhuān)項(xiàng)硬件加速(參考Groq思路),可同時(shí)實(shí)現(xiàn)資源節(jié)省、性能提升與成本下降,建議加強(qiáng)芯片層與落地場(chǎng)景的溝通,推動(dòng)硬件針對(duì)專(zhuān)屬場(chǎng)景的定制化改造。
在他看來(lái),智能體落地不是單一模型運(yùn)算,而是多模型在不同場(chǎng)景、不同節(jié)點(diǎn)、不同步驟的分場(chǎng)景拆解,是否需要專(zhuān)用芯片支撐仍在探索中。
存儲(chǔ)方面,李凡提出存儲(chǔ)架構(gòu)割裂(HBM、DRAM、SSD各自孤立)是當(dāng)前制約token生產(chǎn)效率的隱性障礙,只有打通才能真正釋放算力。
他認(rèn)為,中國(guó)AI推理基礎(chǔ)設(shè)施的token輸出效率已超越國(guó)外水平,現(xiàn)階段主要問(wèn)題是工程配合與生態(tài)整合不足,仍處于堆卡堆資源的初期階段,缺乏計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、運(yùn)維的系統(tǒng)級(jí)協(xié)作。
通信方面,張羽提到計(jì)算、存儲(chǔ)、互聯(lián)三者之間存在此消彼長(zhǎng)的平衡難題,把存儲(chǔ)做成HBM類(lèi)混合存儲(chǔ)可行,但會(huì)將壓力轉(zhuǎn)移到通信側(cè)。
他建議,芯片內(nèi)部的平衡、芯片間互聯(lián)的平衡、存儲(chǔ)的平衡三者需統(tǒng)一建模,建議構(gòu)建性能建模工具,拆解大模型推理任務(wù)中的算子(通信算子、訪(fǎng)存算子、計(jì)算算子),預(yù)估各階段計(jì)算量、訪(fǎng)存帶寬需求,尋找計(jì)算與通信細(xì)粒度overlap的最優(yōu)點(diǎn),從而實(shí)現(xiàn)最大化性能。
張羽預(yù)計(jì)未來(lái)3~5年,計(jì)算卡廠(chǎng)商、存儲(chǔ)廠(chǎng)商將逐步融入統(tǒng)一的Scale-Up超節(jié)點(diǎn)生態(tài)。
七、大模型下半場(chǎng),競(jìng)爭(zhēng)焦點(diǎn)變成場(chǎng)景、數(shù)據(jù)、品味
在大模型專(zhuān)題論壇上,6位演講嘉賓分別從模型能力演進(jìn)、基礎(chǔ)設(shè)施重構(gòu)、行業(yè)應(yīng)用落地等維度展開(kāi)分享。
模型層面,“任務(wù)完成度”成為廠(chǎng)商關(guān)注重點(diǎn),即能否在真實(shí)場(chǎng)景中交付穩(wěn)定、可靠的結(jié)果。
基礎(chǔ)設(shè)施層面,AI訓(xùn)練和推理需要全新的數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施,AI token工廠(chǎng)的每一層都需要被重新設(shè)計(jì)。
應(yīng)用層面,“理解場(chǎng)景”與“理解人”成為AI落地的必修課。大模型不能再僅僅滿(mǎn)足于簡(jiǎn)單生成,而要能理解語(yǔ)言之外的意圖、業(yè)務(wù)邏輯乃至心理。
1、智譜李子玄:Long Horizon成AI編程新重點(diǎn)
智譜Z.ai負(fù)責(zé)人李子玄認(rèn)為,AI編程的競(jìng)爭(zhēng)焦點(diǎn)正從單點(diǎn)生成轉(zhuǎn)向“Long Horizon(長(zhǎng)程任務(wù))”能力。
他澄清,Long Horizon并非長(zhǎng)度的比較,而是要求模型執(zhí)行任務(wù)的過(guò)程中保持目標(biāo)與邏輯不失真,能從失敗中迭代優(yōu)化,交付高質(zhì)量的結(jié)果。
GLM-5.1正是體現(xiàn)這一能力的模型。
結(jié)合自身實(shí)踐,李子玄提出,如今的AI研究員要像產(chǎn)品經(jīng)理一樣懂場(chǎng)景,評(píng)測(cè)已經(jīng)成為引領(lǐng)模型發(fā)展的重要管理方法。而在PMF方面,企業(yè)需要進(jìn)行前瞻布局與技術(shù)儲(chǔ)備,才能在技術(shù)拐點(diǎn)到來(lái)時(shí)捕捉機(jī)遇。
![]()
▲李子玄
2、阿里云王作書(shū):AI將帶來(lái)全局性機(jī)遇
阿里云千問(wèn)大模型解決方案資深總監(jiān)王作書(shū)觀(guān)察到,大模型已走過(guò)學(xué)術(shù)奠基、產(chǎn)業(yè)投入階段,步入了商業(yè)加速期。當(dāng)前,模型推理能力顯著增強(qiáng),多模態(tài)融合與開(kāi)源生態(tài)日趨成熟,AI正從“聊天”進(jìn)化為核心生產(chǎn)力。
為此,阿里巴巴成立ATH事業(yè)群,圍繞“創(chuàng)造token、輸送token、應(yīng)用token”升級(jí)了其AI戰(zhàn)略,目前已圍繞著文本、多模態(tài)等多條主線(xiàn)研發(fā)模型,最新成果包括Qwen3.6系列模型、Qwen3.5-Omni、萬(wàn)相2.7等。
王作書(shū)透露,阿里大模型團(tuán)隊(duì)未來(lái)的三大技術(shù)目標(biāo)為提升知識(shí)規(guī)模和效率、增強(qiáng)智能水平和多模態(tài)融合。
她還提出了價(jià)值四象限的概念:未來(lái)AI將創(chuàng)新力/勞動(dòng)力為縱軸、產(chǎn)品力/生產(chǎn)力為橫軸持續(xù)擴(kuò)展,推動(dòng)消費(fèi)電子、生產(chǎn)系統(tǒng)等升級(jí),帶來(lái)全局性機(jī)遇。
![]()
▲王作書(shū)
3、焱融科技張文濤:AI競(jìng)爭(zhēng)本質(zhì)是數(shù)據(jù)競(jìng)爭(zhēng)
焱融科技CTO張文濤觀(guān)察到,AI的競(jìng)爭(zhēng)本質(zhì)上是數(shù)據(jù)的競(jìng)爭(zhēng),無(wú)論是訓(xùn)練還是推理,都對(duì)高性能、低延遲、去孤島化的數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施有著迫切需求。
焱融應(yīng)對(duì)上述挑戰(zhàn)的思路是打造一套全棧AI存儲(chǔ)解決方案。具體來(lái)看,該公司的全閃存儲(chǔ)一體機(jī)產(chǎn)品F9000X采用了冷熱數(shù)據(jù)智能分層、彈性網(wǎng)絡(luò)等技術(shù),使得每GiB/s帶寬成本下降60%,并在MLPerf Storage v2.0測(cè)試中排名榜首。
面向推理場(chǎng)景,焱融推出了涵蓋DRAM到本地盤(pán)再到遠(yuǎn)端共享存儲(chǔ)的多級(jí)KVCache緩存管理系統(tǒng)YRCache,并通過(guò)智能預(yù)取、異步卸載、零拷貝等技術(shù)實(shí)現(xiàn)加速。
同時(shí),焱融科技也提供了企業(yè)全域數(shù)據(jù)管理平臺(tái)DataInsight,可以統(tǒng)一納管分散在各處的數(shù)據(jù)孤島,形成統(tǒng)一視圖,并支持自定義數(shù)據(jù)流向,給大模型訓(xùn)練提供便利。
![]()
▲張文濤
4、連信數(shù)字/連心云黃杏:理解“人”是AI進(jìn)入真實(shí)世界的關(guān)鍵
連信數(shù)字/連心云洞見(jiàn)研究院院長(zhǎng)黃杏認(rèn)為,現(xiàn)實(shí)中的管理者、面試官、家長(zhǎng)等群體,常常需要借助語(yǔ)言之外的信息來(lái)理解他人。同樣,當(dāng)前AI雖擅長(zhǎng)處理語(yǔ)言,但若想真正融入真實(shí)世界,就必須理解人心。
連信數(shù)字洞見(jiàn)研究院匯聚了心理學(xué)、算法與大數(shù)據(jù)的跨學(xué)科精英,“洞見(jiàn)人和”人本世界(心理)大模型以全球多源數(shù)據(jù)為底座,通過(guò)多模態(tài)感知與神經(jīng)符號(hào)AI的深度融合,改變了傳統(tǒng)的“經(jīng)驗(yàn)驅(qū)動(dòng)”分析,通過(guò)智能循證分析實(shí)現(xiàn)了對(duì)人類(lèi)的深度洞察與全面刻畫(huà)。
這一模型已在公安、教育、司法、安全生產(chǎn)等行業(yè)落地實(shí)戰(zhàn),并已覆蓋20多個(gè)省市,累計(jì)2000萬(wàn)+人群。
在大會(huì)現(xiàn)場(chǎng),黃杏宣布,即日起,連信的所有模型能力與原生Agent將通過(guò)連心云能力平臺(tái)正式對(duì)外開(kāi)放,賦能更多行業(yè)場(chǎng)景。
![]()
▲黃杏
5、上海AI Lab張鴻杰:統(tǒng)一多模態(tài)模型的關(guān)鍵不是技術(shù)選型
上海AI Lab青年研究員張鴻杰介紹,目前統(tǒng)一多模態(tài)大模型主要采用純自回歸、純擴(kuò)散與其他融合上述架構(gòu)的折中方案。但他認(rèn)為關(guān)鍵不是選路線(xiàn),而是在統(tǒng)一上下文中實(shí)現(xiàn)理解與生成各有所長(zhǎng),讓不同模態(tài)采用最適合的預(yù)測(cè)方式。
基于這一判斷,上海AI Lab研發(fā)了InternVL-U,一個(gè)4B參數(shù)的統(tǒng)一多模態(tài)大模型。具體來(lái)看,InternVL-U擁有統(tǒng)一上下文,但目標(biāo)照模態(tài)實(shí)現(xiàn)自適應(yīng)。這一模型采用InternVL 3.5的主干完成理解和推理,并把像素合成交給MMDiT,從而實(shí)現(xiàn)語(yǔ)義建模和視覺(jué)生成的分工。其理解與生成的視覺(jué)表征也完全解耦,理解用ViT高層語(yǔ)義特征,生成用VAE淺層重建特征,避免沖突。
目前,InternVL-U模型、數(shù)據(jù)管線(xiàn)與評(píng)測(cè)工具鏈均已開(kāi)源,張鴻杰也呼吁社區(qū)一同參與到統(tǒng)一多模態(tài)模型的發(fā)展中來(lái)。
![]()
▲張鴻杰
6、商湯大裝置盧國(guó)強(qiáng):AI系統(tǒng)的核心使用者,將從人轉(zhuǎn)變?yōu)锳gent
商湯大裝置產(chǎn)品總經(jīng)理盧國(guó)強(qiáng)認(rèn)為,行業(yè)正從“AI原生”邁向“Agent原生”新階段,未來(lái)AI系統(tǒng)的核心使用者將從人轉(zhuǎn)變?yōu)锳gent,交互方式、度量衡與安全邊界將因此發(fā)生根本性變化,帶來(lái)對(duì)Agent原生基礎(chǔ)設(shè)施的需求。
從具體設(shè)計(jì)上來(lái)看,Agent原生系統(tǒng)應(yīng)讓每一層都變得可發(fā)現(xiàn)、可理解、可操作。其中,算力層將由成本中心轉(zhuǎn)變?yōu)槔麧?rùn)中心,成為“收入工廠(chǎng)”;平臺(tái)層則通過(guò)token統(tǒng)一度量衡,實(shí)現(xiàn)智能化與標(biāo)準(zhǔn)化;應(yīng)用層需要實(shí)現(xiàn)“AI賦能AI”,使AI具備自主迭代能力。
基于此,商湯大裝置在2026年將愿景從“AI數(shù)字工廠(chǎng)”升級(jí)為“AI Token Factory”。這一工廠(chǎng)的原材料是算力、模型與數(shù)據(jù),生產(chǎn)線(xiàn)是推理引擎、緩存與調(diào)度,產(chǎn)品是token,其每一層都需要進(jìn)行重新審視與設(shè)計(jì),以更好服務(wù)Agent的需求。
![]()
▲盧國(guó)強(qiáng)
7、圓桌討論:AI下半場(chǎng),大模型的演進(jìn)與終局
大模型專(zhuān)題論壇的圓桌討論由中信證券首席計(jì)算機(jī)行業(yè)分析師楊澤原主持,四位嘉賓分別是智譜Z.ai負(fù)責(zé)人李子玄、阿里云千問(wèn)大模型解決方案資深總監(jiān)王作書(shū)、上海AI Lab青年研究員張鴻杰、商湯大裝置產(chǎn)品總經(jīng)理盧國(guó)強(qiáng)。
![]()
▲從左到右:楊澤原、李子玄、王作書(shū)、張鴻杰、盧國(guó)強(qiáng)
4位嘉賓先是結(jié)合自身背景談了幾個(gè)熱點(diǎn)話(huà)題。
編程模型方面,李子玄談道,在該領(lǐng)域保持領(lǐng)先的關(guān)鍵在于“品味”,也就是對(duì)技術(shù)趨勢(shì)的判斷力。對(duì)場(chǎng)景進(jìn)行細(xì)致挖掘、通過(guò)coding plan等渠道獲取反饋也很重要。
談及全模態(tài)模型,王作書(shū)認(rèn)為此類(lèi)模型同時(shí)擁有“眼睛、嘴巴、耳朵”,將推動(dòng)智能邊界向三個(gè)方向拓展,分別是感知邊界、推理邊界和交互邊界,最終在視頻理解、自動(dòng)駕駛、實(shí)時(shí)音視頻交互提供更強(qiáng)的能力與更擬人的體驗(yàn)。
小尺寸多模態(tài)模型與大型原生多模態(tài)模型孰優(yōu)孰劣?張鴻杰稱(chēng),后者雖然架構(gòu)優(yōu)美,但訓(xùn)練代價(jià)大,也無(wú)法繼承現(xiàn)有模型的能力。相比之下,前者可在其他模型基礎(chǔ)上外擴(kuò)生成編輯能力,性能上限也不低。小模型在數(shù)據(jù)方面的短板可以結(jié)合Agent補(bǔ)齊,不必單打獨(dú)斗。
基礎(chǔ)設(shè)施方面,盧國(guó)強(qiáng)分享說(shuō),盡管商湯大裝置已經(jīng)預(yù)判未來(lái)算力需求會(huì)大幅增長(zhǎng),但其增幅仍然遠(yuǎn)遠(yuǎn)超出預(yù)期。在推理時(shí)代,模型獲得的輸入要遠(yuǎn)大于模型的輸出,這對(duì)基礎(chǔ)設(shè)施的每一層都提出挑戰(zhàn),尤其是緩存效率。
嘉賓們也就幾個(gè)共同話(huà)題分享了觀(guān)點(diǎn)。
模型架構(gòu)、能力和場(chǎng)景迭代方面,多模態(tài)、空間智能、長(zhǎng)鏈路等被頻繁提及。李子玄總結(jié)道,目前模型迭代的本質(zhì)是智能提升和token效率優(yōu)化的循環(huán),新應(yīng)用場(chǎng)景可能會(huì)因推理速度和穩(wěn)定性的提升而迎來(lái)爆發(fā)。
年初的龍蝦熱讓Harness走進(jìn)主流視野。4位嘉賓認(rèn)為,Harness可能會(huì)被模型逐漸內(nèi)化,或是與具體行業(yè)和場(chǎng)景結(jié)合得更為密切。
王作書(shū)談道,當(dāng)前Harness是模型的放大器,但長(zhǎng)期看會(huì)變成基礎(chǔ)設(shè)施被隱藏,模型向下做深邏輯與工具調(diào)用能力,Harness向上融入行業(yè)。張鴻杰覺(jué)得共生與內(nèi)化是漸進(jìn)過(guò)程,多模態(tài)的Harness比文本更具挑戰(zhàn)。盧國(guó)強(qiáng)提出模型決定上限,而Harness決定下限,兩者缺一不可。李子玄則預(yù)判,未來(lái)模型可能會(huì)自己“上發(fā)條”,不再依賴(lài)Harness,人只負(fù)責(zé)補(bǔ)充上下文。
談及廠(chǎng)商的全棧自主能力,幾位嘉賓都認(rèn)可其商業(yè)價(jià)值,但也不主張絕對(duì)化,而是要做好權(quán)衡與生態(tài)協(xié)同。全棧自主的落腳點(diǎn)最終仍是提供優(yōu)質(zhì)、穩(wěn)定、高效的服務(wù)與商業(yè)價(jià)值。
八、從“龍蝦”、AI眼鏡到token管理,拆解國(guó)產(chǎn)智能體落地潮
在AI智能體專(zhuān)題論壇,8位嘉賓分別從底層架構(gòu)、技術(shù)演進(jìn)、模型創(chuàng)新、硬件載體、垂直場(chǎng)景落地及企業(yè)級(jí)管控工具等方面,拆解智能體商業(yè)化路徑。
從大廠(chǎng)打造的開(kāi)源桌面級(jí)“龍蝦”產(chǎn)品、智能體底層架構(gòu)創(chuàng)新,到AI編程、AI營(yíng)銷(xiāo)、AI眼鏡、token管理等賽道,他們正在推動(dòng)智能體更好地幫人們做事。
1、網(wǎng)易有道王寧:20余天速成國(guó)內(nèi)首個(gè)桌面級(jí)“龍蝦”
網(wǎng)易有道LobsterAI項(xiàng)目負(fù)責(zé)人、智能硬件研發(fā)負(fù)責(zé)人王寧分享說(shuō),他們經(jīng)過(guò)20余天快速打磨,2月19日正式推出國(guó)內(nèi)大廠(chǎng)的第一個(gè)開(kāi)源桌面級(jí)“龍蝦”LobsterAI。
其內(nèi)部認(rèn)為,OpenClaw是Agent時(shí)代的Linux系統(tǒng),因此他們將有道“龍蝦”底層架構(gòu)切換為OpenClaw,上層保留自研GUI與業(yè)務(wù)流程,通過(guò)進(jìn)程通信實(shí)現(xiàn)兼容。
他提到Agent產(chǎn)品的未來(lái)新機(jī)遇包括Agent向各領(lǐng)域滲透、Skill即服務(wù)、開(kāi)源生態(tài)共建、AI Native工作流、多Agent協(xié)作、Agent原生硬件等。
![]()
▲王寧
2、階躍星辰袁微:Agent技術(shù)核心轉(zhuǎn)向外部環(huán)境構(gòu)建
階躍星辰算法專(zhuān)家袁微提到AI Agent的演進(jìn)包括三個(gè)階段,分別是提示詞工程時(shí)代、上下文工程時(shí)代、Harness Engineering時(shí)代,當(dāng)下焦點(diǎn)已從模型本身轉(zhuǎn)向構(gòu)建完善外部運(yùn)行環(huán)境,是Agent從Demo走向產(chǎn)品的關(guān)鍵。
當(dāng)前處于Agent能力躍遷拐點(diǎn),技術(shù)核心從模型競(jìng)賽轉(zhuǎn)向系統(tǒng)工程與環(huán)境構(gòu)建,Harness + OpenClaw是將基礎(chǔ)模型能力轉(zhuǎn)化為企業(yè)級(jí)可交付Agent產(chǎn)品的關(guān)鍵方案。其中,Harness是Agent的腳手架,對(duì)應(yīng)系統(tǒng)層,OpenClaw是Agent的調(diào)度引擎。
![]()
▲袁微
3、華為林煒哲:DLLM Agent有望成為下一代Agent系統(tǒng)基石
華為中央研究院先進(jìn)計(jì)算與存儲(chǔ)實(shí)驗(yàn)室大模型算法專(zhuān)家林煒哲提到,Diffusion模型在同等訓(xùn)練條件的智能體場(chǎng)景下,比AR Agent更快、規(guī)劃更優(yōu)、端到端效率更高。
他們研究發(fā)現(xiàn),DLLM Agent在同等序列長(zhǎng)度、輪次約束下,能保持與AR Agent一致的任務(wù)精度,同時(shí)還能實(shí)現(xiàn)信息搜集調(diào)用量顯著下降、任務(wù)拆分更精準(zhǔn)、搜索輪次更少、耗時(shí)更短,疊加輕量采樣算法可大幅提高精度,而AR Agent疊加復(fù)雜算法會(huì)顯著增加消耗,進(jìn)一步拉開(kāi)性能差距。
林煒哲認(rèn)為,DLLM Agent有望成為下一代Agent系統(tǒng)重要基石。
![]()
▲林煒哲
4、雷鳥(niǎo)創(chuàng)新程思婕:兩大判斷定調(diào)眼鏡是下一代AI最佳載體
如今智能眼鏡進(jìn)入爆發(fā)期,蘋(píng)果、小米、阿里等大廠(chǎng)入局,賽道轉(zhuǎn)向紅海。雷鳥(niǎo)創(chuàng)新AI負(fù)責(zé)人程思婕拋出結(jié)論:眼鏡是下一代AI的最佳載體。其兩大判斷依據(jù)是,眼鏡是最佳的全域數(shù)據(jù)采集終端和隨身智能體載體。
一方面,眼鏡可以全天候貼身佩戴、無(wú)感采集第一人稱(chēng)交互數(shù)據(jù)、搶占物理世界原生數(shù)據(jù)入口,另一方面,其適配原生語(yǔ)音交互,支持一句話(huà)完成任務(wù)、打造個(gè)人隨身外腦、下一代個(gè)性化推薦系統(tǒng)。
此外她認(rèn)為,相較于機(jī)器人,智能眼鏡作為AI載體的優(yōu)勢(shì)是,可以通過(guò)數(shù)據(jù)飛輪實(shí)現(xiàn)數(shù)據(jù)閉環(huán)與模型迭代,僅作為輔助決策的“外腦”,無(wú)需底層控制,從而規(guī)避機(jī)器人的數(shù)據(jù)瓶頸、底層控制難題。
![]()
▲程思婕
5、阿里云沈林:5個(gè)準(zhǔn)則打通Agent上下文環(huán)境數(shù)據(jù)構(gòu)造
阿里云高級(jí)技術(shù)專(zhuān)家沈林分享了EventHouse實(shí)踐的5個(gè)準(zhǔn)則:
(1)Think like an Agent,給你的Agent足夠的信息感知能力;
(2)給你的信息編寫(xiě)一本“圖書(shū)館館藏目錄”;
(3)知識(shí)不是“信息囤積”,和你的Agent做好“知識(shí)對(duì)賬”;
(4)每次知識(shí)迭代都是一次生產(chǎn)級(jí)變更發(fā)布;
(5)“簡(jiǎn)單”、“可靠”不是錦上添花,而是很多行業(yè)的入場(chǎng)券。
![]()
▲沈林
6、極狐馭碼宋健:AI Coding已進(jìn)入準(zhǔn)交付級(jí)編程階段
AI Coding是AI技術(shù)落地的高價(jià)值入口,但目前市場(chǎng)上對(duì)AI Coding存在“玩具論”和“萬(wàn)能論”兩大暴論。極狐馭碼資深A(yù)I解決方案架構(gòu)師宋健認(rèn)為兩種觀(guān)點(diǎn)均有失偏頗,AI Coding已進(jìn)入準(zhǔn)交付級(jí)編程階段,有實(shí)用價(jià)值但仍需工程團(tuán)隊(duì)投入時(shí)間學(xué)習(xí)和實(shí)踐。
AI Coding智能體的五大關(guān)鍵技術(shù)是模式、規(guī)則、工作流、MCP、Skills,模式是將智能體預(yù)先劃分成不同角色、規(guī)則是為智能體定規(guī)矩、工作流類(lèi)似寫(xiě)腳本、MCP是擴(kuò)展智能體能力的工具箱、Skills是原子化的功能插件,協(xié)同用好這些關(guān)鍵技術(shù)和功能是企業(yè)實(shí)施AI Coding的關(guān)鍵。
![]()
▲宋健
7、Noumena AI趙歡:AI營(yíng)銷(xiāo)增長(zhǎng)潛力僅次于編程
Noumena AI(物自體科技)聯(lián)合創(chuàng)始人、產(chǎn)品算法負(fù)責(zé)人趙歡的判斷是,營(yíng)銷(xiāo)是僅次于AI Coding領(lǐng)域的爆發(fā)式增長(zhǎng)場(chǎng)景,且與Coding場(chǎng)景邏輯完全不同。
營(yíng)銷(xiāo)場(chǎng)景面臨數(shù)據(jù)割裂、人員流失導(dǎo)致經(jīng)驗(yàn)丟失、平臺(tái)算法迭代快、品牌方難以適配等痛點(diǎn)。Noumena AI推出了營(yíng)銷(xiāo)行業(yè)的龍蝦產(chǎn)品GrowClaw,不僅能解決典型的營(yíng)銷(xiāo)問(wèn)題比如內(nèi)容洞察,達(dá)人篩選,內(nèi)容運(yùn)營(yíng),投流分享等,還可以適配持續(xù)維護(hù)狀態(tài)、持續(xù)更新、多方協(xié)作的營(yíng)銷(xiāo)業(yè)務(wù)系統(tǒng)。
針對(duì)OpenClaw穩(wěn)定性差、非技術(shù)用戶(hù)上手難問(wèn)題,趙歡稱(chēng)他們?cè)趦?nèi)部打造了“龍蝦醫(yī)院”和“龍蝦學(xué)院”,以實(shí)現(xiàn)Agent故障自動(dòng)診斷以及AI自動(dòng)學(xué)習(xí)、快速為業(yè)務(wù)提供Skill等。
![]()
▲趙歡
8、清程極智李浩瑞:首發(fā)企業(yè)級(jí)token管理工具,即將開(kāi)源
清程極智技術(shù)專(zhuān)家李浩瑞首次正式發(fā)布了其企業(yè)級(jí)token管理新品ATM(Agent Token Manager),該產(chǎn)品后續(xù)將開(kāi)源。
ATM的核心功能是本地聚合網(wǎng)關(guān)、Agent身份級(jí)管控、智能路由下放、本地?cái)?shù)據(jù)存儲(chǔ)、Agent原生適配,他們實(shí)測(cè)顯示,本地網(wǎng)關(guān)融合云端、本地大模型后使得成本降低70%。
為了幫助企業(yè)在AI轉(zhuǎn)型中進(jìn)行token管控與質(zhì)量追蹤,清程極智的AI Ping可以在MaaS層通過(guò)持續(xù)模型服務(wù)評(píng)測(cè),提供高質(zhì)量低價(jià)格token;ATM是本地網(wǎng)關(guān),在本地通過(guò)Agent身份級(jí)管控實(shí)現(xiàn)精細(xì)化企業(yè)內(nèi)部治理。
![]()
▲李浩瑞
9、圓桌討論:OpenClaw x Harness Engineering,AI智能體的范式革命
圓桌討論環(huán)節(jié)由智東西聯(lián)合創(chuàng)始人、智猩猩總經(jīng)理何峰主持,四位嘉賓分別是階躍星辰算法專(zhuān)家袁微,雷鳥(niǎo)創(chuàng)新AI負(fù)責(zé)人程思婕,清程極智技術(shù)專(zhuān)家李浩瑞,Noumena AI(物自體科技)聯(lián)合創(chuàng)始人、產(chǎn)品算法負(fù)責(zé)人趙歡。
嘉賓們探討了當(dāng)下OpenClaw與Hermes Agent之間的“養(yǎng)蝦、養(yǎng)馬”爭(zhēng)論、Skill是否會(huì)吃掉App等諸多熱點(diǎn)話(huà)題。
![]()
▲從左到右:何峰、袁微、程思婕、李浩瑞、趙歡
袁微站在模型團(tuán)隊(duì)角度稱(chēng),OpenClaw開(kāi)啟了AI智能體爆發(fā)元年,當(dāng)下Agent實(shí)現(xiàn)生產(chǎn)級(jí)交付的最大瓶頸是模型研發(fā),因?yàn)槭忻嫔系耐ㄓ肂enchmark很難對(duì)應(yīng)每個(gè)人需求,因此他們?cè)噲D通過(guò)收集專(zhuān)家意見(jiàn)、用戶(hù)的實(shí)際體驗(yàn)、自建Benchmark等方式,讓模型體驗(yàn)和大多數(shù)人體感保持一致。
作為硬件廠(chǎng)商的代表,程思婕認(rèn)為Skills會(huì)逐步替代App,而當(dāng)下Skill變成App的壁壘在生態(tài)層面,需要大廠(chǎng)開(kāi)放自己的原子能力。圍繞OpenClaw與眼鏡的結(jié)合,雷鳥(niǎo)創(chuàng)新制定了三步戰(zhàn)略,第一步是面向開(kāi)發(fā)者,讓眼鏡作為輸入入口快速接入OpenClaw,第二步打通App讓其絲滑連接Agent,第三步是內(nèi)部自研類(lèi)似框架。
作為T(mén)oken服務(wù)商,李浩瑞提到一個(gè)現(xiàn)象,Hermes Agent出來(lái)后,OpenClaw的Token消耗在下降,這進(jìn)一步說(shuō)明,越來(lái)越聰明、越來(lái)越懂用戶(hù)的Agent是技術(shù)上的大趨勢(shì)。企業(yè)內(nèi)部管理Token的最大難點(diǎn),就是不知道Token消耗流去了哪里,這也是他們打造本地Token管理工具的原因。
在營(yíng)銷(xiāo)這一垂類(lèi)場(chǎng)景,趙歡認(rèn)為,OpenClaw是產(chǎn)品形態(tài)革新,能大幅降低非技術(shù)人群AI使用門(mén)檻,未來(lái)模型會(huì)逐步吃掉Harness,垂類(lèi)廠(chǎng)商需構(gòu)建領(lǐng)域護(hù)城河。他們判斷一個(gè)場(chǎng)景是否真正適合Agent落地的兩個(gè)視角是,本身的技術(shù)場(chǎng)景匹配度,以及場(chǎng)景商業(yè)價(jià)值、落地困難程度。
結(jié)語(yǔ):生成式AI產(chǎn)業(yè)開(kāi)始告別“早期階段”
今年AI產(chǎn)業(yè)依然在飛速變化。年初的“養(yǎng)龍蝦”熱潮帶動(dòng)token消耗量爆發(fā),密集迭代的各類(lèi)大模型持續(xù)帶來(lái)新的驚喜,業(yè)界已經(jīng)對(duì)基準(zhǔn)測(cè)試分?jǐn)?shù)祛魅,轉(zhuǎn)而更看重真實(shí)的任務(wù)完成度,新一輪AI基建潮正如火如荼開(kāi)展。
被業(yè)界期盼已久的DeepSeek-V4,也交出了一份具有開(kāi)創(chuàng)意義的答卷:不僅繼續(xù)做到大幅壓低成本和性能領(lǐng)先,而且寫(xiě)出了一個(gè)打破海外芯片依賴(lài)的新敘事。
這場(chǎng)空前的產(chǎn)業(yè)爆發(fā)之中,還有一些需要面對(duì)的問(wèn)題。
模型迭代速度之快,正在給企業(yè)用戶(hù)帶來(lái)選擇疲勞。相比追逐新模型,企業(yè)更需要的是建立與模型無(wú)關(guān)的架構(gòu)能力。
模型能力與安全的矛盾也在激化。Anthropic手握強(qiáng)大的Mythos模型卻不敢全面發(fā)布,ChatGPT Images 2.0生成的圖像已經(jīng)以假亂真,其他旗艦?zāi)P屯瑯用媾R網(wǎng)絡(luò)安全風(fēng)險(xiǎn)的審慎評(píng)估。前沿能力的發(fā)布正成為一個(gè)越來(lái)越沉重的決策。
與此同時(shí),炒作性宣傳和情緒生意也在侵蝕行業(yè)的判斷力,真正的技術(shù)進(jìn)展反而被淹沒(méi)在噪聲之中。在DeepSeek-V4新聞稿的結(jié)尾,有一句引自《荀子》的名言:“不誘于譽(yù),不恐于誹,率道而行,端然正己。”也愿生成式AI道路上的前行者們,都有類(lèi)似的定力。
而AI產(chǎn)品最終需要以真實(shí)的商業(yè)回報(bào)來(lái)驗(yàn)證。頭部企業(yè)交出了快速增長(zhǎng)的收入成績(jī)單,同時(shí)也在尋求巨額算力資源采購(gòu),但這種支出比收入增長(zhǎng)更快的模式會(huì)持續(xù)多久,答案要等到新一代基礎(chǔ)設(shè)施真正投入運(yùn)營(yíng)之后才能揭曉。
AI正在不可逆轉(zhuǎn)地走向產(chǎn)業(yè)化,開(kāi)始觸及軟件開(kāi)發(fā)、知識(shí)工作和人機(jī)交互的底層范式。但截至目前,這個(gè)新型技術(shù)產(chǎn)業(yè)仍處于地基澆筑期,至于最終建成的大廈是什么模樣,可能連建設(shè)者自己都還無(wú)法完全想象。
2026年這個(gè)春天,生成式AI產(chǎn)業(yè)開(kāi)始告別它的“早期階段”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.