![]()
作者 | 文朋
2026 年初,開(kāi)源智能體項(xiàng)目 OpenClaw 風(fēng)靡全球,迅速成為開(kāi)發(fā)者社區(qū)的焦點(diǎn)。
這場(chǎng)現(xiàn)象級(jí)爆發(fā),也讓行業(yè)關(guān)于“Agent 元年”的判斷,第一次有了具象而清晰的參照。
OpenClaw 的走紅,讓開(kāi)發(fā)者乃至普通用戶首次直觀感受到:AI 正在從“對(duì)話框里的顧問(wèn)”,躍遷為“現(xiàn)實(shí)世界中的執(zhí)行者”。
它不再只是提供建議或生成代碼,而是能夠理解復(fù)雜指令、自主調(diào)用工具、在多維環(huán)境中完成任務(wù),并交付閉環(huán)結(jié)果的“數(shù)字勞動(dòng)力”。
短短數(shù)月,這股浪潮便從極客社區(qū)擴(kuò)散至大廠、創(chuàng)業(yè)公司與個(gè)人用戶,推動(dòng)整個(gè)行業(yè)重新思考 AI 的終局形態(tài):未來(lái)的智能入口究竟在哪里?AI 的核心價(jià)值是否正在從“內(nèi)容生成”全面轉(zhuǎn)向“任務(wù)達(dá)成”?
當(dāng) Agent 真正擁有“執(zhí)行權(quán)”后,一系列現(xiàn)實(shí)問(wèn)題也隨之浮現(xiàn):權(quán)限邊界、數(shù)據(jù)安全、成本黑盒、可觀測(cè)性以及長(zhǎng)期信任機(jī)制,逐漸成為企業(yè)級(jí)落地?zé)o法回避的深水區(qū)。
與此同時(shí),以 HermesAgent 為代表的新一代技術(shù)路線,也在為這一賽道引入新的變量。相比單純強(qiáng)調(diào)工具調(diào)用的執(zhí)行模式,新一代智能體開(kāi)始更加關(guān)注記憶沉淀、自我學(xué)習(xí)與長(zhǎng)期進(jìn)化能力。
至此,關(guān)于 AI Agent 的討論,已從“能不能用”、“好不好用”,走向“如何持續(xù)變強(qiáng)”“如何穩(wěn)定治理”,以及“如何真正進(jìn)入企業(yè)核心生產(chǎn)環(huán)境”。
本期是《AI Token 說(shuō)》系列第二場(chǎng)對(duì)談。我們邀請(qǐng)到兩位深度參與 AI Agent 演進(jìn)的一線實(shí)踐者:
馮成成,阿里云專(zhuān)有云 Agent 技術(shù)開(kāi)發(fā)負(fù)責(zé)人,將立足企業(yè)級(jí)落地前線,分享 Agent 在企業(yè)級(jí)場(chǎng)景中面臨的安全管控、權(quán)限體系、協(xié)同機(jī)制問(wèn)題,以及生產(chǎn)部署中的真實(shí)挑戰(zhàn)。
姚柳佚,阿里巴巴 ATH 事業(yè)群通義大模型事業(yè)部科學(xué)家,她也是 QwenPaw 產(chǎn)品技術(shù)的負(fù)責(zé)人之一,將從產(chǎn)品體驗(yàn)、開(kāi)源生態(tài)與用戶路徑出發(fā),解析 Agent 如何從“技術(shù)嘗鮮”走向“工作流”價(jià)值輸出。
本文將圍繞“從 OpenClaw 爆火到企業(yè)級(jí) Agent 落地”這一主線,拆解熱潮背后的底層驅(qū)動(dòng)力,并探討它將如何重塑企業(yè)生產(chǎn)力、個(gè)人智能助理形態(tài)以及加速開(kāi)源生態(tài)演進(jìn)的路徑。
1 從對(duì)話到執(zhí)行:OpenClaw 為什么引爆 Agent 熱潮
主持人:OpenClaw 為什么會(huì)在國(guó)內(nèi)迅速成為一個(gè)全民級(jí)事件?
馮成成:作為技術(shù)人,其實(shí)我們已經(jīng)研究 OpenClaw 一段時(shí)間了。尤其是在 OpenClaw 爆火之前,我們?cè)趯?zhuān)有云 OpenTrek 里就已經(jīng)做過(guò)相關(guān)技術(shù)探索。
OpenClaw 本質(zhì)上代表一次 AI 交互范式質(zhì)變:它從過(guò)去的“對(duì)話式 AI”推進(jìn)到了“執(zhí)行式 AI”。
以前 AI 再聰明,本質(zhì)上是一個(gè)顧問(wèn)。你問(wèn)它問(wèn)題,它給你答案,不會(huì)真正進(jìn)入業(yè)務(wù)流程。
而 OpenClaw 出現(xiàn)后,開(kāi)發(fā)者能非常直觀感受到:AI 不只能回答問(wèn)題,還能拆解任務(wù)、選擇工具,并自動(dòng)完成執(zhí)行。這種體驗(yàn)變化是非常強(qiáng)烈的。
當(dāng)然,它爆火并不是突然發(fā)生的。背后有幾個(gè)前提:首先,底層模型能力已經(jīng)足夠強(qiáng),能理解復(fù)雜指令,并且相對(duì)可靠地完成任務(wù)拆解和調(diào)度;其次,OpenClaw 本身使用門(mén)檻并不高,普通開(kāi)發(fā)者也能快速上手。兩者疊加之后,就點(diǎn)燃了整個(gè)開(kāi)發(fā)者群體的熱情。
姚柳佚:我覺(jué)得可以總結(jié)為三個(gè)方面:模型能力到了、產(chǎn)品體驗(yàn)順了、開(kāi)源傳播快了。這三個(gè)因素共同推動(dòng)了 OpenClaw 的爆火。
尤其是在產(chǎn)品體驗(yàn)層面,它和過(guò)去的云端聊天機(jī)器人很不一樣。它不再只是一個(gè)遠(yuǎn)程問(wèn)答工具,而是真正“長(zhǎng)”在你的本地環(huán)境里,可以理解你的上下文,并且執(zhí)行具體任務(wù)。
它在產(chǎn)品設(shè)計(jì)上接入了 IM 渠道,也有心跳機(jī)制、定時(shí)任務(wù)機(jī)制等,這也是產(chǎn)品體驗(yàn)上的一次重要革新。
主持人:有哪個(gè)產(chǎn)品體驗(yàn)點(diǎn)讓你覺(jué)得它和過(guò)去的 AI 產(chǎn)品完全不一樣?
姚柳佚:我第一次用它的時(shí)候,讓它幫我部署一個(gè)網(wǎng)站。真的是從零開(kāi)始,一步步完成,寫(xiě)代碼、改文件、改配置,最后到我得到一個(gè)在瀏覽器里打開(kāi),可以直接點(diǎn)擊訪問(wèn)的網(wǎng)站頁(yè)面。
這是我第一次非常明確地感受到:AI 真的可以把一個(gè)完整任務(wù)做完,而不是只給我建議或者代碼片段。
但坦白說(shuō),我當(dāng)時(shí)看著它在本地環(huán)境里寫(xiě)代碼、改文件、改配置,心里還是有點(diǎn)發(fā)毛的。我會(huì)擔(dān)心:它會(huì)不會(huì)把我的系統(tǒng)搞崩?更關(guān)鍵的是,它會(huì)不會(huì)把自己也搞崩?
所以一方面這個(gè)體驗(yàn)很震撼,另一方面也確實(shí)會(huì)帶來(lái)一些安全上的挑戰(zhàn)。
馮成成:我第一次使用 OpenClaw 場(chǎng)景,和大多數(shù)人可能比較類(lèi)似。一開(kāi)始會(huì)彈出一些文件權(quán)限授權(quán),先給它授權(quán),然后讓它做了一個(gè)很簡(jiǎn)單的任務(wù):如整理一下本地文件夾。
它確實(shí)做到了普通 AI 很難做到的事情。不只告訴我怎么整理,而且能夠理解我的文件夾結(jié)構(gòu)、文件類(lèi)別以及它們之間的關(guān)系,然后把它們重新整理得更有條理。
我覺(jué)得到了這一步,AI 才真的開(kāi)始接近“個(gè)人助理”的角色。尤其是在本地文件整理這類(lèi)場(chǎng)景里,它不只是回答問(wèn)題,而是開(kāi)始真正幫你處理個(gè)人工作環(huán)境里的具體事務(wù)。
主持人:年初大家都經(jīng)歷了一輪“裝機(jī)熱”,但裝了不代表真的能用起來(lái),尤其是本地化部署。那么,從“養(yǎng)蝦”“試試”到真正高頻、穩(wěn)定用起來(lái),中間到底隔著什么?需要做哪些動(dòng)作,才能讓它真正進(jìn)入日常工作流?
姚柳佚:我覺(jué)得從“試試”到真正“用起來(lái)”,中間主要要補(bǔ)上兩件事:場(chǎng)景適配和信任感。
第一是場(chǎng)景適配。很多人裝完龍蝦后,只是覺(jué)得新鮮,讓它做幾個(gè)任務(wù)。但關(guān)鍵在于,它有沒(méi)有和你的日常高頻場(chǎng)景結(jié)合起來(lái)。如果沒(méi)有結(jié)合日常場(chǎng)景,那它只是一陣“虛火”,看起來(lái)熱鬧,但很難長(zhǎng)期留下來(lái)。
只有當(dāng)它真正進(jìn)入你的工作流,比如處理文件、整理信息、生成報(bào)告、同步消息、執(zhí)行固定流程,它才會(huì)持續(xù)產(chǎn)生價(jià)值。
進(jìn)一步說(shuō),如果這些高頻場(chǎng)景能沉淀成龍蝦自己的 Skills,它就能更穩(wěn)定地理解你的工作方式,后續(xù)執(zhí)行也會(huì)更智能。
第二是信任感。真正用起來(lái)后,大家會(huì)很自然地產(chǎn)生顧慮:它會(huì)不會(huì)把文件改壞?會(huì)不會(huì)誤操作?會(huì)不會(huì)發(fā)送我的隱私信息?
這些擔(dān)心很現(xiàn)實(shí)。因?yàn)辇埼r一旦進(jìn)入本地環(huán)境,開(kāi)始接觸文件、配置、消息和工作流,它就不再只是一個(gè)回答問(wèn)題的工具,而是一個(gè)真正能執(zhí)行各種動(dòng)作的系統(tǒng)。
所以,核心找到并適配高頻場(chǎng)景,同時(shí)建立對(duì)它執(zhí)行能力和安全邊界的信任。
馮成成:從我的視角看,用戶從“試試”到真正用起來(lái),中間隔著三道隱形的墻:場(chǎng)景的墻、成本的墻、信任的墻。
第一道同樣是場(chǎng)景墻。很多用戶把龍蝦裝起來(lái)后,第一反應(yīng)是:“然后呢?我讓它干什么?”還是會(huì)沿用過(guò)去使用 AI 的方式,比如問(wèn)它:“怎么寫(xiě)周報(bào)?”最后得到的也只是一個(gè)普通大模型式的回答。
所以但真正的轉(zhuǎn)變?cè)谟冢阋獡Q一種方式和它溝通。不是問(wèn)它“怎么寫(xiě)周報(bào)”,而是讓它去讀你的本周日程、查看郵件、整理工作內(nèi)容,最后幫你生成一份周報(bào),甚至發(fā)到釘釘上。這才是一個(gè)完整鏈路。
也就是說(shuō),當(dāng)你把龍蝦看作“個(gè)人助理”時(shí),它的價(jià)值才會(huì)真正體現(xiàn)出來(lái)。用戶首先要解決也是“我如何把一個(gè)完整任務(wù)交給它”。
第二道是成本墻。很多用戶剛開(kāi)始覺(jué)得龍蝦很炫酷,但跑了一周之后發(fā)現(xiàn) Token 消耗不少,錢(qián)包確實(shí)有壓力。用戶就會(huì)開(kāi)始算賬:它提升的效率,能不能覆蓋我花出去的錢(qián),以及它節(jié)省下來(lái)的時(shí)間。
如果這筆賬算不過(guò)來(lái),用戶很可能又退回到手動(dòng)操作。所以關(guān)鍵的一點(diǎn),是要選擇高價(jià)值場(chǎng)景。真正適合它的,是那些重復(fù)、高頻、鏈路較長(zhǎng)、手動(dòng)處理成本較高的任務(wù)。
第三道是信任墻。當(dāng)你用得越來(lái)越久,越來(lái)越多事情交給龍蝦后,就會(huì)產(chǎn)生新焦慮:它會(huì)不會(huì)亂改我的文件?會(huì)不會(huì)把隱私數(shù)據(jù)發(fā)出去?如果它真的誤操作了,我該怎么辦?
這道墻最難跨越。因?yàn)樗恢皇枪δ芎图夹g(shù)問(wèn)題,而是用戶心理上的確定性問(wèn)題。用戶需要知道它在做什么、為什么這么做、做錯(cuò)了能不能回滾、哪些動(dòng)作需要確認(rèn)后才能執(zhí)行。
很多用戶就停在了第一道墻或第二道墻。所以,要讓龍蝦真正用起來(lái),要幫助用戶找到高價(jià)值場(chǎng)景、控制使用成本,并逐步建立執(zhí)行信任。
2 從 OpenClaw 到 HermesAgent 產(chǎn)品越來(lái)越多,到底該怎么選?
主持人:開(kāi)源確實(shí)在 OpenClaw 的爆火中發(fā)揮了重要作用。你們?cè)趺纯串?dāng)前 Agent 開(kāi)源生態(tài)的格局?開(kāi)源和 Agent 的發(fā)展之間,究竟是什么關(guān)系?
姚柳佚:如果把 Agent 開(kāi)源生態(tài)比作一張地圖,OpenClaw 肯定是其中非常亮眼的一部分,但整個(gè)生態(tài)遠(yuǎn)不止 OpenClaw。
從我自己體驗(yàn)看,Agent 開(kāi)源生態(tài)已不再只是小圈子開(kāi)發(fā)者的游戲,而是有越來(lái)越多普通用戶、非技術(shù)背景的人參與進(jìn)來(lái)。比如在我們 QwenPaw 的 Discussion 區(qū)域,就會(huì)有很多用戶來(lái)提 Issue、提 FeatureRequest。
這些用戶當(dāng)然不一定都貢獻(xiàn)代碼,但他們同樣是開(kāi)源社區(qū)的重要成員。他們可以提出改進(jìn)建議,可以分享使用體驗(yàn),也可以在社媒上講自己是怎么用的,在哪些場(chǎng)景里獲得了 Ahamoment。
還有一些用戶,會(huì)在小紅書(shū)、朋友圈等平臺(tái)上幫助其他人解答使用問(wèn)題,分享自己踩過(guò)的坑和解決經(jīng)驗(yàn)。也就是說(shuō),今天的開(kāi)源貢獻(xiàn)已經(jīng)不只發(fā)生在代碼倉(cāng)庫(kù)里,也發(fā)生在社媒社區(qū)、用戶討論區(qū)和真實(shí)使用場(chǎng)景中。
我覺(jué)得這是一個(gè)很重要的變化:開(kāi)源社區(qū)正在帶動(dòng)傳播社區(qū)一起成長(zhǎng)。過(guò)去大家理解開(kāi)源,更多想到的是代碼、Issue、PR;但現(xiàn)在,普通用戶的體驗(yàn)分享、問(wèn)題反饋、場(chǎng)景傳播,也在推動(dòng)一個(gè) Agent 產(chǎn)品快速擴(kuò)散和進(jìn)化。
馮成成:我覺(jué)得現(xiàn)在整個(gè) Agent 開(kāi)源生態(tài)已經(jīng)相當(dāng)豐富,OpenClaw 肯定不是唯一選擇。
比如在框架層和平臺(tái)層,有像 LangChain、LangGraph、Dify 這樣的項(xiàng)目或平臺(tái),它們主要解決的是“怎么創(chuàng)造 Agent”以及“怎么編排 Agent”的問(wèn)題,提供的是底層框架能力和平臺(tái)能力。
而在產(chǎn)品層,會(huì)有像 OpenClaw 這種主打本地優(yōu)先、個(gè)人助理形態(tài)的產(chǎn)品,也有像 HermesAgent 這種強(qiáng)調(diào)自我進(jìn)化能力的 Agent。它們更關(guān)注的是“用戶怎么真正用上 Agent”。
這些項(xiàng)目之間并不是簡(jiǎn)單的競(jìng)爭(zhēng)關(guān)系,也沒(méi)有絕對(duì)沖突。它們的側(cè)重點(diǎn)不同:有的解決開(kāi)發(fā)和編排問(wèn)題,有的解決使用和體驗(yàn)問(wèn)題。整體上,我更愿意把它們看成一種相輔相成的關(guān)系:不同項(xiàng)目互相借鑒、互相推動(dòng),共同推進(jìn) Agent 生態(tài)往前。
從更長(zhǎng)期來(lái)看,用戶不再只花 Token 買(mǎi)能聊天的模型,而是雇了一個(gè) AI 來(lái)幫自己干活。而開(kāi)源生態(tài)的價(jià)值就在于,讓這個(gè)過(guò)程變得更快、更透明,也讓更多人能夠參與進(jìn)來(lái),一起定義 Agent 應(yīng)該怎么被創(chuàng)造、怎么被使用、怎么真正進(jìn)入現(xiàn)實(shí)工作流。
主持人:OpenClaw 和 Hermes Agent 看起來(lái)都是個(gè)人 AI Agent 助理,但外界也會(huì)討論它們?cè)诩軜?gòu)和產(chǎn)品思路上的差異。兩者的差異主要體現(xiàn)在架構(gòu)層、產(chǎn)品層,還是技術(shù)實(shí)現(xiàn)層?
馮成成:從表面上看,確實(shí)都是個(gè)人 AI Agent 助理,但它們?cè)诩軜?gòu)深度和產(chǎn)品思路上有明顯差異。
OpenClaw 更像是“人教 Agent 做事”。它的邏輯是:在基礎(chǔ)大模型之上,加上工具調(diào)用和 Skills,讓模型完成意圖識(shí)別、工具選擇,并自主執(zhí)行任務(wù)。它的記憶機(jī)制也相對(duì)直觀,主要通過(guò)文本文件和上下文透?jìng)鳎屇P屠斫庥脩粜枨蠛腿蝿?wù)背景。
這種設(shè)計(jì)的優(yōu)點(diǎn)是簡(jiǎn)單、可控、容易審計(jì)。用戶可以明確知道它能做什么、怎么做,也可以通過(guò)配置 Skills 來(lái)擴(kuò)展它的能力。
但它的局限也很清楚:不太具備真正意義上的自我進(jìn)化能力。它的能力提升,更多依賴(lài)社區(qū)貢獻(xiàn)、Skills 增加,或者產(chǎn)品版本升級(jí)。
HermesAgent 則更像是“Agent 自己學(xué)會(huì)做事”。它有一套更完整的記憶框架,包括短期記憶、中期記憶、長(zhǎng)期記憶以及技能記憶體。在這個(gè)體系里,記憶不是附加能力,而是基礎(chǔ)設(shè)施。
最明顯的區(qū)別是,HermesAgent 不一定需要用戶預(yù)先安裝 Skills。它的 Skill 可以在執(zhí)行任務(wù)的過(guò)程中,通過(guò)總結(jié)經(jīng)驗(yàn)不斷沉淀下來(lái)。
這也決定了兩者更適合不同場(chǎng)景。OpenClaw 更適合確定性強(qiáng)、流程清晰的執(zhí)行任務(wù);HermesAgent 更適合目標(biāo)模糊、需要探索和持續(xù)優(yōu)化的任務(wù)。
但長(zhǎng)期來(lái)看,我不認(rèn)為這兩種架構(gòu)思路是二選一。一個(gè)成熟的 Agent 框架,應(yīng)該同時(shí)具備穩(wěn)定可控的執(zhí)行底座,以及能夠持續(xù)學(xué)習(xí)、自我進(jìn)化的能力。
姚柳佚:如果從相同點(diǎn)說(shuō)起。OpenClaw 和 HermesAgent 都屬于 Agent 的運(yùn)行層,也就是用戶直接面對(duì)的一層,能直觀看到 Agent 在理解任務(wù)、調(diào)用工具、執(zhí)行動(dòng)作。
但從架構(gòu)特點(diǎn)來(lái)看,兩者的側(cè)重點(diǎn)不一樣。
OpenClaw 的插件系統(tǒng)和 Hook 機(jī)制,允許用戶在 Agent 的全生命周期里插入各種 Hook。這樣一來(lái),任務(wù)執(zhí)行過(guò)程就更容易被觀察、干預(yù)和審計(jì)。
這套設(shè)計(jì)非常適合需要確定性和安全邊界的場(chǎng)景。比如處理本地文件、執(zhí)行固定流程、調(diào)用明確工具,這些任務(wù)都需要用戶知道 Agent 在做什么,也需要在關(guān)鍵節(jié)點(diǎn)有可控性。
HermesAgent 則可以總結(jié)為:潛力更大,能力天花板更高。它的核心優(yōu)勢(shì)在于 Learningloop,也就是學(xué)習(xí)閉環(huán)。Agent 可以在空閑時(shí)反復(fù)查看自己過(guò)去的執(zhí)行軌跡,總結(jié)經(jīng)驗(yàn),并沉淀成后續(xù)可復(fù)用的能力。
如果再配合 RL 強(qiáng)化學(xué)習(xí)訓(xùn)練,就有可能形成一套完整閉環(huán):執(zhí)行任務(wù)、記錄軌跡、沉淀記憶、優(yōu)化策略,再回到下一次執(zhí)行中提升表現(xiàn)。
所以?xún)烧卟皇钦l(shuí)完全替代誰(shuí),而是適合不同需求。
當(dāng)然,自我進(jìn)化并不是免費(fèi)的。它在持續(xù)學(xué)習(xí)、回看軌跡、沉淀經(jīng)驗(yàn)的過(guò)程中,也會(huì)消耗 Token 和計(jì)算資源。所以用戶最終還是要權(quán)衡:自己更需要一個(gè)穩(wěn)定可控的執(zhí)行工具,還是一個(gè)有更高成長(zhǎng)潛力、但成本和不確定性也更高的智能體。
主持人:阿里云實(shí)驗(yàn)室也推出了 QwenPaw,這同樣是一個(gè)龍蝦類(lèi)產(chǎn)品,這背后是基于什么樣的考慮?想讓它發(fā)揮什么作用?
姚柳佚:大家知道,QwenPaw 的前身其實(shí)叫 coPaw,最近正式更名為 QwenPaw。這個(gè)名字本身,也體現(xiàn)了我們接下來(lái)開(kāi)源的方向和初心。
其中,Qwen 代表我們會(huì)繼續(xù)擁抱 Qwen 開(kāi)源生態(tài),并且在模型側(cè)持續(xù)發(fā)力。比如支持本地模型部署,支持大模型協(xié)同、端云協(xié)同,也會(huì)針對(duì) Agent 場(chǎng)景,在模型能力上做進(jìn)一步優(yōu)化和適配。
而 Paw,其實(shí)是“小爪子”的意思,也代表我們的初心。我們希望 QwenPaw 不只是一個(gè)冰冷的工具,而是一個(gè)能陪伴在你身邊、真正長(zhǎng)在你生活里的小助手。
它可以更輕量、更簡(jiǎn)單地部署,也能更自然地進(jìn)入用戶的日常場(chǎng)景。
主持人:現(xiàn)在市面上的 Agent 產(chǎn)品越來(lái)越多,用戶在選擇時(shí)也會(huì)產(chǎn)生困惑:這么多 Agent,到底應(yīng)該用哪一個(gè)?因?yàn)檎嬲煤靡粋€(gè) Agent,往往需要投入精力,比如購(gòu)買(mǎi)額度、配置 Skills、適配場(chǎng)景、部署和調(diào)試。那么在投入這些成本之前,我們應(yīng)該通過(guò)哪些維度判斷一個(gè) Agent 產(chǎn)品是否值得長(zhǎng)期使用?
馮成成:我覺(jué)得衡量一個(gè) Agent 的價(jià)值,不只看它能做什么,更要看它能不能在企業(yè)環(huán)境里穩(wěn)定運(yùn)行。
我一般會(huì)從三個(gè)維度看:可控、有能力、能協(xié)同。
第一是可控。一個(gè) Agent 有沒(méi)有全生命周期的審計(jì)能力?能不能做好權(quán)限分級(jí)和隔離策略?在高風(fēng)險(xiǎn)操作時(shí),能不能主動(dòng)尋求人類(lèi)確認(rèn)?只有當(dāng)一個(gè) Agent 是可控的,企業(yè)才真正敢把權(quán)限交給它。
第二是有能力。比如,它有沒(méi)有處理復(fù)雜指令的能力?能不能拆解任務(wù)?有沒(méi)有豐富的工具鏈?能不能對(duì)接企業(yè)內(nèi)部系統(tǒng),完成業(yè)務(wù)接入?有沒(méi)有完整的記憶能力?
這里的記憶,和個(gè)人助理的記憶不太一樣。個(gè)人助理的記憶更偏向“我的記憶我來(lái)用”,讓自己變聰明就可以。
但企業(yè)級(jí)記憶更強(qiáng)調(diào)跨 Agent 之間的共享和協(xié)同。一個(gè) Agent 可以獨(dú)立沉淀某個(gè)業(yè)務(wù)領(lǐng)域的經(jīng)驗(yàn),其他相關(guān)領(lǐng)域的 Agent 或同類(lèi) Agent 也可以共享這套記憶體系。
第三是能協(xié)同。企業(yè)里的業(yè)務(wù)流程,通常不是一個(gè)人就能端到端完成的。Agent 也一樣。比如一個(gè) Agent 負(fù)責(zé)數(shù)據(jù)分析,另一個(gè) Agent 負(fù)責(zé)對(duì)外協(xié)同溝通。那么每個(gè) Agent 都有不同的職能、角色和權(quán)限,就需要標(biāo)準(zhǔn)協(xié)議進(jìn)行交互和互通。
如果一個(gè)框架只能支持單智能體工作,那么它的上限就會(huì)被限制住。
姚柳佚:從協(xié)同角度看,現(xiàn)在市面上已經(jīng)有很多協(xié)議,比如 A2A 協(xié)議、MCP 協(xié)議、ACP 協(xié)議等等。如果一個(gè) Agent 或框架能夠方便地對(duì)接這些協(xié)議,那無(wú)疑是一個(gè)巨大優(yōu)勢(shì)。
另外,我還想從開(kāi)源社區(qū)的角度補(bǔ)充一點(diǎn):一個(gè) Agent 是否擁有良好、繁榮的生態(tài),也非常值得考量。
當(dāng)我想做一件事時(shí),生態(tài)里是否已經(jīng)有可以直接使用的 Skills?如果有,就不需要所有東西都從 0 到 1 自己做。
生態(tài)里是否有足夠多的用戶分享使用體驗(yàn)?這些真實(shí)案例能夠啟發(fā)我,也能幫助我更好地找到自己的使用方式。
第三,當(dāng)我提 Issue,或者向社區(qū)反饋問(wèn)題時(shí),能不能得到及時(shí)回應(yīng)?有沒(méi)有人理你,這一點(diǎn)其實(shí)也很重要。如果反饋了問(wèn)題卻沒(méi)有人回應(yīng),用戶會(huì)很受挫,后面可能就不會(huì)再參與社區(qū)討論了。
所以我覺(jué)得,社區(qū)對(duì)一個(gè) Agent 產(chǎn)品的長(zhǎng)期使用影響很深。它雖然是一個(gè)偏軟性的因素,不完全屬于產(chǎn)品技術(shù)本身,但如果沒(méi)有社區(qū),產(chǎn)品用起來(lái)就會(huì)比較干澀,也更難長(zhǎng)期發(fā)展。
3 從“試一試”到進(jìn)生產(chǎn):企業(yè)級(jí) Agent 首先要解決哪些問(wèn)題?
主持人:對(duì)企業(yè)來(lái)說(shuō),即使選對(duì)了產(chǎn)品,也不代表接入后就能真正用起來(lái)。企業(yè)從“嘗試”到真正進(jìn)入生產(chǎn)環(huán)境,中間還隔著什么?除了技術(shù)接入之外,還有哪些軟性挑戰(zhàn)?
馮成成:我覺(jué)得企業(yè)場(chǎng)景和個(gè)人養(yǎng)蝦,是完全不同的兩個(gè)場(chǎng)景。
個(gè)人用戶裝龍蝦,可能覺(jué)得很酷,自己試一試就可以。但企業(yè)如果真的想把它放到生產(chǎn)環(huán)境里,最大的阻礙往往不是技術(shù)問(wèn)題,而是信任。
這種信任缺失,在企業(yè)內(nèi)部會(huì)體現(xiàn)成一種典型的業(yè)務(wù)張力:研發(fā)團(tuán)隊(duì)熱情很高,希望 Agent 擁有足夠權(quán)限,可以調(diào) API、查數(shù)據(jù)庫(kù),把效能發(fā)揮到最大。
但安全團(tuán)隊(duì)和合規(guī)團(tuán)隊(duì)看到的是另一面:這些調(diào)用有沒(méi)有權(quán)限隔離?操作過(guò)程有沒(méi)有審計(jì)?會(huì)不會(huì)帶來(lái)真實(shí)的生產(chǎn)安全風(fēng)險(xiǎn)?
要平衡這兩者,我覺(jué)得真不能一刀切,不能簡(jiǎn)單地全部開(kāi)放,也不能全部卡掉,而是要做風(fēng)險(xiǎn)分級(jí)。
比如,低風(fēng)險(xiǎn)場(chǎng)景,像智能問(wèn)答、數(shù)據(jù)報(bào)表匯總、信息總結(jié)這類(lèi)任務(wù),通常不會(huì)直接引發(fā)業(yè)務(wù)異常,確定性也比較強(qiáng),就可以放心讓 Agent 去做。
中風(fēng)險(xiǎn)場(chǎng)景,比如自動(dòng)化運(yùn)維、問(wèn)題排查,就需要配合沙箱隔離、安全執(zhí)行機(jī)制來(lái)做。遇到高風(fēng)險(xiǎn)操作時(shí),要彈出人工確認(rèn)。本質(zhì)上是 Agent 在干活,但人保留最終控制權(quán)。
高風(fēng)險(xiǎn)場(chǎng)景,比如自動(dòng)審批、資金流轉(zhuǎn),就要極其謹(jǐn)慎。需要完整的全鏈路審計(jì)能力,也需要完善的回滾機(jī)制。前期更建議采用 AI 輔助決策、人工最終執(zhí)行的方式,先做業(yè)務(wù)過(guò)渡,再逐步建立信任。
所以,從低風(fēng)險(xiǎn)到高風(fēng)險(xiǎn),其實(shí)也是企業(yè)逐步建立信任的過(guò)程。先從低風(fēng)險(xiǎn)場(chǎng)景切入,讓安全團(tuán)隊(duì)看到權(quán)限是可以一層層控制的,也讓研發(fā)團(tuán)隊(duì)看到 Agent 的能力可以逐步開(kāi)放出來(lái)。
姚柳佚:在企業(yè)里,不同團(tuán)隊(duì)站在不同視角,看到問(wèn)題也不一樣。
例如。開(kāi)發(fā)團(tuán)隊(duì)和業(yè)務(wù)團(tuán)隊(duì)看到的是效率,安全團(tuán)隊(duì)看到的是風(fēng)險(xiǎn)。其實(shí)雙方都對(duì),因?yàn)檫@是各自職責(zé)決定的。我們會(huì)把可觀測(cè)性和安全性,放在和能力同等重要的位置上。
只有企業(yè)里的各方團(tuán)隊(duì)都能看得到這個(gè) Agent、看得清這個(gè) Agent,并且管控得住這個(gè) Agent,信任才會(huì)逐步建立起來(lái)。
主持人:前面我們提到,企業(yè)真正用好 Agent,關(guān)鍵是它是否可控、可用、可持續(xù)運(yùn)行。那具體來(lái)說(shuō)要達(dá)到哪些標(biāo)準(zhǔn),才能把它放進(jìn)生產(chǎn)環(huán)境?有沒(méi)有一份更清晰的能力清單?
姚柳佚:我可以從 QwenPaw 的角度來(lái)舉例,這份能力清單首先是數(shù)據(jù)隱私和本地可管控。
我們和一些大型國(guó)企用戶交流時(shí),他們會(huì)明確提出:業(yè)務(wù)數(shù)據(jù)和敏感數(shù)據(jù)不能傳到公有云模型上。所以 QwenPaw 在設(shè)計(jì)時(shí)堅(jiān)定支持本地模型部署。大型國(guó)企用戶可以結(jié)合專(zhuān)有云模型和本地部署的 QwenPaw,滿足數(shù)據(jù)安全和本地管控的要求。
第二是復(fù)雜任務(wù)執(zhí)行能力和權(quán)限管控能力。
在復(fù)雜任務(wù)執(zhí)行上,QwenPaw 新版本設(shè)計(jì)了 Mission 模式,支持 Agent 自主規(guī)劃任務(wù),并巡視任務(wù)是否完成。
在管控上,我們引入了插件機(jī)制,幫助企業(yè)處理部署 Agent 時(shí)大量“接縫”工作,比如接入日志平臺(tái)、監(jiān)控平臺(tái)、自定義安全規(guī)則和安全檢查。這些能力可以通過(guò)插件實(shí)現(xiàn),不打斷主流程。
此外,QwenPaw 也支持包括 ACP 協(xié)議在內(nèi)的多種開(kāi)源協(xié)議,方便和企業(yè)現(xiàn)有系統(tǒng)、工具無(wú)縫對(duì)接。
我覺(jué)得未來(lái)的 Agent,會(huì)像一個(gè)戴著安全帽、穿著工作服的正式工,真正融入企業(yè) IT 系統(tǒng)。
馮成成:我們專(zhuān)有云面向企業(yè)客戶做 Opentrek 智能體平臺(tái)時(shí),跟很多客戶打過(guò)交道,有一些切身體會(huì)。前面講到的可控、有能力、能協(xié)同,真正落到生產(chǎn)環(huán)境里,都需要扎實(shí)的技術(shù)準(zhǔn)備。
首先,Agent 已經(jīng)不只是一個(gè)回答問(wèn)題的系統(tǒng),而是一個(gè)擁有一定操作權(quán)限、能自主執(zhí)行任務(wù)的程序。它可能會(huì)執(zhí)行腳本、調(diào)用工具、處理業(yè)務(wù)流程。
所以安全團(tuán)隊(duì)最關(guān)心的是邊界:誰(shuí)能用?能做什么、不能做什么?出了問(wèn)題能不能溯源?
針對(duì)這些問(wèn)題,我們?cè)趯?zhuān)有云 Opentrek 里做了完整的安全閉環(huán):事前,有身份認(rèn)證和權(quán)限校驗(yàn)體系,讓每個(gè) Agent 像數(shù)字員工一樣擁有不同角色和權(quán)限;事中,有安全沙箱隔離執(zhí)行環(huán)境,也有高風(fēng)險(xiǎn)操作時(shí)的人工授權(quán)確認(rèn)機(jī)制;事后,有全鏈路審計(jì)能力,支持問(wèn)題回溯。這是企業(yè)級(jí) Agent 必須重點(diǎn)建設(shè)的第一層能力。
其次,是豐富的企業(yè)級(jí)能力,它決定 Agent 能不能真正解決業(yè)務(wù)問(wèn)題。企業(yè)最終關(guān)心的,還是 Agent 能不能解決真實(shí)業(yè)務(wù)問(wèn)題。這也是我們希望重點(diǎn)發(fā)力的部分。
我們不僅關(guān)注單個(gè) Agent,也面向一批 Agent 來(lái)設(shè)計(jì),讓它們像企業(yè)員工一樣協(xié)同工作。每個(gè) Agent 都有不同職能角色、業(yè)務(wù)權(quán)限和業(yè)務(wù)記憶,并通過(guò)標(biāo)準(zhǔn)協(xié)議完成業(yè)務(wù)交互。
這里的記憶不是個(gè)人助理式記憶,而是企業(yè)級(jí)記憶。支持跨 Agent 共享和協(xié)同,讓 Agent 不斷學(xué)習(xí)業(yè)務(wù)經(jīng)驗(yàn)、總結(jié)沉淀,并逐步自我進(jìn)化,成為更成熟的企業(yè)員工。
這些記憶也會(huì)存儲(chǔ)在企業(yè)級(jí)私有化數(shù)據(jù)庫(kù)或企業(yè)環(huán)境中,保障數(shù)據(jù)可審計(jì)、可回溯、可回滾。再加上企業(yè)級(jí)知識(shí)庫(kù)和豐富的生態(tài) Skill,Agent 能深入企業(yè)業(yè)務(wù)的毛細(xì)血管,像老員工一樣干活。
然后,企業(yè)把 Agent 發(fā)到線上后,會(huì)關(guān)心它是否穩(wěn)定運(yùn)行、有沒(méi)有異常。圍繞這一點(diǎn),我們建設(shè)了詳細(xì)的可觀測(cè)體系。比如 Agent 的任務(wù)規(guī)劃、方案執(zhí)行、工具調(diào)用,以及過(guò)程中出現(xiàn)的業(yè)務(wù)異常,都應(yīng)該透明可見(jiàn)。
管理一個(gè) Agent 團(tuán)隊(duì),有點(diǎn)像管理遠(yuǎn)程數(shù)字團(tuán)隊(duì)。你需要看到每個(gè) Agent、每個(gè)節(jié)點(diǎn)的任務(wù)狀態(tài),知道它們?cè)谧鍪裁础⒆龅侥囊徊健⒛睦锍隽藛?wèn)題。可觀測(cè)能力不是獨(dú)立于安全、能力、協(xié)同之外的第四個(gè)維度,而是支撐這些能力穩(wěn)定運(yùn)轉(zhuǎn)的基礎(chǔ)設(shè)施。
所以總結(jié)來(lái)說(shuō),企業(yè)級(jí) Agent 進(jìn)入生產(chǎn)環(huán)境,至少要具備三類(lèi)能力:用安全管控解決“敢不敢用”,用企業(yè)級(jí)能力解決“能不能用起來(lái)”,用可觀測(cè)能力解決“能不能長(zhǎng)期運(yùn)行”。
當(dāng)這三點(diǎn)做到位時(shí),Agent 才能從 demo 走向企業(yè)真正可以依賴(lài)的數(shù)字員工,甚至是數(shù)字員工團(tuán)隊(duì)。
主持人:剛才我們聊到很多企業(yè)級(jí) Agent 的管理問(wèn)題,比如權(quán)限、回滾、可觀測(cè)、安全管控等。那么對(duì)企業(yè)來(lái)說(shuō),如果現(xiàn)在就要部署企業(yè)級(jí) Agent,應(yīng)該怎么落地?有沒(méi)有一套更明確的路徑和避坑指南?
馮成成:結(jié)合我們的業(yè)務(wù)經(jīng)驗(yàn),我覺(jué)得可以分四步走。
第一步,選對(duì)場(chǎng)景,而不是一上來(lái)就全面 AI 化。
企業(yè)落地 Agent,最好先從簡(jiǎn)單、容錯(cuò)率高的場(chǎng)景切入,把 AI 先用起來(lái)。很多落地失敗的案例,往往是一開(kāi)始就選了非常敏感的業(yè)務(wù)場(chǎng)景。一旦 Agent 執(zhí)行異常,很可能就在企業(yè)內(nèi)部被“宣判死刑”。
第二步,建立穩(wěn)定、安全的基礎(chǔ)能力。
比如權(quán)限分級(jí)、身份認(rèn)證、操作審計(jì)、沙箱機(jī)制,這些能力不能等到后面再補(bǔ),而是從一開(kāi)始就要具備。否則一旦出問(wèn)題,可能連問(wèn)題發(fā)生在哪里都查不到。
第三步,建設(shè)豐富的企業(yè)級(jí)能力。
很多 Agent 在企業(yè)里表現(xiàn)得“像個(gè)笨蛋”,不一定是模型不夠強(qiáng),而是企業(yè)沒(méi)有把足夠多的業(yè)務(wù)數(shù)據(jù)、業(yè)務(wù)流程和工作經(jīng)驗(yàn)喂給它,也沒(méi)有把能力標(biāo)準(zhǔn)化。這一步做好之后,Agent 才能真正好用,但這一步也最花時(shí)間、最難。
第四步,建立自主可觀測(cè)、自救和自進(jìn)化能力。
Agent 上線之后,企業(yè)必須能看到它的運(yùn)行狀態(tài):有沒(méi)有調(diào)用報(bào)錯(cuò),Skills 成功率是在上漲還是下跌,哪些節(jié)點(diǎn)經(jīng)常卡住,哪些地方需要人工介入。
所以總結(jié)起來(lái)就是四步指南:先從小場(chǎng)景切入,把它用起來(lái);再建立基礎(chǔ)安全能力,擴(kuò)展業(yè)務(wù)邊界;然后豐富企業(yè)級(jí)能力,把業(yè)務(wù)做深做實(shí);最后通過(guò)可觀測(cè)能力,讓 Agent 持續(xù)穩(wěn)定運(yùn)轉(zhuǎn)。
姚柳佚:我覺(jué)得可以概括成三步走:小范圍試驗(yàn)田、大范圍驗(yàn)證、工廠化落地。
第一階段,先在小范圍場(chǎng)景里試。這個(gè)階段重點(diǎn)不是追求規(guī)模,而是驗(yàn)證 Agent 能不能在真實(shí)業(yè)務(wù)里跑通。
第二階段,進(jìn)入更大范圍的驗(yàn)證。這個(gè)階段要看它在更多場(chǎng)景、更多團(tuán)隊(duì)、更多權(quán)限邊界下,是否依然穩(wěn)定可控。
第三階段,才是工廠化落地,也就是把 Agent 真正納入企業(yè)生產(chǎn)體系。
但這里有一個(gè)很多人容易忽略的點(diǎn):每一步都要沉淀安全規(guī)則、安全機(jī)制和安全評(píng)判基準(zhǔn)。不是等規(guī)模擴(kuò)大之后才補(bǔ)安全,而是在每個(gè)階段都要把安全經(jīng)驗(yàn)沉淀下來(lái)。
另外一個(gè)關(guān)鍵點(diǎn)是 Human in the Loop,也就是人和 Agent 的配合方式。Human in the Loop 不是把所有事情都交給 Agent,讓它完全自主;也不是每一步都讓人審批、每一步都卡住。前者風(fēng)險(xiǎn)太高,后者效率太低。
不同場(chǎng)景里,人的參與程度應(yīng)該不一樣。隨著 Agent 覆蓋的場(chǎng)景越來(lái)越多,企業(yè)和 Agent 之間的信任感越來(lái)越強(qiáng),Agent 的權(quán)限也可以逐步放開(kāi)。
未來(lái)企業(yè)里可能還會(huì)出現(xiàn)一個(gè)新的角色,叫 AgentOps。這個(gè)角色負(fù)責(zé)管理 Agent 的運(yùn)行、權(quán)限、協(xié)作和持續(xù)優(yōu)化。
其實(shí),本質(zhì)上,企業(yè)接入 Agent 之后,不只是接入了一個(gè)工具,而是在適應(yīng)一種新的組織模式:怎么和 Agent 配合,怎么信任它,怎么開(kāi)放資源,以及怎么讓人和 Agent 一起完成工作。
4 Agent 會(huì)是泡沫嘛?如何判斷 Agent 的未來(lái)
主持人:最后想請(qǐng)兩位用一句話總結(jié)一下對(duì) Agent 未來(lái)的判斷。現(xiàn)在很多人也會(huì)關(guān)心:Agent 會(huì)不會(huì)只是一個(gè)泡沫?作為長(zhǎng)期在產(chǎn)業(yè)一線的從業(yè)者,你們看到的趨勢(shì)是什么?
姚柳佚:我認(rèn)為現(xiàn)在的 Agent 生態(tài)已經(jīng)進(jìn)入百花齊放的階段。未來(lái),Agent 會(huì)像水和電一樣,成為我們?nèi)粘I钪须[形的基礎(chǔ)設(shè)施。
開(kāi)源生態(tài)和端到端的安全管控能力,也將會(huì)是推動(dòng) Agent 走向千行萬(wàn)業(yè)的強(qiáng)力引擎。
馮成成:我個(gè)人覺(jué)得,Agent 現(xiàn)在已證明了自己是能干活的。未來(lái),當(dāng)它真正做到管得住、有深度、能協(xié)同時(shí),就會(huì)像云計(jì)算一樣,成為各個(gè)企業(yè)的標(biāo)配。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.