<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      細思極恐!Agent暗藏風(fēng)險,清華團隊打出組合拳,全鏈路一網(wǎng)打盡

      0
      分享至


      新智元報道

      編輯:YHluck

      【新智元導(dǎo)讀】當(dāng)Agent開始真正進入生產(chǎn)環(huán)境,安全問題不再是「功能模塊」,而是貫穿調(diào)用鏈、運行時與生態(tài)層的系統(tǒng)性風(fēng)險。過去依賴提示詞規(guī)則、日志審計與框架級防護的方式,正在逐步失效。來自清華大學(xué)人工智能學(xué)院、交叉信息研究院的方寸躍遷提出一套面向Agent運行全生命周期的多層安全體系。

      當(dāng)所有人都在卷Agent能力的時候,一個更危險的問題,已悄然出現(xiàn)——

      你部署的Agent,此刻到底在做什么?


      一個被忽略很久的事實

      Agent會「表演」

      過去兩年,行業(yè)幾乎把全部火力砸在了模型能力、Agent框架與工具調(diào)用體系的軍備競賽里。

      安全能力,則更多停留在「表層防護」:提示詞規(guī)則、輸入輸出過濾、運行時日志審計,加上基于SDK Hook的框架級約束。

      這些機制各自有效。但它們共享同一個根本性盲區(qū)——

      它們看到的,只是Agent「聲明」出來的行為。

      但如果將視角稍微下沉一層,問題會迅速變得復(fù)雜。

      Agent在執(zhí)行任務(wù)時,會與環(huán)境發(fā)生大量真實交互:調(diào)用API、讀寫文件、操控瀏覽器、驅(qū)動數(shù)據(jù)庫、以及與其他Agent協(xié)同通信。

      一個完整任務(wù)的執(zhí)行鏈,可能橫跨數(shù)十個步驟、多個工具鏈與多個運行層級。

      這種復(fù)雜性本身,就天然構(gòu)成了行為掩護層。

      更可怕的是,模型會在被監(jiān)控的環(huán)境下,主動調(diào)整自己的行為表現(xiàn)不是按規(guī)則執(zhí)行,而是「按規(guī)則表演」。

      這不是科幻設(shè)定。而是已經(jīng)在論文里、在紅隊報告里、在企業(yè)內(nèi)部事故復(fù)盤里反復(fù)出現(xiàn)的真實風(fēng)險。

      當(dāng)企業(yè)內(nèi)部同時運行數(shù)十甚至上百個Agent,由不同團隊、不同框架與不同模型構(gòu)建時,一個更現(xiàn)實的問題隨之出現(xiàn):

      系統(tǒng)已經(jīng)無法完整感知,自己正在運行多少個Agent。更無法確認,它們真正在做什么。

      Fangcun Observer

      看見真實動作,守住安全邊界

      來自清華大學(xué)人工智能學(xué)院、交叉信息研究院的方寸躍遷給Observer指定了一條設(shè)計哲學(xué)——

      別問Agent想做什么,看它到底做了什么。

      聽起來簡單,真正的挑戰(zhàn)在于把它鍛造成穩(wěn)定、低延遲、可審計、可規(guī)模化的系統(tǒng)。

      視角的反轉(zhuǎn)

      主流的Agent安全方案,幾乎清一色接在表層:提示詞里的安全規(guī)則、輸入輸出的內(nèi)容過濾、運行時的日志審計、Agent Harness提供的SDK Hook。

      每一層都有人在做。

      每一層也都有同一個盲區(qū):它們看到的,都是Agent在框架邊界上「聲明」出來的那一層。

      Observer不走這條路。

      它直接下沉到操作系統(tǒng)層,不依賴任何框架插件,不依賴SDK接口,不依賴模型供應(yīng)商集成。業(yè)務(wù)代碼零改動,Agent無感知接入——觀測,即刻開始。

      它捕獲的,是Agent的真實行為:

      執(zhí)行了哪些系統(tǒng)命令

      讀寫了哪些文件

      發(fā)起了哪些網(wǎng)絡(luò)請求

      是否出現(xiàn)越權(quán)操作或高風(fēng)險行為序列

      過去的方案,看到的是Agent「說」了什么。Observer看到的,是Agent「做」了什么。


      聲明可以包裝,行為不會撒謊。

      五項核心能力

      重新定義Agent安全的邊界

      • OS層行為感知,徹底解耦Harness,開箱即用


      Agent生態(tài)日新月異,沒有任何一個框架能成為永久標準。今天是Open Claw,明天可能換成Hermes,后天又會有新的涌現(xiàn)。

      Observer直接在操作系統(tǒng)層感知Agent的真實動作,與上層框架、調(diào)用棧、模型供應(yīng)商完全解耦。

      無論Agent跑在哪套棧上,觀測能力始終有效。

      企業(yè)不需要為每一次技術(shù)遷移,重新接入一遍安全體系。

      • 無感知運行時觀測

      業(yè)務(wù)代碼零改動,計算開銷忽略不計,現(xiàn)有鏈路一行都不用碰。不是「改動很小」——真的不用動

      第二層更關(guān)鍵。Agent不會知道自己正在被觀測——你看到的,是它真正的行為。不是它「表演」給你看的樣子。

      • 實時干預(yù),主動阻斷,安全前置


      Observer不只是事后復(fù)盤工具。

      危險命令執(zhí)行、敏感文件操作、異常網(wǎng)絡(luò)訪問、越權(quán)持久化——針對這些高風(fēng)險行為,系統(tǒng)在行為落地之前完成實時研判,按策略執(zhí)行通知、暫停或直接阻斷。

      從亡羊補牢,變成關(guān)門打狗

      • 全鏈路溯源,揪出隱藏威脅


      真正的風(fēng)險,從來不在表面。

      Observer把運行時的真實行為、Agent的決策動作與模型上下文關(guān)聯(lián)成完整的行為圖譜——每一個風(fēng)險事件,都能追溯到完整的決策鏈路。

      哪怕是環(huán)境投毒攻擊;哪怕是從不親自動手、只靠影響其他Agent來轉(zhuǎn)嫁風(fēng)險的惡意Agent——在多Agent協(xié)作網(wǎng)絡(luò)里,都無處遁形

      • 本地審計+自進化防御策略

      所有觀測、審計、事件數(shù)據(jù)均可完整本地沉淀,不上云、不外傳。

      策略模型基于真實運行數(shù)據(jù)持續(xù)迭代,從靜態(tài)規(guī)則走向自進化防御。

      安全能力,隨業(yè)務(wù)規(guī)模一同生長。

      Fangcun Guard

      讓安全審核,從「性能稅」變成「基礎(chǔ)設(shè)施

      Observer守住的是Agent在系統(tǒng)層的真實行為。

      但Agent的輸入和輸出,同樣需要一道護欄。

      一個真正能放進生產(chǎn)環(huán)境的安全護欄,到底要做到什么?

      夠快。一次完整的Agent對話,要過2到4道審核:用戶輸入、工具調(diào)用入?yún)ⅰ⒛P洼敵觥⒐ぞ叻祷亍C恳坏蓝疾荒芡下脩趔w驗。

      夠準。不能某一類強、某一類崩。漏檢少,誤拒低,所有主流場景都要穩(wěn)定輸出。

      夠靈活金融、醫(yī)療、教育、游戲,每個場景的風(fēng)險結(jié)構(gòu)完全不同。一套固定閾值打天下,行不通。

      業(yè)內(nèi)主流的開源安全大模型——Llama Guard、NVIDIA Nemotron、Qwen3 Guard、xGuard——已經(jīng)把這件事推到了相當(dāng)不錯的水平。

      同時把「快、準、靈活」三件事都做到頂尖?

      Fangcun Guard,是方寸躍遷給出的答案。

      數(shù)據(jù)怎么樣,直接看圖

      6項公開benchmark,7款最常用的開源安全模型,同條件對齊評測。


      先看綜合檢測準確性:Fangcun Guard=91.1。開源方案的區(qū)間,分布在70到88之間。

      再看p99推理延時:Fangcun Guard=8毫秒。8B量級的開源方案普遍在130毫秒以上,0.6B的輕量方案能壓到50毫秒以內(nèi)——但F1上還有差距。


      5項差異化能力

      決定它能不能進生產(chǎn)環(huán)境


      • 判定不偏科,灰區(qū)話術(shù)不放過

      一般有害內(nèi)容,能判。精心構(gòu)造的越獄攻擊,能判。深度偽裝成正常對話的灰區(qū)話術(shù)——也能判。

      跨場景穩(wěn)定輸出,是進生產(chǎn)環(huán)境的唯一門票。

      • 毫秒級響應(yīng),安全審核變基礎(chǔ)設(shè)施

      一次完整Agent對話,要過4道審核。4道全跑Guard,總耗時30毫秒。

      用戶感知不到。業(yè)務(wù)感知不到。

      安全審核,從「性能稅」變成了默認開啟、隨處可加的基礎(chǔ)設(shè)施

      • 中文場景,專項打磨

      通用安全大模型的慣常操作:全世界語言一鍋燉,英文亮眼,中文長尾頻繁漏過。

      Fangcun Guard把風(fēng)險拆成10個獨立類別,每一類基于中文場景專項合成數(shù)據(jù)、專項對齊訓(xùn)練。跨語種攻擊、口語化越獄、長尾邊緣案例,穩(wěn)定召回。

      • 10類風(fēng)險獨立可調(diào),不再一刀切

      通用安全模型只給「開/關(guān)」兩檔。但金融、醫(yī)療、教育、游戲,每個場景的風(fēng)險結(jié)構(gòu)完全不同。

      FangcunGuard把10類風(fēng)險作為獨立維度暴露給企業(yè),每一類攔截閾值單獨配置,Web控制臺或接口中按業(yè)務(wù)自調(diào)。

      • 主流Agent生態(tài)一鍵接入

      主流Agent框架開箱即用,業(yè)務(wù)代碼零改動。

      如果你的Agent還卡在130毫秒的延遲里——

      是時候換一個8毫秒搞定的護欄了。

      Skill Ward

      三階段檢測,真實蜜罐運行

      Observer守運行時行為,Guard守輸入輸出邊界。

      但隨著Agent的持續(xù)發(fā)展,還有一類風(fēng)險來自更上游——第三方Skill

      這個生態(tài)已經(jīng)長成了Agent的「App Store」。

      Claude Skills、OpenAI Apps、Claw Hub,幾十萬個第三方Skill匯聚其中。

      行業(yè)現(xiàn)有的方案,幾乎全部停留在靜態(tài)掃描:掃一遍代碼、查可疑導(dǎo)入、檢索黑名單關(guān)鍵詞。

      但惡意Skill真正的殺招,從來不在靜態(tài)代碼里。

      那行寫著「讀取配置文件」的代碼,跑起來才去拉遠程載荷;

      那段標注「調(diào)試日志」的邏輯,觸發(fā)后才向外發(fā)請求;

      那個看上去合法的依賴包,在特定參數(shù)下才激活后門。

      只看代碼,看不出來。

      Skill Ward,是方寸躍遷推出的全球首個三階段Agent Skill安全掃描器——不只是靜態(tài)檢查,是真實運行一遍。


      第一階段:靜態(tài)分析——惡意簽名、危險調(diào)用、可疑依賴,先過一遍。

      第二階段:大模型研判——理解Skill真實意圖,識別偽裝話術(shù)、混淆邏輯、社工誘導(dǎo)。

      第三階段:Docker蜜罐沙箱實際執(zhí)行——真正的殺手锏。

      每一個Skill都會被丟進隔離的蜜罐環(huán)境,真實跑一遍。

      調(diào)用了哪些命令、訪問了哪些路徑、連接了哪些外部地址、有沒有嘗試持久化、有沒有橫向探測——一切行為,無處遁形。

      那些「看上去無害、運行時才動手」的Skill,在這一關(guān)原形畢露。

      5000個真實Skill實測:僅靠靜態(tài)掃描,會漏掉約三分之一的運行時威脅。這部分,全部由蜜罐沙箱階段抓出。

      運行時的真實行為軌跡,才是答案。

      事前、事中、事后

      Agent安全的完整邊界

      Skill Ward,守事前——Skill裝入Agent之前的最后一關(guān)

      Fangcun Guard,守事中的輸入輸出——8毫秒的護欄,安全審核變基礎(chǔ)設(shè)施

      Fangcun Observer,守事中的真實行為,沉淀事后審計——操作系統(tǒng)層的真相,無法造假。

      過去兩年,行業(yè)把幾乎所有火力,砸在了Agent能力的天花板上。

      但Agent真正大規(guī)模進入企業(yè)生產(chǎn)環(huán)境的那一刻,決定它能不能落地的,從來不是它有多聰明——

      而是它有多可控你知道有多少個Agent在運行。你知道每一個Agent真正在做什么。你能在它做錯事之前阻斷它。你能在它做對事的時候,讓它跑得足夠快。

      Agent時代的安全邊界,第一次被完整畫出來。

      在Agent安全尚處早期定義階段的當(dāng)下,方寸躍遷正通過產(chǎn)品與技術(shù)加速構(gòu)建起Agent時代的全新安全基礎(chǔ)設(shè)施平臺。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

      我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

      草莓解說體育
      2026-04-12 17:05:01
      10米天使巨人“墜落”上海!市民:商場不止售賣,更是展示藝術(shù)的好地方

      10米天使巨人“墜落”上海!市民:商場不止售賣,更是展示藝術(shù)的好地方

      新聞晨報隨申Hi
      2026-05-11 10:10:05
      Alphabet市值逼近全球第一

      Alphabet市值逼近全球第一

      財聞
      2026-05-11 10:13:29
      1949年上海解放,軍管會查收敵財政局,局長竟叫囂:把潘漢年找來

      1949年上海解放,軍管會查收敵財政局,局長竟叫囂:把潘漢年找來

      浩渺青史
      2026-05-10 19:04:07
      今年俄羅斯勝利日閱兵,為何唯獨朝鮮派兵參加?中國怎么沒派

      今年俄羅斯勝利日閱兵,為何唯獨朝鮮派兵參加?中國怎么沒派

      劉振起觀點
      2026-05-10 16:05:00
      這5款汽車突然宣布開始停產(chǎn),終究還是敗給了新能源車

      這5款汽車突然宣布開始停產(chǎn),終究還是敗給了新能源車

      小怪吃美食
      2026-05-11 10:34:55
      明目張膽造假,中國電影還有救嗎?

      明目張膽造假,中國電影還有救嗎?

      閑人電影
      2026-05-08 18:31:17
      又談崩了,美國和伊朗,你們真費巴基斯坦啊

      又談崩了,美國和伊朗,你們真費巴基斯坦啊

      牛彈琴
      2026-05-11 07:27:22
      因禍得福!燒129年的地下火被滅,新疆憑空多了個“金飯碗”

      因禍得福!燒129年的地下火被滅,新疆憑空多了個“金飯碗”

      夢在深巷aqa
      2026-03-26 08:02:47
      衡水中學(xué)的清北人數(shù)徹底崩了!巔峰期275人,跌至2025年的45人…

      衡水中學(xué)的清北人數(shù)徹底崩了!巔峰期275人,跌至2025年的45人…

      火山詩話
      2026-05-08 17:44:41
      搞不懂!一個2米13中鋒,29歲拿到8000萬合同,30歲被擺上了貨架

      搞不懂!一個2米13中鋒,29歲拿到8000萬合同,30歲被擺上了貨架

      球毛鬼胎
      2026-05-09 16:14:33
      陳若儀曬和Kimi合照慶母親節(jié),公開13年前齙牙照坦言不敢公開社群

      陳若儀曬和Kimi合照慶母親節(jié),公開13年前齙牙照坦言不敢公開社群

      小椰的奶奶
      2026-05-11 03:51:11
      暴漲!韓國股市熔斷

      暴漲!韓國股市熔斷

      中國基金報
      2026-05-11 09:34:00
      光谷玻璃硬盤量產(chǎn),一片可存2.5萬部電影,傳統(tǒng)硬盤或迎末日

      光谷玻璃硬盤量產(chǎn),一片可存2.5萬部電影,傳統(tǒng)硬盤或迎末日

      豬小艷吖
      2026-05-10 05:31:39
      北大學(xué)神吳謝宇弒母真相:與他的口述不符,與舅舅透露的細節(jié)有關(guān)

      北大學(xué)神吳謝宇弒母真相:與他的口述不符,與舅舅透露的細節(jié)有關(guān)

      微野談寫作
      2026-05-02 15:50:08
      三星堆新發(fā)現(xiàn)!7號坑出土“來自上天的饋贈”

      三星堆新發(fā)現(xiàn)!7號坑出土“來自上天的饋贈”

      封面新聞
      2026-05-10 19:20:05
      一天中,最佳的性生活時間是在幾點?早上好還是晚上好?出乎意料

      一天中,最佳的性生活時間是在幾點?早上好還是晚上好?出乎意料

      荊醫(yī)生科普
      2026-05-06 20:55:04
      孩子脫臼復(fù)位只收100元,家長舉報亂收費!衛(wèi)健委:應(yīng)收110元,你還少給了!家長拒繳費后離開!

      孩子脫臼復(fù)位只收100元,家長舉報亂收費!衛(wèi)健委:應(yīng)收110元,你還少給了!家長拒繳費后離開!

      醫(yī)脈圈
      2026-04-25 20:04:06
      被終身禁足!36歲前國門時隔3年再露面 曾收80萬踢假球助泰山奪冠

      被終身禁足!36歲前國門時隔3年再露面 曾收80萬踢假球助泰山奪冠

      我愛英超
      2026-05-10 12:31:04
      閱兵結(jié)束后,普京馬上宣布將與中國有重大合作!

      閱兵結(jié)束后,普京馬上宣布將與中國有重大合作!

      阿龍聊軍事
      2026-05-10 21:08:10
      2026-05-11 11:56:49
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
      15181文章數(shù) 66862關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機會

      頭條要聞

      特朗普時隔9年再度訪華 今年特朗普還贊嘆中國儀仗隊

      頭條要聞

      特朗普時隔9年再度訪華 今年特朗普還贊嘆中國儀仗隊

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學(xué)畢業(yè)了

      娛樂要聞

      謝霆鋒沒想到,王菲靠張藝謀重返巔峰

      財經(jīng)要聞

      "手搓汽車"曝光:偽造證件、電池以舊代新

      汽車要聞

      全球化成國內(nèi)車企未來勝負手,誰是出海最強"水手"?

      態(tài)度原創(chuàng)

      教育
      時尚
      數(shù)碼
      親子
      軍事航空

      教育要聞

      家長的基本修養(yǎng)是“不拖后腿”

      輕松拿捏又甜又酷的造型,試試這些輕熟穿搭,溫柔有女人味兒

      數(shù)碼要聞

      等了快一年:貓頭鷹黑色版NF-A12x25 G2終于要來了!官方開始預(yù)熱

      親子要聞

      fsh值如何降下來?卵子質(zhì)量不好要調(diào)理卵巢嗎?

      軍事要聞

      伊朗革命衛(wèi)隊深夜警告

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 精品欧洲av无码一区二区14| 91久久国产情侣真实对白| 四虎影视88aa久久人妻| 免费大片黄国产在线观看| 亚洲国产精品一区二区www| 麻豆福利导航| 精品久久久久久无码免费| 国产精品久久久久久久影院| 国产精品美女一区二区三| 亚洲中文字幕AV无码专区| 精品人妻av一区二区三区| 久久久久免费看成人影片| 最大成人精品一区| 91精品午夜福利在线观看| 91超碰在线国产精品| 国产一级小视频| 久热在线这里只有精品国产| 99久久精品美女高潮喷水| 欧美午夜理伦三级在线观看| 无码精品久久一区二区三区| 色噜噜人妻丝袜AⅤ资源| 国产午夜精品成人在线| 香蕉在线精品一区二区| 人人澡人人曰人人摸看| 中文字幕第55页一区| 国产AV一区二区精品凹凸| 大肉大捧一进一出好爽视频mba | 操碰在线视频| 小12箩利洗澡无码视频网站 | 日韩无码2020| 国产欧美一区二区三区在线| 两个男人吮她的花蒂和奶水视频| 久久久久国产精品免费免费搜索| 午夜不卡av免费| 青草内射中出高潮| 精品国产一区91在线| 9久久伊人精品综合| 老太脱裤子让老头玩xxxxx| 欧美日韩亚洲国产| 18禁91| 婷婷综合久久中文字幕|