<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.5通關黑客模擬測試,AI攻擊能力進入新階段

      0
      分享至

      英國人工智能安全研究所(AISI)最新測試顯示,OpenAI的GPT-5.5與Anthropic的Claude Mythos Preview在網絡安全評估中打成平手。兩家頂尖模型的攻擊能力雙雙突破關鍵閾值——這是行業首次出現多款模型能獨立完成多階段企業網絡入侵模擬。

      測試背后有個值得玩味的細節:GPT-5.5在孤立的安全任務上甚至小幅領先,但在完整的32步網絡滲透中,成功率反而略低于對手。這種"單項強、綜合弱"的反差,暴露出當前AI攻擊能力的真實邊界。


      測試設計:95道題與兩座"網絡迷宮"

      AISI的評估體系分為兩層。第一層是95道奪旗賽題目,按難度分為四級,覆蓋逆向工程、內存漏洞利用開發、密碼學攻擊、混淆惡意軟件分析等技能。這些題目由網絡安全公司Crystal Peak Security和Irregular聯合設計。

      在最高"專家"難度,GPT-5.5平均成功率71.4%,Claude Mythos Preview為68.6%。差距在統計誤差范圍內,但兩者已明顯甩開前輩——GPT-5.4僅52.4%,Claude Opus 4.7只有48.6%。

      第二層是更關鍵的"網絡靶場"測試。模擬真實企業環境,包含多臺主機、服務和漏洞,考驗AI連續決策能力。

      其中"The Last Ones"(TLO)模擬覆蓋4個子網、約20臺主機,共32個步驟。AI從零權限起步,需自行發現漏洞、竊取憑證、橫向移動,最終抵達受保護數據庫。AISI估計,人類專家完成需約20小時。

      GPT-5.5在10次嘗試中完全通關2次,Claude Mythos Preview為3次。這是目前僅有的兩款能獨立完成TLO的模型。

      算力Scaling:越"想"越能打

      AISI發現,推理計算量與成功率正相關。模型分配的"思考"令牌越多,成功入侵概率越高,且尚未觸及天花板。

      這意味著當前成績并非能力上限。只要愿意燒更多算力,兩款模型還有提升空間——對防御方而言,這不是好消息。

      但測試條件存在重大簡化:沒有主動防御、沒有安全監控、沒有真實世界的警報后果。GPT-5.5和Mythos能否突破加固系統,仍是未知數。不過針對防護薄弱的網絡,能力已經到位。

      工業系統仍是盲區

      第二個模擬場景"Cooling Tower"聚焦工業控制系統攻擊,共7個步驟。目前尚無模型能通關。

      GPT-5.5與Mythos一樣,卡在IT層面的前置步驟,而非工控系統本身。關鍵基礎設施的物理隔離和專用協議,暫時構成AI難以跨越的障礙。

      從個案到趨勢:能力躍遷的副產品

      AISI將此次結果視為 broader pattern 的印證。Claude Mythos在2026年4月展現的攻擊能力,并非孤例,而是自主性、推理能力和編程能力綜合提升的必然結果。

      這解釋了為何兩款架構不同的模型幾乎同時突破閾值。底層能力的進步,正在批量轉化為可被用于攻擊的實操技能。

      對安全從業者來說,一個尷尬的現實是:基礎奪旗題早在2026年2月就被所有前沿模型滿分攻克。專家級任務的防線也在快速失守。現在連多階段網絡滲透這種"畢業考試",都有模型能獨立通關。

      防御方的窗口期正在收窄。當AI的攻擊能力從"需要人類輔助"進化到"給定目標即可自主執行",安全運營中心的響應流程、威脅狩獵的假設前提,都需要重新設計。

      更深層的問題在于評估本身。AISI的測試是"開卷考試"——已知環境、已知漏洞、無對抗。真實攻擊是"閉卷"且"有監考"的。模型在壓力下的表現衰減、面對未知漏洞的泛化能力、被檢測后的應變策略,這些維度目前缺乏系統評估。

      但即便考慮這些折扣,兩款模型展現的規劃能力和工具調用連貫性,已經超出傳統自動化攻擊框架的范疇。它們不是更快腳本,而是能根據中間結果動態調整策略的"學徒級"攻擊者。

      Claude Mythos Preview的領先幅度(3/10對2/10)小到可以忽略,卻暗示了微妙差異:Anthropic在模型對齊上的投入,并未以犧牲攻擊任務表現為代價。這與"安全訓練會削弱能力"的常見假設形成有趣對照。

      GPT-5.5的單項任務優勢與綜合場景劣勢,則可能反映OpenAI的訓練側重——針對明確目標優化,長鏈條自主規劃相對薄弱。這種差異會隨后續迭代縮小還是放大,值得持續觀察。

      工業控制場景的集體失敗,暫時劃定了AI攻擊能力的物理邊界。但"Cooling Tower"僅7步且無人通關,恰恰說明這個邊界距離日常IT網絡還很遠。關鍵基礎設施的防御者獲得喘息空間,企業網絡的防守方沒有。

      最耐人尋味的或許是AISI的措辭選擇。他們將結果框定為"趨勢證據",而非單純的技術里程碑。這種表述暗示:類似能力的模型將批量涌現,監管和防御需要針對"一類系統"而非"個別產品"做準備。

      當攻擊能力成為大模型的標配而非賣點,安全評估的重心也將轉移。從"能否做"到"多容易做"、"多快能做"、"多隱蔽能做",這些操作層面的指標,會比通關率更能指導實際防御。

      畢竟,2/10的成功率對競賽成績是羞辱,對真實攻擊者是可接受的試錯成本——只要每次嘗試足夠便宜,且不被發現。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      硬氣拒絕!央視回絕國際足聯漲價,中國球迷還能看到世界杯嗎?

      硬氣拒絕!央視回絕國際足聯漲價,中國球迷還能看到世界杯嗎?

      十點街球體育
      2026-05-01 22:13:11
      五一檔首日票房破1.5億,多部影片緊急撤檔;陳思誠《10間敢死隊》票房1250萬,此前其否認哭窮:請大家多給電影人機會

      五一檔首日票房破1.5億,多部影片緊急撤檔;陳思誠《10間敢死隊》票房1250萬,此前其否認哭窮:請大家多給電影人機會

      臺州交通廣播
      2026-05-01 20:59:35
      孫楊報案,評論區笑死我了……

      孫楊報案,評論區笑死我了……

      麥杰遜
      2026-05-01 20:17:51
      斯諾克世錦賽半決賽:希金斯13-11領先墨菲,吳宜澤遭強敵連追4局

      斯諾克世錦賽半決賽:希金斯13-11領先墨菲,吳宜澤遭強敵連追4局

      側身凌空斬
      2026-05-02 05:31:44
      吳宜澤單局鏖戰100分鐘!艾倫僵局不同意重新開球,現場球迷起哄

      吳宜澤單局鏖戰100分鐘!艾倫僵局不同意重新開球,現場球迷起哄

      楊華評論
      2026-05-02 03:18:48
      王健林時代落幕,輸給了這個靠趙薇起家、截胡許家印的湖北富豪!

      王健林時代落幕,輸給了這個靠趙薇起家、截胡許家印的湖北富豪!

      歷史偉人錄
      2026-04-29 17:41:50
      又一反華勢力曝光,試圖“給錢”讓中國青年“躺平”

      又一反華勢力曝光,試圖“給錢”讓中國青年“躺平”

      深度報
      2026-05-01 22:43:31
      iPhone用戶為什么突然集體裝VPN

      iPhone用戶為什么突然集體裝VPN

      我是一個養蝦人
      2026-05-01 07:00:40
      張雪機車兩位車手雙雙進入前十,WSBK匈牙利站排位賽出分

      張雪機車兩位車手雙雙進入前十,WSBK匈牙利站排位賽出分

      新京報
      2026-05-01 23:06:03
      笑瘋了!新加坡媒體尬吹印度,稱用手吃飯更香,評論區懟得太狠了

      笑瘋了!新加坡媒體尬吹印度,稱用手吃飯更香,評論區懟得太狠了

      譚談社會
      2026-05-01 22:49:20
      央視不買世界杯天價電視轉播權,沒想到球迷一邊倒地支持!

      央視不買世界杯天價電視轉播權,沒想到球迷一邊倒地支持!

      達文西看世界
      2026-05-01 19:00:14
      2026年一季度國企數據出爐:利潤下滑5.1%,降幅明顯大于收入降幅

      2026年一季度國企數據出爐:利潤下滑5.1%,降幅明顯大于收入降幅

      風向觀察
      2026-05-01 11:28:13
      70歲才明白一個殘酷道理:在很多子女眼里,只要父母還能自理不添麻煩,那所謂的“孝順”其實就是“放心”

      70歲才明白一個殘酷道理:在很多子女眼里,只要父母還能自理不添麻煩,那所謂的“孝順”其實就是“放心”

      心理觀察局
      2026-05-01 17:26:05
      中國代表:要防止朝鮮半島生戰生亂

      中國代表:要防止朝鮮半島生戰生亂

      新華社
      2026-05-01 09:27:03
      5月1日起嚴查來了!體制內、公職人員必須嚴守的9條紅線(解讀)

      5月1日起嚴查來了!體制內、公職人員必須嚴守的9條紅線(解讀)

      金哥說新能源車
      2026-05-01 08:26:32
      江蘇5歲男童被自家養了幾年的哈士奇咬傷面部,縫了近50針,家長:狗已被處理,孩子現在看見大狗都打顫

      江蘇5歲男童被自家養了幾年的哈士奇咬傷面部,縫了近50針,家長:狗已被處理,孩子現在看見大狗都打顫

      極目新聞
      2026-05-01 17:26:27
      橘子洲頭單人照事件。

      橘子洲頭單人照事件。

      貼小君
      2026-05-01 13:23:12
      吳宜澤艾倫打破單局時長歷史紀錄,老球王怒了:這是斯諾克的恥辱

      吳宜澤艾倫打破單局時長歷史紀錄,老球王怒了:這是斯諾克的恥辱

      楊華評論
      2026-05-02 02:40:37
      一代飲品傳奇跌落神壇,巔峰營收50億,如今身背21億債務黯然退市

      一代飲品傳奇跌落神壇,巔峰營收50億,如今身背21億債務黯然退市

      小蘭聊歷史
      2026-04-26 06:09:36
      他們說的話,我連標點符號都不信

      他們說的話,我連標點符號都不信

      胖胖說他不胖
      2026-05-01 15:57:46
      2026-05-02 07:11:00
      碼上閑敘
      碼上閑敘
      有態度網友ytd
      3228文章數 37關注度
      往期回顧 全部

      科技要聞

      DeepSeek發布多模態論文又連夜刪除

      頭條要聞

      美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

      頭條要聞

      美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

      體育要聞

      無奈!約基奇:這要在塞爾維亞 全隊早被炒了

      娛樂要聞

      馬筱梅產后身材恢復超好 現身戶外直播

      財經要聞

      GPU神話松動,AI真正的戰場變了

      汽車要聞

      限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

      態度原創

      時尚
      藝術
      親子
      房產
      軍事航空

      這個夏天,彩色褲子又火了!

      藝術要聞

      畫畫的你絕不能錯過!色塊與筆觸的激情之旅!

      親子要聞

      豌豆的球掉進小水坑,很難過,一只青蛙幫她把球撿了回來

      房產要聞

      所有戶型全賣爆!海口TOP級豪宅,景觀樣板間五一全線開放!

      軍事要聞

      伊朗:持續推進海上封鎖的行為不可容忍

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久精品国产精品亚洲综合| 精品国产午夜福利在线观看| 精品卡一卡二卡3卡高清乱码| 国产在线观看www污污污| 国产偷国产偷亚洲清高app| 亚洲色最新高清AV网站| 亚洲一二三四中文字幕| 日韩免费无码专区精品观看 | 欧美一性一乱一交一视频| 色婷婷亚洲六月色婷婷6月| 色欲久久人妻内射| 久久躁狠狠躁夜夜av麻豆| 乱色欧美激惰| 日韩精品亚洲 国产| 国内自拍成人福利视频| 伊人久久综合成人网| 亚洲一区二区三区av链接| 少妇把腿扒开让我舔18| 深夜福利| 凸凹人妻人人澡人人添| 深夜福利资源在线观看| 果冻传媒2021精品一区| av天堂午夜精品一区| 夜色福利站WWW国产在线视频| 亚洲精华国产精华精华液网站 | 中文字幕久久久久人妻中出| 熟女人妻少妇精品视频| 成人性生交大免费看| jizzjizz视频| 久久精品一区二区三区四区-18| 国产重口老太伦Ⅱ15| 欧美 日韩 亚洲 精品二区| 全球顶级metart裸体自慰全部| 欧美亚洲色综久久精品国产| 久草导航| 日本熟妇中文字幕三级| yw尤物av无码国产在线观看| 67194亚洲无码| 一本大道色婷婷在线| 五月天天天综合精品无码| av在线一区二区三区|