由于不可抗力的限流導致無法接收推送文章的問題,我們迫切需要以下操作:
點擊標題下方藍字 “一半杯 ” → 點擊右上角“...” → 點選“設為星標★”,這樣就更容易找到我們和收到推送文章!
保持愛讀文章,保持領先!
![]()
人工智能領域的網絡安全競賽正進入白熱化階段。上個月,人工智能企業Anthropic對其名為Mythos Preview(預覽版)的大語言模型進行了高調宣傳,聲稱該模型在網絡安全方面構成了巨大的威脅,并以此為由決定將其初始版本僅限“關鍵行業合作伙伴”使用。然而,這一“神話”的獨特性似乎已被打破。根據英國人工智能安全研究所(AISI)發布的最新研究結果表明,OpenAI于上周公開發布的GPT-5.5模型在網絡安全評估中,已經達到了與Mythos Preview相似的性能水平。
評估數據曝光:GPT-5.5在極高難度挑戰中表現搶眼
自2023年以來,英國人工智能安全研究所(AISI)一直致力于通過95項不同的“奪旗賽”挑戰來測試各類前沿AI模型的網絡安全能力。這些復雜的測試涵蓋了逆向工程、網絡漏洞利用以及密碼學等多個關鍵的專業領域。
在最高級別的“專家(Expert)”難度任務中,測試數據揭示了令人矚目的結果:新近推出的GPT-5.5平均通過率達到了71.4%,這一成績甚至略高于Anthropic公司Mythos Preview模型所取得的68.6%的平均通過率(盡管研究人員指出該差距仍在誤差范圍之內)。
在其中一項極其困難的特定任務中,AI需要構建一個反匯編程序來解碼一段Rust二進制代碼。AISI的研究報告特別指出,GPT-5.5在沒有任何人類協助的情況下,僅耗時10分鐘零22秒就成功解決了這項挑戰,并且在此過程中產生的API調用成本僅為微乎其微的1.73美元。這一驚人的效率和低廉的成本充分展示了其在自動化代碼解析和逆向工程方面的深厚實力。
深度滲透與破壞測試:突破防線與尚存的技術瓶頸
除了基礎的任務外,模型們還接受了更為復雜和貼近實戰的模擬攻擊測試。在一個名為“The Last Ones (TLO)”的AISI測試靶場中,研究人員設置了一個針對企業網絡的32步數據提取攻擊模擬。在以往的測試中,沒有任何一個早期的AI模型能夠成功完成過哪怕一次這樣的測試。
然而,在此次較量中,GPT-5.5在10次嘗試中成功了3次,不僅打破了以往零成功的記錄,還與Mythos Preview的表現(10次嘗試中成功2次)旗鼓相當,甚至略勝一籌。
盡管如此,這并不意味著這些頂級AI已經可以在網絡世界中為所欲為。在AISI設計的難度更高的“冷卻塔”模擬測試中——該測試旨在模擬對發電廠控制軟件的破壞企圖——GPT-5.5同樣未能成功實施破壞,這也是此前所有接受測試的AI模型共同面臨的技術瓶頸。
業界觀察:這是“特定模型突破”還是“行業整體進化”?
面對GPT-5.5交出的這份亮眼答卷,AISI在報告中給出了他們的專業洞察。研究人員指出,這些新的結果表明,在網絡安全風險方面,Mythos Preview之前展現出的強大能力可能并非是“特定于某一個模型的突破”。相反,這反映出前沿AI技術在“長期自主性、推理能力和編程能力方面普遍提升的副產品”。這說明整個大模型行業的基礎能力正在全面進化。
恐懼營銷”惹爭議:OpenAI CEO薩姆·奧特曼的犀利回應
伴隨著模型能力的躍升,業界對于“模型過于危險而不能公開發布”的討論也日益激烈。OpenAI首席執行官薩姆·奧特曼(Sam Altman)在最近接受《Core Memory》播客采訪時,對這種現象表達了明確的看法。他嚴厲批評了某些公司在推廣有限發布的AI模型時所采用的“基于恐懼的營銷”策略。
奧特曼在采訪中坦言,他“確信Mythos在網絡安全方面是一個偉大的模型”,但他一針見血地指出:“說‘我們制造了一顆炸彈。我們打算把它扔到你的頭上。然后我們將以1億美元的價格賣給你一個防空洞’,這顯然是令人難以置信的營銷手段。”
奧特曼進一步預測,“未來將會有更多關于模型過于危險而不能發布的言論出現。”但他同時也承認了客觀存在的行業風險,表示“確實也會有一些非常危險的模型,必須以不同的方式進行發布。”
受限發布的未來:OpenAI的“網絡防御者”專屬模型計劃
事實上,雖然批評了同行的營銷話術,OpenAI自身也在積極推進針對高風險網絡安全模型的受控制發布機制。今年2月,OpenAI推出了“網絡可信訪問”試點計劃。該機制允許安全研究人員和企業驗證其身份,并注冊他們研究OpenAI前沿模型以進行“合法的防御性工作”的意向。
利用這份可信訪問名單,OpenAI在上個月嚴格控制了GPT-5.4-Cyber模型的有限發布。據OpenAI官方介紹,這是一個專為增強網絡能力而有意進行微調的模型變體,并且減少了部分能力限制。
這一安全防御戰略正在進一步延續。本周四,OpenAI首席執行官薩姆·奧特曼在社交媒體上正式宣布,GPT-5.5-Cyber的初始版本也將采取類似的受限發布策略,在接下來的幾天內“僅限于關鍵的網絡防御者”使用。
這場關于AI與網絡安全的博弈,顯然才剛剛拉開序幕。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.