來源:市場資訊
(來源:AI信息Gap)
Sam Altman 又官宣了。
4 月 30 日,他深夜發文,「一個全新的網絡安全模型 GPT-5.5-Cyber 將會在幾天內推送給關鍵的網絡防御者。」
![]()
幾乎同一時間,Anthropic 的 Claude Security(一款安全掃描工具)向企業用戶開放公測,之前是內部預覽階段。
![]()
兩個 AI 巨頭,把目光同時對準了網絡安全。
英國 AI 安全研究所(AISI)測試了 95 道網安任務,專家級通過率,GPT-5.5 71.4%,Claude Mythos Preview 68.6%。AISI 在博客里寫道,「GPT-5.5 可能是他們測過的最強模型。」
其中一個任務,人類專家平均要 12 小時。GPT-5.5 用了 11 分鐘,花費 1.73 美元。
關鍵不是 71.4% 這個數字。關鍵是,這還是第一次有模型追上 Mythos。
Mythos 是 Anthropic 4 月 7 日發布的「AI 核武器」,定位是比 Claude Opus 系列更強一層的模型。
Anthropic 披露過幾組內部數據。Mythos 運行 1000 次,燒了不到 2 萬美元,挖出了 OpenBSD 里 27 年沒人發現的 TCP SACK 零日漏洞。它還自主完成了 FreeBSD 17 年遠程代碼執行漏洞的全套利用流程。
在與 Mozilla 合作的 Firefox 漏洞測試里,Opus 4.6 試了幾百次,僅成功 2 次。Mythos 成功 181 次,并實現 29 次寄存器控制。Mozilla 后來用它修補了 271 個 Firefox 漏洞。
![]()
Anthropic 自己給 Mythos 貼的標簽是「太危險,不能公開」。
不到兩個月,OpenAI 就拿出了同等水平的模型。
GPT-5.5-Cyber 不是 OpenAI 的第一個安全模型。
4 月 14 日,他們已經發布過一版 GPT-5.4-Cyber,主打二進制反編譯。不要源代碼就能審計編譯后的軟件,查找漏洞、惡意軟件、依賴污染。GPT-5.5-Cyber 在它之上更進一步。
它屬于 OpenAI 的「信任接入」(Trusted Access for Cyber)計劃。這個計劃 2 月上線,已經簽下來一大批企業客戶,包括貝萊德、花旗、思科、Cloudflare、CrowdStrike、英偉達、Oracle 等。
OpenAI 給 GPT-5.5 做安全評估時,把 GPT-5.5 評成網絡安全「High」級。
也就是,能力很強,但還沒到 Critical 閾值。
同一天,Anthropic 把 Claude Security 轉入了公開測試。
之前叫 Claude Code Security,2 月開啟內部預覽,幾百家公司在用。這次正式改名 Claude Security,面向 Claude 企業客戶開放,Team 和 Max 用戶即將跟進。
![]()
Claude Security 沒有繼承 Mythos。底層模型是 Opus 4.7。
它的工作流并不復雜。掃描代碼庫,多階段驗證降低誤報,然后生成一份附帶置信度的修復方案。再加上 Slack/Jira webhook、定時掃描、CSV 導出功能。
Claude Security 的合作名單和上面 OpenAI 那份名單幾乎完全重合。
Anthropic 在產品博客里這樣寫道。
「現在的模型已經能在代碼里找漏洞。下一代會更強,能自己利用漏洞。」
這話更像是在打預防針。
回頭看 AISI 那份報告。
95 道 CTF(奪旗賽)任務,覆蓋逆向工程、Web 攻擊、密碼學。
還有一道測試叫「The Last Ones」(TLO)。32 步企業內網攻擊模擬,從一臺沒憑證的攻擊機起步,要打穿四層子網、20 多臺主機,繞過自動化部署、跨網段橫移,最后偷走一個內部數據庫的數據。人類專家平均需要 20 小時。
Mythos 是第一個完整跑完 TLO 的模型,10 次有 3 次成功。
GPT-5.5,10 次有 2 次成功。
![]()
AISI 說,專家級任務上 GPT-5.5 可能是他們測過的最強模型,但優勢仍在誤差范圍內。
Mythos 最近還出過一個意外。
4 月 21 日,Bloomberg 報道,在一個私有的 Discord 頻道里,幾個用戶根據 Anthropic 給其他模型用過的 URL 命名習慣,硬生生猜出了 Mythos 的部署位置。然后通過一個第三方承包商的內部門戶,拿到了訪問權。
整件事里,雖然 Anthropic 自家系統沒被攻破,但供應商那邊掉鏈子了。
Mythos 沒有公開開放。
它只通過 Anthropic 4 月 7 日啟動的 Project Glasswing 開放。12 家合作伙伴外加 40 多家關鍵基礎設施組織拿到了訪問權限,包括 AWS、蘋果、谷歌、微軟、思科、英偉達、博通等。Anthropic 準備了 1 億美元的模型調用額度。
搞得這么神秘,最后還是泄露了。
Anthropic 的新模型也已經在路上。
據爆料 Anthropic 已經開始通過紅隊測試一個新模型,代號 claude-jupiter-v1-p。
![]()
去年這個時候,他們用過一次行星代號 Neptune,幾周后就發布了 Claude 4 全家桶模型。
Jupiter 大概率就是下一代主力。
順便一提。5 月 6 日,Anthropic 在舊金山舉辦「Code with Claude」開發者大會。
4 月 21 日,Sam Altman 參加 Ashlee Vance 的 Core Memory 播客時,瘋狂嘲諷。
「這套營銷(Mythos)做得很厲害。我們造了顆炸彈,馬上要扔到你頭上。但我們能賣你一個 1 億美元的避難所。」
「炸彈」指的是 Mythos 的漏洞挖掘能力,「避難所」指的是 Project Glasswing 的付費合作模式。明顯吐槽 Anthropic 先把你唬住,再把解藥賣給你。
然而 9 天后,他自己也開始把模型只開放給「關鍵的網絡防御者」。
我是木易,Top2 + 美國 Top10 CS 碩,現在是 AI 產品經理。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.