幾周前剛罵完Anthropic"搞小圈子",轉頭自己也搞起邀請制——GPT-5.5-Cyber的發布,讓OpenAI的批評和做法撞了個正著。
限量測試:誰有資格當"可信防御者"
![]()
Sam Altman在X上宣布,GPT-5.5-Cyber將在未來幾天內向特定群體開放。這個群體被他定義為"致力于保護關鍵系統的可信防御者"。
他的原話是:「我們將與整個生態系統和政府合作,為網絡領域確定可信訪問機制。」目標是「快速幫助保護公司和基礎設施」。
這個模型的能力很直接:滲透測試、漏洞發現、漏洞利用、惡意軟件分析。用OpenAI的話說,它能在別人濫用之前發現缺陷。
但問題也在這里——能破壞系統的工具,從來就不容易留在"正確的人"手里。
正方:能力確實過硬
獨立測試給了這顆定心丸。英國人工智能安全研究所本周表示,GPT-5.5-Cyber是"我們在網絡任務上測試過的最強模型之一"。
更具體的數據:它是第二個能從頭到尾完成該機構多步驟攻擊模擬的系統。不是演示視頻,是端到端跑通。
Altman的敘事也很清晰:網絡防御是一場速度競賽,好人需要更好的工具。限制訪問是暫時的,最終要和政府、生態一起找到"可信訪問"的平衡點。
這套邏輯放在安全圈并不陌生——零日漏洞的負責任披露、威脅情報的共享機制,都是先小范圍驗證,再逐步放開。
反方:批評別人的話,怎么解釋
尷尬的是時間線。
就在幾周前,Anthropic發布了Claude Mythos,同樣聚焦網絡安全,同樣只給約50家組織使用,同樣宣布永不公開。Altman當時在Core Memory播客上火力全開。
他的原話是:「世界上有些人,長期以來一直想把AI掌握在少數人手里。你可以用很多方式為此辯護。」
然后來了更尖銳的比喻:「我們造了一顆炸彈,正要扔到你頭上。我們會以1億美元的價格賣給你一個防空洞。」
現在OpenAI也在"檢查身份證"了。不是賣防空洞,但門確實上了鎖。
這種反差很難不讓人追問:限量測試和"小圈子控制"的邊界到底在哪?Anthropic的50家組織和OpenAI的"可信防御者"名單,本質區別是什么?
核心矛盾:工具的雙重屬性
網絡安全模型的特殊之處在于,攻防是一體兩面。
GPT-5.5-Cyber能 pentest(滲透測試)也能 exploit(漏洞利用),能拆惡意軟件也能寫惡意軟件。同樣的提示詞,換個意圖就是完全不同的輸出。
這意味著訪問控制不是簡單的"給或不給",而是"給誰、在什么場景下、有什么約束"。
OpenAI和Anthropic的分歧,可能不在于"要不要限制",而在于"誰來定義限制規則"。Anthropic選擇自己定規則、畫紅線;OpenAI則強調和政府、生態共同決策——至少話術上是這么說的。
但眼下的事實是:兩家都在做限量測試,都還沒公開。
行業信號:網絡安全成為大模型的首個"敏感領域"
值得注意的不是某一家公司的做法,而是這個領域的整體走向。
網絡安全可能是第一個讓主流AI公司普遍放棄"開放發布"策略的應用場景。之前的生物安全、化學安全討論更多停留在政策層面,而網絡工具已經實際進入限量測試階段。
英國AI安全研究所的介入也是個信號。政府背景的測試機構開始系統評估模型的攻擊能力,這在全球還是新鮮事。他們的認可意味著GPT-5.5-Cyber不是PPT產品,但也意味著這類評估可能成為未來發布的標配門檻。
對于科技公司來說,這意味著更長的合規周期、更復雜的利益相關方協調。對于安全從業者來說,這意味著獲取先進工具的渠道正在收窄,且篩選標準不透明。
判斷:這不是虛偽,是問題本身沒有 clean answer
Altman的批評和OpenAI的做法,表面矛盾,實則指向同一個困境:當AI能力可以造成實際損害時,"開放"和"安全"的權衡沒有標準答案。
他的批評針對的是Anthropic"永不公開"的決絕姿態,而OpenAI給自己留了"和政府、生態一起找方案"的口子。話術差異背后,是兩種不同的風險溝通策略。
但真正的問題可能是:兩家公司都沒有回答"可信防御者"的篩選標準是什么、誰來審計這個名單、測試期有多長。這些細節比"限不限量"更能說明問題。
網絡安全AI的發布模式,正在從"先發布后治理"轉向"先治理后發布"。這個轉變本身比任何一家公司的具體做法都更值得跟蹤——它可能預示其他高風險領域的政策走向。
至于Altman的1億美元防空洞比喻,現在回頭看,至少價格還沒公布。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.