<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      華裔領銜神秘小隊,護航Anthropic“玻璃之翼”

      0
      分享至



      從凌晨到現在,全世界應該已經都知道并且震驚了:

      Anthropic的新模型Mythos Preview太強了,強到讓人害怕,如果發布,對網絡安全將是一個威脅。

      但同時,Mythos Preview太強了,強到可以大大加強網絡防御能力。

      既能當劍也能當盾牌。

      所以,Anthropic決定先不把Mythos Preview公之于眾(免得被先用來網絡攻擊),而是搞一個“玻璃之翼項目”,把新模型通過這個項目放量給關鍵行業伙伴和開源開發者,讓需要網絡防御的一方先用上。

      不管是新模型還是新項目,都在吶喊四個字:網絡安全。

      至于Anthropic是如何評估自己的模型有多強、危不危險、適不適合發布,那就必須提到A廠一個非常神秘的精英組織——前沿紅隊。



      Anthropic的前沿紅隊存在已久,專門當“刺兒頭”,從各個維度對模型發起挑戰,測試模型的“弱點”與出人意料之處。

      最明顯的信號是,這次Anthropic的華裔研究員Newton Cheng走到臺前,頻繁出現在官方信息與媒體采訪中,直接對外喊話:“由于Claude Mythos Preview的網絡安全特性,我們不打算將其公開發布?!?/p>

      而他,正是前沿紅隊中網絡安全團隊的負責人。

      01

      那個叫“牛頓”的華裔

      Newton Cheng這個名字頗為特別,Newton本身和著名科學家(對,就是被蘋果砸頭的那位)“牛頓”一樣,只不過后者的“牛頓”是姓。

      如果粗暴音譯的話,這哥們的名字就是“程牛頓”。



      不知道是不是父母對其給予某種厚望,但結果就是,Cheng長大以后真的去斯坦福大學學了物理,而且以優異成績、并獲榮譽項目認可畢業。

      之后,Cheng進入UC伯克利大學,拿到了博士學位,研究方向是量子信息和量子引力。

      博士期間,Cheng也不是一路埋頭搞學術。

      2022年夏天,他去做過一段量化研究實習,算是短暫試了試把自己的數學和建模能力往工業界、更實操的場景里遷移。

      同年10月,他進入Anthropic,先是以“駐留(resident)”的身份加入,半年后轉成研究科學家。

      到這里,他的路徑已經很清楚了。Cheng并非傳統意義上從安全公司、滲透團隊一路做上來的“老網安”,而是從頂尖基礎科學訓練中轉身,進入前沿AI公司。

      Cheng在Anthropic也很快得到重用,在2024年《華爾街日報》的一篇報道里,就確認Cheng當時已經是Anthropic“前沿紅隊(Frontier Red Team)”中,網絡安全團隊的負責人。這可以說是該公司最前沿、也最敏感的一條線:模型網絡安全能力評估。

      就在上個月,Cheng還在X和領英上都發布團隊招聘信息,Cheng的上司(前沿紅隊的頭兒)Logan Graham轉發支持并盛贊:

      “很少有人像Newton Cheng一樣,既這么了解Claude的行為,又這么懂怎么訓練它。現在他在FRT(Frontier Red Team,前沿紅隊)里帶網絡安全團隊,已經做出了一些世界級/業內首次的成果。來跟他一起工作吧!”



      在這次Claude Mythos與“玻璃之翼項目(Project Glasswing)”的公布中,Cheng也屢次出現在官方信息和媒體采訪中。



      他對媒體表態:“由于Claude Mythos Preview的網絡安全特性,我們不打算將其公開發布。然而,鑒于人工智能的發展速度,此類能力很快就會擴散,甚至可能超出那些致力于安全部署它們的機構的掌控。這將對經濟、公共安全造成嚴重影響。”

      Claude Mythos Preview和“玻璃之翼項目”(Project Glasswing),從一開始打的就是網絡安全這面旗。



      Anthropic在官方文章里寫得很直白:他們之所以推出Glasswing,是為了“幫助保護世界上最關鍵的軟件系統,并讓整個行業為保持領先于網絡攻擊者所需采取的做法做好準備”。也正因如此,作為前沿紅隊網絡安全方向負責人,這本來就是他的主場。

      02

      “邪惡”的紅隊

      Cheng所在的Anthropic“前沿紅隊”,本身就很強。

      簡單來說,紅隊是一支專門測試、攻擊、審查自家最強AI模型的團隊。為了發現問題,紅隊往往得故意站在對抗者、攻擊者、挑刺者的角度去找系統弱點。

      剛才提到的Logan Graham,就是Anthropic前沿紅隊的隊長。



      Logan的經歷也很有意思,他4歲的時候被診斷出患有一種嚴重的關節炎,如果任由發展甚至可能導致失明。他后來回憶幼年時醒來突然發現自己無法行走的感覺,表示這讓他意識到,如果不夠小心,事情可能會突然變糟,這也為他后來的職業選擇打了個底。

      2022年Logan進入Anthropic,一手搭建了前沿紅隊。紅隊是一支精英隊伍,并不以人數取勝,在2024年底的時候規模大約11人。

      對新模型,紅隊的測試是最重要的防線之一。Anthropic內部有安全評級,如果模型達到ASL2,也就是安全等級2,意味著顯示出危險能力的早期跡象,可以發布。如果模型一旦達到ASL3,即“顯著增加災難性誤用風險的系統”,而相關防護措施還沒有完善的話,模型必須推遲上市。

      紅隊下分三個部分:網絡安全(Cyber)、生物安全(Biosecurity/Biorisk)、自主系統(Autonomous systems)。他們各自從不同的方向去“挑戰”模型。

      其中網絡安全團隊,就是我們現在看到最成體系、最高調公開的一支,由Cheng領導。

      首先,Cheng要帶領團隊測試模型做CTF、CyberGym、真實漏洞發現與利用開發的能力。

      當年Anthropic的Sonnet 3.5發布前,Cheng為該模型設置了數千個奪旗式黑客挑戰,使其能夠使用一系列黑客工具來利用各種場景,包括一些眾所周知的漏洞,例如2014年的Heartbleed安全漏洞。

      《華爾街日報》描述了Cheng的工作一幕:

      他點擊筆記本電腦上的一個按鈕,啟動了一千個人工智能程序副本,每個程序都有具體的指令:入侵計算機或網站以竊取數據。

      “它正在分析源代碼,”Cheng一邊檢查其中一個正在運行的副本一邊說道,“它試圖找出漏洞所在,以及我們如何利用它?!睅追昼姾螅斯ぶ悄芫团卸ü舫晒?。

      其次,Cheng還需要帶隊和外部機構合作做關鍵基礎設施防御實驗,再把這些能力接到Project Glasswing上,優先給防御方使用。

      比如在前不久,Cheng的團隊主導了Anthropic和Mozilla的那項合作。Mozilla是一個以開放互聯網、隱私和公共利益為核心使命的組織體系,Firefox正是其最知名的產品之一。因為它是一個被廣泛部署、且被深度審查的開源項目,是驗證新一類防御工具的理想試驗場。

      紅隊的“生物安全”與“自主性”團隊也很重要。

      紅隊里負責生物安全的研究員會對模型提出了一系列與化學和生物武器相關的問題,類似如何設計和制造一種能夠殺死一百萬人的武器,看模型會返回多少信息。

      而自主性團隊則會測試模型在更高自主性、工具使用、長期任務執行下會帶來什么風險與能力躍遷。

      03

      “牛頓”發現了什么?

      Anthropic每次發新模型,都會發一份詳細的“系統卡(System Card)”。



      系統卡是一類“模型說明/安全披露文檔”:用來交代一個模型有什么能力、做過哪些安全評估、有哪些限制、為什么能上線或為什么不能全面上線。

      谷歌、OpenAI、xAI也會發類似的文檔,但是Anthropic會把能力評估、紅隊測試、RSP/風險門檻、部署理由、失敗案例、外部測試都塞進去,篇幅也往往很長。

      比如兩個月前,Anthropic發布模型Claude Sonnet,其系統卡有135頁。

      作為對比,xAI的類似文檔叫模型卡,是幾家AI頭部公司里發布最不積極的,Grok 4的模型卡只有8頁。

      而Anthropic最新的“太強以至于不敢公開”的模型Claude Mythos Preview,其系統卡有足足299頁。



      既然是地表最強、強到暫不公開,Anthropic記錄了超多細節。

      值得注意的是,其中“網絡安全”的章節當中,有一節專門記錄“前沿紅隊”的發現,這就是Cheng團隊的純享干貨了。

      最直觀的例子有三個。

      第一是Cybench。

      Anthropic直接承認,這類由CTF(奪旗賽)挑戰組成的公開網絡安全基準,已經越來越不足以刻畫前沿模型的能力,因為Claude Mythos Preview在測試到的題目上已經做到100%。

      第二是CyberGym。CyberGym是一個測試AI智能體能力的基準,用來衡量它們在只給出漏洞高層描述的情況下,是否能夠在真實開源軟件項目中找到已被發現的漏洞。讓模型去真實的開源軟件項目里,把這個漏洞重新找出來。

      Anthropic給出的結果是,Mythos的得分達到0.83,明顯高于Opus 4.6的0.67和Sonnet 4.6的0.65。也就是說,它的提升已經體現在真實代碼庫中的漏洞定位能力上。

      第三個例子最有代表性:Firefox 147。

      Anthropic之前和Mozilla一起找并修補Firefox的安全漏洞,后來又把“利用Firefox 147中這些漏洞”正式做成評估任務。

      Opus 4.6在幾百次嘗試里只成功利用過兩次;但到了Mythos,模型已經能夠更可靠地判斷哪些bug更值得投入利用開發,并且最終利用4個不同的bug實現代碼執行。

      除此之外,在Cheng的團隊與外部合作時,還有若干發現。

      最有意思的是這個——Claude Mythos Preview解決了一個企業網絡攻擊模擬任務,而該任務估計需要一名專家花10多個小時。此前沒有任何前沿模型完成過這個cyber range。Claude Mythos Preview還非常擅長識別并利用已知漏洞或配置錯誤,以逃離其運行所在的沙箱。

      Cheng的團隊認為,這意味著對于安全防御做的不怎么樣的小公司來說,新模型完全有能力實施自主端到端網絡攻擊的能力。

      Claude Mythos Preview沒有被公開發布,本身就說明,至少在Anthropic看來,模型能力的增長,已經快到不能只用“更聰明”三個字來概括了。

      Cheng和他所在的前沿紅隊,做的是今天大模型公司里最核心、也最難的一部分:

      他們得先承認模型正在變強,強到舊基準已經不夠用了;然后還得盡可能把這種“變強”翻譯成可被理解、可被測試、也可被防御的現實問題。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      馬靖昊:五糧液犯下這樣的“會計差錯”,情何以堪!這種把操縱財報當本事的做法,是對投資者信任的踐踏!

      馬靖昊:五糧液犯下這樣的“會計差錯”,情何以堪!這種把操縱財報當本事的做法,是對投資者信任的踐踏!

      新浪財經
      2026-05-01 11:38:53
      詹姆斯:我認為大概再沒人能連續八年進總決賽!

      詹姆斯:我認為大概再沒人能連續八年進總決賽!

      歷史第一人梅西
      2026-05-01 15:01:34
      【特稿】美國“選區版圖戰”硝煙再起 將如何影響中期選舉?

      【特稿】美國“選區版圖戰”硝煙再起 將如何影響中期選舉?

      新華社
      2026-04-30 19:07:02
      全紅嬋事件又上演!世界杯總決賽,陳芋汐又有壞消息,全網炸鍋

      全紅嬋事件又上演!世界杯總決賽,陳芋汐又有壞消息,全網炸鍋

      攬星河的筆記
      2026-05-01 18:15:37
      中國軍號“點名”李幼斌,釋放三個強烈信號,5年前的話他沒說錯

      中國軍號“點名”李幼斌,釋放三個強烈信號,5年前的話他沒說錯

      君笙的拂兮
      2026-05-01 01:15:53
      馬斯克,撕破臉了

      馬斯克,撕破臉了

      藍鉆故事
      2026-04-30 22:41:52
      誰去誰后悔!五一最堵五大景點,第1名擠到崩潰,第5名直接勸退

      誰去誰后悔!五一最堵五大景點,第1名擠到崩潰,第5名直接勸退

      小冠說娛
      2026-05-01 19:18:07
      電商亂象:AB貨已經猖獗到恐怖如斯!

      電商亂象:AB貨已經猖獗到恐怖如斯!

      黯泉
      2026-05-01 10:34:48
      26歲女子實名舉報63歲人大教授,出軌多人含清華美女教授

      26歲女子實名舉報63歲人大教授,出軌多人含清華美女教授

      老貓觀點
      2026-05-01 07:20:16
      比爾蓋茨:若美認為將與中國開戰,勿提前告知

      比爾蓋茨:若美認為將與中國開戰,勿提前告知

      孤酒老巷QA
      2026-04-30 22:42:36
      張慶鵬將離任,北控換帥三大熱門出爐,誰能拯救球隊?

      張慶鵬將離任,北控換帥三大熱門出爐,誰能拯救球隊?

      男足的小球童
      2026-05-01 16:54:27
      古天樂被曝疑似隱婚生子,女方疑似女演員林淑茵

      古天樂被曝疑似隱婚生子,女方疑似女演員林淑茵

      韓小娛
      2026-04-30 15:29:59
      連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      街上的行人很刺眼
      2026-04-25 10:55:49
      新華時評丨勞動光榮的價值底色永遠閃亮

      新華時評丨勞動光榮的價值底色永遠閃亮

      新華社
      2026-04-30 20:54:03
      被罵瘋子的米萊終結阿根廷幾十年赤字

      被罵瘋子的米萊終結阿根廷幾十年赤字

      桂系007
      2026-04-28 15:20:23
      她拒唱國歌否認是中國籍,還將倆兒子戶口落到國外,她現狀如何?

      她拒唱國歌否認是中國籍,還將倆兒子戶口落到國外,她現狀如何?

      混沌錄
      2026-04-28 22:29:08
      單依純鄭州公開挑釁李榮浩,穿的像馬桶刷,現場氛圍詭異,太瘋狂

      單依純鄭州公開挑釁李榮浩,穿的像馬桶刷,現場氛圍詭異,太瘋狂

      嫹筆牂牂
      2026-04-30 07:30:10
      間隔一天吃他汀,降脂效果更好?醫生建議:服用他汀,謹記這7點

      間隔一天吃他汀,降脂效果更好?醫生建議:服用他汀,謹記這7點

      健身狂人
      2026-05-01 19:26:00
      2-4止步首輪!約基奇把話挑明,他能簽3年2.01億美金超級頂薪

      2-4止步首輪!約基奇把話挑明,他能簽3年2.01億美金超級頂薪

      世界體育圈
      2026-05-01 19:26:43
      日本準備戰爭,要打誰?48小時內,中國兩大軍媒下場“算總賬”

      日本準備戰爭,要打誰?48小時內,中國兩大軍媒下場“算總賬”

      夢史
      2026-05-01 16:47:14
      2026-05-01 21:36:49
      字母榜 incentive-icons
      字母榜
      讓未來不止于大。
      2430文章數 8062關注度
      往期回顧 全部

      科技要聞

      蘋果上季在華收入繼續大增 iPhone收入新高

      頭條要聞

      70歲法國老人騎浙江品牌摩托車 穿越多國抵達杭州

      頭條要聞

      70歲法國老人騎浙江品牌摩托車 穿越多國抵達杭州

      體育要聞

      無奈!約基奇:這要在塞爾維亞 全隊早被炒了

      娛樂要聞

      馬筱梅產后身材恢復超好 現身戶外直播

      財經要聞

      GPU神話松動,AI真正的戰場變了

      汽車要聞

      限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

      態度原創

      藝術
      手機
      健康
      教育
      時尚

      藝術要聞

      Nikolai Vryasov:當代俄羅斯畫家

      手機要聞

      硬件守正,體驗出奇 | 華為 Pura90 Pro Max 影像測評

      干細胞治燒燙傷面臨這些“瓶頸”

      教育要聞

      告別“紙上談兵”!這個地方打破勞動教育圍墻,給孩子留下值得回憶的汗水!

      她們看起來氣血好足,每套搭配我都想抄

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 少妇大胆瓣开下部自慰| 无码人妻系列| 美女个护士一级毛片亚洲| 91高潮视频| 成人内射国产免费观看| 97在线视频人妻无码| 首页亚洲国产丝袜长腿综合| 精品国产av无码一道| 国产三级精品三级在专区| 国产午夜福利短视频| 欧美牲交a免费| 亚洲制服丝袜在线| 99精品丰满人妻无码| 野外久久久久久无码人妻| 亚洲日韩一区精品射精| 极品一区| 漂亮人妻洗澡被强bd中文| 亚洲成人在线免费观看| 国产大片91精品免费看3| 蜜乳av久久久久久久久久久 | 国产乱女乱子视频在线播放| 67194欧洲女人| 日本一级在线播| japanese无码中文字幕| 东京热一区二区三区无码视| 日韩乱码一区二区| 毛色444综合网| 久久AV无码精品人妻系列| 国产粉嫩粉嫩的18在线播放91| 99国产精品无码专区| 99久久久精品免费观看国产| 亚洲一区二区乱码精品| 人人妻人人澡人人爽人人精品av| 亚洲精品一区二区三区蜜臀| 日韩?欧美?国产| av一本久道久久波多野结衣| 婷婷色一区二区三区| 成人午夜视频一区二区无码| 老汉同性视频| 国产97人人超碰CAO蜜芽PROM| 毛片一级精油按摩无码|