<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Claude Mythos核心架構開源!22歲天才一人破解,融合DeepSeek思路

      0
      分享至


      新智元報道

      編輯:桃子

      【新智元導讀】Claude Mythos核心架構,竟被一個22歲天才扒了個精光!OpenMythos現已全開源,不靠堆參數,原地「循環思考」16次就能推理。閉源實驗室的護城河,真的還在嗎?

      簡直太瘋狂了!

      Anthropic捂得最嚴實的Claude Mythos,竟被一個22歲的年輕人扒開了。


      不是泄露,不是內部員工跳槽帶出來的。

      是一個叫Kye Gomez的初創CEO,以第一性原理,硬生生把Claude Mythos的核心架構從頭推導了出來。

      更炸裂的是,他把這一項目——OpenMythos全開源了



      復現帖引近100萬人圍觀

      一時間,全網都坐不住了,網友們紛紛驚嘆Mythos背景精妙的設計。




      不堆參數,原地「循環思考」16次

      先說結論,Kye Gomez認為——

      Claude Mythos的核心不是一個更大的Transformer,而是一種叫做「循環深度Transformer」(Recurrent-Depth Transformer, RDT)的架構

      說白了就是,同一套權重,在一次前向傳播里循環跑最多16次。


      傳統大模型像蓋高樓,一層一層往上堆參數。100層不夠就200層,200層不夠就500層。

      參數越多,模型越大,顯存吃得越猛,訓練成本越恐怖。

      但RDT完全換了一個思路:不蓋高樓,原地跑圈。

      模型只有一個核心計算塊,但這個塊會被反復執行。每循環一次,隱藏狀態就更新一次,就相當于「多想了一步」。

      而且所有的思考都在連續潛空間里默默進行——不用像思維鏈(CoT)那樣,每一步都吐出可見的token。

      這不是重復計算,是迭代推理。


      架構全拆解:三段式設計

      整個OpenMythos的架構分三段:

      Prelude(序曲)→ Recurrent Block(循環核心)→ Coda(終章)

      Prelude和Coda是標準的Transformer層,各跑一次。

      真正的計算核心是中間的「循環塊」,它最多循環16次,每次循環的更新規則是:

      h_{t+1} = A·h_t + B·e + Transformer(h_t, e)

      其中e是Prelude編碼后的原始輸入,每一步都會被重新注入,防止模型在循環中「跑偏」。


      MoE給廣度,循環給深度

      光靠循環能解釋Mythos推理的「深度」,但解釋不了廣度。

      OpenMythos在循環核心的每個FFN層,都替換成了MoE層,設計參考了DeepSeek-MoE:

      • 大量細粒度的路由專家;

      • 每個token只激活其中一小部分;

      • 少量「共享專家」始終激活,負責吸收跨領域的通用知識。

      最精妙的一點,隨著隱藏狀態h_t在循環中不斷演化,路由器在每一層循環深度會選擇不同的專家子集。

      也就是說,雖然權重共享,但每次循環的計算路徑完全不同:

      MoE提供廣度,循環提供深度。


      項目地址:https://github.com/kyegomez/OpenMythos

      注意力機制默認使用「多潛變量注意力」(Multi-Latent Attention),來自DeepSeek-V2,把KV緩存壓縮成低秩潛變量,在生產規模下能實現10-20倍的KV顯存節省。

      三個額外機制保證循環穩定性:LTI約束注入(譜半徑強制小于1)、自適應計算時間(ACT)逐位置停機、以及深度級LoRA適配器讓每次迭代都有獨立的行為調整能力。

      細思極恐,這套設計精密得像一臺瑞士鐘表。

      770M打平1.3B,參數效率直接翻倍

      這不是嘴上說說。

      此前,來自Parcae團隊的實驗數據:一個770M參數的循環模型,在同等訓練數據下,能達到1.3B標準Transformer的下游任務質量。

      換句話說——用一半的參數,干了同樣的活。


      這對整個行業意味著什么?

      對消費級硬件來說,這是天大的利好。以前跑個像樣的模型,沒有A100你連門都進不了。

      現在呢?推理深度是時間換空間——你不需要更多的顯存,只需要多跑幾圈。

      更重磅的是,這徹底改寫了AI的Scaling法則。以前拼的是誰的參數多、誰的GPU多、誰的電費賬單厚。

      現在的規則變了:未來最強的模型,不是參數最多的,而是想得最多次的。

      不過,作者也表示,這目前只是理論上的說法,還需要保留一些意見。


      高中畢業,就當上了CEO

      這位扒開22歲Claude Mythos黑箱的大男孩Kye Gomez,是Swarms的創始人,之前還領導過Agora Labs。

      他的研究重點是——大規模多智能體系統、替代模型架構和多模態模型。


      個人主頁顯示,Kye Gomez高中畢業之后,就開始投身于創業。


      在2021年-2024年間,他同時擔任了三家公司的聯創/CEO,創建立了一個以「APAC」為品牌的生態體系。

      其覆蓋了AI深科技、媒體、食品科技等多個領域。


      22歲小哥,開源了Anthropic神級模型

      這件事最讓人震撼的,不是架構本身有多厲害。

      是一個22歲的創業者,只用公開論文和第一性原理,就把Anthropic藏了一年的黑箱直接復現了出來。

      還全開源了,而且只要幾行代碼就能跑。

      這意味著什么?

      閉源實驗室的架構優勢,正在以肉眼可見的速度消失。

      FT最新報道中,Dario Amodei重磅預測,中國將在12個月內,完全復刻出具備Claude Mythos級別能力的大模型。


      針對外界對LLM性能是否觸及天花板的質疑,Amode用一句富有詩意的話給出了回應——

      彩虹沒有盡頭,只有彩虹本身。

      他強調,目前完全看不到技術放緩的跡象。

      當一個人用公開信息就能重建最核心的技術,護城河就不再是架構了。

      參考資料:

      https://x.com/KyeGomezB/status/2045659150340723107?s=20

      https://github.com/kyegomez/OpenMythos

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      太諷刺!2026勞模名單爭議大,被疑有“許家印”,評論區不留情面

      太諷刺!2026勞模名單爭議大,被疑有“許家印”,評論區不留情面

      譚談社會
      2026-05-01 14:42:03
      燃氣表沒電池也能跑,河南一男子用了3年1分錢沒交,燃氣公司:補交3700多元,不交不給通氣,經協商支付1000元

      燃氣表沒電池也能跑,河南一男子用了3年1分錢沒交,燃氣公司:補交3700多元,不交不給通氣,經協商支付1000元

      臺州交通廣播
      2026-05-01 18:45:20
      吳宜澤單局鏖戰100分鐘!艾倫僵局不同意重新開球,現場球迷起哄

      吳宜澤單局鏖戰100分鐘!艾倫僵局不同意重新開球,現場球迷起哄

      楊華評論
      2026-05-02 03:18:48
      倫敦世乒賽爆出大冷,孫穎莎閨蜜輸球!世界冠軍慘敗,賽后哽咽

      倫敦世乒賽爆出大冷,孫穎莎閨蜜輸球!世界冠軍慘敗,賽后哽咽

      老王大話體育
      2026-05-02 02:08:17
      美媒:特朗普告知國會 對伊朗戰事已“結束”

      美媒:特朗普告知國會 對伊朗戰事已“結束”

      財聯社
      2026-05-02 03:18:03
      T-Mobile光纖低價入場,電信價格戰開打?

      T-Mobile光纖低價入場,電信價格戰開打?

      影視情報室
      2026-05-01 02:33:18
      大膽到離譜!模特嘴巴被強制撐開,全網看懵:好怕模特流口水

      大膽到離譜!模特嘴巴被強制撐開,全網看懵:好怕模特流口水

      品牌新
      2026-05-01 08:47:23
      湖人腸子都悔青了!當年交易施羅德的添頭,狂砍32分,淘汰了約基奇

      湖人腸子都悔青了!當年交易施羅德的添頭,狂砍32分,淘汰了約基奇

      籃球神吐槽
      2026-05-01 22:51:32
      英超提前保級?利茲聯3-1后領先熱刺9分,倫敦2強和森林降級3選1

      英超提前保級?利茲聯3-1后領先熱刺9分,倫敦2強和森林降級3選1

      體育知多少
      2026-05-02 06:59:51
      太尷尬!烏克蘭名模戛納豪擲半億辦婚禮,美照還沒發完,就被罵到不敢回嘴……

      太尷尬!烏克蘭名模戛納豪擲半億辦婚禮,美照還沒發完,就被罵到不敢回嘴……

      新歐洲
      2026-05-01 18:51:00
      吳亦凡二審維持13年!繼續在里面踩縫紉機當班長,網友神評笑死個人

      吳亦凡二審維持13年!繼續在里面踩縫紉機當班長,網友神評笑死個人

      八卦王者
      2026-05-01 14:05:38
      高潔主任:半夜易醒,睡眠淺?每天拍打這處50次,讓你一覺到天亮

      高潔主任:半夜易醒,睡眠淺?每天拍打這處50次,讓你一覺到天亮

      大明愛養生
      2026-04-28 14:17:50
      世界杯版權談崩!足聯張口要3億,央視僅出8千萬,評論區十分清醒

      世界杯版權談崩!足聯張口要3億,央視僅出8千萬,評論區十分清醒

      譚談社會
      2026-05-01 23:43:14
      世錦賽2日凌晨戰報,8-8,7-7,吳宜澤比賽被迫提前結束,墨菲絕平

      世錦賽2日凌晨戰報,8-8,7-7,吳宜澤比賽被迫提前結束,墨菲絕平

      等等talk
      2026-05-02 02:58:24
      5月1日起嚴查來了!體制內、公職人員必須嚴守的9條紅線(解讀)

      5月1日起嚴查來了!體制內、公職人員必須嚴守的9條紅線(解讀)

      金哥說新能源車
      2026-05-01 08:26:32
      重磅:烏克蘭擊中兩架俄軍最強的蘇57戰機!奔襲1700公里

      重磅:烏克蘭擊中兩架俄軍最強的蘇57戰機!奔襲1700公里

      項鵬飛
      2026-05-01 21:35:04
      2026娛樂圈男明星咖位大洗牌:歐豪難進前5,肖戰第2,第1沒爭議

      2026娛樂圈男明星咖位大洗牌:歐豪難進前5,肖戰第2,第1沒爭議

      不似少年游
      2026-04-17 19:35:14
      五一檔首日票房破1.5億,多部影片緊急撤檔;陳思誠《10間敢死隊》票房1250萬,此前其否認哭窮:請大家多給電影人機會

      五一檔首日票房破1.5億,多部影片緊急撤檔;陳思誠《10間敢死隊》票房1250萬,此前其否認哭窮:請大家多給電影人機會

      臺州交通廣播
      2026-05-01 20:59:35
      新華社消息|商務部:堅決反對美國聯邦通信委員會審議通過檢測認證和電信領域相關限制措施

      新華社消息|商務部:堅決反對美國聯邦通信委員會審議通過檢測認證和電信領域相關限制措施

      新華社
      2026-05-01 14:48:10
      日本著名馬桶公司TOTO殺入芯片行業大獲成功

      日本著名馬桶公司TOTO殺入芯片行業大獲成功

      爆角追蹤
      2026-05-01 19:37:18
      2026-05-02 08:03:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15111文章數 66827關注度
      往期回顧 全部

      科技要聞

      AI熱潮耗盡庫存,Mac Mini起售調高200美元

      頭條要聞

      特朗普點名批意西德三國 稱可能考慮撤軍

      頭條要聞

      特朗普點名批意西德三國 稱可能考慮撤軍

      體育要聞

      無奈!約基奇:這要在塞爾維亞 全隊早被炒了

      娛樂要聞

      馬筱梅產后身材恢復超好 現身戶外直播

      財經要聞

      GPU神話松動,AI真正的戰場變了

      汽車要聞

      限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

      態度原創

      本地
      家居
      親子
      教育
      軍事航空

      本地新聞

      用青花瓷的方式,打開西溪濕地

      家居要聞

      靈動實用 生活藝術場

      親子要聞

      豌豆的球掉進小水坑,很難過,一只青蛙幫她把球撿了回來

      教育要聞

      高考地理中的機制問題

      軍事要聞

      特朗普:對伊戰事結束 無限期延長停火

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产99视频精品免费视看6| 超caopor在线公开视频| 国产69精品久久久久久人妻精品| 国产 在线视频无码| 婷婷网亚洲色偷偷男人的天堂| 91网在线| 伊人久久大香线蕉av色婷婷色| 国产无码8页| 中文字幕天无码久久精品视频免费| 污视频网站免费观看| 四川丰满妇女毛片四川话| www.日| 国内精品久久久久久久久久影视 | 亚洲人色婷婷成人网站在线观看| 国产按头口爆吞精在线视频| 国产亚洲欧洲AⅤ综合一区| 日韩在线观看a| 午夜阳光精品一区二区三区| 久久机爽| 日韩午夜高清福利片在线观看| 潮喷大喷水系列无码视频| 伊人久久无码大香线蕉综合| 玩丰满熟妇xxxx视频| 国产?xxxx| 白丝乳交内射一二三区| 亚洲国产AV白丝| 免费观看av在线播放| 东京热无码国产精品| 青青青青久久精品国产| 自拍偷拍日韩| 天美传媒mv免费观看完整| 91精品国产91| A男人的天堂久久A毛片| 安岳县| 色悠久久久久综合网伊| 国产 在线 | 日韩| 日韩精品欧美| 久久久婷婷成人综合激情| 精品综合88久久| 污网址| 久久久无码精品一区二区三区蜜桃|