<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      13人干翻Transformer!新架構(gòu)SSA算力暴減千倍,成本僅Opus 5%

      0
      分享至


      新智元報(bào)道

      編輯:桃子

      【新智元導(dǎo)讀】Transformer統(tǒng)治地位懸了!一款SubQ模型帶著SAA架構(gòu)橫空出世,1200萬上下文成本僅Opus的5%,計(jì)算量暴減千倍。

      Transformer,王座不保?!

      今天,一款A(yù)I模型SubQ橫空出世,震撼了全世界。

      這是全球首個(gè)基于完全亞二次方稀疏注意力架構(gòu)(SSA)的模型,上下文高達(dá)1200萬Token。


      SubQ的核心優(yōu)勢(shì)在于,其SSA架構(gòu)會(huì)根據(jù)內(nèi)容「動(dòng)態(tài)選擇」關(guān)注點(diǎn),不會(huì)盲目計(jì)算所有Token間的關(guān)聯(lián)。

      相較于Transformer,它的計(jì)算量直接暴減1000倍。

      實(shí)驗(yàn)結(jié)果顯示,100萬token上下文,SubQ要比FlashAttention快52倍,成本不到Claude Opus的5%。


      而打造出這款架構(gòu)的背后這家公司,叫Subquadratic,坐標(biāo)邁阿密,全公司僅13人。

      AI大佬Bindu Reddy辣評(píng)道,「若這一切都是真的,Anthropic和OpenAI的估值直接歸0」!


      還有人表示,這才是LLM接下來真正Scaling的方式。


      Transformer「原罪」,九年未解

      2017年,谷歌那篇「Attention is All You Need」奠定了Transformer架構(gòu)的統(tǒng)治地位。

      此后九年,從GPT到Claude到Gemini,所有前沿大模型都建立在同一個(gè)基礎(chǔ)上:密集注意力機(jī)制。


      長(zhǎng)期以來,Transformer的工作方式非常暴力,即每個(gè)token都要和序列中所有其他token做一次比較。

      這種機(jī)制讓它深陷「二次方復(fù)雜度」的泥潭,上下文每增加一倍,計(jì)算成本飆升四倍。

      這意味著,輸入越長(zhǎng),模型越貴、越慢、越容易崩。

      這就解釋了幾乎所有LLM的上下文卡在100萬token左右,不是技術(shù)做不到更長(zhǎng),是做到了也用不起。

      這一次,SubQ的誕生,從根本上改變了這個(gè)等式。


      SSA架構(gòu)出世

      不要「更快」只要「更少」

      SubQ的核心突破叫做SSA——亞二次方稀疏注意力(Subquadratic Sparse Attention)。

      它的思路出奇地簡(jiǎn)單,不再讓每個(gè)token和所有token做比較。

      既然訓(xùn)練好的模型中,絕大多數(shù)注意力權(quán)重都接近零0,那為什么還要算它們?

      SSA的做法是,對(duì)每一個(gè)query,基于「內(nèi)容」選擇序列中真正值得關(guān)注的位置,然后只在這些位置上精確計(jì)算注意力。

      它只計(jì)算那些真正有意義的交互,跳過其余99%以上的無用計(jì)算。


      以下是SSA的三大關(guān)鍵特性——

      • 線性擴(kuò)展

      計(jì)算量隨選中的位置數(shù)量增長(zhǎng),而不是隨整個(gè)序列長(zhǎng)度增長(zhǎng)。上下文翻倍,成本只翻倍,不再是翻四倍。

      • 內(nèi)容依賴路由

      模型根據(jù)語義決定看哪里,而不是根據(jù)位置。關(guān)鍵信息在序列第3個(gè)token還是第1100萬個(gè)token,都能被找到。

      • 精確檢索

      不像循環(huán)模型那樣把信息壓縮成固定狀態(tài),SSA保留了從任意位置精確取回信息的能力。

      說白了,SSA不是「把密集注意力算得更快」,而是「讓模型做更少的注意力計(jì)算」。


      減少的計(jì)算量,直接轉(zhuǎn)化為速度。

      速度狂飆52.5倍,成本不到Opus 5%

      SubQ放出的數(shù)據(jù),每一條都在暴擊:

      在100萬token長(zhǎng)度上,SSA比標(biāo)準(zhǔn)密集注意力+FlashAttention-2快52.2倍。


      在12.8萬token上快7.2倍,25.6萬token快13.2倍,51.2萬token快23倍。

      顯而易見,上下文越長(zhǎng),優(yōu)勢(shì)越碾壓。

      這正是SSA線性擴(kuò)展的直接體現(xiàn)——密集注意力越長(zhǎng)越慢,SSA越長(zhǎng)越劃算。


      再來看算力消耗,在100萬token下,注意力FLOP減少了62.5倍。在1200萬token下,這個(gè)數(shù)字飆升到接近1000倍。


      至于成本,Subquadratic給了一個(gè)非常直觀的對(duì)比——

      在RULER 128K基準(zhǔn)測(cè)試上,SubQ花費(fèi)8美元,Opus為2600美元,直接拉出了300倍的成本差距。

      最關(guān)鍵的是,這些速度和成本優(yōu)勢(shì),并沒有以犧牲準(zhǔn)確率為代價(jià)。

      RULER 128K基準(zhǔn)測(cè)試: SubQ拿下95%,Opus 4.6是94.8%;


      SWE-Bench Verified(代碼工程): SubQ得分81.8,超過Opus 4.6的80.8。

      MRCR v2(長(zhǎng)上下文檢索): SubQ拿到65.9%,雖然低于Opus 4.6的78%,但遠(yuǎn)超GPT 5.4(39%)和Gemini 3.1 Pro(23%)。


      這組數(shù)字放在一起看,細(xì)思極恐——

      一家種子輪公司,用不到Opus 5%的成本,在多項(xiàng)核心基準(zhǔn)測(cè)試上打平甚至超過了Anthropic和OpenAI的旗艦?zāi)P汀?/p>


      一個(gè)提示詞,SubQ即可處理1200萬Token的超長(zhǎng)信息:

      無論是整個(gè)代碼庫、數(shù)月的 PR 記錄,還是長(zhǎng)期運(yùn)行的 AI 智能體狀態(tài),全都游刃有余,而且成本僅需原來的五分之一。


      不得不說,若這一切成真,這將是Transformer問世以來最重要的架構(gòu)級(jí)突破。

      13人初創(chuàng)公司,要顛覆Transformer

      Subquadratic成立于2024年,拿下2900萬美元種子輪,估值5億美元。

      它有兩位聯(lián)合創(chuàng)始人:CEO Justin Dangel,CTO Alexander Whedon。


      研究團(tuán)隊(duì)11人,全部是博士,來自Meta、谷歌、牛津大學(xué)、劍橋大學(xué)、Adobe。

      值得一提的是,這家公司之前叫Aldea,做的是語音模型,后來轉(zhuǎn)型到了注意力架構(gòu)研究。

      這一次,產(chǎn)品線三條同時(shí)上線:

      • SubQ API:12M token全量上下文接口

      • SubQ Code:命令行編碼Agent,整個(gè)代碼庫一次性塞進(jìn)去

      • SubQ Search:深度研究工具,初期免費(fèi)

      全網(wǎng)炸鍋:是終結(jié)者,還是AI版Theranos?

      SubQ發(fā)布后數(shù)小時(shí)內(nèi),AI社區(qū)就分裂成了兩個(gè)陣營(yíng)。

      AI大佬Dan McAteer一句話,概括了所有人的心態(tài):

      SubQ要么是Transformer以來最大的突破……

      要么就是AI界的Theranos。


      支持者一方陣容不小。

      有人表示,這是2026年最瘋狂的AI發(fā)布之一。

      Subquadratic可能找到了奧特曼所言的另一個(gè)架構(gòu)的重大突破。




      但懷疑派也毫不留情,有人直言這就是一個(gè)「騙子公司」,尤其是看完創(chuàng)始人領(lǐng)英介紹后。



      OpenAI前研究員Will Depue更是連發(fā)多條,第一時(shí)間指出,「SubQ幾乎可以確定是基于Kimi或DeepSeek的稀疏注意力微調(diào)」。




      AI圈見過太多「發(fā)布即巔峰」的故事,發(fā)布會(huì)上的PPT和真實(shí)世界的部署之間,隔著一整條死亡谷。

      但話說回來,也正因?yàn)檫@個(gè)賭注太大,整個(gè)行業(yè)才不敢不認(rèn)真對(duì)待。

      答案,也許只有等技術(shù)報(bào)告公開、獨(dú)立benchmark復(fù)現(xiàn)之后,才會(huì)真正揭曉。

      參考資料:

      https://x.com/alex_whedon/status/2051663268704636937?s=20

      https://subq.ai/how-ssa-makes-long-context-practical

      https://x.com/daniel_mac8/status/2051710659822305661?s=20

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      晚上7點(diǎn)半!中國(guó)女足將大戰(zhàn)東南亞勁旅,打平=小組頭名出線,劍指世界杯!

      晚上7點(diǎn)半!中國(guó)女足將大戰(zhàn)東南亞勁旅,打平=小組頭名出線,劍指世界杯!

      海闊山遙YAO
      2026-05-07 08:21:44
      美日菲“肩并肩2026”聯(lián)合演習(xí)中,一張熟悉的面孔再次出現(xiàn)

      美日菲“肩并肩2026”聯(lián)合演習(xí)中,一張熟悉的面孔再次出現(xiàn)

      三叔的裝備空間
      2026-05-06 23:40:02
      臺(tái)灣省人均GDP四萬美元,超過日韓,但為什么給人感覺比較落后

      臺(tái)灣省人均GDP四萬美元,超過日韓,但為什么給人感覺比較落后

      狐貍先森講升學(xué)規(guī)劃
      2026-05-06 05:35:03
      41.6 萬鎊周薪!曼聯(lián)鎖定世界第一中鋒,拉特克利夫欽點(diǎn)!

      41.6 萬鎊周薪!曼聯(lián)鎖定世界第一中鋒,拉特克利夫欽點(diǎn)!

      奶蓋熊本熊
      2026-05-07 06:20:34
      黃博文熱身中!鄭智遭中足聯(lián)禁賽6場(chǎng),曾因不與裁判握手被停賽4場(chǎng)

      黃博文熱身中!鄭智遭中足聯(lián)禁賽6場(chǎng),曾因不與裁判握手被停賽4場(chǎng)

      楊仔述
      2026-05-07 13:52:50
      100個(gè)能救命的冷知識(shí)!關(guān)鍵時(shí)刻能保命,建議收藏

      100個(gè)能救命的冷知識(shí)!關(guān)鍵時(shí)刻能保命,建議收藏

      詩詞天地
      2026-04-22 14:06:22
      滬蘇浙皖共同出資,長(zhǎng)三角基礎(chǔ)研究聯(lián)合基金將正式推出

      滬蘇浙皖共同出資,長(zhǎng)三角基礎(chǔ)研究聯(lián)合基金將正式推出

      上觀新聞
      2026-05-06 21:14:04
      文班亞馬19+15+2+2無緣今日最佳!對(duì)不起,你碰到暴走的唐斯了

      文班亞馬19+15+2+2無緣今日最佳!對(duì)不起,你碰到暴走的唐斯了

      世界體育圈
      2026-05-07 12:25:31
      倆男孩餐館吃飯消費(fèi)50元,翻遍書包只湊到48元,老板表示沒關(guān)系

      倆男孩餐館吃飯消費(fèi)50元,翻遍書包只湊到48元,老板表示沒關(guān)系

      張曉磊
      2026-05-06 11:29:22
      游龍戲鳳:烏電子戰(zhàn)部隊(duì)空中擒獲俄軍戰(zhàn)機(jī),俄上將慘遭爆頭

      游龍戲鳳:烏電子戰(zhàn)部隊(duì)空中擒獲俄軍戰(zhàn)機(jī),俄上將慘遭爆頭

      史政先鋒
      2026-05-06 20:14:22
      老外稱在中國(guó)電商購買4TB外置硬盤被騙:拆開竟是SD卡+讀卡器 平臺(tái)秒退款

      老外稱在中國(guó)電商購買4TB外置硬盤被騙:拆開竟是SD卡+讀卡器 平臺(tái)秒退款

      快科技
      2026-05-05 12:05:14
      中日關(guān)系在發(fā)生改變:日本表面動(dòng)作不斷,實(shí)則開始另眼看中國(guó)

      中日關(guān)系在發(fā)生改變:日本表面動(dòng)作不斷,實(shí)則開始另眼看中國(guó)

      墨羽怪談
      2026-05-07 13:16:46
      《新聞聯(lián)播》大換血,李梓萌康輝退居幕后,四代接班人悄然就位

      《新聞聯(lián)播》大換血,李梓萌康輝退居幕后,四代接班人悄然就位

      阿纂看事
      2026-04-25 13:48:54
      軍售放行后,日烏開始共制武器

      軍售放行后,日烏開始共制武器

      鳳凰WEEKLY
      2026-05-06 19:44:21
      警惕,日本向南海發(fā)射兩枚反艦導(dǎo)彈,精準(zhǔn)命中一艘軍艦

      警惕,日本向南海發(fā)射兩枚反艦導(dǎo)彈,精準(zhǔn)命中一艘軍艦

      愛吃醋的貓咪
      2026-05-06 20:48:49
      2比0!一只腳踏進(jìn)東決!NBA季后賽最強(qiáng)進(jìn)攻

      2比0!一只腳踏進(jìn)東決!NBA季后賽最強(qiáng)進(jìn)攻

      籃球教學(xué)論壇
      2026-05-07 10:49:06
      奧運(yùn)冠軍王軍霞:退役后移居美國(guó),3個(gè)孩子3個(gè)爹,如今活成了這樣

      奧運(yùn)冠軍王軍霞:退役后移居美國(guó),3個(gè)孩子3個(gè)爹,如今活成了這樣

      拳擊時(shí)空
      2026-05-07 05:50:29
      歐冠決賽數(shù)據(jù):皇馬15冠3亞 米蘭7冠4亞 拜仁6冠5亞 利物浦6冠4亞

      歐冠決賽數(shù)據(jù):皇馬15冠3亞 米蘭7冠4亞 拜仁6冠5亞 利物浦6冠4亞

      智道足球
      2026-05-07 08:08:01
      “迪士尼”變“迪土尼”?上海迪士尼度假區(qū)回應(yīng):正制定解決方案

      “迪士尼”變“迪土尼”?上海迪士尼度假區(qū)回應(yīng):正制定解決方案

      財(cái)視傳播
      2026-05-06 15:11:30
      明星套現(xiàn)離場(chǎng),留下85億窟窿,華誼兄弟被誰“抽”干了?

      明星套現(xiàn)離場(chǎng),留下85億窟窿,華誼兄弟被誰“抽”干了?

      帥真商業(yè)
      2026-05-06 21:23:01
      2026-05-07 14:55:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
      15151文章數(shù) 66843關(guān)注度
      往期回顧 全部

      科技要聞

      凌晨突發(fā)!馬斯克租22萬塊GPU給“死敵”

      頭條要聞

      美國(guó)博主自發(fā)抵制:不想收錢抹黑中國(guó)

      頭條要聞

      美國(guó)博主自發(fā)抵制:不想收錢抹黑中國(guó)

      體育要聞

      阿森納巴黎會(huì)師歐冠決賽!5月31日開戰(zhàn)

      娛樂要聞

      小S阿雅重返大S母校,翻看大S畢業(yè)照

      財(cái)經(jīng)要聞

      特朗普:美伊“很有可能”達(dá)成協(xié)議

      汽車要聞

      理想為什么不做轎車,有了解釋……

      態(tài)度原創(chuàng)

      本地
      時(shí)尚
      藝術(shù)
      家居
      公開課

      本地新聞

      用青花瓷的方式,打開西溪濕地

      “白色闊腿褲”今年夏天又火了!這樣穿時(shí)髦又高級(jí)

      藝術(shù)要聞

      這位老教授筆下的青年,活力滿滿

      家居要聞

      破繭成蝶 土味精裝房爆改

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 潘金莲a级片| 免费国产一级片内射老| 五月天成人小说| 国产A V无码专区亚洲AV| 欧美高清精品一区二区| 美女扒开大腿让男人桶| 日韩欧美激情兽交| 在线看片免费人成视久网下载| 波多野结衣色av一本一道| wwwwww.日本色| 国产一区二区黄色在线观看| 国产午夜亚洲精品国产成人 | 少妇被粗大的猛烈进出VA视频| 亚洲综合av一区二区三区| 福利视频一区| 91蜜臀国产自产在线观看| 国产精品露脸3p普通话| 成人国产亚洲精品一区二| 亚洲中文字幕无码专区| 99四虎在线视频播放| 久久精品成人免费观看三| 爆乳熟妇一区二区三区霸乳| 97久久香蕉国产线看观看| 一本久久知道综合久久| 女人与公狼做交十配视频| 男女做爰猛烈叫床视频动态图| 一本久道综合色婷婷五月| 亚洲精品无码永久中文字幕| 亚洲国产成人无码AV在线影院L| 亚洲国产中文精品va在线播放| 亚洲色情在线播放| 久久人精品| 日韩av电影在线观看| 国产97公开成人免费视频| 欧美日韩另类在线| 蜜桃av色偷偷av老熟女| 99久久人妻精品免费二区| 国产精品午夜电影| 国产成人精品日本亚洲专区61| 无翼乌口工全彩无遮挡h全彩| 亚洲AV无码日韩综合欧亚|