<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      13人干翻Transformer!新架構SSA算力暴減千倍,成本僅Opus 5%

      0
      分享至


      新智元報道

      編輯:桃子

      【新智元導讀】Transformer統治地位懸了!一款SubQ模型帶著SAA架構橫空出世,1200萬上下文成本僅Opus的5%,計算量暴減千倍。

      Transformer,王座不保?!

      今天,一款AI模型SubQ橫空出世,震撼了全世界。

      這是全球首個基于完全亞二次方稀疏注意力架構(SSA)的模型,上下文高達1200萬Token。


      SubQ的核心優勢在于,其SSA架構會根據內容「動態選擇」關注點,不會盲目計算所有Token間的關聯。

      相較于Transformer,它的計算量直接暴減1000倍。

      實驗結果顯示,100萬token上下文,SubQ要比FlashAttention快52倍,成本不到Claude Opus的5%。


      而打造出這款架構的背后這家公司,叫Subquadratic,坐標邁阿密,全公司僅13人。

      AI大佬Bindu Reddy辣評道,「若這一切都是真的,Anthropic和OpenAI的估值直接歸0」!


      還有人表示,這才是LLM接下來真正Scaling的方式。


      Transformer「原罪」,九年未解

      2017年,谷歌那篇「Attention is All You Need」奠定了Transformer架構的統治地位。

      此后九年,從GPT到Claude到Gemini,所有前沿大模型都建立在同一個基礎上:密集注意力機制。


      長期以來,Transformer的工作方式非常暴力,即每個token都要和序列中所有其他token做一次比較。

      這種機制讓它深陷「二次方復雜度」的泥潭,上下文每增加一倍,計算成本飆升四倍。

      這意味著,輸入越長,模型越貴、越慢、越容易崩。

      這就解釋了幾乎所有LLM的上下文卡在100萬token左右,不是技術做不到更長,是做到了也用不起。

      這一次,SubQ的誕生,從根本上改變了這個等式。


      SSA架構出世

      不要「更快」只要「更少」

      SubQ的核心突破叫做SSA——亞二次方稀疏注意力(Subquadratic Sparse Attention)。

      它的思路出奇地簡單,不再讓每個token和所有token做比較。

      既然訓練好的模型中,絕大多數注意力權重都接近零0,那為什么還要算它們?

      SSA的做法是,對每一個query,基于「內容」選擇序列中真正值得關注的位置,然后只在這些位置上精確計算注意力。

      它只計算那些真正有意義的交互,跳過其余99%以上的無用計算。


      以下是SSA的三大關鍵特性——

      • 線性擴展

      計算量隨選中的位置數量增長,而不是隨整個序列長度增長。上下文翻倍,成本只翻倍,不再是翻四倍。

      • 內容依賴路由

      模型根據語義決定看哪里,而不是根據位置。關鍵信息在序列第3個token還是第1100萬個token,都能被找到。

      • 精確檢索

      不像循環模型那樣把信息壓縮成固定狀態,SSA保留了從任意位置精確取回信息的能力。

      說白了,SSA不是「把密集注意力算得更快」,而是「讓模型做更少的注意力計算」。


      減少的計算量,直接轉化為速度。

      速度狂飆52.5倍,成本不到Opus 5%

      SubQ放出的數據,每一條都在暴擊:

      在100萬token長度上,SSA比標準密集注意力+FlashAttention-2快52.2倍。


      在12.8萬token上快7.2倍,25.6萬token快13.2倍,51.2萬token快23倍。

      顯而易見,上下文越長,優勢越碾壓。

      這正是SSA線性擴展的直接體現——密集注意力越長越慢,SSA越長越劃算。


      再來看算力消耗,在100萬token下,注意力FLOP減少了62.5倍。在1200萬token下,這個數字飆升到接近1000倍。


      至于成本,Subquadratic給了一個非常直觀的對比——

      在RULER 128K基準測試上,SubQ花費8美元,Opus為2600美元,直接拉出了300倍的成本差距。

      最關鍵的是,這些速度和成本優勢,并沒有以犧牲準確率為代價。

      RULER 128K基準測試: SubQ拿下95%,Opus 4.6是94.8%;


      SWE-Bench Verified(代碼工程): SubQ得分81.8,超過Opus 4.6的80.8。

      MRCR v2(長上下文檢索): SubQ拿到65.9%,雖然低于Opus 4.6的78%,但遠超GPT 5.4(39%)和Gemini 3.1 Pro(23%)。


      這組數字放在一起看,細思極恐——

      一家種子輪公司,用不到Opus 5%的成本,在多項核心基準測試上打平甚至超過了Anthropic和OpenAI的旗艦模型。


      一個提示詞,SubQ即可處理1200萬Token的超長信息:

      無論是整個代碼庫、數月的 PR 記錄,還是長期運行的 AI 智能體狀態,全都游刃有余,而且成本僅需原來的五分之一。


      不得不說,若這一切成真,這將是Transformer問世以來最重要的架構級突破。

      13人初創公司,要顛覆Transformer

      Subquadratic成立于2024年,拿下2900萬美元種子輪,估值5億美元。

      它有兩位聯合創始人:CEO Justin Dangel,CTO Alexander Whedon。


      研究團隊11人,全部是博士,來自Meta、谷歌、牛津大學、劍橋大學、Adobe。

      值得一提的是,這家公司之前叫Aldea,做的是語音模型,后來轉型到了注意力架構研究。

      這一次,產品線三條同時上線:

      • SubQ API:12M token全量上下文接口

      • SubQ Code:命令行編碼Agent,整個代碼庫一次性塞進去

      • SubQ Search:深度研究工具,初期免費

      全網炸鍋:是終結者,還是AI版Theranos?

      SubQ發布后數小時內,AI社區就分裂成了兩個陣營。

      AI大佬Dan McAteer一句話,概括了所有人的心態:

      SubQ要么是Transformer以來最大的突破……

      要么就是AI界的Theranos。


      支持者一方陣容不小。

      有人表示,這是2026年最瘋狂的AI發布之一。

      Subquadratic可能找到了奧特曼所言的另一個架構的重大突破。




      但懷疑派也毫不留情,有人直言這就是一個「騙子公司」,尤其是看完創始人領英介紹后。



      OpenAI前研究員Will Depue更是連發多條,第一時間指出,「SubQ幾乎可以確定是基于Kimi或DeepSeek的稀疏注意力微調」。




      AI圈見過太多「發布即巔峰」的故事,發布會上的PPT和真實世界的部署之間,隔著一整條死亡谷。

      但話說回來,也正因為這個賭注太大,整個行業才不敢不認真對待。

      答案,也許只有等技術報告公開、獨立benchmark復現之后,才會真正揭曉。

      參考資料:

      https://x.com/alex_whedon/status/2051663268704636937?s=20

      https://subq.ai/how-ssa-makes-long-context-practical

      https://x.com/daniel_mac8/status/2051710659822305661?s=20

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “臺獨”頑固分子劉世芳親屬已被在大陸臺企解職

      “臺獨”頑固分子劉世芳親屬已被在大陸臺企解職

      界面新聞
      2026-05-06 21:01:54
      DeepSeek預測:未來普通家庭升值最快的5項資產,越早布局越好

      DeepSeek預測:未來普通家庭升值最快的5項資產,越早布局越好

      洞見
      2026-05-06 10:00:15
      連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      街上的行人很刺眼
      2026-04-25 10:55:49
      GDP增速再墊底!西北第一城,怎么了?

      GDP增速再墊底!西北第一城,怎么了?

      西部城市
      2026-05-06 21:27:23
      荒唐至極!歐洲議會勒令廢除普通話法案?中國主權絕不容外人置喙

      荒唐至極!歐洲議會勒令廢除普通話法案?中國主權絕不容外人置喙

      行者聊官
      2026-05-06 14:16:30
      升隊史第一!愛德華茲48場季后賽超越加內特 打破塵封22年紀錄

      升隊史第一!愛德華茲48場季后賽超越加內特 打破塵封22年紀錄

      醉臥浮生
      2026-05-07 10:11:17
      70.9萬輛創同期新高,吉利汽車憑何登頂一季度中國品牌銷冠

      70.9萬輛創同期新高,吉利汽車憑何登頂一季度中國品牌銷冠

      一品汽車
      2026-04-03 15:01:29
      被罵“想休息不要當醫生”,華西五一放假被熱議!同行:華西帶了個好頭!有底氣才敢放假,小醫院仍掙扎求生!做好門診分流,醫生才有假放

      被罵“想休息不要當醫生”,華西五一放假被熱議!同行:華西帶了個好頭!有底氣才敢放假,小醫院仍掙扎求生!做好門診分流,醫生才有假放

      梅斯醫學
      2026-05-07 07:55:00
      芭提雅海灣8名外國游客不雅行為引爭議,當地民眾表示強烈不滿

      芭提雅海灣8名外國游客不雅行為引爭議,當地民眾表示強烈不滿

      曼谷陳大叔
      2026-05-06 15:05:34
      全靠內鬼,105噸假黃金騙了253億

      全靠內鬼,105噸假黃金騙了253億

      大貓財經Pro
      2026-05-06 18:44:18
      男子騎摩托車撞人致2死1傷,保險公司給每位死者49000元安葬費,受害者家屬:兩位遇難者的遺體存放在殯儀館,不接受賠償結果

      男子騎摩托車撞人致2死1傷,保險公司給每位死者49000元安葬費,受害者家屬:兩位遇難者的遺體存放在殯儀館,不接受賠償結果

      大風新聞
      2026-05-06 22:13:02
      死于獄中近7年后,愛潑斯坦遺書公布,寫著“調查了我一個月,什么也沒發現”;遺書由前獄友提交給法庭

      死于獄中近7年后,愛潑斯坦遺書公布,寫著“調查了我一個月,什么也沒發現”;遺書由前獄友提交給法庭

      大風新聞
      2026-05-07 09:30:04
      俄羅斯副部長被查前成功出逃美國,跨三國離境

      俄羅斯副部長被查前成功出逃美國,跨三國離境

      桂系007
      2026-05-01 23:48:19
      當年游戲廳競爭有多激烈,年輕老板娘把自己都搭進去了

      當年游戲廳競爭有多激烈,年輕老板娘把自己都搭進去了

      街機時代
      2026-04-20 18:00:03
      人心是怎么壞的?女子被救后,反手一巴掌給施救者,后續來了!

      人心是怎么壞的?女子被救后,反手一巴掌給施救者,后續來了!

      眼光很亮
      2026-05-07 07:35:40
      三峽“無縫大壩”締造者落馬!功勛滿身,卻沒管住心中一道縫

      三峽“無縫大壩”締造者落馬!功勛滿身,卻沒管住心中一道縫

      甜檸聊史
      2026-03-25 18:43:05
      三星宣布停止在中國市場銷售所有家電產品

      三星宣布停止在中國市場銷售所有家電產品

      財聯社
      2026-05-06 19:32:22
      恒大集團創始人許家印被曝出猛料

      恒大集團創始人許家印被曝出猛料

      地產微資訊
      2026-05-07 09:28:09
      謝娜演唱會這一夜,半個娛樂圈捧場,網友直呼票價不值,吃相難看

      謝娜演唱會這一夜,半個娛樂圈捧場,網友直呼票價不值,吃相難看

      青梅侃史啊
      2026-05-07 07:28:32
      歐冠狂歡夜:凱恩補時破門絕平 拜仁5-6遭巴黎淘汰 決賽對陣誕生

      歐冠狂歡夜:凱恩補時破門絕平 拜仁5-6遭巴黎淘汰 決賽對陣誕生

      侃球熊弟
      2026-05-07 03:57:40
      2026-05-07 10:24:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15148文章數 66841關注度
      往期回顧 全部

      科技要聞

      三星停止在中國大陸銷售家電!知情人回應

      頭條要聞

      牛彈琴:一位特殊的客人來到北京 12個細節很意味深長

      頭條要聞

      牛彈琴:一位特殊的客人來到北京 12個細節很意味深長

      體育要聞

      活塞1比0騎士:坎寧安不再是一個人了

      娛樂要聞

      謝娜演唱會暗藏驚喜 何炅瞞天過?,F身

      財經要聞

      特朗普:美伊“很有可能”達成協議

      汽車要聞

      領克10/領克10+ 無論能源形式 領克都要快樂

      態度原創

      本地
      數碼
      房產
      手機
      軍事航空

      本地新聞

      用青花瓷的方式,打開西溪濕地

      數碼要聞

      AMD發布26.5.1驅動更新:支持《識質存在》游戲

      房產要聞

      遙遙領先!這個澄邁頂流紅盤,憑什么持續霸榜

      手機要聞

      OPPO、人民日報聯手,劉作虎給出總結

      軍事要聞

      實施不到48小時 特朗普緊急喊停"霍爾木茲自由計劃"

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产成人综合野草| 精品国产乱子伦一区二区三区| 91成人啪国产啪永久地址 | 亚洲精品在线少妇内射| 亚洲男人的天堂久久精品| 亚洲欧美日韩在线观看高清| 少妇伦子伦情品无吗| 亚洲AV综合色区无码另类小说| 欧美精品亚洲精品日韩专| 另类专区欧美在线亚洲免费| 亚洲精品国产高清一线久久| 日日碰狠狠躁久久躁9| 亚洲成a∨人片在线观看无码| 中文字日产幕乱五区| 国产黄色短视频| 超碰97人人做人人爱综合| 亚洲AV一二三区天堂无码www| 国产freexxxx性播放麻豆| 亚洲成人中文字幕| 亚洲成a人v欧美综合天堂| 高清无码一区二区三区| 野外做受又硬又粗又大视频| 成在人线av无码免费看网站直播| 日日摸日日碰人妻无码老牲| 日产精品久久久一区二区| 春梦视频站| 亚洲一区二区| 人妻系列国产精品| tom影院亚洲国产日本一区| 国产乱人伦av在线a| 亚洲午夜久久久久久久久久| 国产精品白浆无码流出| 国产成人一区二区三区A片免费| 亚洲国产av一区二区三区四区| 久久天天躁狠狠躁夜夜| 亚洲丁香五月| 日韩亚洲欧美精品综合 | 人妻人人澡人人添人人爽人人玩 | 怡红院一区二区三区在线| av高清无码国产在线观看| 国产综合色产在线精品|