<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      CVPR 2026 四篇論文透視:大廠如何靠「算法瘦身」對抗算力漲價?

      0
      分享至


      2026年,大廠們不再比誰的GPU多,而是比誰的算法更聰明。

      作者丨陳淑瑜

      編輯丨岑 峰

      一個在2026年越來越難以回避的問題是:如果H100全面斷供、電費賬單直線飆升、訓練一次大模型的成本足以買下一家創(chuàng)業(yè)公司,大模型的故事還講得下去嗎?

      也許頂級學術會議的論文能給大家一個新的啟發(fā)。

      今年的CVPR收到了四千余篇投稿,其中一個清晰的信號正在浮現(xiàn):大廠不再比拼GPU數量,而是較量如何把GPU用得更好。算力封鎖之下,算法正在成為新的護城河。

      在論文的汪洋中,字節(jié)跳動Seed團隊是出手最密集的玩家之一。

      AI 科技評論聚焦四篇來自字節(jié)跳動的論文——TEMF、Beyond Token Eviction、Mixture-of-Depths Attention和GenieDrive。它們全都圍繞一個核心命題展開:當算力不再能夠"暴力"解決,算法如何接棒?

      這四篇論文覆蓋了一條完整的鏈條:從生成模型的采樣步數壓縮,到推理過程的顯存瘦身,再到注意力計算資源的動態(tài)分配,最終延伸到端側部署的物理感知。它們不是孤立的創(chuàng)新,而是Seed團隊圍繞"算力降本"這一命題打出的組合拳。

      01


      采樣降速:一步生成的尺度跨越

      大模型的推理成本,很大程度上藏在采樣步數里。

      以Stable Diffusion為代表的多步迭代生成,一個看似簡單的512×512圖像,背后可能是50到100次神經網絡前向傳播。訓練時模型學到的是“每一步該怎么加噪”,但推理時模型需要做的是“每一步該怎么去噪”,這兩個過程天然不對稱,訓練目標與推理目標之間存在一道看不見的裂縫。

      傳統(tǒng)MeanFlow的尺度差距問題正源于此:一步生成的質量始終無法與多步采樣競爭,而多步采樣意味著成倍增加的算力消耗。

      字節(jié)跳動Seed團隊提交的TEMF(Temporal Equilibrium MeanFlow)正是對這一困境的直接回應。

      TEMF的核心設計是讓模型在訓練階段就同時學習“從數據到噪聲”和“從噪聲到數據”的雙向變換,而非像傳統(tǒng)歸一化流那樣只學習單向映射。

      雙向建模的效果立竿見影,模型在訓練時就熟悉了反向采樣的路徑,推理時不再需要依賴多步迭代來逐步精煉,可以直接從噪聲出發(fā)、在單次前向傳播中完成整個生成過程。

      這種從百次計算到一次計算的跨越,在實際部署中帶來的成本削減是數量級的。


      論文地址:

      https://cvpr.thecvf.com/virtual/2026/poster/39823

      有意思的是,這道裂縫的修補并非只有一種解法。同期Meta發(fā)表的Improved Mean Flows從原理層面分析了快轉發(fā)聲模型訓練與推理不對稱的根源,并提出了自己的改進框架。(Improved Mean Flows的論文解讀可閱讀:)


      論文地址: https://arxiv.org/abs/2512.02012

      兩支獨立團隊在幾乎同一時間節(jié)點做出了相似的技術判斷——一步生成不是天方夜譚,關鍵在于彌合訓練與推理之間的結構性裂縫。這不是巧合,這是行業(yè)共識正在形成的信號。

      02


      顯存瘦身:KV Cache的精準壓縮

      如果說TEMF解決的是計算次數的問題,那么另一篇字節(jié)跳動Seed團隊的工作Beyond Token Eviction,則直指推理過程中另一個更隱蔽的成本中心:顯存占用。

      理解KV Cache的機制,是理解大模型推理成本的關鍵切口。

      當大語言模型處理一段文本時,它需要記住此前所有詞元的信息才能生成下一個詞元。每一個經過注意力計算的詞元,都會在顯存中留下一組對應的向量,這些向量是模型“上下文記憶”的物理載體。

      問題在于,這種“記憶”是只增不減的。當上下文窗口從4K擴展到32K、再到100K,KV Cache的顯存占用也在同步膨脹。

      一個有100K上下文窗口的模型,僅KV Cache就可能消耗40到60GB的顯存,而消費級顯卡的顯存上限不過24GB,就連專業(yè)級A100也不過80GB。也就是說,在不遠的將來,顯存瓶頸會比計算瓶頸更早到來。

      傳統(tǒng)解法“Token Eviction”是在顯存壓力過大時,將一部分“不那么重要”的舊Token驅逐出去,釋放空間給新的Token。

      而Beyond Token Eviction的突破則在于“混合維度預算分配”策略。它不再將Token的存留視為非此即彼的二元判斷,而是允許不同Token擁有不同的“精度維度”指標。重要的Token保留更高的維度,從而完整存儲其語義信息;不那么關鍵的Token被壓縮到更低的維度,以更少的空間保存其核心語義。

      這種“混合維度”策略的本質是對信息做“有損壓縮”而非“徹底刪除”。被壓縮的Token仍然保留著足夠用于后續(xù)推理的語義信息,而模型通過訓練學會了“自適應地”判斷哪些Token值得高精度、哪些可以接受低精度。

      系統(tǒng)不再需要在“全部保留”和“全部丟棄”之間做選擇,而是在精度與效率之間找到了一個可調的平衡點。


      用于KV緩存壓縮的雙階段尺寸分配流程

      更難得的是,這套方案無需對模型進行任何重訓練。云廠商可以直接將它部署在現(xiàn)有推理框架上,以工程側的輕量改動換取顯存占用的大幅下降。


      論文地址:https://arxiv.org/pdf/2603.20616

      這正是當前大廠在降本路徑上最務實的選擇:不是推翻重來,而是在既有架構上做“微創(chuàng)手術”。

      03


      計算平等:讓模型自己分配算力

      采樣步數降了,顯存空間省了,但字節(jié)在注意力計算的效率問題上也沒有閑著。他們的Mixture-of-Depths Attention,從計算資源分配策略的維度提供了一種正交解法。

      傳統(tǒng)Transformer在處理每個Token時,都會執(zhí)行完整的注意力計算。這意味著,即使某個Token在當前語境下的語義貢獻微乎其微,它仍然會消耗與其他Token同等的計算資源。這種“一視同仁”的計算策略,本質上是一種隱性的算力浪費。

      新的思路由此出發(fā):并非所有Token都需要被“深度處理”。它引入了一種動態(tài)路由機制,讓模型在運行時自主決定——哪些Token值得走完整的注意力計算路徑,哪些Token可以被引導至更輕量的快速路徑。


      混合深度注意力機制MoDA

      結果隨之而來:系統(tǒng)層面的有效計算量顯著下降,但模型輸出的質量并未等比例衰減。真正重要的Token仍然得到了充分的計算資源,而大量“搭便車”的Token被引導至旁路。

      這種“讓模型自己判斷輕重緩急”的思路,代表了算法層面“降本增效”的一種優(yōu)雅路徑。這與混合專家(MoE)模型的設計哲學一脈相承,但不是整個模型層的專家切換,而是在每個注意力層做細粒度的資源調度。

      模型在訓練過程中學會動態(tài)分配計算預算,而非通過硬編碼的稀疏規(guī)則強行削減計算量——好鋼用在刀刃上,這是2026年算法工程師們最希望模型學會的本事。


      論文地址:https://arxiv.org/pdf/2603.15619

      04


      端側部署:物理感知驅動的世界模型

      上述三篇工作幾乎都在回答同一個問題:如何在有限的算力約束下,讓模型跑得更快、占得更少。但字節(jié)跳動在GenieDrive這篇工作中,提出了一個更遠見的問題:高效模型在端側能做什么?

      自動駕駛的視覺感知系統(tǒng),一直是算力軍備競賽的重災區(qū)。傳統(tǒng)自動駕駛的感知系統(tǒng)依賴多傳感器融合,各司其職又彼此冗余,在算力有限的嵌入式平臺上捉襟見肘。

      GenieDrive把這個問題拆解得更深了一層。它搭建了一種“物理感知驅動的4D占用引導視頻生成”框架,不再將視覺感知視為一個“看懂圖像”的問題,而是將其視為一個“理解物理世界如何運轉”的問題,不僅讓模型生成視覺上逼真的駕駛場景視頻,還讓模型具備對物理規(guī)律的基本理解,比如運動物體的軌跡遵循物理動量、遮擋關系遵循空間一致性、光照變化遵循物理反射模型。

      這種設計的直接效果是:GenieDrive生成的不是一段“視覺上逼真的視頻”,而是一個“物理上可信的4D模擬環(huán)境”。

      當這個模擬環(huán)境可以直接服務于下游的軌跡規(guī)劃和決策控制時,端側模型的商業(yè)價值就超越了單純的速度競賽。比如說如果模型能夠準確預測“兩秒后前方車輛會因為慣性繼續(xù)滑行兩米”,這個信息對于緊急制動的決策價值,遠高于“那個地方有一輛車”的語義標簽。

      值得注意的是,GenieDrive的高效性并不來自單一算法的突破,而是來自“4D表示+物理先驗+端到端聯(lián)合優(yōu)化”的協(xié)同設計。它代表了2026年大廠在高效視覺表征上的另一條路徑:不只是讓模型跑得更快,而是讓模型“想得更少、做得更準”。


      論文地址:

      https://www.paperdigest.org/paper/?paper_id=cvpr-36900-2026-04-21

      05


      結語:算法天才的元年

      縱觀字節(jié)跳動Seed團隊在CVPR 2026上這四篇論文,一個清晰的敘事正在浮現(xiàn):算力封鎖并沒有殺死創(chuàng)新,反而催生了一種更精致的工程哲學。

      TEMF用“時間均衡”彌合了訓練與推理的結構裂縫,讓一步生成從不可能變成了工程現(xiàn)實;

      Beyond Token Eviction用“混合維度”重新定義了信息的取舍策略,讓顯存壓縮從粗暴刪除變成了精細調控;

      Mixture-of-Depths讓計算資源學會了「按需分配」,讓模型自己成為計算預算的聰明管家;

      GenieDrive則將高效表征引向了物理可解釋的端側應用,讓速度競賽升維為智能競賽。

      這四條路徑指向同一個結論:2026年不是“大模型時代的終結”,而是“聰明模型時代的元年”。當暴力堆砌算力的路徑變得不可持續(xù),那些能夠用更少資源做更多事情的算法天才,正在成為這個時代最稀缺的人才。

      對于CTO和云廠商而言,字節(jié)的這組論文給出了一個清晰的信號:與其等待下一代芯片的算力提升,不如今天就擁抱這些算法優(yōu)化帶來的降本紅利。

      對于軟硬件開發(fā)者而言,這意味著新的機會窗口正在打開:適配ELSA這類硬件無關內核的編譯器優(yōu)化、基于動態(tài)注意力路由的模型壓縮工具、面向4D物理感知模型的端側部署框架,每一個環(huán)節(jié)都是尚未被充分開采的富礦。

      算力封鎖的本質是一道經濟命題,但它的解法,最終要靠算法給出。

      這次去 CVPR 現(xiàn)場,一定不要錯過

      【認識大牛+賺外快】的機會

      需要你做什么:把你最關注的10個大會報告,每頁PPT都拍下來

      你能獲得什么?

      認識大牛:你將可以進入CVPR名師博士社群;

      錢多活少:提供豐厚獎金,任務量精簡;

      聽會自由:你的行程你做主,順手就把外快賺。拍下你最感興趣的10個報告PPT即可。

      如果你即將前往CVPR,想邊聽會邊賺錢,還能順便為AI學術社區(qū)做貢獻、認識更多大牛,歡迎聯(lián)系我們:[添加微信號:MS_Yahei]

      【限額5位,先到先得】

      未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區(qū)進行轉載!

      公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      2-1,成都蓉城9連勝鎖定半程冠軍 韋世豪梅開二度 津門虎繼續(xù)墊底

      2-1,成都蓉城9連勝鎖定半程冠軍 韋世豪梅開二度 津門虎繼續(xù)墊底

      替補席看球
      2026-05-15 21:36:33
      全球最大的公司誕生!市值35萬億,相當于15個阿里,利潤超8000億

      全球最大的公司誕生!市值35萬億,相當于15個阿里,利潤超8000億

      混沌錄
      2026-05-11 22:34:09
      布馮:當年買了輛保時捷但父親覺得張揚,不到一年我就賣了

      布馮:當年買了輛保時捷但父親覺得張揚,不到一年我就賣了

      懂球帝
      2026-05-14 09:57:48
      小米手機官宣降價,門店員工:15Ultra直降1500元,17Ultra也有優(yōu)惠

      小米手機官宣降價,門店員工:15Ultra直降1500元,17Ultra也有優(yōu)惠

      極目新聞
      2026-05-15 19:08:44
      中美會談圓滿后,中方當面對臺灣問題定調,特朗普反應耐人尋味

      中美會談圓滿后,中方當面對臺灣問題定調,特朗普反應耐人尋味

      顧史
      2026-05-15 17:06:04
      世界第1粉碎日本爭冠希望!石宇奇2-1渡邊航貴,晉級男單四強

      世界第1粉碎日本爭冠希望!石宇奇2-1渡邊航貴,晉級男單四強

      釘釘陌上花開
      2026-05-15 18:19:32
      來了來了!19歲超級新星!正式打進中國男籃

      來了來了!19歲超級新星!正式打進中國男籃

      籃球實戰(zhàn)寶典
      2026-05-15 17:19:02
      故宮建造時使用的木材,來自哪里?為何這些木材至今沒有腐爛

      故宮建造時使用的木材,來自哪里?為何這些木材至今沒有腐爛

      云霄紀史觀
      2026-05-15 01:49:45
      中美談判桌炸出4顆深水炸彈:特朗普千億訂單被中國反手撕碎?

      中美談判桌炸出4顆深水炸彈:特朗普千億訂單被中國反手撕碎?

      小莜讀史
      2026-05-14 13:43:45
      4000萬年薪泡湯?倫敦之夜,張本宇看兒女慘敗,紅著眼眶收拾書包。

      4000萬年薪泡湯?倫敦之夜,張本宇看兒女慘敗,紅著眼眶收拾書包。

      最愛乒乓球
      2026-05-15 00:08:05
      定了!央視宣布拿下兩屆世界杯版權

      定了!央視宣布拿下兩屆世界杯版權

      界面新聞
      2026-05-15 18:36:59
      盤點十大元帥的子女,最有出息的是誰?這位老帥的子女很突出

      盤點十大元帥的子女,最有出息的是誰?這位老帥的子女很突出

      霹靂炮
      2026-05-15 13:54:39
      剛離華就爆猛料!特朗普親口承認:伊朗核設施,被美國 24 小時盯死

      剛離華就爆猛料!特朗普親口承認:伊朗核設施,被美國 24 小時盯死

      老寓雜談
      2026-05-15 21:26:01
      京滬大戰(zhàn)名場面:周琦“反向封神”,上海87比82占得先機

      京滬大戰(zhàn)名場面:周琦“反向封神”,上海87比82占得先機

      姜大叔侃球
      2026-05-15 21:48:04
      1.4億歐!巴黎簽阿爾瓦雷斯!

      1.4億歐!巴黎簽阿爾瓦雷斯!

      足球王國
      2026-05-15 13:07:13
      訪華最后一天,中方以茶論道,給了特朗普外交史上唯二的待遇

      訪華最后一天,中方以茶論道,給了特朗普外交史上唯二的待遇

      云上烏托邦
      2026-05-15 20:25:18
      賴清德鬧大笑話、斯威士蘭捅他刀子!轉身發(fā)現(xiàn):鄭麗文悶聲做大事

      賴清德鬧大笑話、斯威士蘭捅他刀子!轉身發(fā)現(xiàn):鄭麗文悶聲做大事

      野史日記
      2026-05-14 09:40:25
      國宴桌上驚現(xiàn)“最丑礦泉水”!沒logo、沒廣告,卻連霸70年 憑啥?

      國宴桌上驚現(xiàn)“最丑礦泉水”!沒logo、沒廣告,卻連霸70年 憑啥?

      房產衫哥
      2026-05-15 18:51:31
      G1北京82-87不敵上海 球員評價:4人優(yōu)秀,5人低迷

      G1北京82-87不敵上海 球員評價:4人優(yōu)秀,5人低迷

      籃球資訊達人
      2026-05-15 21:46:54
      王鈺棟補射破門!激情滑跪慶祝,米神連過4人,顏駿凌撲球脫手

      王鈺棟補射破門!激情滑跪慶祝,米神連過4人,顏駿凌撲球脫手

      奧拜爾
      2026-05-15 20:09:02
      2026-05-15 22:15:00
      AI科技評論 incentive-icons
      AI科技評論
      點評學術,服務AI
      7280文章數 20751關注度
      往期回顧 全部

      科技要聞

      直降千元起步!蘋果華為率先開啟618讓利

      頭條要聞

      生產成本疑不足40元 "童鞋界愛馬仕"泰蘭尼斯廣告翻車

      頭條要聞

      生產成本疑不足40元 "童鞋界愛馬仕"泰蘭尼斯廣告翻車

      體育要聞

      德約科維奇買的球隊,從第6級聯(lián)賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      財經要聞

      騰訊掉隊,馬化騰戳破真相

      汽車要聞

      高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

      態(tài)度原創(chuàng)

      數碼
      家居
      親子
      本地
      游戲

      數碼要聞

      艾為電子連啟三場 mini研討會 | 攜手合作伙伴全域賦能生態(tài)

      家居要聞

      110㎡淡而有致的生活表達

      親子要聞

      深圳萌娃化身“護鳥衛(wèi)士” 為紅耳鵯蛋寶寶搭圍欄立守則

      本地新聞

      用蘇繡的方式,打開江西婺源

      PS5獨占神作銷量太慘了!首周僅4614份 第二周消失

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲熟妇AV一区二区三区宅男| 亚洲成人黄色网址| 中国亚州女人69内射少妇| 五月丁香色色| 国产精品亚洲精品日韩已满| 久青草视频在线观看免费| 黄色av电影| 欧美大胆老熟妇乱子伦视频| 免费美女黄网站久久久| 精品视频国产香人视频| 野外做受三级视频| 久久婷婷综合缴情亚洲狠狠_| 极品无码国模国产在线观看 | 国产免费午夜一区二区视频| 欧美在线观看网址| 乱人伦人妻系列| 91福利导航| av香港经典三级级 在线| 尹人香蕉久久99天天拍久女久| 人妻av综合天堂一区| 51精品免费视频国产专区| 天堂中文а√在线官网| 国产色无码专区在线观看| 国产av不卡一区二区| 91精品91久久久| 2019精品国自产拍在线不卡| 狠狠色狠狠色综合网| 日韩一区二区三| 本免费Av无码专区一区| 欧美黑人又粗又硬xxxxx喷水| 99RE8这里有精品热视频| 2021无码天堂在线| 爱性久久久久久久久| 亚洲中文字幕av| 国产一区二区三区小说| 午夜福利一区福利二区| 亚洲国产午夜精品理论片在线播放| 久久中文字幕国产精品| 91豆花成人社区在线| 国产乱人伦AV在线麻豆A| 亚洲中文在线观看|