<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      ApdativeNN:建模類人自適應感知機制,突破機器視覺不可能三角

      0
      分享至



      視覺是人類理解復雜物理世界的重要方式。讓計算機具備視覺感知與認知的能力,是人工智能的主要研究問題之一,對多模態基礎模型、具身智能、醫療 AI 等重要領域具有關鍵支撐作用。過去幾十年間,計算機視覺取得了顯著突破,已在圖像識別、目標檢測、多模態理解等多個任務上接近甚至超越人類專家水平。然而,當前的高精度模型在實際落地中常面臨較大挑戰:它們的推理過程往往需要激活上億參數來處理高分辨率圖像或視頻、以解決復雜和挑戰性的視覺問題,導致功耗、存儲需求和響應時延急劇上升。這一瓶頸使得它們難以部署在算力、能耗、存儲等資源高度受限的實際系統中(如機器人、自動駕駛、移動設備或邊緣終端等),甚至在醫療、交通等場景下由于延遲決策危害生命安全。另一方面,大型模型龐大的推理能耗在也帶來了大規模部署的環境可持續性問題。

      上述挑戰的一個重要原因在于現有視覺模型普遍采用了全局表征學習范式:一次性并行處理整幅圖像或視頻的所有像素、提取全部對應特征,再應用于具體任務。這種 “全局并行計算” 范式使得模型計算復雜度隨輸入尺寸呈至少平方或立方增長,逐漸形成了一個日益嚴峻的能效瓶頸:信息豐富的高分辨率時空輸入、性能領先的大型模型、高效快速推理,三者難以同時滿足。這一挑戰正在成為制約視覺智能走向大規模、可部署落地、低碳環保的公認難題。



      圖1 當前計算機視覺范式所面臨的能效瓶頸

      人類視覺系統為突破上述瓶頸提供了重要啟示:在觀察復雜環境時,人眼不會一次性處理全部視覺信息,而是通過一系列 “注視” 動作主動、選擇性地采樣關鍵區域,以小范圍高分辨率的感知逐步拼接出對物理世界中有用信息的認知。這種先進的機制能在龐雜的信息流中快速篩取要點,大幅降低計算開銷,使得人類高度復雜的視覺系統即便在資源受限的前提下依然能夠高效、快速運行。無論外界場景多么復雜,人類視覺的能耗主要取決于注視帶寬與注視次數,而非全局像素量。早在 2015 年,LeCun, Bengio, Hinton 便在《Nature》綜述論文 “Deep Learning” 中指出,未來的 AI 視覺系統應具備類人的、任務驅動的主動觀察能力。然而近十年來,這一方向仍缺乏系統性研究。



      圖2 人類視覺系統的主動自適應感知策略

      2025 年 11 月,清華大學自動化系宋士吉、黃高團隊在《自然?機器智能》(Nature Machine Intelligence)上發表了論文《Emulating human-like adaptive vision for efficient and flexible machine visual perception》(模擬人類自適應視覺,實現高效靈活的機器視覺感知)。該研究提出了AdaptiveNN 架構,通過借鑒人類 “主動自適應視覺” 的機制,將視覺感知建模為由粗到精的最優序貫決策問題:逐步定位關鍵區域、累積多次注視信息,并在信息足夠完成任務時主動終止觀察。在理論上,該研究通過結合表征學習與自獎勵強化學習,給出了 AdaptiveNN 所面臨的離散 - 連續混合優化問題的無需額外監督的端到端求解方法。在涵蓋 9 類任務的廣泛實驗中,AdaptiveNN 在保持精度的同時實現了最高 28 倍的推理成本降低,可在線動態調整其行為以適配不同任務需求與算力約束,同時,其基于注視路徑的推理機制顯著提升了可解釋性。AdaptiveNN 展現出構建高效、靈活且可解釋的計算機視覺新范式的潛力。另一方面,AdaptiveNN 的感知行為在多項測試中與人類接近,也為未來探索人類視覺認知機制的關鍵問題提供了新的見解和研究工具。



      • 論文標題:Emulating human-like adaptive vision for efficient and flexible machine visual perception
      • 論文鏈接:https://www.nature.com/articles/s42256-025-01130-7

      AdaptiveNN:類人主動感知架構



      借助這一機制,AdaptiveNN 能夠在保證高精度的同時顯著降低計算量,實現“看得清,也看得省”。它使神經網絡具備了類人式的主動感知,從而突破了傳統視覺模型在效率與效果之間的權衡瓶頸。

      值得注意的是,AdaptiveNN 在設計上具有較強的兼容性和靈活性,適用于多種不同的深度神經網絡基礎架構(如卷積網絡、Transformer等)和多種類型的任務(如純視覺感知、視覺-語言多模態聯合建模等)。



      圖3 AdaptiveNN的網絡架構和推理過程

      理論創新:自激勵強化學習驅動的主動感知行為學習

      AdaptiveNN 的訓練過程同時涉及連續變量(如從注視區域中提取特征)與離散變量(如決定下一次注視位置)的優化,傳統反向傳播算法難以直接處理這一混合問題。為此,研究團隊在理論上提出了面向離散 - 連續混合優化問題的端到端求解方法,使 AdaptiveNN 能夠在統一框架下簡單易行地完成整體訓練。具體而言,從期望優化目標出發,對整體損失函數 L(θ) 進行分解,AdaptiveNN 的端到端優化過程可自然地分解為兩部分



      其中第一項為表征學習目標(representation learning),對應于從注視區域中提取任務相關的特征;第二項為自激勵強化學習目標(self-rewarding reinforcement learning),對應于優化注視位置的分布,驅使模型的主動注視行為實現最大化的任務收益。這一理論結果揭示了 AdaptiveNN 的內在學習規律:主動感知的優化本質上是表征學習與強化學習的統一



      圖4 強化學習驅動的端到端主動視覺的理論框架

      實驗驗證:高效視覺感知,類人視覺行為

      • 性能提升顯著:在使用相同主干網絡(如 DeiT-S、ResNet-50)的情況下,AdaptiveNN-DeiT-S 和 AdaptiveNN-ResNet-50 分別以2.86 GFLOPs 與 3.37 GFLOPs的平均計算量,取得與傳統靜態模型相當甚至更優的準確率(81.6% / 79.1%),實現了 5.4× 與 3.6× 的計算節省。
      • 可解釋性增強:AdaptiveNN 的注視軌跡自動聚焦于類別判別性區域,例如動物的頭部、樂器的關鍵結構、咖啡機的旋鈕與噴嘴等。當目標較小或遠離攝像機時,模型會自適應地延長觀察序列,主動調整注視步數以獲得更精確的判斷。這種 “由粗到細、按需注視” 的策略,與人類視覺的逐步注視過程高度一致。



      圖5 ImageNet視覺感知實驗結果

      為了進一步驗證 AdaptiveNN 的泛化與精細感知能力,研究團隊在六個細粒度視覺識別任務(CUB-200、NABirds、Oxford-IIIT Pet、Stanford Dogs、Stanford Cars、FGVC-Aircraft)上進行了系統評估。

      • AdaptiveNN 在保持精度基本不變甚至略有提升的情況下,實現了5.8×–8.2× 的計算量節省,顯著超越傳統靜態視覺模型的性能–能效上限。
      • 通過可視化(Fig. A1b–A1e),可以看到模型自發聚焦于任務判別性區域 —— 如鳥類的喙部、犬類的面部、汽車的燈組與航空器的螺旋槳 —— 而無需任何顯式的定位監督。



      圖6 細粒度視覺識別任務實驗結果

      AdaptiveNN 在空間注視位置任務難度判斷兩個層面,都展現出與人類視覺高度一致的自適應行為。定量結果表明,無論是 “看哪里”、還是 “覺得什么難”,模型的感知策略都與人類極為相似。在 “視覺圖靈測試” 中,人類受試者幾乎無法區分模型與真實人類的凝視軌跡。

      更值得關注的是,這一成果對認知科學的研究具有啟發意義。AdaptiveNN 的結果不僅為理解人類視覺行為的關鍵認知科學問題(例如 “視覺能力的形成究竟源于先天機制還是后天學習”)提供了新的啟發,也展示了其作為一種通用計算模型的潛力。未來,AdaptiveNN 有望用于模擬和檢驗人類的注意分配、感知學習、以及復雜任務中的視覺決策機制,為將來認知科學方面的研究提供了潛在的定量工具。



      圖7 AdaptiveNN與人類視覺感知行為的一致性測試

      從視覺感知到邁向高效具身推理

      在實驗驗證中,研究團隊進一步將 AdaptiveNN 應用于具身智能的基礎模型(視覺 - 語言 - 行為模型,VLA)上結果表明,該框架在復雜操作場景中顯著提升了具身基礎模型的推理與感知效率,在保持任務成功率的同時將計算開銷大幅降低 4.4-5.9 倍。這一成果為解決具身智能系統長期面臨的效率瓶頸提供了新的思路與技術路徑。



      圖8 ApdativeNN應用于VLA具身任務的實驗結果

      清華大學自動化系博士生王語霖、樂洋、樂陽為論文共同第一作者,宋士吉教授與黃高副教授為共同通訊作者。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      076“四川艦”對比法國的“戴高樂號”,扮豬吃老虎是吧!

      076“四川艦”對比法國的“戴高樂號”,扮豬吃老虎是吧!

      Ck的蜜糖
      2026-05-03 20:49:14
      90歲才明白:那些精神矍鑠、活過百歲的老人,都在60歲后,戒掉了這兩個“壞習慣”

      90歲才明白:那些精神矍鑠、活過百歲的老人,都在60歲后,戒掉了這兩個“壞習慣”

      心理觀察局
      2026-05-04 08:51:08
      看了長假全網破防的“8萬人集體自爆丑照”,我才頓悟什么是人生頂級心態!

      看了長假全網破防的“8萬人集體自爆丑照”,我才頓悟什么是人生頂級心態!

      脆皮先生
      2026-05-04 19:42:03
      55歲"紙片人"魯豫,與小19歲男友同居后變樣,如今她令人大跌眼鏡

      55歲"紙片人"魯豫,與小19歲男友同居后變樣,如今她令人大跌眼鏡

      觀察鑒娛
      2026-04-17 09:43:01
      開國大校姚天成戳破抗日神劇濾鏡:同等火力對射,日軍有效殺傷憑啥是蘇軍兩倍國軍百倍?

      開國大校姚天成戳破抗日神劇濾鏡:同等火力對射,日軍有效殺傷憑啥是蘇軍兩倍國軍百倍?

      歷史回憶室
      2026-05-02 20:58:17
      記者:U17亞洲杯小組賽轉播只有單機位,1/4決賽才提供信號

      記者:U17亞洲杯小組賽轉播只有單機位,1/4決賽才提供信號

      狗哥是一名內拉
      2026-05-04 14:33:17
      陪伴就是愛:不是在身邊,是愿意在身邊

      陪伴就是愛:不是在身邊,是愿意在身邊

      疾跑的小蝸牛
      2026-05-01 23:09:50
      終老掘金!4年2.78億,約基奇拒絕逼宮,這才是巨星該有的樣子!

      終老掘金!4年2.78億,約基奇拒絕逼宮,這才是巨星該有的樣子!

      體育大朋說
      2026-05-04 11:15:08
      媒體稱,俄總統普京擔心遭遇無人機暗殺

      媒體稱,俄總統普京擔心遭遇無人機暗殺

      山河路口
      2026-05-04 20:30:38
      體檢報告中,若3個指標都正常,基本可排除很多疾病

      體檢報告中,若3個指標都正常,基本可排除很多疾病

      白話電影院
      2026-04-09 16:11:20
      每體:姆巴佩出游事件勢必引發后續風波,皇馬眾人早對他不滿

      每體:姆巴佩出游事件勢必引發后續風波,皇馬眾人早對他不滿

      懂球帝
      2026-05-04 09:13:24
      WTA1000羅馬站簽表出爐:鄭欽文薩巴同處1/4區,王欣瑜首輪輪空

      WTA1000羅馬站簽表出爐:鄭欽文薩巴同處1/4區,王欣瑜首輪輪空

      全景體育V
      2026-05-04 18:03:10
      能幫林詩棟走出當下困境的,其實也就這三個人

      能幫林詩棟走出當下困境的,其實也就這三個人

      小光侃娛樂
      2026-03-30 20:00:03
      “香港演員幾乎全軍覆沒! 無戲可拍”引發網友熱議

      “香港演員幾乎全軍覆沒! 無戲可拍”引發網友熱議

      許三歲
      2026-03-26 11:35:13
      張雪機車發生故障退賽!車手德比斯回應:很抱歉 本來有機會兩連冠

      張雪機車發生故障退賽!車手德比斯回應:很抱歉 本來有機會兩連冠

      快科技
      2026-05-04 11:31:04
      中國電池驚天突破!徹底碾壓固態電池,再也不怕起火爆炸

      中國電池驚天突破!徹底碾壓固態電池,再也不怕起火爆炸

      音樂時光的娛樂
      2026-05-03 16:25:23
      伊朗軍方稱對美驅逐艦進行了警告射擊

      伊朗軍方稱對美驅逐艦進行了警告射擊

      界面新聞
      2026-05-04 21:18:44
      哲凱賴什:歷史最佳前鋒C羅,最佳鋒線組合MSN,最佳慶自己

      哲凱賴什:歷史最佳前鋒C羅,最佳鋒線組合MSN,最佳慶自己

      懂球帝
      2026-05-04 18:56:23
      燒烤簽喂狗擼串后續:更多惡心事被扒,已道歉認慫,店主含淚停業

      燒烤簽喂狗擼串后續:更多惡心事被扒,已道歉認慫,店主含淚停業

      天天熱點見聞
      2026-05-04 12:02:49
      萬萬沒想到!美伊大戰傷亡懸殊:中東血戰40天,真實傷亡數據曝光

      萬萬沒想到!美伊大戰傷亡懸殊:中東血戰40天,真實傷亡數據曝光

      兵鑒史
      2026-04-28 22:15:15
      2026-05-04 21:52:50
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12905文章數 142639關注度
      往期回顧 全部

      科技要聞

      OpenAI“復活”了QQ寵物,網友直接玩瘋

      頭條要聞

      媒體:霍爾木茲海峽一聲驚雷炸響 戰爭的引信已經點燃

      頭條要聞

      媒體:霍爾木茲海峽一聲驚雷炸響 戰爭的引信已經點燃

      體育要聞

      騎士破猛龍:加雷特·阿倫的活力

      娛樂要聞

      張敬軒還是站上了英皇25周年舞臺

      財經要聞

      魔幻的韓國股市,父母給嬰兒開戶買股票

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      教育
      時尚
      手機
      數碼
      軍事航空

      教育要聞

      2026年上海新招17所高中,1所高中停招

      習慣一身黑的穿搭?其實換一種穿衣思路更高級,養眼又有活力

      手機要聞

      曝三星將推安卓系統 Galaxy Book 筆記本,覆蓋多個檔位

      數碼要聞

      前行者磁軸鍵盤ES68新增“粉櫻劍士”配色,699元

      軍事要聞

      特朗普回絕伊朗新方案

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 一区二区视频午夜福利| 国产成人无码综合亚洲日韩| 国产成人咱精品视频免费网站 | 97久久超碰国产精品旧版| 成人网中文字幕| 国产精品毛片一区视频播| 国产免费无码av在线观看| 大香蕉一区二区三区| 67194成是人免费无码| 日韩a在线| 国产v综合v亚洲欧美大天堂| 国产精品久久人妻无码网站蜜臀 | 亚洲电影在线观看| 日韩少妇内射免费播放| 夜夜欢影院| 亚洲免费婷婷综合| 久久精品国产九一九九九| 欧美一区内射最近更新| 91精品国产三级在线观看| 午夜福利国产精品视频| 日日嗨av一区二区三区四区 | 日韩精品成人无码专区免费| 午夜成人精品福利网站在线观看| 国产96在线 | 亚洲激情偷拍| 国产视频一区二区在线观看| 亚洲av片在线免费观看| 免费vA片| 亚洲一区二区三区高清在线看| 国产丨熟女丨国产熟女??在线| 51精品国产人成在线观看| 国产女人18毛片水真多| 国产欧美性成人精品午夜| 喀什市| 日韩av激情在线| 波多野一区二区无码中文字幕| 国产福利酱国产一区二区| 国产精品小蝌蚪福利| 日韩精品亚洲精品第一页| 欧美精品一区二区三区制服首页 | 久六精品|