<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Nat Mach Intell | 隨機初始化為何讓模型“自信過頭”?

      0
      分享至


      認知神經科學前沿文獻分享


      基本信息

      Title:Brain-inspired warm-up training with random noise for uncertainty calibration

      發表時間:2026-04-09

      發表期刊:Nature Machine Intelligence

      獲取原文:

      1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



      引言

      對很多實際部署中的人工智能系統來說,真正決定能否被信任的,往往不只是“答得對不對”,還包括“它是否知道自己有多確定”。一輛自動駕駛汽車是否該減速,一套醫學影像模型給出的結論是否值得醫生進一步采納,乃至大語言模型生成的回答能否被直接引用,背后都牽涉同一個問題:模型給出的置信度,能不能真實反映它答對的概率。若二者不匹配,系統就可能在最不該自信的時候顯得異常篤定。

      這正是不確定性校準(uncertainty calibration)要解決的核心問題。理想情況下,模型說自己有 80% 把握時,長期統計上就應當接近 80% 正確;但現實中的深度神經網絡經常不是這樣。它們在分布內數據上可能已經表現出“置信度高于正確率”的過度自信,面對分布外(out-of-distribution, OOD)輸入時也常把“沒見過”誤判成“很確定”。過去已有不少方法嘗試修正這一問題,但許多做法集中在預處理或后處理環節,往往依賴額外計算、輔助模型,或把分布內與分布外樣本分開處理。換句話說,這些方法更像是在輸出端補救,而不是追問失準究竟從哪里開始。


      實驗設計與方法邏輯

      文章的主分析對象是一個用于 CIFAR-10 十分類的多層前饋神經網絡,采用 He 初始化、ReLU 和 batch normalization,并系統改變網絡深度與訓練數據規模,以觀察校準誤差如何隨模型復雜度和樣本量變化。核心干預是在真實數據訓練前增加一段“隨機噪聲熱身”:輸入為與圖像同尺寸的高斯噪聲,標簽從均勻分布隨機采樣,輸入與標簽不配對。


      核心發現


      發現一:常規隨機初始化并非中性起點,而是過度自信的重要來源,且在“模型更復雜、數據更少”時更嚴重

      論文先用 Figure 1c 和 Figure 1d 立住了問題本身。Figure 1c 的可靠性圖顯示,理想校準應貼近對角線,但實際網絡的 accuracy 普遍低于 confidence,說明模型在常見訓練設置下存在系統性過度自信。Figure 1d 更關鍵,它把這種偏差放到“網絡深度 × 訓練數據規模”的條件網格中考察,顯示 ECE 會隨著訓練樣本減少、模型復雜度提高而加重。也就是說,失準并不是零散現象,而與現代深度學習常見的“大模型配有限數據”條件密切相關。


      Figure 1. Confidence miscalibration in artificial neural networks

      發現二:隨機噪聲熱身能顯著改善校準,并在不同架構與訓練場景中保持效果

      Figure 2 系統回答了這套方法是否真正有效。Figure 2d 顯示,在熱身階段,網絡損失下降但準確率停留在機會水平;而切換到真實數據后,熱身組的測試損失進一步降得更充分。更直接的證據來自 Figure 2e:加入熱身后,可靠性圖明顯更靠近理想對角線,插圖中的 ECE 也顯著下降。Figure 2f 則說明這種改善并非只在單一設定成立,而是在不同深度、不同數據規模下都能觀察到,且在“小數據、深網絡”這些本來更容易失準的條件下尤其明顯。


      Figure 2. Warm-up training with random noise enables confidence calibration in neural networks

      發現三:熱身之所以有效,是因為它先把初始化階段的高置信度與類別偏置壓回機會水平

      論文最有價值的部分之一,是它沒有停在“方法有效”,而繼續追問“為什么有效”。Figure 3b 在二維 toy model 中可視化輸入空間后發現:未經訓練、只做常規隨機初始化的網絡,并不是均勻中性的,它已經在大片區域上表現出明顯高置信度;而熱身之后,這種分布變得更均勻,更接近機會水平。Figure 3c 和 Figure 3d 進一步表明,熱身不僅降低了整體 confidence bias,也減輕了對特定輸出類別的初始偏向。


      Figure 3. Random noise pre-calibrates neural network uncertainty over input space

      發現四:預校準會重塑后續學習軌跡,并提升對分布外輸入的識別能力

      Figure 4 和 Figure 5 把方法的意義從“初始狀態改變”延伸到了“后續行為改變”。Figure 4a–c 顯示,無論是在相同準確率下比較,還是在相同訓練輪次下比較,熱身組都擁有更好的可靠性圖和更低的 ECE,說明這不是一次性修補,而是改變了學習動力學。Figure 4d–f 更進一步表明,熱身組在訓練過程中能讓 confidence 與 accuracy 持續貼近理想對角線,而未熱身組則長期存在“置信度跑在正確率前面”的偏差。


      Figure 4. Pre-calibration enables learning with matching confidence and accuracy


      Figure 5. OOD detection using calibrated network confidence


      歸納總結和點評

      這篇工作最強的貢獻,是把“不確定性校準”從常見的輸出修正問題,前移為一個初始化與學習動力學問題:作者認為,深度網絡的過度自信并非只在訓練后形成,常規隨機初始化本身就可能讓模型在尚未理解數據前先顯得“太確定”;而一次簡短的隨機噪聲熱身,則能把這種初始置信度預先拉回機會水平,使后續真實任務訓練中的 confidence–accuracy 對齊更穩定,并在分布外樣本識別上帶來收益。論文的優點在于證據鏈完整,從失準現象、方法效果,到 toy model 機制解釋,再到訓練軌跡與 OOD 檢測,形成了較清晰的閉環,也把發育神經科學中的自發活動與機器學習中的模型可靠性建立了有啟發性的聯系。與此同時,它的邊界也應被認真看待:文中雖已擴展到多類視覺架構,并補充展示了語言生成等任務線索,但關于更大規模系統、尤其是復雜現實部署和大語言模型場景的系統驗證,仍有待后續研究補足,因此目前更適合把它理解為一種有機制支撐的訓練起點策略,而非已經對所有 AI 系統普遍成立的最終答案。


      請打分

      這篇剛剛登上 Nature Machine Intelligence 的研究,是否實至名歸?我們邀請您作為“云審稿人”,一同品鑒。精讀全文后,歡迎在匿名投票中打分,并在評論區分享您的深度見解。

      分享人:BQ

      審核:PsyBrain 腦心前沿編輯部

      你好,這里是「PsyBrain 腦心前沿

      專注追蹤全球認知神經科學的最尖端突破

      視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級大刊

      每日速遞「深度解讀」與「前沿快訊

      科研是一場探索未知的長跑,但你無需獨行。歡迎加入PsyBrain 學術社群,和一群懂你的同行,共同丈量腦與心智的無垠前沿。

      點擊卡片進群,歡迎你的到來

      一鍵關注,點亮星標 ? 前沿不走丟!


      一鍵分享,讓更多人了解前沿

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      詐尸了!哈梅內伊死而復生?特朗普大秀軍功,伊朗做出了一個舉動

      詐尸了!哈梅內伊死而復生?特朗普大秀軍功,伊朗做出了一個舉動

      游古史
      2026-04-07 17:52:48
      伊朗媒體:兩枚導彈擊中穿越霍爾木茲海峽的美國軍艦

      伊朗媒體:兩枚導彈擊中穿越霍爾木茲海峽的美國軍艦

      新華社
      2026-05-04 18:51:04
      馬克龍時代將畫上句號,梅朗雄宣布競選法國總統,對華態度已曝光

      馬克龍時代將畫上句號,梅朗雄宣布競選法國總統,對華態度已曝光

      達文西看世界
      2026-05-05 09:47:35
      申花球迷不滿1-4負泰山,另有五大深層原因

      申花球迷不滿1-4負泰山,另有五大深層原因

      小僫搞笑解說
      2026-05-05 21:42:23
      警察絕對不能插手的5件事,真不能管,否則違法!

      警察絕對不能插手的5件事,真不能管,否則違法!

      細說職場
      2026-04-20 15:52:21
      30集都市情感大劇!李小冉、鐘漢良、王驍、王陽領銜,全是熟面孔

      30集都市情感大劇!李小冉、鐘漢良、王驍、王陽領銜,全是熟面孔

      小椰的奶奶
      2026-05-06 00:47:50
      林依晨自曝曾遭情感PUA,被要求退圈做家庭主婦,前男友后因性侵入獄

      林依晨自曝曾遭情感PUA,被要求退圈做家庭主婦,前男友后因性侵入獄

      大風新聞
      2026-05-04 17:55:03
      黑尾醬,徹底消失了?

      黑尾醬,徹底消失了?

      生如稗草
      2026-03-15 08:48:11
      “骨盆前傾成這樣,還不去醫院?”家長曬一年級女兒體態,被群嘲

      “骨盆前傾成這樣,還不去醫院?”家長曬一年級女兒體態,被群嘲

      妍妍教育日記
      2026-04-24 11:15:25
      高薪兼職“跑腿”,一男子被判刑!涉案上百萬!深圳檢方披露

      高薪兼職“跑腿”,一男子被判刑!涉案上百萬!深圳檢方披露

      南方都市報
      2026-05-05 20:43:43
      她是王洪文親信,曾任上海市委書記,1982年被判處17年有期徒刑

      她是王洪文親信,曾任上海市委書記,1982年被判處17年有期徒刑

      鍋鍋愛歷史
      2026-04-29 01:31:20
      炸了!河北新政:小學初中不得組織月考、單元考!家長群沸騰了

      炸了!河北新政:小學初中不得組織月考、單元考!家長群沸騰了

      教師吧
      2026-05-05 10:10:04
      央國企的內幕被網友們扒得干干凈凈!

      央國企的內幕被網友們扒得干干凈凈!

      燈錦年
      2026-04-28 00:05:06
      女子玩瀑布秋千從高空墜落 當地通報:送醫途中死亡 公園已停業整頓 正在依法依規調查處理中

      女子玩瀑布秋千從高空墜落 當地通報:送醫途中死亡 公園已停業整頓 正在依法依規調查處理中

      閃電新聞
      2026-05-05 22:14:25
      把最佳球員獎投給B費,記者:這是我自1999年最容易選的一次

      把最佳球員獎投給B費,記者:這是我自1999年最容易選的一次

      懂球帝
      2026-05-06 01:20:08
      “只顧自己紋眉,不管女兒死活?”14歲女孩生日照,臉上全是槽點

      “只顧自己紋眉,不管女兒死活?”14歲女孩生日照,臉上全是槽點

      澤澤先生
      2026-04-18 22:17:16
      斯諾克世錦賽中國“00后”選手吳宜澤奪冠,多家上市公司受益,金利來提前押寶成功

      斯諾克世錦賽中國“00后”選手吳宜澤奪冠,多家上市公司受益,金利來提前押寶成功

      紅星資本局
      2026-05-05 19:04:42
      不少博主拿孩子測試享界副駕駛折疊,網友怒噴:既沒常識也沒底線

      不少博主拿孩子測試享界副駕駛折疊,網友怒噴:既沒常識也沒底線

      映射生活的身影
      2026-05-05 20:09:21
      為什么說陽痿、跑步、心梗,成了“斬殺”中年男性的“三件套”?

      為什么說陽痿、跑步、心梗,成了“斬殺”中年男性的“三件套”?

      醫藥養生保健報社
      2026-04-28 17:59:19
      老公年終獎給婆婆,我10萬給娘家,年三十只有2盤花生,公公怒掀桌

      老公年終獎給婆婆,我10萬給娘家,年三十只有2盤花生,公公怒掀桌

      麥子情感故事
      2026-05-05 21:11:15
      2026-05-06 01:36:49
      PsyBrain腦心前沿
      PsyBrain腦心前沿
      追蹤腦科學新動態,聚焦認知與神經新研究
      380文章數 18關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內娛真情誼!楊紫為謝娜演唱會送花籃

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      藝術
      數碼
      家居
      公開課
      軍事航空

      藝術要聞

      AI應用“豆包”要收費,第一批“韭菜”是誰?

      數碼要聞

      亞馬遜押注“諾獎材料”除濕技術 可大幅削減建筑能耗

      家居要聞

      靈動實用 生活藝術場

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普威脅伊朗不要向美國船開火

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 黄色好看一区二区三区| 亚洲 制服 丝袜 无码| 国产制服丝袜在线视频观看| 日本特黄特黄刺激大片| 国产对白刺激在线观看| 亚洲 欧美 变态 另类 综合| 亚洲高清国产拍精品青青草原| 久久久久久成人毛片免费看| 多p在线观看| 成在线人免费| 日本亚洲高清乱码中文在线观看| 一区二区三区乱码在线 | 中文| 久久久亚洲欧洲日产国码农村| 国产日韩av一区| 亚州性无码不卡免费视频| 亚洲一区乱码精品中文字幕| 亚洲人成网站18禁止大| 国精品人妻无码一区二区三区喝尿| 91精品网| caoporm超免费公开视频| 亚洲人成色7777在线观看| 护士张开腿被奷日出白浆| 亚洲电影a| 男人天堂手机在线| 亚洲日产无码中文字幕| 性色av无码无在线观看| 99精品国产一区二区| 亚洲综合小说另类图片五月天| 国产真实偷乱视频| 91茄子| 精品国产AV二区| 国产人成亚洲第一网站在线播放| 丝袜人妻一区二区三区网站| 国产亚洲精品AA片在线爽| 亚洲中文 字幕 国产 综合| 国模在线视频| 生产安全高潮呻吟久久av| 国产成人精品午夜2022| 万年县| 精品不卡久久久久久无码人妻| 午夜中文在线|