網易首頁 > 網易號 > 正文申請入駐

一直學習效果更好？最新研究實錘：學習間隔拉長10倍，速度反而快10倍！

2026-04-08 12:20:55　來源: 丘腦大叔

北京舉報

分享至

關注視頻號：丘腦大叔

早上好，我是腦叔，一個愛聊腦的家伙。

在這個考試內卷的時代，我們似乎陷入了一種"勤奮迷信"：單詞要一口氣背完，真題要通宵刷透，連健身都要"每天打卡不間斷"。從小到大，"勤能補拙"、"熟能生巧"的信條深深刻在骨子里——重復次數越多，掌握得越牢，對吧？

但假如我告訴你，把兩次學習之間的間隔拉長10倍，只用十分之一的"刷題量"，就能達到同樣的學習效果，而且總用時一模一樣，你會不會覺得這是天方夜譚？更玄乎的是，這背后控制一切的，居然不是意志力，而是大腦里一套自動調節的"后臺算法"。

加州大學舊金山分校（UCSF）Namboodiri 團隊最近在《Nature Neuroscience》發表的研究，就用一群小鼠的"課表實驗"，探索了這個反常識的結論。他們發現，無論是行為學習還是大腦深處的多巴胺信號，學習速率都與獎勵（或懲罰）之間的間隔時長嚴格成正比。說白了：歇一歇，單次學習的效率越高，總量算下來居然絲毫不差。

給小鼠開"間隔課表"

為了測試"學習密度"到底怎么影響效率，研究團隊給小鼠設計了一套 head-fixed（頭部固定）的" Pavlovian 條件反射課程"——聽到聲音提示（CS）后，等待1秒就能喝到一口蔗糖水。這就像給學生上課：鈴聲=開始答題，答完馬上發糖。

關鍵變量在于"課間休息"（inter-trial interval, ITI）的長度。研究者設置了兩組：

密集組（60秒組）：每天上50節課，課間休息平均60秒，像極了中國高中生的課間；

長間隔組（600秒組）：每天只上6節課，但課間休息拉長到600秒（10分鐘），總課時和密集班一樣都是約1小時。

兩組小鼠聽到的鈴聲、喝到的糖水、甚至總的學習時間預算，全都一模一樣。唯一的區別就是：密集班是"連軸轉"，長間隔組是"上一課，歇很久"。

圖1：試驗間隔拉長10倍使學習所需試驗次數減少10倍，但總學習時間保持不變

反直覺的發現：10倍間隔=10倍效率

按照常識，密集班每天多練44次，應該學得更快、更穩。然而數據一出來，研究團隊自己都驚了。

長間隔組的小鼠僅用8.8次試驗（平均）就學會了對鈴聲產生預期舔水行為，而密集組需要94次試驗。整整10倍的差距！如果把課間休息從60秒增加到300秒（5倍），學習所需的試驗次數也精準地下降為原來的五分之一（16.7次 vs 176次）。

更不可思議的是，把兩組的學習曲線按"總學習時間"（而非試驗次數）對齊時，它們幾乎完全重合。這意味著：長間隔組刪掉的那些"多余練習"，對最終掌握知識毫無貢獻。總用時約5800秒（約1.6小時），兩組小鼠都達到了同樣的熟練度。

論文通訊作者 Vijay Mohan K Namboodiri 指出："這徹底挑戰了'練習造就完美'的直覺。在簡單的聯想學習中，關鍵變量不是練習次數，而是每次練習之間的時間尺度。"

圖2：多巴胺能學習同樣遵循間隔比例縮放規律，且先于行為出現

多巴胺的"點贊"也遵循同一套算法

行為數據已經夠反常識了，大腦內部的信號更讓人開腦洞。研究團隊用光纖光度法（fiber photometry）實時記錄了伏隔核（nucleus accumbens core）的多巴胺釋放——這是大腦的"獎勵預測誤差"（reward prediction error）信號，相當于給學習過程"點贊"的反饋機制。

結果發現，多巴胺能學習（dopaminergic learning）也嚴格遵循"比例縮放"規律：長間隔組的多巴胺信號僅需3.6次試驗就能建立起對提示音的響應，而密集組需要36次試驗。同樣是10倍差距，而且多巴胺信號總是比行為反應早出現約5-60次試驗（取決于間隔長度），像是在后臺提前完成了學習。

更有趣的是，在懲罰學習（聲音-電擊配對）中，把間隔從45秒拉長到135秒（3倍），習得凍結反應（freezing）所需的試驗次數也精準地縮減為三分之一。這說明這套"時間縮放算法"通用于獎賞和厭惡學習，是大腦的基礎配置。

圖3：學習速率與獎勵間隔（IRI）呈嚴格的反比關系，總學習時間恒定于約5800秒

效率的背后：間隔才是關鍵

為了確認到底是"刺激間隔"（ICI）還是"獎勵間隔"（IRI）在起作用，研究者他們給密集組（60秒間隔）改成了50%的獎勵概率——也就是說，有一半的鈴聲后面不給水，但提示音照樣每隔60秒響一次。這相當于把"真實獎勵間隔"（IRI）拉長到了約120秒，而"提示音間隔"（ICI）保持60秒不變。

結果如何？小鼠僅用45次有獎勵的試驗就學會了，幾乎是原來94次的一半，完美匹配"獎勵間隔翻倍，學習速率翻倍"的預測，而非"提示音間隔不變，學習速率不變"。

甚至在極端的10%獎勵概率下（相當于把獎勵間隔拉長10倍），多巴胺學習信號依然在用約5次獎勵就建立起來，與長間隔班的效率相當。這證明：真正控制學習速度的，是兩次"實際獲得獎勵"之間的時間空檔，而非你重復提示的次數。

圖4：極端間隔（3,600秒，每天2次試驗）打破嚴格比例縮放但仍保持高效學習

大腦后臺的"因果分析器"

為什么間隔越長，單次學習效率越高？傳統的時序差分強化學習（TDRL）模型完全無法解釋這個現象——它預測學習速率應該與試驗次數掛鉤，而非時間間隔。

研究團隊提出的 ANCCR（Adjusted Net Contingency of Causal Relations）模型給出了一個貝葉斯解釋：大腦并非在每次試驗時被動接收信息，而是在每次獲得獎勵時，回溯性地分析"剛才那個提示是否經常出現在獎勵之前"。間隔越長，大腦積累的"歷史數據窗口"就越大，每次更新關聯強度時就能更準確地計算因果概率。

就像偵探破案：如果案發后馬上問話（短間隔），每次證詞都很新鮮但樣本少；如果間隔很久再問（長間隔），雖然問的次數少，但每次都能綜合更多背景線索，反而更快鎖定真兇。ANCCR 模型成功預測了這種比例縮放關系，而傳統的 TDRL 和 SOP 模型在對比中全軍覆沒。

圖5：只有回顧性因果學習模型（ANCCR）能解釋學習速率的比例縮放現象

別熬夜了，去"間隔休息"一下

所以，這項研究到底給我們這些備考黨、考證族什么啟示？

首先，通宵刷50道題的效果，可能遠不如分5天、每天專注做6道題，且每道題之間留出足夠長的"放空時間"。

其次，這解釋了為什么"睡一覺起來會做題"（夢里開竅）——REM睡眠天然提供了極長的信息處理間隔，讓大腦的后臺算法（類似 ANCCR 的機制）能充分整理白天的線索。刻意在睡前看一道難題，然后放空大腦，可能比通宵鉆研更有效。

當然，這項研究也有局限：樣本量相對較小（每組6-19只小鼠），且主要測試的是簡單聯想學習，復雜技能（如樂器、運動）是否完全適用還需驗證。但無論如何，它給我們提供了一個視角：有時候，慢才是快，少即是多。

參考文獻：

https://www.nature.com/articles/s41593-026-02206-2

Burke, D.A., Taylor, A., Jeong, H. et al. Duration between rewards controls the rate of behavioral and dopaminergic learning. Nat Neurosci (2026). https://doi.org/10.1038/s41593-026-02206-2

聲明：本文版權屬于原作者，僅用于學術交流！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.