![]()
關注視頻號:丘腦大叔
早上好,我是腦叔,一個愛聊腦的家伙。
在這個考試內卷的時代,我們似乎陷入了一種"勤奮迷信":單詞要一口氣背完,真題要通宵刷透,連健身都要"每天打卡不間斷"。從小到大,"勤能補拙"、"熟能生巧"的信條深深刻在骨子里——重復次數越多,掌握得越牢,對吧?
但假如我告訴你,把兩次學習之間的間隔拉長10倍,只用十分之一的"刷題量",就能達到同樣的學習效果,而且總用時一模一樣,你會不會覺得這是天方夜譚?更玄乎的是,這背后控制一切的,居然不是意志力,而是大腦里一套自動調節的"后臺算法"。
加州大學舊金山分校(UCSF)Namboodiri 團隊最近在《Nature Neuroscience》發表的研究,就用一群小鼠的"課表實驗",探索了這個反常識的結論。他們發現,無論是行為學習還是大腦深處的多巴胺信號,學習速率都與獎勵(或懲罰)之間的間隔時長嚴格成正比。說白了:歇一歇,單次學習的效率越高,總量算下來居然絲毫不差。
給小鼠開"間隔課表"
為了測試"學習密度"到底怎么影響效率,研究團隊給小鼠設計了一套 head-fixed(頭部固定)的" Pavlovian 條件反射課程"——聽到聲音提示(CS)后,等待1秒就能喝到一口蔗糖水。這就像給學生上課:鈴聲=開始答題,答完馬上發糖。
關鍵變量在于"課間休息"(inter-trial interval, ITI)的長度。研究者設置了兩組:
密集組(60秒組):每天上50節課,課間休息平均60秒,像極了中國高中生的課間;
長間隔組(600秒組):每天只上6節課,但課間休息拉長到600秒(10分鐘),總課時和密集班一樣都是約1小時。
兩組小鼠聽到的鈴聲、喝到的糖水、甚至總的學習時間預算,全都一模一樣。唯一的區別就是:密集班是"連軸轉",長間隔組是"上一課,歇很久"。
![]()
圖1:試驗間隔拉長10倍使學習所需試驗次數減少10倍,但總學習時間保持不變
反直覺的發現:10倍間隔=10倍效率
按照常識,密集班每天多練44次,應該學得更快、更穩。然而數據一出來,研究團隊自己都驚了。
長間隔組的小鼠僅用8.8次試驗(平均)就學會了對鈴聲產生預期舔水行為,而密集組需要94次試驗。整整10倍的差距!如果把課間休息從60秒增加到300秒(5倍),學習所需的試驗次數也精準地下降為原來的五分之一(16.7次 vs 176次)。
更不可思議的是,把兩組的學習曲線按"總學習時間"(而非試驗次數)對齊時,它們幾乎完全重合。這意味著:長間隔組刪掉的那些"多余練習",對最終掌握知識毫無貢獻。總用時約5800秒(約1.6小時),兩組小鼠都達到了同樣的熟練度。
論文通訊作者 Vijay Mohan K Namboodiri 指出:"這徹底挑戰了'練習造就完美'的直覺。在簡單的聯想學習中,關鍵變量不是練習次數,而是每次練習之間的時間尺度。"
![]()
圖2:多巴胺能學習同樣遵循間隔比例縮放規律,且先于行為出現
多巴胺的"點贊"也遵循同一套算法
行為數據已經夠反常識了,大腦內部的信號更讓人開腦洞。研究團隊用光纖光度法(fiber photometry)實時記錄了伏隔核(nucleus accumbens core)的多巴胺釋放——這是大腦的"獎勵預測誤差"(reward prediction error)信號,相當于給學習過程"點贊"的反饋機制。
結果發現,多巴胺能學習(dopaminergic learning)也嚴格遵循"比例縮放"規律:長間隔組的多巴胺信號僅需3.6次試驗就能建立起對提示音的響應,而密集組需要36次試驗。同樣是10倍差距,而且多巴胺信號總是比行為反應早出現約5-60次試驗(取決于間隔長度),像是在后臺提前完成了學習。
更有趣的是,在懲罰學習(聲音-電擊配對)中,把間隔從45秒拉長到135秒(3倍),習得凍結反應(freezing)所需的試驗次數也精準地縮減為三分之一。這說明這套"時間縮放算法"通用于獎賞和厭惡學習,是大腦的基礎配置。
![]()
圖3:學習速率與獎勵間隔(IRI)呈嚴格的反比關系,總學習時間恒定于約5800秒
效率的背后:間隔才是關鍵
為了確認到底是"刺激間隔"(ICI)還是"獎勵間隔"(IRI)在起作用,研究者他們給密集組(60秒間隔)改成了50%的獎勵概率——也就是說,有一半的鈴聲后面不給水,但提示音照樣每隔60秒響一次。這相當于把"真實獎勵間隔"(IRI)拉長到了約120秒,而"提示音間隔"(ICI)保持60秒不變。
結果如何?小鼠僅用45次有獎勵的試驗就學會了,幾乎是原來94次的一半,完美匹配"獎勵間隔翻倍,學習速率翻倍"的預測,而非"提示音間隔不變,學習速率不變"。
甚至在極端的10%獎勵概率下(相當于把獎勵間隔拉長10倍),多巴胺學習信號依然在用約5次獎勵就建立起來,與長間隔班的效率相當。這證明:真正控制學習速度的,是兩次"實際獲得獎勵"之間的時間空檔,而非你重復提示的次數。
![]()
圖4:極端間隔(3,600秒,每天2次試驗)打破嚴格比例縮放但仍保持高效學習
大腦后臺的"因果分析器"
為什么間隔越長,單次學習效率越高?傳統的時序差分強化學習(TDRL)模型完全無法解釋這個現象——它預測學習速率應該與試驗次數掛鉤,而非時間間隔。
研究團隊提出的 ANCCR(Adjusted Net Contingency of Causal Relations)模型給出了一個貝葉斯解釋:大腦并非在每次試驗時被動接收信息,而是在每次獲得獎勵時,回溯性地分析"剛才那個提示是否經常出現在獎勵之前"。間隔越長,大腦積累的"歷史數據窗口"就越大,每次更新關聯強度時就能更準確地計算因果概率。
就像偵探破案:如果案發后馬上問話(短間隔),每次證詞都很新鮮但樣本少;如果間隔很久再問(長間隔),雖然問的次數少,但每次都能綜合更多背景線索,反而更快鎖定真兇。ANCCR 模型成功預測了這種比例縮放關系,而傳統的 TDRL 和 SOP 模型在對比中全軍覆沒。
![]()
圖5:只有回顧性因果學習模型(ANCCR)能解釋學習速率的比例縮放現象
別熬夜了,去"間隔休息"一下
所以,這項研究到底給我們這些備考黨、考證族什么啟示?
首先,通宵刷50道題的效果,可能遠不如分5天、每天專注做6道題,且每道題之間留出足夠長的"放空時間"。
其次,這解釋了為什么"睡一覺起來會做題"(夢里開竅)——REM睡眠天然提供了極長的信息處理間隔,讓大腦的后臺算法(類似 ANCCR 的機制)能充分整理白天的線索。刻意在睡前看一道難題,然后放空大腦,可能比通宵鉆研更有效。
當然,這項研究也有局限:樣本量相對較小(每組6-19只小鼠),且主要測試的是簡單聯想學習,復雜技能(如樂器、運動)是否完全適用還需驗證。但無論如何,它給我們提供了一個視角:有時候,慢才是快,少即是多。
參考文獻:
https://www.nature.com/articles/s41593-026-02206-2
Burke, D.A., Taylor, A., Jeong, H. et al. Duration between rewards controls the rate of behavioral and dopaminergic learning. Nat Neurosci (2026). https://doi.org/10.1038/s41593-026-02206-2
聲明:本文版權屬于原作者,僅用于學術交流!
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.