網易首頁 > 網易號 > 正文申請入駐

大腦的學習算法并非反向傳播：一種可能超越反向傳播的腦啟發學習框架

2026-05-16 16:20:58　來源: 人工智能學家

北京舉報

分享至

反向傳播是現代深度學習的核心算法，但它在生物腦中如何實現仍存在根本困難：它需要嚴格分離的前向與反向階段、全局協調、精確的誤差信號傳輸以及近似對稱的權重結構。預測編碼提供了一條不同路線：大腦不是被動接收世界，而是持續預測感官輸入，并用預測誤差來更新內部模型。若把學習理解為一種能量或自由能最小化過程，神經活動與突觸權重都可以通過局部誤差信號連續調整。

問題的起點：大腦如何學習？

人工智能的成功在很大程度上建立在反向傳播和梯度下降之上。只要一個神經網絡的輸入、權重、激活函數和損失函數可以寫成一個可微分的數學函數，計算機就能利用鏈式法則精確計算每個參數對最終誤差的貢獻，并沿著誤差下降最快的方向更新權重。這一機制極其強大，幾乎支撐了現代機器學習從圖像識別、語音處理到大型語言模型的主要進展。

然而，生物大腦并不像數字計算機那樣工作。人腦沒有一個中央控制器去協調全腦神經元先做一次前向傳播，再凍結活動，再逐層反向傳播誤差，最后同步更新所有突觸。神經組織中的信號傳遞相對緩慢，神經元和突觸又高度局部化、異步化、并行化。大腦在感知、行動和學習時并不會“按暫停鍵”。

因此，核心問題不是反向傳播是否有用，而是：如果大腦不太可能嚴格執行反向傳播，它是否使用了另一種能夠解決信用分配問題、同時又符合神經生物學約束的學習機制？預測編碼正是在這個問題上變得重要。它既是一種關于大腦感知和學習的理論，也是一種可能啟發新型人工智能架構的計算框架。

信用分配：所有學習系統都必須解決的根本難題

所謂信用分配問題，是指當一個復雜系統產生了錯誤輸出時，我們如何判斷系統內部哪些參數應該負責、應該如何改變、改變多少。對于一個多層神經網絡，最終錯誤可能來自最上層的分類器，也可能來自低層特征提取不佳，還可能來自中間層表示結構不合適。學習的本質，就是把整體表現的成敗分解為局部參數的調整方向。

在工程神經網絡中，反向傳播給出了一個優雅答案：把整個網絡看成一個復合函數，用鏈式法則從輸出誤差向輸入方向逐層求導。這樣，每個權重都能得到一個明確梯度，告訴它下一步應該增大還是減小。這個方法在硅基計算機上非常高效，因為計算圖、內存、同步控制和矩陣運算都可以精確管理。

但在大腦中，這種形式的全局精確求導面臨兩類最尖銳的困難。

第一是連續處理問題：大腦無法把感知和學習分成互不干擾的階段。

第二是局部自治問題：真實突觸只能訪問局部可獲得的信息，不可能知道整個網絡的全局損失函數和遠端神經元的精確導數。

預測編碼的吸引力，正是因為它試圖用局部誤差、連續動力學和近似 Hebbian 可塑性來完成類似的信用分配。

反向傳播為什么難以直接映射到大腦？

標準反向傳播通常包含嚴格的階段分離。首先輸入信號自下而上通過網絡，得到輸出預測；隨后輸出與目標值比較，產生誤差；接著誤差自上而下逐層反傳；最后權重根據梯度同步更新。這個過程對機器來說自然，對神經組織卻并不自然。

如果大腦嚴格執行這種機制，它就需要在學習時臨時凍結前向活動，等待反向誤差信號傳回，再逐層更新突觸。由于生物神經信號傳遞速度有限，這將導致感知和行動出現頻繁的短暫中斷。現實中的大腦并非如此：我們在看、聽、走路、說話和學習時，神經系統始終處在連續流動中。感知、預測、誤差修正和突觸可塑性同時發生。

另一個困難是全局協調。反向傳播要求不同層級以精確次序解凍、傳遞和更新，還要求反饋通路攜帶與前饋權重相匹配的誤差信息。這就是所謂“權重傳輸問題”。生物腦當然存在節律、注意系統和多巴胺等神經遞質，但這些機制通常在較粗的時間和空間尺度上調節神經活動，很難滿足反向傳播所要求的逐細胞、逐突觸精度。

反向傳播與預測編碼的核心差異

維度

反向傳播

預測編碼

信息流

前向計算與反向誤差傳播通常分階段進行

預測自上而下傳遞，誤差自下而上傳遞，可連續并行發生

學習信號

依賴全局損失函數的梯度

依賴局部預測誤差

生物合理性

需要凍結活動、全局協調和近似權重對稱

可由局部誤差神經元和局部突觸可塑性近似實現

計算形式

顯式自動微分與鏈式法則

能量/自由能最小化下的活動松弛與權重更新

AI 啟發

高效訓練深度網絡的主流方法

可能支持并行、局部、連續、類腦和神經形態學習

預測編碼的基本思想

預測編碼的核心思想很簡單：大腦并不是一臺被動接收刺激的機器，而是一個主動預測系統。它不斷構造關于世界的內部模型，用高層表示去預測低層感官活動；當預測與實際輸入不一致時，差異被編碼為預測誤差，進而驅動內部模型更新。

在視覺系統中，低層可能對應邊緣、紋理、顏色和局部運動等較原始特征；高層則表示物體、場景、類別和行為意義。高層向低層發送“我認為你應該看到什么”的預測，低層向高層返回“你的預測錯在哪里”的誤差信號。這樣，大腦不必傳遞所有冗余信息，只需要重點處理沒有被模型解釋的部分。

這一思想不僅有計算效率上的意義，也有生存意義。對于動物來說，預測意味著提前準備：預測捕食者、預測食物、預測身體狀態、預測他人行為。更好的預測可以減少不確定性，使行動更快速、更節省能量，也更符合環境約束。

能量形式：把學習看成預測誤差的最小化

為了把預測編碼變成一個可計算的學習算法，可以把網絡狀態寫成一個能量函數。這個能量并不一定是物理能量，而是一個衡量系統整體預測誤差大小的標量。最常見的直覺形式是：

E = 1/2 Σ_l ||ε_l||2，其中 ε_l = x_l ? f(W_{l+1} x_{l+1})

這里，x_l 表示第 l 層神經活動，W_{l+1} 表示從更高層到當前層的預測權重，f 是非線性函數，ε_l 是當前層實際活動與高層預測之間的誤差。系統的目標就是讓所有層級的誤差平方和盡可能小。

這個框架有一個重要直覺：網絡中的神經活動并不是一次性前向算完，而是在能量地形中逐漸“松弛”到一個較低能量狀態。就像一個彈簧系統會自動尋找張力較小的位置，預測編碼網絡也會通過調節神經活動，讓實際活動、上層預測和下層誤差之間達到相對平衡。

活動更新：每個神經元在兩種力量之間尋找平衡

在預測編碼網絡中，一個表征神經元的活動更新受到兩類局部信號影響。

第一類來自它自己的預測誤差：如果它的實際活動高于上層對它的預測，它會被拉低；如果低于預測，它會被拉高。

第二類來自它所預測的下層神經元：如果下層仍有很大誤差，它就需要調整自身活動，以便更好地解釋下層輸入。

因此，每個神經元并不是聽從一個全局損失函數，而是在局部層級中協調兩件事：一方面讓自己符合上層模型，另一方面讓自己更好地預測下層活動。這個局部折中過程構成了預測編碼的推斷過程。

從神經生物學角度看，這種形式很有吸引力。它不要求所有神經元同步切換模式，也不要求一個中央控制器逐層調度。神經元只需接收來自相鄰層的預測與誤差信息，就能連續更新自身狀態。

誤差神經元：預測編碼為什么需要兩類神經群體

預測編碼最重要的結構假設之一，是神經系統可能區分兩類功能性群體：

一類編碼表征或預測，

另一類編碼預測誤差。

表征神經元負責維持對當前世界狀態的解釋；誤差神經元負責比較實際活動與預測活動之間的差異。

在一個層級中，誤差神經元可以被看成比較器：它接收來自同層表征神經元的興奮性輸入，同時接收來自高層預測的抑制性輸入。如果兩者匹配，誤差信號很小；如果不匹配，誤差信號就變強。隨后，這些誤差信號向上傳遞，通知高層模型需要修正。

這也解釋了預測編碼為什么可以具體落實為神經連接結構：自上而下的連接傳遞預測，自下而上的連接傳遞預測誤差；同層局部回路則完成實際活動與預測活動之間的比較。

權重更新：局部Hebbian可塑性如何承擔學習

如果神經活動的更新對應“當前輸入下如何解釋世界”，那么權重更新對應“長期經驗中如何改變模型”。在預測編碼中，連接權重也沿著降低能量的方向調整。簡化地說，某條突觸的改變可以由突觸前活動與突觸后誤差信號的乘積決定：

ΔW ∝ 預測誤差 × 突觸前活動

這與神經科學中的 Hebbian 可塑性思想相呼應：共同活動的神經元更容易加強連接。不過預測編碼中的規則更精細，因為它不是簡單地讓所有共同放電的神經元連接增強，而是讓連接調整服務于減少預測誤差。

這種學習方式具有重要生物合理性。突觸只需要知道局部可獲得的信息：突觸前神經元活動、突觸后誤差信號以及局部調制狀態。它不需要讀取全局損失，也不需要等待遠端層級傳回精確導數。

預測編碼與反向傳播的關系

預測編碼常被稱為反向傳播的生物合理替代方案，但更準確地說，它在某些條件下可以近似甚至重現反向傳播的梯度計算。Whittington 與 Bogacz 的工作顯示，預測編碼網絡可以在局部 Hebbian 突觸可塑性的基礎上近似誤差反向傳播。后續研究進一步表明，預測編碼可以沿更一般的計算圖近似反向傳播梯度。

這說明二者并不是完全互不相干的陣營。反向傳播提供了工程上非常高效的全局優化工具；預測編碼則提供了一種通過神經活動松弛、局部誤差傳播和局部可塑性實現相似學習目標的動力學機制。

換言之，預測編碼的價值在于提供一種可能更適合生物組織、神經形態硬件和分布式智能系統的學習范式。它把學習從一次性矩陣求導，重新解釋為一個連續發生的局部自組織過程。

為什么它可能啟發下一代AI

從人工智能角度看，預測編碼至少具有四個潛在吸引力。

第一，它天然支持并行計算。每個層級和局部回路都可以根據相鄰誤差持續更新，不必等待一個全局反向階段完成。

第二，它適合神經形態硬件，因為局部更新和事件驅動處理更接近神經芯片與脈沖神經網絡的實現方式。

第三，它可能更適合持續學習。標準深度網絡容易出現災難性遺忘：新任務的全局誤差更新可能覆蓋舊知識結構。預測編碼的局部誤差更新有潛力更好地保留已有模型結構，雖然這一優勢在不同任務、架構和訓練條件下仍需具體驗證。

第四，預測編碼與生成模型、變分推斷和主動推斷之間存在深層聯系。它不只是學習輸入到輸出的映射，而是學習一個可以解釋輸入、生成預測并處理不確定性的內部模型。這一點使其與未來面向世界模型、機器人、具身智能和自主智能體的 AI 架構具有天然關聯。

必須保持清醒：預測編碼不是萬能答案

盡管預測編碼極具吸引力，但它不是已經取代反向傳播的萬能算法。首先，工程深度學習中反向傳播仍然效率極高、工具鏈成熟、可擴展性強。預測編碼網絡往往需要迭代松弛到平衡狀態，這在某些任務中可能帶來額外計算開銷。

其次，生物合理性并不等于生物真實性。預測編碼可以解釋許多神經現象，但真實大腦遠比標準層級預測編碼模型復雜：皮層并非嚴格層狀前饋-反饋結構，神經調質、振蕩、膠質細胞、樹突計算、身體反饋和主動行為都參與學習。

第三，預測編碼是否在所有腦區、所有任務、所有學習階段都占據核心地位，仍是開放問題。它更像一種強有力的理論框架和算法族，而不是一條已經被完全證實的統一定律。

結論：預測編碼的真正意義

預測編碼的重要性在于，它把學習重新放回了生物系統的真實約束中。它不再假設大腦是一臺執行全局反向傳播的數字計算機，而是假設大腦是一個持續預測、持續比較、持續修正的動力學系統。每個神經元和突觸都在局部誤差信號的驅動下參與整體模型的更新。

預測編碼提出了一個深刻方向：未來的 AI 如果要更加穩健、節能、可解釋、可持續學習，并且更接近生物智能，可能需要從“全局誤差反傳的工程機器”走向“局部預測誤差驅動的動態系統”。這正是預測編碼作為腦啟發學習框架的理論魅力和技術價值。

參考文獻Rao, R. P. N., & Ballard, D. H. (1999). Predictive coding in the visual cortex: a functional interpretation of some extra-classical receptive-field effects. Nature Neuroscience, 2, 79–87.Bogacz, R. (2017). A tutorial on the free-energy framework for modelling perception and learning. Journal of Mathematical Psychology, 76, 198–211.Friston, K. (2018). Does predictive coding have a future? Nature Neuroscience, 21, 1019–1021.Huang, Y., & Rao, R. P. N. (2011). Predictive coding. Wiley Interdisciplinary Reviews: Cognitive Science, 2, 580–593.Keller, G. B., & Mrsic-Flogel, T. D. (2018). Predictive processing: a canonical cortical computation. Neuron, 100, 424–435.Lillicrap, T. P., Santoro, A., Marris, L., Akerman, C. J., & Hinton, G. (2020). Backpropagation and the brain. Nature Reviews Neuroscience, 21, 335–346.Whittington, J. C. R., & Bogacz, R. (2017). An approximation of the error backpropagation algorithm in a predictive coding network with local Hebbian synaptic plasticity. Neural Computation, 29, 1229–1262.Millidge, B., Tschantz, A., & Buckley, C. L. (2022). Predictive coding approximates backprop along arbitrary computation graphs. Neural Computation, 34, 1329–1368.Millidge, B., Seth, A., & Buckley, C. L. (2021). Predictive Coding: a Theoretical and Experimental Review. arXiv:2107.12979.Song, Y., Millidge, B., Salvatori, T., Lukasiewicz, T., Xu, Z., & Bogacz, R. (2024). Inferring neural activity before plasticity as a foundation for learning beyond backpropagation. Nature Neuroscience, 27, 348–358.Salvatori, T., Mali, A., Buckley, C. L., Lukasiewicz, T., Rao, R. P. N., Friston, K., & Ororbia, A. (2025). A Survey on Brain-Inspired Deep Learning via Predictive Coding. arXiv:2308.07870.

掃描或長按識別二維碼獲取超強醫療模型MedGPT免費使用額度

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.