網易首頁 > 網易號 > 正文申請入駐

浙大最新Nat Neurosci：人腦像GPT一樣處理語言嗎？揭示人類語言預測的“精度與效率權衡”

2026-04-27 12:10:37　來源: PsyBrain腦心前沿

北京舉報

分享至

認知神經科學前沿文獻分享

基本信息

Title:Constituent-constrained word prediction during language comprehension

發表時間:2026-04-21

發表期刊:Nature Neuroscience

影響因子:20.0

獲取原文:

1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本

研究背景

當我們聽別人說話時，大腦是否像ChatGPT一樣，在瘋狂且精確地預測對方接下來要說的每一個詞？近年來，隨著大語言模型（LLMs）的成功，“預測下一個詞”被許多研究者視為人類語言系統的核心計算目標。主流觀點認為，大腦會盡可能精確地預測每一個即將到來的詞，無論這個詞處于句子的什么位置。

然而，這種“逐詞精確預測”需要極高的計算成本和龐大的工作記憶容量。最先進的LLMs可以同時緩沖成千上萬個詞，但人類的工作記憶卻非常有限。因此，大腦在處理語言時，真的會不計成本地追求預測精度嗎？

為了回答這一問題，浙江大學丁鼐、鄒家杰團隊聯合紐約大學David Poeppel近日在 Nature Neuroscience 發表了最新研究。他們提出了一種“成分受限預測假說”（constituent-constrained prediction hypothesis）：為了在預測精度和認知效率之間取得平衡，大腦會將詞匯壓縮成更大層級的“句法成分”（如短語或句子）。這種壓縮策略雖然提高了效率，但代價是：在跨越這些成分邊界時，大腦對下一個詞的預測精度會顯著下降。

研究核心總結

研究團隊設計了三項針對中文母語者的腦磁圖（MEG）實驗，并結合行為學測試，對比了人類大腦與GPT-2模型在詞匯預測上的差異。

一、成分邊界顯著削弱了大腦對下一個詞的預測精度

如果大腦像GPT-2一樣追求極致的預測，那么無論詞匯處于短語內部還是短語開頭，人類的神經預測反應應該與模型的預測概率（Surprisal，驚奇值）保持一致。然而，實驗1的結果否定了這一假設。

研究者讓被試聆聽由“名詞短語+動詞短語”組成的句子（如“小漁船/緩慢前進”）。MEG數據顯示，在短語內部，大腦的神經反應與GPT-2的預測高度吻合；但當跨越短語邊界或句子邊界（即遇到新成分的第一個詞）時，這種相關性顯著減弱。這意味著，大腦在同一個句法成分內部能進行精確預測，但在開啟一個新成分時，預測精度會大幅“掉線”。

Fig 1. 本研究的核心假設：與大語言模型“無視邊界、精確預測每一個詞”不同，人類大腦的預測受到句法成分邊界的限制。

Fig 4. MEG結果顯示，相比于成分內部的詞，大腦在處理短語首詞和句子首詞時，神經反應與GPT預測的吻合度顯著降低。

二、邊界的“確定性”越強，對預測的削弱效應越明顯

在真實的語言交流中，判斷一句話或一個短語是否結束往往需要依賴后續語境。那么，如果大腦能提前確定邊界的位置，這種“預測掉線”的現象會更明顯嗎？

在實驗2和實驗3中，研究者操縱了成分邊界的確定性。當被試連續聽到結構和時長完全一致的句子（邊界確定性極高）時，成分邊界對神經預測的削弱效應達到了最強。而當研究者將完整的句子與不連貫的兩詞短語混合播放，從而降低被試對句子邊界的預期時，這種削弱效應也隨之減弱。這表明，大腦會根據對句法結構的預期，動態調整其詞匯預測策略。

Fig 2. | Design of experiment 1. a, Each trial consists of a sequence of sentences, and each sentence contains a noun phrase (3–5 words) followed b...

Fig 5. 當句子結構和時長固定（邊界確定性高）時，大腦在句子和短語邊界處的預測精度下降得更為劇烈。

三、更高層級的句法成分會施加額外的預測限制

語言具有層級結構（詞匯構成短語，短語構成句子）。研究進一步發現，不僅是基礎的短語邊界，更高層級的句子邊界也會對詞匯預測產生獨立的影響。

當被試只聽一堆不連貫的短語（如“飛機、紅酒”）時，短語邊界的削弱效應幾乎消失了；但當這些短語被組合成完整的句子（如“飛機起飛”）時，邊界效應再次顯現。這說明，大腦在將詞匯打包成更大的超級成分（如完整的句子）時，神經預測的差異會被進一步放大。

Fig 3. | Behavioral word prediction and influence of processing time. a, The cloze test presented sentence sequences used in experiment 1. b, The c...

Fig 7. 不同實驗條件下邊界效應比例的對比，證明了更高層級的句子結構對詞匯預測的額外調制作用。

四、該機制在自然英語對話中同樣成立

為了驗證這一發現不局限于高度控制的中文實驗材料，研究團隊進一步分析了一個公開的皮層腦電（ECoG）數據集。該數據集記錄了被試聆聽30分鐘自然英語播客時的神經活動。

結果顯示，在真實的英語自然語流中，大腦左側顳上回和左側額下回（經典語言區）同樣表現出了顯著的成分邊界效應：對句子首詞的預測精度遠低于句子內部詞。這證明了“成分受限預測”是人類語言系統跨語言、跨情境的普遍機制。

Fig 6. | Sentence boundary modulates word prediction. a, Trials presenting disconnected phrases in experiments 2 and 3, in which two-word phrases c...

Fig 8. 英文自然語音的ECoG數據表明，左半球語言網絡在處理句子首詞時，同樣出現了預測精度的顯著下降。

研究意義

這項研究從根本上修正了近年來認知神經科學界的一個流行觀點：人類語言系統并非像當前的大語言模型那樣，將“精確預測下一個詞”作為唯一的計算目標。

相反，它揭示了大腦在面對有限工作記憶時的生存智慧：在預測精度與認知效率之間進行權衡。在句法成分的邊界處，大腦會優先調用認知資源，將剛剛聽到的詞匯壓縮打包成更高層級的表征（如短語或句子意義），這一“打包”過程不可避免地擠占了預測下一個詞的資源。

這一發現不僅為理解人類語言理解的神經機制提供了全新的理論框架，也為人工智能領域敲響了警鐘：一味追求超長上下文和逐詞預測精度的LLMs，在計算上是極其昂貴的。借鑒人類大腦“基于句法成分進行信息壓縮與預測權衡”的策略，或許是未來構建更高效、更具生物學合理性的大語言模型的關鍵路徑。

分享人：飯鴿兒

審核：PsyBrain 腦心前沿編輯部

你好，這里是「PsyBrain 腦心前沿」

專注追蹤全球認知神經科學的最尖端突破

視野直擊 Nature, Science, Cell 正刊及核心子刊與頂級大刊

每日速遞「深度解讀」與「前沿快訊」

科研是一場探索未知的長跑，但你無需獨行。歡迎加入PsyBrain 學術社群，和一群懂你的同行，共同丈量腦與心智的無垠前沿。

點擊卡片進群，歡迎你的到來

一鍵關注，點亮星標 ? 前沿不走丟！

一鍵分享，讓更多人了解前沿

聲明：包含AI生成內容

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.