網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

你的AI Agent越用越蠢？港中大、浙大戳破「記憶」的謊言

2026-05-19 12:37:30　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

【新智元導(dǎo)讀】你是否在使用Agent工作或者寫(xiě)代碼時(shí)，總感覺(jué)上下文不夠用？或者感覺(jué)反復(fù)使用Agent時(shí)并沒(méi)有變得更聰明？感覺(jué)目前的記憶方案仍然不夠用？今日，香港中文大學(xué)聯(lián)合浙江大學(xué)發(fā)布的一篇論文關(guān)注了這個(gè)問(wèn)題，并引起了學(xué)術(shù)界廣泛討論：你以為Agent在「記憶」，其實(shí)只是在記備忘錄。

你有沒(méi)有遇到過(guò)這種情況：

給Agent配了向量數(shù)據(jù)庫(kù)，上傳了大量歷史對(duì)話，結(jié)果它下次還是答不上來(lái)；或者用Cursor、Claude寫(xiě)了幾十輪代碼，感覺(jué)它對(duì)你項(xiàng)目的理解并沒(méi)有隨著時(shí)間真正加深，每次都像是在重新認(rèn)識(shí)你。

這不是模型的問(wèn)題，也不是RAG配置的問(wèn)題。

香港中文大學(xué)與浙江大學(xué)的研究者在一篇新論文中給出了一個(gè)更根本的答案：我們根本就沒(méi)有給Agent真正的記憶。我們只是給了它一個(gè)備忘錄（Memo）。

論文鏈接：https://arxiv.org/pdf/2604.27707

論文于2026年4月30日在arXiv發(fā)布預(yù)印本，約10天之內(nèi)便在國(guó)際學(xué)術(shù)社區(qū)引發(fā)大量討論。AI領(lǐng)域知名賬號(hào) @dair_ai 在X（Twitter）的轉(zhuǎn)發(fā)獲得超過(guò)26,100次瀏覽與700余次點(diǎn)贊，多位YouTuber亦自發(fā)制作了介紹視頻，小紅書(shū)上也有多篇轉(zhuǎn)載。

Agent為什么越用越蠢？

當(dāng)前主流的Agent記憶方案，大體可以分為四類(lèi)：向量存儲(chǔ)、檢索增強(qiáng)生成（RAG）、便簽本（Scratchpad）與上下文窗口管理。

它們有一個(gè)共同點(diǎn)：都是「查找」，而非「記憶」。

論文作者將這類(lèi)機(jī)制統(tǒng)稱(chēng)為「?jìng)渫洠∕emo）」，而非真正意義上的記憶（True Memory）。

備忘錄的邏輯是：把信息存起來(lái)，用的時(shí)候再檢索出來(lái)。這和人類(lèi)把一件事「記在心里」，是完全不同的兩件事。

這個(gè)區(qū)別的核心在于泛化機(jī)制的本質(zhì)差異：

基于檢索的記憶：通過(guò)與存儲(chǔ)案例的相似性進(jìn)行泛化。如果你存的案例里沒(méi)有類(lèi)似的情境，Agent就不會(huì)處理。
基于權(quán)重的記憶：將經(jīng)驗(yàn)抽象成規(guī)則，并將規(guī)則應(yīng)用于從未見(jiàn)過(guò)的輸入。

人類(lèi)在學(xué)習(xí)一門(mén)語(yǔ)言時(shí)，不是把每一個(gè)句子都背下來(lái)，而是內(nèi)化了語(yǔ)法規(guī)則，然后能造出從沒(méi)說(shuō)過(guò)的新句子。

目前的Agent「記憶」，更像是基于檢索的記憶。

三大結(jié)構(gòu)性缺陷

作者歸納出當(dāng)前上下文代理記憶系統(tǒng)的三個(gè)關(guān)鍵局限，且每一個(gè)都可以在理論層面被證明，而非僅憑直覺(jué)。

缺陷一：信息量不等于能力

Agent會(huì)無(wú)限積累筆記，卻無(wú)法發(fā)展出真正的專(zhuān)業(yè)知識(shí)。

認(rèn)知科學(xué)早已證明（Chi et al., 1981），人類(lèi)專(zhuān)家與新手的根本區(qū)別不在于掌握了更多信息，而在于知識(shí)的組織方式發(fā)生了質(zhì)變：專(zhuān)家的知識(shí)按照深層原則重新結(jié)構(gòu)化，而非簡(jiǎn)單堆積。

當(dāng)前Agent做不到這一步。每次會(huì)話結(jié)束，模型的權(quán)重完全不變，下一次依然是從同一個(gè)「新手」起點(diǎn)出發(fā)，只是多了幾條備忘錄。

缺陷二：泛化天花板——數(shù)學(xué)分析

研究者用樣本復(fù)雜度理論，證明了可量化的泛化鴻溝：

檢索式記憶系統(tǒng)，要處理組合式新穎任務(wù)，需要存儲(chǔ)Ω(k2)個(gè)案例
而參數(shù)化學(xué)習(xí)（權(quán)重記憶），只需O(d)個(gè)示例（d為算子的復(fù)雜度維度）

更關(guān)鍵的是：增大上下文窗口無(wú)法突破這個(gè)上限。限制不來(lái)自容量，而來(lái)自組合覆蓋度。如果Agent從沒(méi)見(jiàn)過(guò)「A規(guī)則+B規(guī)則同時(shí)適用」的情形，它就無(wú)法處理這種組合，無(wú)論你塞進(jìn)多少備忘錄。

用一個(gè)直觀的例子：假設(shè)Agent學(xué)會(huì)了「攝氏度轉(zhuǎn)華氏度」和「時(shí)區(qū)換算」兩項(xiàng)技能，如果它只是把案例存在向量庫(kù)里，那遇到「把北京時(shí)間的溫度轉(zhuǎn)換到紐約同等時(shí)刻」這類(lèi)組合問(wèn)題，它很可能就卡殼了。而人類(lèi)學(xué)會(huì)了規(guī)則之后，這種組合是自然而然的。

缺陷三：記憶投毒——結(jié)構(gòu)性安全漏洞

持久化記憶存儲(chǔ)在結(jié)構(gòu)上對(duì)記憶投毒攻擊（Memory Poisoning）具有固有脆弱性。論文引用的實(shí)證數(shù)據(jù)觸目驚心：

MINJA攻擊：在最小化功能損耗的前提下，注入成功率高達(dá)98.2%
PoisonedRAG攻擊：僅用5條對(duì)抗性文本，即可實(shí)現(xiàn)90%的攻擊成功率

更危險(xiǎn)的是，一旦注入成功，惡意內(nèi)容會(huì)通過(guò)持久記憶在所有后續(xù)會(huì)話中持續(xù)循環(huán)，單次攻擊轉(zhuǎn)化為永久性入侵。

海馬體＋新皮層

缺一不可

論文的理論基礎(chǔ)來(lái)自神經(jīng)科學(xué)中的互補(bǔ)學(xué)習(xí)系統(tǒng)理論（Complementary Learning Systems, CLS）。

哺乳動(dòng)物大腦通過(guò)兩套系統(tǒng)的協(xié)作解決了記憶問(wèn)題：

海馬體（Hippocampus）：快速記錄情景，高保真存儲(chǔ)新經(jīng)驗(yàn)
新皮層（Neocortex）：緩慢整合，將情景記憶提煉為抽象規(guī)則，寫(xiě)入權(quán)重

這兩套系統(tǒng)缺一不可。人類(lèi)睡眠時(shí)，大腦會(huì)將白天的情景記憶向新皮層「回放」，完成從「記住這件事」到「學(xué)會(huì)這件事」的轉(zhuǎn)化。

當(dāng)前AI Agent只實(shí)現(xiàn)了海馬體，即快速寫(xiě)入，相似性召回，沒(méi)有抽象步驟。

論文作者將當(dāng)前的Agent比作一個(gè)永遠(yuǎn)不睡覺(jué)的人——不斷記筆記，卻從不整理，永遠(yuǎn)無(wú)法將零散的經(jīng)驗(yàn)升華為真正的專(zhuān)業(yè)知識(shí)。

學(xué)界怎么看？

X上的真實(shí)討論

論文發(fā)布后，@dair_ai 的轉(zhuǎn)發(fā)帖迅速引發(fā)國(guó)際學(xué)術(shù)社區(qū)的熱議，以下是部分代表性討論的翻譯：

雙系統(tǒng)并存

不是推倒重來(lái)

論文并非只是「批判」，而是提出了雙系統(tǒng)共存的架構(gòu)路徑。

核心思路是：在保留現(xiàn)有檢索式情景記憶（海馬體等價(jià)物）的同時(shí)，增加一條異步鞏固通道，將情景記憶逐步整合進(jìn)模型權(quán)重（新皮層等價(jià)物）。

具體技術(shù)早已存在，從LoRA（輕量微調(diào)）和MEMIT（記憶編輯），到TTT層（測(cè)試時(shí)訓(xùn)練）和SSR（自我蒸餾）等。

論文為三類(lèi)受眾發(fā)出具體的行動(dòng)呼吁：

系統(tǒng)構(gòu)建者：實(shí)現(xiàn)從情景存儲(chǔ)到權(quán)重的鞏固通道，而非無(wú)限擴(kuò)大向量庫(kù)
基準(zhǔn)設(shè)計(jì)者（Benchmark）：引入「跨時(shí)間組合泛化（CGT）」指標(biāo)，真正衡量Agent是否在學(xué)習(xí)
持續(xù)學(xué)習(xí)研究社區(qū)：重新關(guān)注Agent場(chǎng)景，它天然提供了連續(xù)經(jīng)驗(yàn)流、獎(jiǎng)勵(lì)信號(hào)與真實(shí)的部署環(huán)境

總結(jié)

這篇論文本質(zhì)上是一篇立場(chǎng)論文（Position Paper），沒(méi)有龐大的實(shí)驗(yàn)堆砌，但論證框架清晰，理論證明嚴(yán)格，

它引發(fā)如此廣泛的討論，或許恰恰說(shuō)明：這個(gè)問(wèn)題，幾乎每一個(gè)認(rèn)真使用過(guò)長(zhǎng)期Agent的工程師和研究者都曾隱約感受到，只是暫時(shí)沒(méi)有人把它說(shuō)清楚。

如果你正在構(gòu)建長(zhǎng)期運(yùn)行的Agent系統(tǒng)，這篇論文提供了一個(gè)重要的概念校準(zhǔn)：你存的那些「記憶」，到底是備忘錄，還是真正的學(xué)習(xí)？

參考資料：

Xu, B., Dai, X., & Zhang, K. (2026). Contextual Agentic Memory is a Memo, Not True Memory. arXiv:2604.27707v1

@dair_ai Twitter/X 討論：https://x.com/dair_ai/status/2050694339165335754

Chi, M. T. H., et al. (1981). Categorization and representation of physics problems by experts and novices. Cognitive Science.

MINJA & PoisonedRAG 相關(guān)攻擊研究（見(jiàn)論文參考文獻(xiàn)）

編輯：LRST

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.