![]()
新智元報(bào)道
![]()
【新智元導(dǎo)讀】你是否在使用Agent工作或者寫(xiě)代碼時(shí),總感覺(jué)上下文不夠用?或者感覺(jué)反復(fù)使用Agent時(shí)并沒(méi)有變得更聰明?感覺(jué)目前的記憶方案仍然不夠用?今日,香港中文大學(xué)聯(lián)合浙江大學(xué)發(fā)布的一篇論文關(guān)注了這個(gè)問(wèn)題,并引起了學(xué)術(shù)界廣泛討論:你以為Agent在「記憶」,其實(shí)只是在記備忘錄。
你有沒(méi)有遇到過(guò)這種情況:
給Agent配了向量數(shù)據(jù)庫(kù),上傳了大量歷史對(duì)話,結(jié)果它下次還是答不上來(lái);或者用Cursor、Claude寫(xiě)了幾十輪代碼,感覺(jué)它對(duì)你項(xiàng)目的理解并沒(méi)有隨著時(shí)間真正加深,每次都像是在重新認(rèn)識(shí)你。
![]()
這不是模型的問(wèn)題,也不是RAG配置的問(wèn)題。
香港中文大學(xué)與浙江大學(xué)的研究者在一篇新論文中給出了一個(gè)更根本的答案:我們根本就沒(méi)有給Agent真正的記憶。我們只是給了它一個(gè)備忘錄(Memo)。
![]()
論文鏈接:https://arxiv.org/pdf/2604.27707
論文于2026年4月30日在arXiv發(fā)布預(yù)印本,約10天之內(nèi)便在國(guó)際學(xué)術(shù)社區(qū)引發(fā)大量討論。AI領(lǐng)域知名賬號(hào) @dair_ai 在X(Twitter)的轉(zhuǎn)發(fā)獲得超過(guò)26,100次瀏覽與700余次點(diǎn)贊,多位YouTuber亦自發(fā)制作了介紹視頻,小紅書(shū)上也有多篇轉(zhuǎn)載。
Agent為什么越用越蠢?
當(dāng)前主流的Agent記憶方案,大體可以分為四類(lèi):向量存儲(chǔ)、檢索增強(qiáng)生成(RAG)、便簽本(Scratchpad)與上下文窗口管理。
它們有一個(gè)共同點(diǎn):都是「查找」,而非「記憶」。
論文作者將這類(lèi)機(jī)制統(tǒng)稱(chēng)為「?jìng)渫洠∕emo)」,而非真正意義上的記憶(True Memory)。
備忘錄的邏輯是:把信息存起來(lái),用的時(shí)候再檢索出來(lái)。這和人類(lèi)把一件事「記在心里」,是完全不同的兩件事。
![]()
這個(gè)區(qū)別的核心在于泛化機(jī)制的本質(zhì)差異:
基于檢索的記憶:通過(guò)與存儲(chǔ)案例的相似性進(jìn)行泛化。如果你存的案例里沒(méi)有類(lèi)似的情境,Agent就不會(huì)處理。
基于權(quán)重的記憶:將經(jīng)驗(yàn)抽象成規(guī)則,并將規(guī)則應(yīng)用于從未見(jiàn)過(guò)的輸入。
人類(lèi)在學(xué)習(xí)一門(mén)語(yǔ)言時(shí),不是把每一個(gè)句子都背下來(lái),而是內(nèi)化了語(yǔ)法規(guī)則,然后能造出從沒(méi)說(shuō)過(guò)的新句子。
目前的Agent「記憶」,更像是基于檢索的記憶。
三大結(jié)構(gòu)性缺陷
作者歸納出當(dāng)前上下文代理記憶系統(tǒng)的三個(gè)關(guān)鍵局限,且每一個(gè)都可以在理論層面被證明,而非僅憑直覺(jué)。
缺陷一:信息量不等于能力
Agent會(huì)無(wú)限積累筆記,卻無(wú)法發(fā)展出真正的專(zhuān)業(yè)知識(shí)。
認(rèn)知科學(xué)早已證明(Chi et al., 1981),人類(lèi)專(zhuān)家與新手的根本區(qū)別不在于掌握了更多信息,而在于知識(shí)的組織方式發(fā)生了質(zhì)變:專(zhuān)家的知識(shí)按照深層原則重新結(jié)構(gòu)化,而非簡(jiǎn)單堆積。
當(dāng)前Agent做不到這一步。每次會(huì)話結(jié)束,模型的權(quán)重完全不變,下一次依然是從同一個(gè)「新手」起點(diǎn)出發(fā),只是多了幾條備忘錄。
缺陷二:泛化天花板——數(shù)學(xué)分析
研究者用樣本復(fù)雜度理論,證明了可量化的泛化鴻溝:
檢索式記憶系統(tǒng),要處理組合式新穎任務(wù),需要存儲(chǔ)Ω(k2)個(gè)案例
而參數(shù)化學(xué)習(xí)(權(quán)重記憶),只需O(d)個(gè)示例(d為算子的復(fù)雜度維度)
更關(guān)鍵的是:增大上下文窗口無(wú)法突破這個(gè)上限。限制不來(lái)自容量,而來(lái)自組合覆蓋度。如果Agent從沒(méi)見(jiàn)過(guò)「A規(guī)則+B規(guī)則同時(shí)適用」的情形,它就無(wú)法處理這種組合,無(wú)論你塞進(jìn)多少備忘錄。
用一個(gè)直觀的例子:假設(shè)Agent學(xué)會(huì)了「攝氏度轉(zhuǎn)華氏度」和「時(shí)區(qū)換算」兩項(xiàng)技能,如果它只是把案例存在向量庫(kù)里,那遇到「把北京時(shí)間的溫度轉(zhuǎn)換到紐約同等時(shí)刻」這類(lèi)組合問(wèn)題,它很可能就卡殼了。而人類(lèi)學(xué)會(huì)了規(guī)則之后,這種組合是自然而然的。
缺陷三:記憶投毒——結(jié)構(gòu)性安全漏洞
持久化記憶存儲(chǔ)在結(jié)構(gòu)上對(duì)記憶投毒攻擊(Memory Poisoning)具有固有脆弱性。論文引用的實(shí)證數(shù)據(jù)觸目驚心:
MINJA攻擊:在最小化功能損耗的前提下,注入成功率高達(dá)98.2%
PoisonedRAG攻擊:僅用5條對(duì)抗性文本,即可實(shí)現(xiàn)90%的攻擊成功率
更危險(xiǎn)的是,一旦注入成功,惡意內(nèi)容會(huì)通過(guò)持久記憶在所有后續(xù)會(huì)話中持續(xù)循環(huán),單次攻擊轉(zhuǎn)化為永久性入侵。
海馬體+新皮層
缺一不可
論文的理論基礎(chǔ)來(lái)自神經(jīng)科學(xué)中的互補(bǔ)學(xué)習(xí)系統(tǒng)理論(Complementary Learning Systems, CLS)。
哺乳動(dòng)物大腦通過(guò)兩套系統(tǒng)的協(xié)作解決了記憶問(wèn)題:
海馬體(Hippocampus):快速記錄情景,高保真存儲(chǔ)新經(jīng)驗(yàn)
新皮層(Neocortex):緩慢整合,將情景記憶提煉為抽象規(guī)則,寫(xiě)入權(quán)重
這兩套系統(tǒng)缺一不可。人類(lèi)睡眠時(shí),大腦會(huì)將白天的情景記憶向新皮層「回放」,完成從「記住這件事」到「學(xué)會(huì)這件事」的轉(zhuǎn)化。
當(dāng)前AI Agent只實(shí)現(xiàn)了海馬體,即快速寫(xiě)入,相似性召回,沒(méi)有抽象步驟。
![]()
論文作者將當(dāng)前的Agent比作一個(gè)永遠(yuǎn)不睡覺(jué)的人——不斷記筆記,卻從不整理,永遠(yuǎn)無(wú)法將零散的經(jīng)驗(yàn)升華為真正的專(zhuān)業(yè)知識(shí)。
學(xué)界怎么看?
X上的真實(shí)討論
論文發(fā)布后,@dair_ai 的轉(zhuǎn)發(fā)帖迅速引發(fā)國(guó)際學(xué)術(shù)社區(qū)的熱議,以下是部分代表性討論的翻譯:
![]()
![]()
![]()
![]()
![]()
雙系統(tǒng)并存
不是推倒重來(lái)
論文并非只是「批判」,而是提出了雙系統(tǒng)共存的架構(gòu)路徑。
核心思路是:在保留現(xiàn)有檢索式情景記憶(海馬體等價(jià)物)的同時(shí),增加一條異步鞏固通道,將情景記憶逐步整合進(jìn)模型權(quán)重(新皮層等價(jià)物)。
具體技術(shù)早已存在,從LoRA(輕量微調(diào))和MEMIT(記憶編輯),到TTT層(測(cè)試時(shí)訓(xùn)練)和SSR(自我蒸餾)等。
論文為三類(lèi)受眾發(fā)出具體的行動(dòng)呼吁:
系統(tǒng)構(gòu)建者:實(shí)現(xiàn)從情景存儲(chǔ)到權(quán)重的鞏固通道,而非無(wú)限擴(kuò)大向量庫(kù)
基準(zhǔn)設(shè)計(jì)者(Benchmark):引入「跨時(shí)間組合泛化(CGT)」指標(biāo),真正衡量Agent是否在學(xué)習(xí)
持續(xù)學(xué)習(xí)研究社區(qū):重新關(guān)注Agent場(chǎng)景,它天然提供了連續(xù)經(jīng)驗(yàn)流、獎(jiǎng)勵(lì)信號(hào)與真實(shí)的部署環(huán)境
總結(jié)
這篇論文本質(zhì)上是一篇立場(chǎng)論文(Position Paper),沒(méi)有龐大的實(shí)驗(yàn)堆砌,但論證框架清晰,理論證明嚴(yán)格,
它引發(fā)如此廣泛的討論,或許恰恰說(shuō)明:這個(gè)問(wèn)題,幾乎每一個(gè)認(rèn)真使用過(guò)長(zhǎng)期Agent的工程師和研究者都曾隱約感受到,只是暫時(shí)沒(méi)有人把它說(shuō)清楚。
如果你正在構(gòu)建長(zhǎng)期運(yùn)行的Agent系統(tǒng),這篇論文提供了一個(gè)重要的概念校準(zhǔn):你存的那些「記憶」,到底是備忘錄,還是真正的學(xué)習(xí)?
參考資料:
Xu, B., Dai, X., & Zhang, K. (2026). Contextual Agentic Memory is a Memo, Not True Memory. arXiv:2604.27707v1
@dair_ai Twitter/X 討論:https://x.com/dair_ai/status/2050694339165335754
Chi, M. T. H., et al. (1981). Categorization and representation of physics problems by experts and novices. Cognitive Science.
MINJA & PoisonedRAG 相關(guān)攻擊研究(見(jiàn)論文參考文獻(xiàn))
編輯:LRST
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.