1953年,一位患者接受腦手術后,再也記不住任何事——每段對話對他都是第一次。你的編程智能體(AI Agent)患著同樣的病。
每次啟動都從零開始。你必須反復 onboarding,反復填坑。
![]()
問題不是"能不能做成",而是為什么要忍受這種昂貴、不可靠、消耗耐心的 brute force(蠻力解法)。
這位患者的病例恰恰指明了出路。
蠻力解法的隱性成本
你可以不給智能體記憶。重試循環、糾錯提示、任務重構、越來越臃腫的指令文件——這些確實能"eventually(最終)"拿到結果。
但代價是什么?
計算資源在燃燒。上下文在腐爛。用戶的耐心被一點點磨光。
更隱蔽的問題是:把"正確性"當成唯一成功指標,本身就是一種偷懶。不必要的交互輪次吞噬時間和金錢,而耐心恰恰是最該被珍視的稀缺品。
目標不該是"最終成功",而該是連續性、確定性、可重復的結果,且成本最低。
要理解怎么做到,得先拆解記憶的運作機制。
記憶的三種形態,智能體缺了哪塊
人類對記憶的直覺理解往往過于簡化。它其實是編碼、存儲、按需提取的完整鏈條。
三種核心類型分工明確:
短期記憶(Short-term Memory):感官信息暫存約30秒,大腦據此判斷值不值得編碼入庫。對智能體來說這不是痛點,略過。
長期記憶(Long-term Memory):信息被編碼、存儲、長期可提取。關鍵要區分兩個子類型——陳述性記憶(事實與事件)和非陳述性記憶(技能、習慣、啟動效應)。
工作記憶(Working Memory):這是大腦的"工作臺",完成任務的核心場所。它操縱信息,嚴重依賴長期記憶。沒有工作記憶,你能"知道"事情,但無法"應用"。
工作記憶讓任務執行成為可能,長期陳述性記憶是其功能基礎。但這還不夠。
控制進程(Control Processes)必須到位——篩選與當前目標相關的信息,過濾噪音。
對工作記憶功能至關重要的控制模型有三種:
中央執行系統(Central Executive):工作記憶的控制中心,協調注意力、選擇目標、判定任務相關信息。
自上而下加工(Top-down Processing):調用先驗知識來整合、理解新信息,填補空白、做出推斷、將已知應用于新情境。
情景緩沖器(Episodic Buffer):臨時存儲系統,將不同來源的信息整合為連貫的工作狀態,融合長期記憶、感官輸入和其他認知進程的信息。
這位患者的病例恰好揭示了這些組件如何協同——以及失去它們會怎樣。
海馬體切除的啟示:當陳述性記憶斷裂
手術摘除了患者的海馬體。他保留了手術前的長期記憶,但再也無法形成新的陳述性記憶。
諷刺的是,他的工作記憶和程序性學習能力完好無損。他可以完成需要專注的復雜任務,甚至通過反復練習提升表現——只是每次都不記得自己做過。
這正是當前編程智能體的處境。
每次會話都是干凈的石板。你昨天解釋過的架構決策、上周踩過的坑、上個月定下的編碼規范——全部歸零。智能體表現得像個熟練的臨時工,技能在手,背景全無。
更糟的是,這種"失憶"被掩蓋在流暢的交互界面之下。用戶往往要到第三輪、第五輪、第十輪對話才意識到:自己不是在"協作",而是在"復讀"。
上下文窗口的膨脹是癥狀,不是解藥。把整本代碼庫塞進提示詞,就像讓患者隨身攜帶一本寫滿筆記的日記——他確實能"讀取",但無法真正"擁有"這些記憶。
為什么上下文窗口不是記憶
當前主流的"記憶"方案,本質上是工作記憶的粗暴延伸:把更多 token 塞進單次會話的上下文窗口。
這解決了患者的問題嗎?沒有。
他的工作記憶是正常的。他能專注處理眼前信息,能在信息之間建立即時聯系。他的缺陷在于編碼與存儲——新經歷無法進入長期記憶庫,也就無法被未來的工作記憶調用。
上下文窗口的擴容,只是讓"眼前"變得更寬。一旦會話結束,一切依然消散。
更隱蔽的風險是上下文腐爛(Context Rot)。當窗口被無關信息填滿,信號噪聲比惡化,智能體的表現隨之崩塌。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.