![]()
在AI圈,由于大模型普遍存在“轉頭就忘”的局限性,如何賦予AI長期記憶一直是開發者攻堅的堡壘。然而,2026年4月初,好萊塢知名女星米拉·喬沃維奇(Milla Jovovich)與工程師本·西格曼(Ben Sigman)突然宣布發布開源項目MemPalace,聲稱其在長文本記憶基準測試中取得了“100%滿分”的驚人成績。這一跨界組合帶來的技術神話迅速點燃了社區,但隨之而來的卻是激烈的技術質疑與反噬。
100%滿分的背后:是技術突破還是“應試技巧”?
MemPalace之所以能瞬間出圈,核心賣點在于它在LongMemEval基準測試上的表現。
通俗來說,LongMemEval是一個專門考核AI長期記憶能力的“考場”。它會給AI喂下海量的歷史對話,然后針對很久以前的一個細節進行提問。衡量成績的核心指標之一是Recall@5(召回率@5)。
我們可以把Recall@5想象成一個“翻箱倒柜”的過程:如果AI被要求找一把鑰匙,它獲準打開5個最有可能的抽屜。只要鑰匙在其中任何一個抽屜里,就算得分。顯然,這是一個相對寬松的指標。MemPalace宣稱其在純本地模式下達到了96.6%的召回率,而在開啟Reranking(重排)技術后,竟然拿到了500道題全對的100%滿分。
所謂Reranking(重排)技術,好比是先讓一個動作飛快的“普通搜查員”粗略找出幾十個嫌疑目標,再請一位“高級偵探”(通常是一個更強大的模型,如Claude Haiku)對這些目標進行精細對比和二次排序,選出最終答案。
![]()
圖注:MemPalace在營銷宣傳中強調的“滿分成績”,在技術視角下實際上是基于特定指標和重排技術優化的結果。
然而,社區的反噬也正源于此。資深開發者指出,能通過Recall@5“找對對話片段”,并不等同于AI具備了真正的長期對話理解能力。這就像是一個學生記住了書本上每句話所在的頁碼,雖然能快速翻到那一頁,但他未必理解這些話背后的邏輯。更嚴重的指控是,MemPalace的代碼中被發現存在針對特定測試題目的“硬編碼補丁”,這種“照著答案背考卷”的行為,讓所謂的滿分神話在專業人士眼中大打折扣。
記憶宮殿:將古老術法引入本地AI
盡管評分標準引發爭議,MemPalace的設計理念確實有其獨到之處。它借鑒了古希臘的“記憶宮殿”技術,將非結構化的對話信息映射到空間結構中。
根據項目文檔,MemPalace將記憶劃分為“翼(Wings)”、“廳(Halls)”、“房間(Rooms)”和“抽屜(Drawers)”四個層級。這種分層存儲方式配合AAAK壓縮算法,試圖在本地有限的硬件資源下,實現高效的語義檢索。
![]()
圖注:MemPalace的核心架構邏輯,通過模擬物理空間的層級劃分,試圖解決AI在海量歷史數據中的檢索效率問題。
相比于將所有對話丟進一個巨大的“垃圾場”進行全掃描,MemPalace的架構確實為隱私優先的本地運行提供了思路。米拉·喬沃維奇在聲明中強調,該項目源于她個人在大型游戲創作中對AI記憶缺失的挫敗感,她扮演的是“記憶架構師”的角色,而具體的代碼實現則由AI編程代理和工程師協同完成。
人設、動機與同名代幣的迷霧
隨著項目熱度的飆升,圍繞創始團隊的爭議也浮出水面。工程師本·西格曼(Ben Sigman)的加密貨幣背景成為了社區審視的焦點。作為比特幣借貸平臺的CEO,他敏銳的營銷手段被認為帶有強烈的“加密圈”風格——高調、數據華麗且極具煽動性。
這種風格在項目發布不久后便引發了副作用。在Solana等公鏈上,迅速出現了名為“$MemPalace”的同名代幣,并伴隨著項目熱度大幅波動。盡管目前沒有任何直接證據表明米拉·喬沃維奇或西格曼參與了發幣,但這種“名人+開源項目+代幣炒作”的既視感,讓不少推崇純粹開源文化的開發者感到不適。
面對外界對米拉·喬沃維奇“代筆編程”的疑慮,她本人表現得相對坦誠。她承認代碼中的核心貢獻者“Lu”其實是她使用的AI編程工具,她更傾向于把自己定位為需求提出者和邏輯設計者。
核心判斷:爭議背后的真實與虛妄
綜合各方證據,我們對MemPalace可以給出一個核心判斷:這更像是一個“真實存在的開源項目+高強度爭議性營銷”的混合體,而非一個純粹的假李鬼騙局。
項目確實可用:它提供了完整的Python源代碼和本地化部署方案,其分層存儲的思路對隱私敏感型用戶具有參考價值。
數據存在水分:所謂的100%滿分更多是針對特定測試環境的“應試優化”,在實際復雜的對話場景中,其表現未必能全面碾壓Mem0等成熟產品。
營銷痕跡重:利用名人效應和極限數據博取關注,是典型的互聯網初創項目打法,雖然在學術嚴謹性上有所欠缺,但在商業傳播上極其成功。
對于普通用戶而言,MemPalace提供了一個無需API密鑰、隱私受控的記憶方案,值得一試;但對于追求極致技術透明度的開發者來說,剝離其營銷外殼,客觀評估其在非應試場景下的檢索準確度,才是理性的選擇。這場由好萊塢明星發起的AI試驗,最終會演變成長期記憶的技術標桿,還是僅僅作為一段互聯網營銷談資,仍需社區后續的長期審計與迭代。
*本文依據網絡搜集數據整理,由AI工具輔助完成
All rights reserved. Copyright ? 2026
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.