# TL;DR
- OpenHuman 的記憶系統設計非常有品位,值得每一位在做 AI 的 PM 學習,但不只是“118 信源”那套
- 三個關鍵:Memory Tree、Bucket-Seal 和 Obsidian Wiki
- 我搞了個 SKill 復刻了 OpenHuman 的記憶系統,并擴展了它不能處理的一些信源
過去 1 周,GitHub Trending 熱榜上 OpenHuman 這個項目幾乎每天都是第一。
![]()
我看了一下它的 Star 增長歷史,基本每天都是 2K Star 的增長速度。
目前常見的評價基本一樣,都是類似:
- “繼 OpenClaw、Hermes 之后的又一個個人助理 Agent”
- “終于有直接帶客戶端的助理 Agent 了”
- “鏈接 118 個數據源,自動構建你的記憶”
這些都是從項目 README 里復制粘貼來的“信息”,不是產品經理應該學的“知識”。
我跟我的 Hermes 一起扒了它的源碼,逐模塊、逐文件讀了一遍。
基本上把它的記憶系統搞明白了:OpenHuman 在記憶的組織方式上,做了一個非常有產品品味的設計決策。
這個決策,值得每一個做 AI 產品的 PM 拆明白。
02 / 簡單科普:大多數 AI 的"記憶"是什么樣的
在拆 OpenHuman 之前,我們先簡單過一下"普通" Agent 的記憶系統長什么樣。
大多數產品的做法是:
Agent 的系統提示詞里有一句話“當你覺得這事對定義用戶和幫你未來更好的做事有用,把它寫下來,存到XXX.md文檔里。”
有些文檔,是默認強行插入 Agent 上下文的,比如USER.md、SOUL.md這種;
有些文檔,會在用戶明確提到的時候 Agent 去閱讀,比如memory/2026-05-06.md這種日記型的。
還有些產品會在用戶靜默時(比如凌晨 4 點)激活一個 Agent 讀取當日會話,從里面提取有用的信息,存到某個文檔或者SQlite數據庫里。
等到用戶某天提出涉及記憶相關需求時,在文檔或者數據庫搜索后使用。
這些“記憶”方式整體上沒啥毛病,但有兩點點小細節:
- 只能是邊用邊構建,你過往的信息,Agent 沒法知道
- Agent 友好,但人不方便看+編輯
OpenHuman 核心就是在解決這倆問題,并且方式有點優雅。
03 / 記憶樹:OpenHuman 的核心設計
OpenHuman 的記憶系統叫 Memory Tree,翻譯過來就是記憶樹。
這不是一個修辭手法,它真的是樹形結構,而且是三層樹。
三層樹,三種作用域
嘗試思考一下你的大腦是怎么處理信息的:
- 感官記憶:看到、聽到、讀到的一切,先存著
- 工作記憶:把感官記憶整理成"現在在處理什么"
- 長期記憶:再壓縮、抽象化,變成"我知道什么"
OpenHuman 的三層樹,幾乎就是這個結構的工程化版本:
第一層:源樹(Source Tree)—— 每個數據來源一棵
大家在宣傳的 OpenHuman 可以接入 118 個信源,就是用來干這個的:
你接了一個 Gmail,就有一棵 Gmail 源樹。接了一個 Slack 頻道,就有一棵 Slack 源樹。
每棵樹獨立管理自己的原始數據。
第二層:主題樹(Topic Tree)—— 按人物/項目/話題聚合
當某個實體(比如你的同事"張三")在多個來源中反復出現,系統會自動為"張三"創建一棵主題樹,把他相關的所有信息——郵件、聊天、文檔——都聚合到一起。
第三層:全局樹(Global Tree)—— 跨來源的每日/周/月/年回顧
每天凌晨,系統自動跑一次,把所有源樹當天的"精華"匯總成一份每日摘要。
7 個每日摘要再壓縮成一個每周摘要,4 個每周摘要壓縮成每月……以此類推。
![]()
產品洞察:
大多數 AI 記憶是"平"的——所有信息都在一個層面上。
OpenHuman 的記憶是"立體"的——你能從全局看全貌,也能沿著某個實體一路鉆到原始對話。
Bucket-Seal 機制:自動壓縮的引擎
三層樹是怎么"自動整理"的呢?
它有一個叫Bucket-Seal的機制。
翻譯成中文是:桶 + 封印,也基本就是它的工作原理:
- 新數據進來后,先扔進 L0 緩沖區(桶)
- 當桶滿了——具體來說是累計達到 50,000 tokens,或者積累了 10 條數據——觸發"封印"
- 封印時,把桶里所有內容交給 LLM,生成一份摘要(SummaryNode)
- 這份摘要自動升入 L1 層
- 當 L1 層也積累了 10 個同級摘要,再觸發一次封印,升入 L2……
- 如此級聯向上,每一層都是一次"壓縮"
啥用呢?
假設你把飛書連上作為信息源了(它還不支持……):
你 3 個月前在飛書跟同事討論了一堆信息,它們進入記憶系統后,會被自動壓縮成一段精煉的摘要,掛在那棵源樹的 L1 或 L2 節點上。
當你的 AI 需要"回憶"那次討論,它可以從全局樹的月度摘要→周度摘要→源樹的 L1 摘要,一路精確導航到原始對話。
不是全量搜索,是層級導航。或者叫“漸進式披露記憶”。
產品洞察:
Bucket-Seal 的精髓在于它的惰性——不主動干活,滿了才壓縮。這保證了兩個重要特性:
- 低成本:熱路徑(數據進來時)沒有 LLM 調用,只有廉價的啟發式評分
- 不丟信息:壓縮發生在后臺,原始數據始終保留在磁盤上
04 / 數據是從哪來的?
記憶樹的"原料"從哪來?這是 OpenHuman 另一個值得拆解的設計。
Composio:118+ 服務的一鍵接入
OpenHuman 底層用了 Composio[1] 作為數據接入層,提供 118+ 第三方服務的 OAuth 一鍵接入。
已原生支持自動攝取的服務包括:
類型 服務 說明 Chat Slack / Discord / Telegram / WhatsApp 消息自動同步 Email Gmail / 通用 IMAP 郵件自動拉取 Document Notion / Google Drive / 會議記錄 文檔自動入庫 Dev GitHub / GitLab 代碼和 Issue 追蹤 Social Reddit / Instagram / Facebook 社交媒體監控
關鍵機制:Auto-fetch。
每個接入的服務,每隔 20 分鐘自動同步一次新數據。
不需要你手動觸發——連上 Gmail,它就開始幫你"記"每一封新郵件。
從原始數據到標準化格式
不管數據從哪來,最終都要經過一個標準化器(Canonicalizer),變成統一的 Markdown 格式:
- 聊天記錄:
## 2026-05-19T14:30:00Z — 張三\n消息內容 - 郵件:
From: 張三 | Subject: 項目進展 | Date: ...\n正文內容 - 文檔:直接裁剪為 Markdown body
標準化后,進入分塊器,切成 ≤3000 tokens 的小塊,每塊生成一個確定性 ID(基于內容的 SHA-256 哈希)。
![]()
05 / 它不只是"記住"——還有"想"
OpenHuman 記憶系統還有一個有意思的設計:它有一個"潛意識"模塊。
Subconscious:后臺一直在想
大多數 AI 助理是"你問我答"的模式——你不說話,它就安靜地等著。
OpenHuman 不是。
它有一個后臺循環,每 5 分鐘跑一次"tick"(心跳)。每次 tick:
- 構建態勢報告:從記憶樹中拉取最新變化——哪些實體熱度在漲?哪些新摘要剛生成?最近有什么反思?
- 評估任務:檢查有沒有待辦事項該做了
- 生成反思:發現跨來源的模式、異常、機會
反思的六種類型:
類型 含義 示例 熱度突變 某個實體被高頻提到了 "張三在 Slack/郵件/Notion 都出現了" 跨源模式 多個來源指向同一件事 "Gmail 和 Slack 都在討論同一個客戶問題" 每日摘要 新的全局回顧生成了 "今天的重要事件匯總" ? 截止提醒 引用了近截止日期的摘要 "項目 X 的 deadline 是明天" ?? 風險模式 發現潛在風險 "連續 3 天沒人回復那封關鍵郵件" 機會模式 發現潛在機會 "競品剛發布新功能,你的產品有對應優勢" 安全邊界:觀察但不行動
這些反思不會自動執行任何操作——它們只出現在 Intelligence Tab 里,等你來看。
如果 AI 判斷需要執行寫操作(發郵件、創建文檔等),會創建一個 escalation(升級請求),需要你手動批準。
產品洞察:
這背后的理念是——AI 應該是一個"觀察者"而不是"行動者"。它負責發現、整理、提醒,但把決策權留給你。這比那些"全自動"的 Agent 設計要克制得多,也安全得多。
06 / Obsidian Wiki:你信任你的 AI 的記憶嗎?
這是 OpenHuman 記憶系統最有"品味"的一個設計決策:
所有記憶,字面上就是你電腦上的 Markdown 文件。
你可以用 Obsidian 打開這個文件夾,看到 AI 的每一個"記憶":
- 每條原始對話、每封郵件、每篇文檔,都是一個
.md文件 - 每個層級摘要,也是一個
.md文件,通過[[wikilink]]鏈接到它的子節點 - 自動標簽(
person/張三project/Phoenix)讓 Obsidian 的圖譜視圖直接變成知識網絡
他們引用了一句話:
"You can't trust a memory you can't read."
你無法信任一個你看不到的記憶。
這句話直接引用了 Karpathy 的 Obsidian Wiki 工作流——一個你生命中每件有趣的事都變成可鏈接筆記的個人知識庫。
這意味著:
- 透明性:AI 記錯了東西,你直接找到那個文件,改掉它
- 可遷移性:不用 OpenHuman 了?你帶走一個完整的個人 Wiki
- 可審計性:你隨時可以審查 AI 到底"記住"了你的哪些信息
記憶系統的運行成本是做產品時必須考慮的。
OpenHuman 有幾招控制成本的設計:
設計 作用 效果 熱路徑無 LLM 數據進來時只做啟發式評分 攝入零 LLM 成本 TokenJuice 壓縮 工具調用結果進入 LLM 前壓縮 80% 6 個月郵件同步成本個位數美元 惰性主題樹 不熱的實體不建樹 避免為冷門信息浪費資源 軟回退機制 LLM 摘要失敗時用簡單拼接替代 管道永不中斷 本地模型優先 簡單任務用本地 Ollama 免費評估
產品洞察:
這里有一個很重要的產品原則——確定性優先于概率性。
熱路徑上沒有 LLM 調用,意味著你的記憶系統不會因為 API 限流、模型故障而停擺。LLM 只在后臺"深度整理"時才登場。
08 / 它"不夠好"的地方
好歸好,但對國人不友好。
OpenHuman 目前支持的信息源渠道:
Slack、Gmail、Notion、Google Drive、GitHub、Discord、Reddit、Instagram、Facebook、WhatsApp……
全是海外 App。
對于中國的個人用戶和產品經理來說,我們日常用的是什么?
- 微信 / 飛書 / 釘釘(聊天)
- 微信讀書 / 得到(知識)
- 石墨文檔 / 飛書文檔 / 語雀(協作)
- 小紅書 / 即刻 / 知識星球(社區)
- 本地的 Word / PDF / Markdown 文件(工作資料)
OpenHuman 的記憶系統做得再好,如果我的數據源喂不進來,就等于沒有記憶。
好在它是開源的。并且它的記憶樹架構和數據源是解耦的。
標準化器(Canonicalizer)把任意數據源轉成統一 Markdown,然后才進入記憶樹。這意味著——
只要我們能把任何格式的文檔(Word、PDF、Markdown、JSON、純文本)標準化成 Markdown,就能復用整套記憶樹的邏輯。
這正是我們需要做的。
09 / 一個解決思路
基于 OpenHuman 記憶系統的核心邏輯,我設計了一個Skill(技能)。
它能做什么:
- 指定任意本地文件夾,Agent 自動掃描并識別所有文檔(Word、PDF、Markdown、JSON、純文本)
- 根據文檔規模制定處理計劃,半夜自動激活來干活,干完輸出交接文檔
- 統一轉成 Markdown,按照 OpenHuman 的記憶系統邏輯進行記憶抽取
- 輸出為 Obsidian Wiki——帶標簽、帶層級、帶 wikilink 的完整知識庫
你只需要把你電腦上的文件夾路徑告訴它。
這個 Skill 的 1.0 版本我放在 AI 學習行動圈知識星球里了,后續我會持續迭代它的穩定性,感興趣可以在星球搜索「記憶樹」下載體驗。
![]()
10 / 關于 AI 學習行動圈
這是我 23 年底開始,和人人都是產品經理社區共同運營的一個圈子,截止目前已經持續運營、維護超過 700 天了,已有超過 5000+圈友!
我的各種 AI 研究心得、發現的好應用、開發的小項目都會在里面分享,目前圈子有核心三個交流學習平臺。
8 個微信群,早報和日常交流
微信群里每天一早有 AI 早報,上下午還有“讀報時間”,以及我每天不定期刷屏級的各種 AI 工具體驗、提示詞編排思考、行業新聞解讀同步。
![]()
以及,你可以在群里討論任何與 AI 相關的工具、應用問題,幾乎都能找到答案。
![]()
騰訊文檔-圈友空間
用來沉淀體系化、深度的 AI 文章和超長的工程化提示詞,不定期更新。
當前包括:Claude code、Cursor、Manus等頂級產品的系統提示詞和工具列表,各種深度的 Agent 白皮書和實踐指南
![]()
知識星球-每日報告、工具和實戰經驗分享
我在星球里主要維護「實戰分享」「工具箱」和「情報局」三個標簽
![]()
實戰分享是可以在日常工作和生活中直接應用的提示詞和效率工具。上面截圖里的 Step-Back 提示詞就非常好用,堪比 o4。在公眾號、直播中演示的所有 AI 實戰應用的提示詞也都在這個標簽下。
AI 工具和鮮知道就是好用的、熱門的 AI 工具、資訊分享,我把那些太技術、太浮夸的都篩選了,放進這個標簽的都是可以直接用來的好玩兒!
加入圈子,跟 5000+ 行動派一起玩 AI、聊 AI,精進起飛~
- Composio: https://composio.dev
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.