網易首頁 > 網易號 > 正文申請入駐

霸榜GitHub一周的OpenHuman，強在哪里？

2026-05-20 07:49:43　來源: 人人都是產品經理社區

廣東舉報

分享至

# TL;DR

OpenHuman 的記憶系統設計非常有品位，值得每一位在做 AI 的 PM 學習，但不只是“118 信源”那套
三個關鍵：Memory Tree、Bucket-Seal 和 Obsidian Wiki
我搞了個 SKill 復刻了 OpenHuman 的記憶系統，并擴展了它不能處理的一些信源

過去 1 周，GitHub Trending 熱榜上 OpenHuman 這個項目幾乎每天都是第一。

我看了一下它的 Star 增長歷史，基本每天都是 2K Star 的增長速度。

目前常見的評價基本一樣，都是類似：

“繼 OpenClaw、Hermes 之后的又一個個人助理 Agent”
“終于有直接帶客戶端的助理 Agent 了”
“鏈接 118 個數據源，自動構建你的記憶”

這些都是從項目 README 里復制粘貼來的“信息”，不是產品經理應該學的“知識”。

我跟我的 Hermes 一起扒了它的源碼，逐模塊、逐文件讀了一遍。

基本上把它的記憶系統搞明白了：OpenHuman 在記憶的組織方式上，做了一個非常有產品品味的設計決策。

這個決策，值得每一個做 AI 產品的 PM 拆明白。

02 / 簡單科普：大多數 AI 的"記憶"是什么樣的

在拆 OpenHuman 之前，我們先簡單過一下"普通" Agent 的記憶系統長什么樣。

大多數產品的做法是：

Agent 的系統提示詞里有一句話“當你覺得這事對定義用戶和幫你未來更好的做事有用，把它寫下來，存到XXX.md文檔里。”

有些文檔，是默認強行插入 Agent 上下文的，比如USER.md、SOUL.md這種；

有些文檔，會在用戶明確提到的時候 Agent 去閱讀，比如memory/2026-05-06.md這種日記型的。

還有些產品會在用戶靜默時(比如凌晨 4 點)激活一個 Agent 讀取當日會話，從里面提取有用的信息，存到某個文檔或者SQlite數據庫里。

等到用戶某天提出涉及記憶相關需求時，在文檔或者數據庫搜索后使用。

這些“記憶”方式整體上沒啥毛病，但有兩點點小細節：

只能是邊用邊構建，你過往的信息，Agent 沒法知道
Agent 友好，但人不方便看+編輯

OpenHuman 核心就是在解決這倆問題，并且方式有點優雅。

03 / 記憶樹：OpenHuman 的核心設計

OpenHuman 的記憶系統叫 Memory Tree，翻譯過來就是記憶樹。

這不是一個修辭手法，它真的是樹形結構，而且是三層樹。

三層樹，三種作用域

嘗試思考一下你的大腦是怎么處理信息的：

感官記憶：看到、聽到、讀到的一切，先存著
工作記憶：把感官記憶整理成"現在在處理什么"
長期記憶：再壓縮、抽象化，變成"我知道什么"

OpenHuman 的三層樹，幾乎就是這個結構的工程化版本：

第一層：源樹（Source Tree）—— 每個數據來源一棵

大家在宣傳的 OpenHuman 可以接入 118 個信源，就是用來干這個的：

你接了一個 Gmail，就有一棵 Gmail 源樹。接了一個 Slack 頻道，就有一棵 Slack 源樹。

每棵樹獨立管理自己的原始數據。

第二層：主題樹（Topic Tree）—— 按人物/項目/話題聚合

當某個實體（比如你的同事"張三"）在多個來源中反復出現，系統會自動為"張三"創建一棵主題樹，把他相關的所有信息——郵件、聊天、文檔——都聚合到一起。

第三層：全局樹（Global Tree）—— 跨來源的每日/周/月/年回顧

每天凌晨，系統自動跑一次，把所有源樹當天的"精華"匯總成一份每日摘要。

7 個每日摘要再壓縮成一個每周摘要，4 個每周摘要壓縮成每月……以此類推。

產品洞察：

大多數 AI 記憶是"平"的——所有信息都在一個層面上。

OpenHuman 的記憶是"立體"的——你能從全局看全貌，也能沿著某個實體一路鉆到原始對話。

Bucket-Seal 機制：自動壓縮的引擎

三層樹是怎么"自動整理"的呢？

它有一個叫Bucket-Seal的機制。

翻譯成中文是：桶 + 封印，也基本就是它的工作原理：

新數據進來后，先扔進 L0 緩沖區（桶）
當桶滿了——具體來說是累計達到 50,000 tokens，或者積累了 10 條數據——觸發"封印"
封印時，把桶里所有內容交給 LLM，生成一份摘要（SummaryNode）
這份摘要自動升入 L1 層
當 L1 層也積累了 10 個同級摘要，再觸發一次封印，升入 L2……
如此級聯向上，每一層都是一次"壓縮"

啥用呢？

假設你把飛書連上作為信息源了（它還不支持……）：

你 3 個月前在飛書跟同事討論了一堆信息，它們進入記憶系統后，會被自動壓縮成一段精煉的摘要，掛在那棵源樹的 L1 或 L2 節點上。

當你的 AI 需要"回憶"那次討論，它可以從全局樹的月度摘要→周度摘要→源樹的 L1 摘要，一路精確導航到原始對話。

不是全量搜索，是層級導航。或者叫“漸進式披露記憶”。

產品洞察：

Bucket-Seal 的精髓在于它的惰性——不主動干活，滿了才壓縮。這保證了兩個重要特性：

低成本：熱路徑（數據進來時）沒有 LLM 調用，只有廉價的啟發式評分
不丟信息：壓縮發生在后臺，原始數據始終保留在磁盤上

04 / 數據是從哪來的？

記憶樹的"原料"從哪來？這是 OpenHuman 另一個值得拆解的設計。

Composio：118+ 服務的一鍵接入

OpenHuman 底層用了 Composio[1] 作為數據接入層，提供 118+ 第三方服務的 OAuth 一鍵接入。

已原生支持自動攝取的服務包括：

類型服務說明 Chat Slack / Discord / Telegram / WhatsApp 消息自動同步 Email Gmail / 通用 IMAP 郵件自動拉取 Document Notion / Google Drive / 會議記錄文檔自動入庫 Dev GitHub / GitLab 代碼和 Issue 追蹤 Social Reddit / Instagram / Facebook 社交媒體監控

關鍵機制：Auto-fetch。

每個接入的服務，每隔 20 分鐘自動同步一次新數據。

不需要你手動觸發——連上 Gmail，它就開始幫你"記"每一封新郵件。

從原始數據到標準化格式

不管數據從哪來，最終都要經過一個標準化器（Canonicalizer），變成統一的 Markdown 格式：

聊天記錄：## 2026-05-19T14:30:00Z — 張三\n消息內容
郵件：From: 張三 | Subject: 項目進展 | Date: ...\n正文內容
文檔：直接裁剪為 Markdown body

標準化后，進入分塊器，切成 ≤3000 tokens 的小塊，每塊生成一個確定性 ID（基于內容的 SHA-256 哈希）。

05 / 它不只是"記住"——還有"想"

OpenHuman 記憶系統還有一個有意思的設計：它有一個"潛意識"模塊。

Subconscious：后臺一直在想

大多數 AI 助理是"你問我答"的模式——你不說話，它就安靜地等著。

OpenHuman 不是。

它有一個后臺循環，每 5 分鐘跑一次"tick"（心跳）。每次 tick：

構建態勢報告：從記憶樹中拉取最新變化——哪些實體熱度在漲？哪些新摘要剛生成？最近有什么反思？
評估任務：檢查有沒有待辦事項該做了
生成反思：發現跨來源的模式、異常、機會

反思的六種類型：

類型含義示例熱度突變某個實體被高頻提到了 "張三在 Slack/郵件/Notion 都出現了" 跨源模式多個來源指向同一件事 "Gmail 和 Slack 都在討論同一個客戶問題" 每日摘要新的全局回顧生成了 "今天的重要事件匯總" ? 截止提醒引用了近截止日期的摘要 "項目 X 的 deadline 是明天" ?? 風險模式發現潛在風險 "連續 3 天沒人回復那封關鍵郵件" 機會模式發現潛在機會 "競品剛發布新功能，你的產品有對應優勢" 安全邊界：觀察但不行動

這些反思不會自動執行任何操作——它們只出現在 Intelligence Tab 里，等你來看。

如果 AI 判斷需要執行寫操作（發郵件、創建文檔等），會創建一個 escalation（升級請求），需要你手動批準。

產品洞察：

這背后的理念是——AI 應該是一個"觀察者"而不是"行動者"。它負責發現、整理、提醒，但把決策權留給你。這比那些"全自動"的 Agent 設計要克制得多，也安全得多。

06 / Obsidian Wiki：你信任你的 AI 的記憶嗎？

這是 OpenHuman 記憶系統最有"品味"的一個設計決策：

所有記憶，字面上就是你電腦上的 Markdown 文件。

你可以用 Obsidian 打開這個文件夾，看到 AI 的每一個"記憶"：

每條原始對話、每封郵件、每篇文檔，都是一個.md文件
每個層級摘要，也是一個.md文件，通過[[wikilink]]鏈接到它的子節點
自動標簽（person/張三project/Phoenix）讓 Obsidian 的圖譜視圖直接變成知識網絡

他們引用了一句話：

"You can't trust a memory you can't read."

你無法信任一個你看不到的記憶。

這句話直接引用了 Karpathy 的 Obsidian Wiki 工作流——一個你生命中每件有趣的事都變成可鏈接筆記的個人知識庫。

這意味著：

透明性：AI 記錯了東西，你直接找到那個文件，改掉它
可遷移性：不用 OpenHuman 了？你帶走一個完整的個人 Wiki
可審計性：你隨時可以審查 AI 到底"記住"了你的哪些信息

07 / 技術細節：它"不吃"LLM 的算力

記憶系統的運行成本是做產品時必須考慮的。

OpenHuman 有幾招控制成本的設計：

設計作用效果熱路徑無 LLM 數據進來時只做啟發式評分攝入零 LLM 成本 TokenJuice 壓縮工具調用結果進入 LLM 前壓縮 80% 6 個月郵件同步成本個位數美元惰性主題樹不熱的實體不建樹避免為冷門信息浪費資源軟回退機制 LLM 摘要失敗時用簡單拼接替代管道永不中斷本地模型優先簡單任務用本地 Ollama 免費評估

產品洞察：

這里有一個很重要的產品原則——確定性優先于概率性。

熱路徑上沒有 LLM 調用，意味著你的記憶系統不會因為 API 限流、模型故障而停擺。LLM 只在后臺"深度整理"時才登場。

08 / 它"不夠好"的地方

好歸好，但對國人不友好。

OpenHuman 目前支持的信息源渠道：

Slack、Gmail、Notion、Google Drive、GitHub、Discord、Reddit、Instagram、Facebook、WhatsApp……

全是海外 App。

對于中國的個人用戶和產品經理來說，我們日常用的是什么？

微信 / 飛書 / 釘釘（聊天）
微信讀書 / 得到（知識）
石墨文檔 / 飛書文檔 / 語雀（協作）
小紅書 / 即刻 / 知識星球（社區）
本地的 Word / PDF / Markdown 文件（工作資料）

OpenHuman 的記憶系統做得再好，如果我的數據源喂不進來，就等于沒有記憶。

好在它是開源的。并且它的記憶樹架構和數據源是解耦的。

標準化器（Canonicalizer）把任意數據源轉成統一 Markdown，然后才進入記憶樹。這意味著——

只要我們能把任何格式的文檔（Word、PDF、Markdown、JSON、純文本）標準化成 Markdown，就能復用整套記憶樹的邏輯。

這正是我們需要做的。

09 / 一個解決思路

基于 OpenHuman 記憶系統的核心邏輯，我設計了一個Skill（技能）。

它能做什么：

指定任意本地文件夾，Agent 自動掃描并識別所有文檔（Word、PDF、Markdown、JSON、純文本）
根據文檔規模制定處理計劃，半夜自動激活來干活，干完輸出交接文檔
統一轉成 Markdown，按照 OpenHuman 的記憶系統邏輯進行記憶抽取
輸出為 Obsidian Wiki——帶標簽、帶層級、帶 wikilink 的完整知識庫

你只需要把你電腦上的文件夾路徑告訴它。

這個 Skill 的 1.0 版本我放在 AI 學習行動圈知識星球里了，后續我會持續迭代它的穩定性，感興趣可以在星球搜索「記憶樹」下載體驗。

10 / 關于 AI 學習行動圈

這是我 23 年底開始，和人人都是產品經理社區共同運營的一個圈子，截止目前已經持續運營、維護超過 700 天了，已有超過 5000+圈友！

我的各種 AI 研究心得、發現的好應用、開發的小項目都會在里面分享，目前圈子有核心三個交流學習平臺。

8 個微信群，早報和日常交流

微信群里每天一早有 AI 早報，上下午還有“讀報時間”，以及我每天不定期刷屏級的各種 AI 工具體驗、提示詞編排思考、行業新聞解讀同步。

以及，你可以在群里討論任何與 AI 相關的工具、應用問題，幾乎都能找到答案。

騰訊文檔-圈友空間

用來沉淀體系化、深度的 AI 文章和超長的工程化提示詞，不定期更新。

當前包括：Claude code、Cursor、Manus等頂級產品的系統提示詞和工具列表，各種深度的 Agent 白皮書和實踐指南

知識星球-每日報告、工具和實戰經驗分享

我在星球里主要維護「實戰分享」「工具箱」和「情報局」三個標簽

實戰分享是可以在日常工作和生活中直接應用的提示詞和效率工具。上面截圖里的 Step-Back 提示詞就非常好用，堪比 o4。在公眾號、直播中演示的所有 AI 實戰應用的提示詞也都在這個標簽下。

AI 工具和鮮知道就是好用的、熱門的 AI 工具、資訊分享，我把那些太技術、太浮夸的都篩選了，放進這個標簽的都是可以直接用來的好玩兒！

加入圈子，跟 5000+ 行動派一起玩 AI、聊 AI，精進起飛~

Composio: https://composio.dev

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.