![]()
作者 | 黃小藝
郵箱 | huangxiaoyi@pingwest.com
Manus在去年3月引爆了“通用Agent”的概念——不再是大模型套個殼,而是真正能自主規(guī)劃、調用工具、端到端執(zhí)行復雜任務的獨立系統。它給整個行業(yè)建立了一種想象力:Agent是一個獨立于大模型的品類,有自己的技術棧和產品邏輯,不會輕易被基礎模型“吃掉”。
一大批“通用Agent”跟進了這個敘事。但一年過去,你很難再聽到它們的新動向。
舊人走,新人來。這一輪Agent的關鍵詞來了:Proactive。
上一波Agent的核心是“你給任務,它去執(zhí)行”;這一波的區(qū)別是——它不等你開口。 它自己盯著你的郵件、日歷、文檔、聊天記錄,發(fā)現該做的事就主動推到你面前,甚至直接替你做了。
OpenClaw在今年直接帶火了這個概念,以及它背后的Runtime心跳體系——Agent不再是被動等待指令的工具,而是一個7×24小時在后臺巡航的“集成員工”。在此之前,谷歌管類似的東西叫Ambient Agent,VC們則套的是“從Copilot到Autopilot”的框架。
但名字其實不重要。重要的是:這一波 Agent 創(chuàng)業(yè)公司,又給自己講了一個新故事——技術更先進、想象力更大、護城河更深,不會被模型吃掉。
而這,正是上一波 Manus 們也講過的故事。
上一輪的贏家,贏的是創(chuàng)始人和投資人;這一輪值得期待的,是有沒有一家,能讓公司本身贏。
我們先來看看,誰在場上。
1
新一波Proactive Agent產品
相比上一輪以Manus為代表的通用Agent(你給任務,它去執(zhí)行),Proactive Agent的共同特征是它們吃進你各式各樣的上下文——郵件、日歷、通訊APP、屏幕、端側文檔——然后主動生成行動建議或直接替你執(zhí)行。
ColaOS:情感優(yōu)先
產品介紹:ColaOS是首個提出“Soul-First”的AI操作系統。核心創(chuàng)新在三層:第一,強調無感上下文獲取——通過分析用戶的文件、瀏覽記錄等數字痕跡自動構建畫像,不需要你手動填任何資料就能實現個性化服務;第二,主動式任務執(zhí)行——支持“One Prompt”深度理解,比如一句“互聯網尋回犬”指令,它會自動拆解為多平臺監(jiān)控、智能篩選和定期推送;第三,人格化交互設計——具備思緒透明、自我進化和主動關懷三個維度的“靈魂系統”。
典型案例包括整理桌面時發(fā)現用戶壁紙是某一電影,ColaOS能主動提醒該電影即將上映,自動關聯用戶關注事件。
總體來看,Cola的界面十分簡潔,和其他Proactive Agent的根本區(qū)別在于:它不只是在幫你干活,而是在試圖建立一種持續(xù)的理解關系,這點體現在產品功能和交互設計上。
比如,語音入口更醒目;有心跡功能——會寫“日記”。
![]()
透明思緒并非單純的模型思維鏈,更像AI自己的內心OS。
![]()
團隊及融資背景:由ListenHub團隊開發(fā),2026年年初ListenHub母公司MarsWave宣布完成了200萬美元天使+輪融資,由天際資本領投,小米聯合創(chuàng)始人王川跟投。同時,MarsWave也對外公布了盈利狀況:目前公司年經常性收入(ARR)已突破300萬美元,并達到月度盈虧平衡,成為少數已跑通盈利模型的AI原生公司。
AirJelly:屏幕即上下文
產品介紹:桌面端主動式AI助手,2026年4月上線。
在屏幕上以一只懸浮的小水母形態(tài)持續(xù)存在。最大的設計亮點是“Enter鍵意圖捕獲”——不像傳統錄屏Agent那樣不間斷截取屏幕畫面(成本高、數據冗余),而是在你按下Enter鍵的瞬間捕獲屏幕上下文,把這個操作建模為一個事件,再轉化為可追蹤的任務。
![]()
主動推送鏈路:截圖→分析→建模Event→歸納Task→推斷Next Step→觸發(fā)Proactive→Agent執(zhí)行→推送給用戶。核心指標看兩個:Token消耗量(證明Agent真的在幫用戶干活)和Proactive接收率(用戶愿不愿意接受推送,代表整條鏈路是否正確)。
創(chuàng)始人背景:創(chuàng)始人柏特,西安電子科技大學人工智能專業(yè),曾在字節(jié)跳動主導開發(fā)MineContext(一款上下文工程產品,AirJelly的技術腳手架)。2025年嘗試將MineContext接入OpenClaw的Pi框架后,團隊發(fā)現Context+Agent執(zhí)行能產生1+1大于2的效果,2026年2月確定方向,轉型為主動式Agent。
融資情況:獲得五源資本投資,具體金額未公開。
AirJelly的“Enter鍵觸發(fā)”是一個核心工程取舍——與其像其他錄屏Agent一樣不停截圖然后用視覺模型識別(成本高、噪音多),不如只在用戶有明確操作意圖的瞬間捕獲上下文,數據更干凈、成本更低。
通過Enter+截圖,相比Cola,AirJelly更像Agent全天候和你一起使用電腦,它的“操作臺”也更加豐富。但小水母以懸浮窗形態(tài)的“窺屏”,如何把控干擾性和主動性是一個邊界問題。
Paperboy:本地意圖識別
產品介紹:macOS桌面端Proactive Agent,目前處于Private Beta階段。定位“ambient desktop assistant”——在后臺持續(xù)觀察你的工作方式,跨平臺學習你的全部上下文,然后在你開口之前就把事情做了。
名字來源很直白:以前送報紙的paperboy知道你家在哪、你幾點起床、下雨天報紙該放哪。Paperboy想建立的就是這種關系——可靠、私人、用得越久越好用。
![]()
技術上有幾個值得注意的選擇:第一,本地推理優(yōu)先。所有上下文都存在本地,利用端側模型在200毫秒內完成意圖推斷——不是識別你按了什么鍵,而是推斷你為什么按這個鍵。團隊認為現在本地推理終于快到能做實時意圖識別了;第二,上下文邊界可解釋。Netflix追劇記錄不該污染你的工作推薦,工作壓力不該影響你和朋友聊天的語氣——不同場景的上下文有明確隔離。第三,權限細粒度控制。“幫我管郵件”不等于永久訪問所有郵件,而是指定發(fā)件人、時間段、項目范圍。
團隊背景:John Yang,YC背景,此前創(chuàng)辦了Million(React極速性能優(yōu)化框架),從Pratt休學;Vivian Kong,沃頓商學院背景。
融資情況:2026年1月完成了$5M的種子輪融資,投資方未公開。
相比Cola和AirJelly更全棧的野心,Paperboy更像一個安靜但靠譜的私人秘書。它不試圖成為你的操作系統,而是默默在后臺幫你把信息整理好。目前上一輪內測已關閉,產品暫時還未上線。
Boxy:交互創(chuàng)新
產品介紹:面向海外市場的Proactive Agent。核心做法是通過授權獲取用戶的社交數據——WhatsApp、LinkedIn、Instagram等應用,在虛擬機內控制鼠標,合規(guī)拿到全量歷史聊天記錄和瀏覽數據,把所有信息流蒸餾成一張卡片——檢測到的上下文、建議的行動方案,直接推送給用戶,右劃執(zhí)行、左劃拒絕。
![]()
比如你在趕報告,合作方發(fā)消息問能不能改日程,Boxy發(fā)現你明天下午有空,直接推一張卡片:“已確認明下午無會,是否回復'沒問題,明天下午2點線上見'?”
團隊背景:創(chuàng)始人John,1998年,12歲赴美留學,畢業(yè)于Emory University。AGI浪潮前作為第8號員工加入MiniMax,參與從零搭建AI數據管線和多模態(tài)數據采集系統。
融資情況:近期獲得紅杉中國種子基金數百萬美元融資。
Boxy最有意思的地方是虛擬機數據獲取這條路——既繞開了平臺API封鎖(豆包手機被其他大廠封禁就是前車之鑒),又比錄屏方案拿到的數據深得多(完整聊天歷史vs屏幕片段)。“卡片劃動”很新穎,作為RLHF機制也比傳統對話框的反饋效率高,用戶每次劃動都在訓練模型但感知不到負擔。
Creao :對話即自動化
產品介紹:“7×24小時AI員工”,2026年3月上線了新版本。新版本中,用戶和Creao的交互方式是:你描述一個工作任務,Agent自己拆解、自己寫代碼實現、在獨立沙盒環(huán)境里運行。任務跑通之后,系統會主動建議你把這個流程保存為一個可復用的Agent——以后可以定時自動運行,不需要每次重新來過。這是它的Proactive設計:不是等你提問才回答,而是識別出你有重復性工作后,主動幫你固化成自動化流程。
創(chuàng)始人背景:CEO Kai Cheng,十年產品級AI系統構建經驗。聯合創(chuàng)始人Clark Gao負責GTM,此前在LinkedIn和騰訊搭建數據團隊。CTO Peter Pang,前Meta Llama 3團隊研究科學家,曾在Apple做多模態(tài)模型。公司2025年1月底成立,產品方向經歷了兩次轉型:最早做類似Dify的工作流工具;2025年6月轉做Vibe Coding平臺,9月上線;2026年1月開始第二次轉型,2月完成團隊AI-first改造,一個月內從頭重構整個新產品,迭代速度快。
融資情況:剛剛完成千萬級美金融資,領投方為 Prosperity7 Ventures——阿美風險投資(Aramco Ventures)旗下的多元化風投基金和經緯創(chuàng)投,并獲得過往投資人—包括云啟資本、MONOLITH、高瓴創(chuàng)投、紅杉中國、華業(yè)天成資本持續(xù)加注。在過去不到一年的時間內,CREAO AI已累積完成超3000萬美元融資。
Creao的產品邏輯比較實在:“先手動做一次,好用就自動化”——這比直接許諾“全自動Agent”要誠實。$20-$150/月的定價已經上線,說明它過了demo階段。核心問題是:當對話變成自動化Agent后,質量能不能持續(xù)穩(wěn)定?這是所有“對話轉工作流”產品的共同挑戰(zhàn)。
1
比Proactive概念更重要的,是“用戶是誰”?
回頭看上面這份名單——能真正跑起來不多。Paperboy、Boxy還在waiting list,Creao已上線但更接近“對話固化為流程”的工具,離純 Proactive Agent還有距離。除此之外,目前還有不少Proactive Agent正在準備上線,例如FreeU等。
這是一個挺奇特的狀態(tài):詞已經爛大街,但產品沒幾個能讓普通用戶上手。
我們在《AI創(chuàng)業(yè)公司們,困在“眼前一黑”的賬單里》那篇里展開過,一種原因是主動型Agent對上下文和模型能力的需求更大,在SOTA模型Token單價沒跌、任務復雜度反而陡升的情況下,結果就是普遍的:發(fā)得了聲,跑不起量。
此外,另一個原因是Proactive不是2026年才發(fā)明的詞,這個概念早就比產品跑得快了。
2023年和2024年,學術界就出現了大量區(qū)分Reactive和 Proactive Agent的論文和討論,直到 2025 年下半年后,跨會話記憶、Agent 間通信、后臺心跳等基礎設施依次補齊,“主動性”才從一個論文術語、一個小功能的迭代,變成能支撐整體產品敘事的代際定義。
但話說回來,“新代際真的來了”這種敘事,Agent 圈每一輪都講過。
過去三年,Agent 賽道的標簽換得比模型迭代還勤:從AutoGPT到Autonomous Agent,從Copilot到Autopilot,中間還穿插著谷歌的Ambient Agent、Agentic AI 等等變體。每一輪熱潮來的時候,所有產品都急著給自己貼上新標簽——哪怕底層技術的迭代,遠沒有名詞更換得那么快。
這種概念跟隨的代價也是雙倍的。對用戶來說,每隔幾個月就要重新理解一遍“Agent 到底是什么”——你剛搞懂 Copilot,它告訴你現在是 Autopilot;你剛搞懂 Autopilot,它又說其實應該叫 Proactive;對創(chuàng)業(yè)者來說,每一輪熱潮都會吸引一批新玩家、推高一波估值、制造一批 PPT。但熱潮一過,沒有找到真實場景的產品就要面臨“敘事重構”,不管它的Demo多酷。
上一輪的通用 Agent,就是這么變沉默的。
所以其實重要的不是你叫自己 Copilot、Autopilot 還是 Proactive。重要的是:你是否真的在替客戶/用戶完成他們原本的工作。
Proactive Agent的本質,不是表面意義上的“主動性”——主動性只是它的一種表現。真正的轉變是:它從一個“執(zhí)行工具”,變成了一個“任務結算單位”。它能吃進多少 context、調用多少工具,很炫酷,但那是地基;客戶愿不愿意按結果付錢,愿意付多少,才是核心。
以Harvey為例,2022 年成立,早期做的是律師 Copilot——幫律師查案例、起草文件、做法律研究。后來,它推出了 Agent 模式,能自主執(zhí)行端到端的法律工作流:備忘錄撰寫、盡職調查、合同監(jiān)控。再之后,是2026年4月的內部Agent “Spectre”披露——主動監(jiān)控律所的數據和事件,發(fā)現潛在問題就提醒,Proactive。
這個技術演進非常的自然:先讓人信任你的建議,再讓人信任你的執(zhí)行,目前Harvey估值已經到了110億美元。
問題是,這個樣板,新一輪的 Proactive Agent不好學。Harvey 能跑通,依賴一個 C 端沒有的前提:法律、會計、保險這些行業(yè)本身就堆滿了規(guī)則、審計流程和合規(guī)要求。規(guī)則越明確、流程越標準化,AI 從“建議”到“自主執(zhí)行”的跨越就越順暢——因為檢驗標準是現成的。
Sequoia Capital把這個分界叫做 “Intelligence vs Judgment”:Intelligence工作(規(guī)則復雜但規(guī)則存在)正在被 AI 接管;Judgment工作(需要經驗、品味、直覺)暫時還是人類的領地。翻譯一下就是:哪里有現成的對錯標準,哪里就先被 Proactive Agent 拿下。
而 C 端的Proactive Agent缺的就是這個Intelligence前提。多大的主動性合適?需要拿多少權限?要找什么樣的用戶、切什么樣的場景?怎么定價?怎么觸達?通用可以是終局,但人群的增長路徑需要選擇,每一道題都得自己摸索。
決定一個Agent產品生死的,從來不是它叫什么名字。Proactive也好,Autonomous也好,Ambient也好——這些詞的半衰期大概是六個月。但有一個問題的半衰期是永久的:你到底在幫誰,解決什么問題?
答得出來的人,不管風口怎么換,都會留在場上。
![]()
點個“愛心”,再走 吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.