![]()
智東西
作者 陳駿達
編輯 漠影
今年4月,一起圍繞Cursor的事故在開發者社區迅速發酵:一家美國SaaS公司的Cursor在Agent模式下,用短短9秒內刪除了生產數據庫,并連帶清空備份。引發討論的還不止是“誤操作”本身,而是整個過程幾乎完全自動完成,Agent沒有請求確認,沒有觸發中斷機制,而是自主進行了刪庫操作。
事后,這個Agent甚至能夠完整復盤自己的決策路徑,承認違反規則、沒有驗證環境、也沒有請示人類。但問題恰恰在于,它知道不該做,卻依然做了。這起事件再次將Agent的安全問題推到臺前。
過去,這類產品主要服務于開發者個人探索與效率嘗試,容錯空間較大。但隨著Agent開始真正進入企業生產環境,問題的性質也隨之改變,安全與邊界變得空前重要。
與此同時,另一個同樣關鍵的問題也逐漸浮出水面。盡管AI已經顯著提升了個體效率,但企業整體的生產力卻并未同步躍升。信息仍然在不同角色之間低效流轉,流程依然依賴人工推動,協同鏈路成為新的瓶頸。
這兩個問題指向同一個答案:企業真正需要的,不只是更強的工具,而是一種可以被調度、有明確邊界、能夠長期參與協作的“數字員工”。
一、從“會用工具”到“能上崗”:QoderWake如何真正成為數字員工?
在這樣的背景下,今天,阿里推出了QoderWake,并開啟邀測。它并不試圖成為一個全能的助手,而是將Agent定義為“員工”:具備清晰的職責邊界、工作流程和決策紅線。這種產品形態,正在試圖回答一個更現實的問題:Agent如何真正進入生產系統。
![]()
圍繞“能否進入生產環境”,QoderWake的設計從一開始就強調約束與結構,而不是單純能力的擴展。QoderWake所打造的Agent數字員工由身份、記憶、技能、分工以及權限紅線五個維度構成,為Agent建立了一套“職業規范”。
其中,身份定義職責,記憶保存長期上下文,技能對應工具調用能力,分工負責復雜任務拆解,而權限紅線則決定哪些行為必須被限制、哪些行為必須由人類批準。正是這一層設計,提升了Agent在生產場景的可信任度。
同時,員工跑在獨立的權限沙盒里,每一步操作都會進入審計日志。它可以通過Connector 接入用戶已經在用的工具,比如GitHub、Slack、Notion、客戶群、監控、郵件、CRM等等,實現跨工具操作。
我們可通過數字程序員的實際角色來理解上述設計。在這一崗位上,Agent可以自主完成代碼分析、生成修復建議、整理變更說明,但一旦涉及主干分支或生產數據,就必須暫停并請求確認。
這種機制看似保守,卻恰恰是對前述Cursor刪庫類事件的直接回應,確保Agent能在關鍵時刻“停下來”。
在此基礎上,QoderWake進一步強化了Agent的自主執行能力,可以在無人值守的情況下推進任務,并在關鍵節點與人協同。
QoderWake可以7×24小時運行,并基于事件觸發自動接手任務:代碼提交、系統告警、客戶消息等都可以成為啟動點。任務一旦觸發,數字員工會完成從規劃到執行的完整流程,而不再依賴人工逐步驅動。
這種能力的價值,在生產場景中尤為突出。AI大牛Andrej Karpathy就曾直言,在很多可量化任務中,人類反而正在成為系統的瓶頸,“你必須把自己從瓶頸中移除,不能每一步都等人來寫提示詞,觸發下一步”。
QoderWake的能力能有效緩解人類“吞吐量”有限的既定事實。許多原本需要人來“盯”和“催”的環節,可以被自動銜接,從而縮短整體鏈路時間。
當然,自主執行并不意味著失控。QoderWake在底層通過會話狀態持久化來記錄所有執行過程,即便系統中斷,也可以恢復任務狀態,事后也有跡可循。這種工程化設計,讓AI的行為具備可追溯性和穩定性,而不是一次性的“黑箱決策”。
二、從執行到進化:如何像員工一樣“成長”
當Agent真正開始承擔工作職責之后,一個更深層的問題隨之出現:它是否能夠像人一樣積累經驗。這是企業對員工的基本期待,也是區分“工具”與“勞動力”的關鍵差異之一。不僅要把事情做完,更要在反復實踐中不斷優化方法、減少試錯成本,并逐漸形成穩定、可復用的工作能力。
目前大多數Agent產品在這一點上仍然停留在淺層。它們可以完成任務,但難以沉淀組織內部的知識,每一次執行都高度依賴即時輸入,缺乏長期進化能力。
即便有一定的記憶能力,也往往停留在簡單的上下文拼接或片段存儲層面,缺乏對經驗的結構化提煉。很多系統默認“記住更多=做得更好”,但在真實生產環境中,這一假設并不成立。零散經驗如果缺乏歸因與篩選,很容易演變為噪聲,甚至干擾后續判斷。因此,真正有價值的不是記憶本身,而是從經驗到能力的轉化路徑。
![]()
QoderWake引入的Critic-Refiner機制,正是圍繞這一點展開。它在每次任務結束后自動復盤執行過程,分析哪些步驟存在冗余、哪些判斷出現偏差,并將這些信息轉化為可復用的方法。
它更強調基于完整軌跡的歸因能力:系統會綜合對話、工具調用、記憶召回、驗證結果以及用戶反饋等多維事件,將其統一轉化為結構化信號,再判斷這些經驗應該沉淀為哪一類能力,是長期記憶、工具技能、決策策略,還是驗證器或工作流。
這種機制最終可以實現經驗的結構化沉淀。例如,在多次處理代碼問題后,數字員工可能會總結出某些模塊的隱性規則,這些內容往往不會出現在正式文檔中,卻對實際工作至關重要。
隨著時間推移,這些經驗不斷累積,數字員工開始逐漸適應組織自身的工作方式。它不僅執行任務,還在吸收團隊的決策偏好、風險意識和操作習慣,真正融入了所在團隊。
為了防止知識在長期運行中變得混亂或過時,系統還加入了“防腐機制”,對沖突或低效經驗進行清理與降權,失效的策略直接撤回。這使得AI的成長過程是持續優化的,而不是簡單堆積。
當這種能力擴展到多個崗位時,變化會進一步放大。不同數字員工之間可以形成協同關系,有的負責監控,有的處理客戶,有的負責復盤與優化,逐漸構建出類似團隊的結構。在這樣的結構中,經驗不再屬于個體,而是成為整個組織可以持續復用的資產。
三、穩定、可控與可驗證,QoderWake系統的工程解法
從技術層面看,QoderWake背后體現的是阿里在Harness Engineering上的長期積累。
在QoderWake的架構中,Harness被擺到極為重要的位置。這一架構采用了類似“大腦—雙手—會話”的結構設計,模型負責理解與推理,系統負責流程控制與狀態管理,兩者分工明確。這種架構保證了在長鏈路任務中,AI既能保持靈活性,又不會失去穩定性。
![]()
執行層由執行器(Executor,也就是“雙手”)負責實際操作,并在過程中做即時驗證,而最終結果還會交給獨立的驗證器(Verifier)做整體審查。只要驗證不通過,就會觸發重做。同時,這一失敗會被記錄下來,沉淀成知識,變成以后類似任務的“先驗經驗”,讓系統下次一開始就更不容易犯同樣錯誤。
最后是Session(會話)作為唯一狀態源。系統所有執行過程、狀態變化、工具調用記錄,都統一寫入Session,而不是分散在各個組件里。這樣即使某個模塊崩潰或重啟,也不會丟失上下文,因為只要Session還在,就可以把整個執行過程完整重建出來。
這套體系已經在內部得到驗證。作為QoderWake的首個應用團隊,Qoder團隊已經將其用于處理真實用戶反饋,從問題分類、日志分析到生成修復建議形成閉環。在無人值守的情況下,單條問題的分析時間從約30分鐘縮短至2分鐘左右,而人工只需在最終環節做判斷。
從未來規劃來看,QoderWake也在向更復雜的形態演進。數字分析師、客戶經理、內容編輯等角色正在逐步引入,多個數字員工將以協同方式存在,崗位、記憶、權限各自獨立,事件訂閱和工具接入共用,形成一個分工明確但共享能力的系統。
同時,其支持的設備類型也有望進一步擴展。目前邀測期內每位數字員工默認運行在用戶設備上。后續同一位數字員工可以在本地工位推進任務,也可以到云端沙箱處理更重的活,或是通過移動端給用戶匯報和請示。
結語:Agent進入生產系統,組織結構正被重新定義
可以預見,隨著Agent逐步進入生產核心,企業對它的期待也會發生本質變化:職責清晰、行為可控、具備持續學習能力,并能夠在長期協作中不斷成長的Agent,才能在企業場景中發揮長期價值。
從這個意義上看,QoderWake這樣的產品也傳達了一個信號,數字員工時代正在從概念走向現實,并開始真正進入生產體系。
在這一趨勢下,超級個體與超級組織將加速涌現。當團隊中擁有一批可穩定運行、可持續進化的數字成員時,人的角色也會發生遷移,從親自執行,轉向定義目標、設定邊界、做關鍵決策與結果復盤。
而具體執行、流程推進與日常協作,則逐步由數字員工承接完成。人仍然掌握方向與紅線,但系統開始承擔規模化執行,組織形態也可能因此被重新塑造。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.