![]()
整理| Tina
Anthropic 推出了最新的 Claude Code 桌面應用。
這本來應該是一件很順理成章的事。CLI 當然有它的價值,但如果真要把 agentic coding 推向更大規模、更高頻、更接近日常開發的使用場景,圖形界面幾乎是繞不過去的。尤其是在你同時處理多個任務、多個線程、多個上下文的時候,一個慢、卡、狀態又不透明的命令行界面,確實很難說是“最終形態”。從這個意義上說,Claude Code 桌面版的發布,本來是一個值得期待的節點。
Anthropic 顯然也對它寄予厚望,官方賬號親自下場發推,外界預熱已經持續了幾個月,整個發布姿態都在傳遞一個信號:他們終于要把 Claude Code 從一個“能用的 CLI 工具”,推進成一個更完整的正式產品了。
![]()
但真正的問題在于,這個桌面版一旦開始上手,給人的感受并不是“終于成熟了”,而是“怎么會爛成這樣”。
新桌面版爛到根本沒法用
這個版本上線才兩天,就在社區里迅速積累起一波密集吐槽。
用戶提到,iOS 下,鍵盤會突然卡住。有時連最核心的輸入框都會頻繁消失,而且幾乎每次會話都會遇到,必須退出再重新進入聊天才能恢復。
![]()
![]()
Windows 版本也一樣會經常卡頓和崩潰。
![]()
界面層面的問題也很明顯:按鈕位置不符合預期,聊天框還頻繁閃爍,整體交互體驗不穩定。
![]()
![]()
另一個明顯問題是,一些原本最該體現效率價值的自動化功能,本身就不太穩定。比如用戶想用 Routines 跑一個簡單的數據庫內容處理流程,結果不管怎么折騰,始終連不上數據庫。
![]()
不少人吐槽 bug 多到實際上沒法用。
![]()
![]()
![]()
上手一小時,直接撞出 40 多個 bug
網上很快就有人曬出了一份 bug 清單,里面列了 40 多個問題。更夸張的是,這 40 多個問題,都是 Theo 在一個小時的試用過程中集中撞出來的。
![]()
這 40 多個 bug,大致可以分為三類。一類是快捷鍵和標簽頁邏輯混亂,很多快捷鍵只在主標簽頁生效,切換標簽時操作對象還會亂跳;一類是側邊欄和項目管理彼此割裂,項目列表、recent projects、線程拖拽、菜單展開方式彼此對不上,用戶很難搞清楚當前到底在操作什么;還有一類更直接,屬于一些基礎功能本身就不成立,比如“打開文件”并不會真正打開文件,創建 fork 會連帶生成 worktree 卻沒有任何提示...
這些問題寫在列表里還只是觀感不佳,放進真實任務里,很快就會變成一連串的實打實的使用障礙。
比如在一個再普通不過的場景里,讓它去分析一個應用可能存在的性能問題,本來只是一個起手測試,還沒涉及真正改代碼,系統就已經開始不穩定。任務一啟動,就先卡住了將近一分鐘,隨后 agent run 隨機停住,線程直接凍結,界面上的圖標卻還掛在那里,像是在告訴你它仍然在運行。
![]()
但實際上,它已經不動了。UI 沒有任何提示,也沒有報錯,沒有結束,也沒有失敗。你眼前看到的是一個仿佛還活著的線程,實際面對的卻是一個已經死掉的流程。
這個問題,本質上可以說是它出錯的門檻太低了。不是在長鏈路任務里失手,也不是在高復雜度項目里崩掉,而是在一個本該最容易跑通的基礎場景里,把任務執行、線程狀態和界面反饋三件事一起做亂了。這種狀態錯亂,放在聊天產品里都不算小問題,放在開發工具里就更致命,因為開發者最依賴的,恰恰是系統狀態的清晰、反饋的準確,以及操作結果的可預期。
![]()
接著往下操作,在界面這一層,又會遇到更多問題。比如分屏時,你明明在右側窗口里操作,打開 terminal 后,它卻出現在左側分屏上;而且 terminal 一旦開出來,Tab 鍵會被當作輸入鍵使用,也就沒法再順手切回其他窗口。
與此同時,terminal 右上角的關閉按鈕旁邊又貼著 拖拽區域,結果那個 X 很難點中。也就是說,terminal 一旦開出來,輸入會受影響,想關又不那么容易關掉。
還有些極其荒謬、莫名其妙的 bug:
比如語音模式下,所有輸入框都會自動輸入文字,而不是只輸入你當前選中的那個。
“v more”下拉菜單根本不是下拉,而是往側邊展開的(但箭頭是向下的)。
“打開文件”會執行大約 15 種不同的操作,但沒有一種操作是真正打開文件。
可以拖拽線程,但實際上永遠不能改變它們的順序,任何情況下都不行。
可以在 diff 視圖里套娃式地嵌套可折疊側邊欄。
diff 視圖里的“x”按鈕會關閉整個標簽頁,而不是只關閉 diff 視圖。
他吐槽說,“我不太相信那些說自己已經用這個應用用了好幾周的人,真的認真用過它。我甚至還沒開始用它干活、改代碼,就已經連續撞上了五六個這樣的 bug,感覺自己都快瘋了。”
“現在的問題是,很多人只是接受了這種質量。”即便存在大量更穩定、功能更完整、甚至開源的替代方案,用戶仍然在使用 Claude Code,僅僅因為它綁定了模型入口。“他們不是在為這個界面付費,他們是為模型付費,但結果卻要忍受這個界面。”
100%AI 編寫,落地質量堪憂
對此,還有其他網友吐槽:“一個整天說‘軟件開發已經被解決了’的公司,現在做成這樣,確實挺好笑的。”不過,也因此至少說明開發者的飯碗還沒丟。
畢竟 Anthropic 過去這一年的對外敘事一直很激進,核心就一句話:代碼越來越多是 AI 寫的,而且比例還在一路往上抬。從“80% 到 90%”,到“90%”,再到“100%”,數字一次比一次高。到了 2026 年初,“內部大多數產品基本已經是 100% AI 編碼”的說法,也已經被他們反復講了很多次。
2025 年 3 月,CEO Dario Amodei 在美國外交關系委員會上說:“再過 3 到 6 個月,AI 就會寫出 90% 的代碼。”
2025 年 5 月,Boris Cherny 在播客《Latent Space》中表示:“整體來看,大概 80% 到 90% 的代碼是 Claude 寫的。”
2025 年 9 月,Amodei 再次發聲,但開始收口:“在 Anthropic,70%、80%、90% 的代碼是 Claude 寫的。”注意這個區間——70% 和 90% 是兩回事,但媒體只抓了 90%。
2025 年 10 月,Amodei 在 Dreamforce 與 Marc Benioff 同臺時說:“我之前預測過,六個月內 90% 的代碼會由 AI 完成,現在已經實現了。”但被追問后,他又補了一句:“也不是所有情況都這樣。”
2025 年 12 月,Boris Cherny 發推:100%。
2026 年 2 月,CPO Mike Krieger 在 Cisco AI Summit 上表示:“目前在 Anthropic,大多數產品基本可以說是 100%。”
2026 年 3 月 7 日,Boris Cherny 再次確認:“Claude Code 是 100% 由 Claude Code 寫的。”
![]()
問題在于,這個“100%”一旦真正落到產品上,情況就開始變得不太對勁。Claude Code 桌面版給人的感覺,不像一個打磨完成的正式產品,更像一個邊寫邊補、一路 vibe 出來的半成品。問題不在于它偶爾出錯,而在于它在最基礎的使用路徑上就已經不穩,這才是最讓人擔心的地方。
有人算了筆賬:這些工程師一天能拿到一千萬到一千五百萬 token,最后做出來的就是這個效果。更讓人困惑的是,從什么時候開始,行業默認“能大規模生成高質量 token”就等于可以為了速度把編程質量一起扔掉?
這種不滿,其實不只是針對桌面版這一次翻車。回頭看,之前的代碼泄露,已經提前把問題暴露得很徹底了。
其中一個反復被提到的文件:print.ts。里面只有一個函數,但這個函數足足寫了 3167 行代碼,包含 486 個分支判斷,嵌套深度達到 12 層。有人專門把這個函數里塞的東西列了一遍:agent 的運行循環、SIGINT 中斷處理、限流邏輯、AWS 認證、MCP 生命周期管理、插件加載、通過 while(true) 輪詢“team lead”、模型切換、以及對中斷的恢復機制……幾乎所有核心邏輯,都被硬塞進了這一個函數里。而實際上,這至少應該拆成 8 到 10 個獨立模塊。
類似的情況,不止這一處。QueryEngine.ts 寫到了 4.6 萬行,Tool.ts 接近 3 萬行,commands.ts 也有 2.5 萬行,入口文件 main.tsx 單文件體積達到 785KB。不是某一段代碼出了問題,而是整個結構本身,就已經開始失控。
在 userPromptKeywords.ts 里,這家公司用來判斷用戶是否“情緒崩潰”的方式,是這樣一段正則:/\b(wtf|shit|fuck|horrible|awful|terrible)\b/i,也就是說,這家號稱擁有最先進大語言模型的公司,在做情緒識別時,用的還是最原始的關鍵詞匹配。這就像一家卡車公司,結果還在用馬來拉零件。也有人解釋,說正則更快、更便宜,不需要額外的推理調用,這在工程上是合理的。這話當然沒錯。但這恰恰說明這是一個“能跑就行”的工程選擇。便宜優先,速度優先,先上線再說。
工程文化是沒有開關的。一個能寫出 12 層嵌套、把所有邏輯塞進一個函數里的團隊,不會在寫模型訓練代碼、寫桌面應用的時候突然變得嚴謹起來。
這家公司一邊賣 AI 編程工具,一邊卻沒法用自己的 AI 編程工具做出一個質量過關的產品。那些百分比,從一開始就是用來講故事的,而不是用來交付產品的。80、90、95、100——在源碼被看見之前,沒有人真正問過,“100%”到底產出了什么。
AI 只是把原本的東西放大。原本有工程紀律,就會被放大成更好的產出;原本沒有紀律,就會以機器的速度放大成技術債。Anthropic 選了一條路:更快一點,讓 Claude 去檢查 Claude。出了問題,就再快一點。
如果在一家“構建未來”的公司里,“100% AI 編寫”意味著一個包含 486 個分支、3167 行代碼的函數,一個桌面應用包含無數 bug 就能上線,那這個未來需要的不是更快的工程,而是更好的工程。
如果這就是一家正在把行業往前帶的公司所代表的質量標準,那這個方向本身是有問題的。
https://x.com/theo/status/2044680030706663726
聲明:本文為 InfoQ 原創,不代表平臺觀點,未經許可禁止轉載。
會議推薦
世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?
AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構。14 個專題全面開放征稿。
誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.