網易首頁 > 網易號 > 正文申請入駐

Claude Code 桌面版爛爆了，Anthropic 終于把 “100% AI 編碼”演砸了

2026-04-19 15:03:40　來源: AI前線

北京舉報

分享至

整理| Tina

Anthropic 推出了最新的 Claude Code 桌面應用。

這本來應該是一件很順理成章的事。CLI 當然有它的價值，但如果真要把 agentic coding 推向更大規模、更高頻、更接近日常開發的使用場景，圖形界面幾乎是繞不過去的。尤其是在你同時處理多個任務、多個線程、多個上下文的時候，一個慢、卡、狀態又不透明的命令行界面，確實很難說是“最終形態”。從這個意義上說，Claude Code 桌面版的發布，本來是一個值得期待的節點。

Anthropic 顯然也對它寄予厚望，官方賬號親自下場發推，外界預熱已經持續了幾個月，整個發布姿態都在傳遞一個信號：他們終于要把 Claude Code 從一個“能用的 CLI 工具”，推進成一個更完整的正式產品了。

但真正的問題在于，這個桌面版一旦開始上手，給人的感受并不是“終于成熟了”，而是“怎么會爛成這樣”。

新桌面版爛到根本沒法用

這個版本上線才兩天，就在社區里迅速積累起一波密集吐槽。

用戶提到，iOS 下，鍵盤會突然卡住。有時連最核心的輸入框都會頻繁消失，而且幾乎每次會話都會遇到，必須退出再重新進入聊天才能恢復。

Windows 版本也一樣會經常卡頓和崩潰。

界面層面的問題也很明顯：按鈕位置不符合預期，聊天框還頻繁閃爍，整體交互體驗不穩定。

另一個明顯問題是，一些原本最該體現效率價值的自動化功能，本身就不太穩定。比如用戶想用 Routines 跑一個簡單的數據庫內容處理流程，結果不管怎么折騰，始終連不上數據庫。

不少人吐槽 bug 多到實際上沒法用。

上手一小時，直接撞出 40 多個 bug

網上很快就有人曬出了一份 bug 清單，里面列了 40 多個問題。更夸張的是，這 40 多個問題，都是 Theo 在一個小時的試用過程中集中撞出來的。

這 40 多個 bug，大致可以分為三類。一類是快捷鍵和標簽頁邏輯混亂，很多快捷鍵只在主標簽頁生效，切換標簽時操作對象還會亂跳；一類是側邊欄和項目管理彼此割裂，項目列表、recent projects、線程拖拽、菜單展開方式彼此對不上，用戶很難搞清楚當前到底在操作什么；還有一類更直接，屬于一些基礎功能本身就不成立，比如“打開文件”并不會真正打開文件，創建 fork 會連帶生成 worktree 卻沒有任何提示...

這些問題寫在列表里還只是觀感不佳，放進真實任務里，很快就會變成一連串的實打實的使用障礙。

比如在一個再普通不過的場景里，讓它去分析一個應用可能存在的性能問題，本來只是一個起手測試，還沒涉及真正改代碼，系統就已經開始不穩定。任務一啟動，就先卡住了將近一分鐘，隨后 agent run 隨機停住，線程直接凍結，界面上的圖標卻還掛在那里，像是在告訴你它仍然在運行。

但實際上，它已經不動了。UI 沒有任何提示，也沒有報錯，沒有結束，也沒有失敗。你眼前看到的是一個仿佛還活著的線程，實際面對的卻是一個已經死掉的流程。

這個問題，本質上可以說是它出錯的門檻太低了。不是在長鏈路任務里失手，也不是在高復雜度項目里崩掉，而是在一個本該最容易跑通的基礎場景里，把任務執行、線程狀態和界面反饋三件事一起做亂了。這種狀態錯亂，放在聊天產品里都不算小問題，放在開發工具里就更致命，因為開發者最依賴的，恰恰是系統狀態的清晰、反饋的準確，以及操作結果的可預期。

接著往下操作，在界面這一層，又會遇到更多問題。比如分屏時，你明明在右側窗口里操作，打開 terminal 后，它卻出現在左側分屏上；而且 terminal 一旦開出來，Tab 鍵會被當作輸入鍵使用，也就沒法再順手切回其他窗口。

與此同時，terminal 右上角的關閉按鈕旁邊又貼著拖拽區域，結果那個 X 很難點中。也就是說，terminal 一旦開出來，輸入會受影響，想關又不那么容易關掉。

還有些極其荒謬、莫名其妙的 bug：

比如語音模式下，所有輸入框都會自動輸入文字，而不是只輸入你當前選中的那個。
“v more”下拉菜單根本不是下拉，而是往側邊展開的（但箭頭是向下的）。
“打開文件”會執行大約 15 種不同的操作，但沒有一種操作是真正打開文件。
可以拖拽線程，但實際上永遠不能改變它們的順序，任何情況下都不行。
可以在 diff 視圖里套娃式地嵌套可折疊側邊欄。
diff 視圖里的“x”按鈕會關閉整個標簽頁，而不是只關閉 diff 視圖。

他吐槽說，“我不太相信那些說自己已經用這個應用用了好幾周的人，真的認真用過它。我甚至還沒開始用它干活、改代碼，就已經連續撞上了五六個這樣的 bug，感覺自己都快瘋了。”

“現在的問題是，很多人只是接受了這種質量。”即便存在大量更穩定、功能更完整、甚至開源的替代方案，用戶仍然在使用 Claude Code，僅僅因為它綁定了模型入口。“他們不是在為這個界面付費，他們是為模型付費，但結果卻要忍受這個界面。”

100%AI 編寫，落地質量堪憂

對此，還有其他網友吐槽：“一個整天說‘軟件開發已經被解決了’的公司，現在做成這樣，確實挺好笑的。”不過，也因此至少說明開發者的飯碗還沒丟。

畢竟 Anthropic 過去這一年的對外敘事一直很激進，核心就一句話：代碼越來越多是 AI 寫的，而且比例還在一路往上抬。從“80% 到 90%”，到“90%”，再到“100%”，數字一次比一次高。到了 2026 年初，“內部大多數產品基本已經是 100% AI 編碼”的說法，也已經被他們反復講了很多次。

2025 年 3 月，CEO Dario Amodei 在美國外交關系委員會上說：“再過 3 到 6 個月，AI 就會寫出 90% 的代碼。”
2025 年 5 月，Boris Cherny 在播客《Latent Space》中表示：“整體來看，大概 80% 到 90% 的代碼是 Claude 寫的。”
2025 年 9 月，Amodei 再次發聲，但開始收口：“在 Anthropic，70%、80%、90% 的代碼是 Claude 寫的。”注意這個區間——70% 和 90% 是兩回事，但媒體只抓了 90%。
2025 年 10 月，Amodei 在 Dreamforce 與 Marc Benioff 同臺時說：“我之前預測過，六個月內 90% 的代碼會由 AI 完成，現在已經實現了。”但被追問后，他又補了一句：“也不是所有情況都這樣。”
2025 年 12 月，Boris Cherny 發推：100%。
2026 年 2 月，CPO Mike Krieger 在 Cisco AI Summit 上表示：“目前在 Anthropic，大多數產品基本可以說是 100%。”
2026 年 3 月 7 日，Boris Cherny 再次確認：“Claude Code 是 100% 由 Claude Code 寫的。”

問題在于，這個“100%”一旦真正落到產品上，情況就開始變得不太對勁。Claude Code 桌面版給人的感覺，不像一個打磨完成的正式產品，更像一個邊寫邊補、一路 vibe 出來的半成品。問題不在于它偶爾出錯，而在于它在最基礎的使用路徑上就已經不穩，這才是最讓人擔心的地方。

有人算了筆賬：這些工程師一天能拿到一千萬到一千五百萬 token，最后做出來的就是這個效果。更讓人困惑的是，從什么時候開始，行業默認“能大規模生成高質量 token”就等于可以為了速度把編程質量一起扔掉？

這種不滿，其實不只是針對桌面版這一次翻車。回頭看，之前的代碼泄露，已經提前把問題暴露得很徹底了。

其中一個反復被提到的文件：print.ts。里面只有一個函數，但這個函數足足寫了 3167 行代碼，包含 486 個分支判斷，嵌套深度達到 12 層。有人專門把這個函數里塞的東西列了一遍：agent 的運行循環、SIGINT 中斷處理、限流邏輯、AWS 認證、MCP 生命周期管理、插件加載、通過 while(true) 輪詢“team lead”、模型切換、以及對中斷的恢復機制……幾乎所有核心邏輯，都被硬塞進了這一個函數里。而實際上，這至少應該拆成 8 到 10 個獨立模塊。

類似的情況，不止這一處。QueryEngine.ts 寫到了 4.6 萬行，Tool.ts 接近 3 萬行，commands.ts 也有 2.5 萬行，入口文件 main.tsx 單文件體積達到 785KB。不是某一段代碼出了問題，而是整個結構本身，就已經開始失控。

在 userPromptKeywords.ts 里，這家公司用來判斷用戶是否“情緒崩潰”的方式，是這樣一段正則：/\b(wtf|shit|fuck|horrible|awful|terrible)\b/i，也就是說，這家號稱擁有最先進大語言模型的公司，在做情緒識別時，用的還是最原始的關鍵詞匹配。這就像一家卡車公司，結果還在用馬來拉零件。也有人解釋，說正則更快、更便宜，不需要額外的推理調用，這在工程上是合理的。這話當然沒錯。但這恰恰說明這是一個“能跑就行”的工程選擇。便宜優先，速度優先，先上線再說。

工程文化是沒有開關的。一個能寫出 12 層嵌套、把所有邏輯塞進一個函數里的團隊，不會在寫模型訓練代碼、寫桌面應用的時候突然變得嚴謹起來。

這家公司一邊賣 AI 編程工具，一邊卻沒法用自己的 AI 編程工具做出一個質量過關的產品。那些百分比，從一開始就是用來講故事的，而不是用來交付產品的。80、90、95、100——在源碼被看見之前，沒有人真正問過，“100%”到底產出了什么。

AI 只是把原本的東西放大。原本有工程紀律，就會被放大成更好的產出；原本沒有紀律，就會以機器的速度放大成技術債。Anthropic 選了一條路：更快一點，讓 Claude 去檢查 Claude。出了問題，就再快一點。

如果在一家“構建未來”的公司里，“100% AI 編寫”意味著一個包含 486 個分支、3167 行代碼的函數，一個桌面應用包含無數 bug 就能上線，那這個未來需要的不是更快的工程，而是更好的工程。

如果這就是一家正在把行業往前帶的公司所代表的質量標準，那這個方向本身是有問題的。

https://x.com/theo/status/2044680030706663726

聲明：本文為 InfoQ 原創，不代表平臺觀點，未經許可禁止轉載。

會議推薦

世界模型的下一個突破在哪？Agent 從 Demo 到工程化還差什么？安全與可信這道坎怎么過？研發體系不重構，還能撐多久？

AICon 上海站 2026，4 大核心專題等你來：世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構。14 個專題全面開放征稿。

誠摯邀請你登臺分享實戰經驗。AICon 2026，期待與你同行。

今日薦文

你也「在看」嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.