Claude桌面版翻車，AI編程神話真的破滅？

2026-04-21 10:58:41　來源: 主宰穩(wěn)場

四川舉報

分享至

Anthropic 終于還是把 Claude Code 做成了桌面應(yīng)用。

Anthropic 顯然也對它寄予厚望，官方賬號親自下場發(fā)推，外界預(yù)熱已經(jīng)持續(xù)了幾個月，整個發(fā)布姿態(tài)都在傳遞一個信號：他們終于要把 Claude Code 從一個“能用的 CLI 工具”，推進成一個更完整的正式產(chǎn)品了。

但真正的問題在于，這個桌面版一旦開始上手，給人的感受并不是“終于成熟了”，而是“怎么會爛成這樣”。

新桌面版爛到根本沒法用

這個版本上線才兩天，就在社區(qū)里迅速積累起一波密集吐槽。

用戶提到，iOS 下，鍵盤會突然卡住。有時連最核心的輸入框都會頻繁消失，而且?guī)缀趺看螘挾紩龅剑仨毻顺鲈僦匦逻M入聊天才能恢復(fù)。

Windows 版本也一樣會經(jīng)常卡頓和崩潰。

界面層面的問題也很明顯：按鈕位置不符合預(yù)期，聊天框還頻繁閃爍，整體交互體驗不穩(wěn)定。

另一個明顯問題是，一些原本最該體現(xiàn)效率價值的自動化功能，本身就不太穩(wěn)定。比如用戶想用 Routines 跑一個簡單的數(shù)據(jù)庫內(nèi)容處理流程，結(jié)果不管怎么折騰，始終連不上數(shù)據(jù)庫。

不少人吐槽 bug 多到實際上沒法用。

上手一小時，直接撞出 40 多個 bug

網(wǎng)上很快就有人曬出了一份 bug 清單，里面列了 40 多個問題。更夸張的是，這 40 多個問題，都是 Theo 在一個小時的試用過程中集中撞出來的。

這些問題寫在列表里還只是觀感不佳，放進真實任務(wù)里，很快就會變成一連串的實打?qū)嵉氖褂谜系K。

比如在一個再普通不過的場景里，讓它去分析一個應(yīng)用可能存在的性能問題，本來只是一個起手測試，還沒涉及真正改代碼，系統(tǒng)就已經(jīng)開始不穩(wěn)定。任務(wù)一啟動，就先卡住了將近一分鐘，隨后 agent run 隨機停住，線程直接凍結(jié)，界面上的圖標(biāo)卻還掛在那里，像是在告訴你它仍然在運行。

但實際上，它已經(jīng)不動了。UI 沒有任何提示，也沒有報錯，沒有結(jié)束，也沒有失敗。你眼前看到的是一個仿佛還活著的線程，實際面對的卻是一個已經(jīng)死掉的流程。

這個問題，本質(zhì)上可以說是它出錯的門檻太低了。不是在長鏈路任務(wù)里失手，也不是在高復(fù)雜度項目里崩掉，而是在一個本該最容易跑通的基礎(chǔ)場景里，把任務(wù)執(zhí)行、線程狀態(tài)和界面反饋三件事一起做亂了。這種狀態(tài)錯亂，放在聊天產(chǎn)品里都不算小問題，放在開發(fā)工具里就更致命，因為開發(fā)者最依賴的，恰恰是系統(tǒng)狀態(tài)的清晰、反饋的準(zhǔn)確，以及操作結(jié)果的可預(yù)期。

接著往下操作，在界面這一層，又會遇到更多問題。比如分屏?xí)r，你明明在右側(cè)窗口里操作，打開 terminal 后，它卻出現(xiàn)在左側(cè)分屏上；而且 terminal 一旦開出來，Tab 鍵會被當(dāng)作輸入鍵使用，也就沒法再順手切回其他窗口。

terminal 右上角的關(guān)閉按鈕旁邊又貼著拖拽區(qū)域，結(jié)果那個 X 很難點中。也就是說，terminal 一旦開出來，輸入會受影響，想關(guān)又不那么容易關(guān)掉。

還有些極其荒謬、莫名其妙的 bug：

他吐槽說，“我不太相信那些說自己已經(jīng)用這個應(yīng)用用了好幾周的人，真的認真用過它。我甚至還沒開始用它干活、改代碼，就已經(jīng)連續(xù)撞上了五六個這樣的 bug，感覺自己都快瘋了。”

“現(xiàn)在的問題是，很多人只是接受了這種質(zhì)量。”即便存在大量更穩(wěn)定、功能更完整、甚至開源的替代方案，用戶仍然在使用 Claude Code，僅僅因為它綁定了模型入口。“他們不是在為這個界面付費，他們是為模型付費，但結(jié)果卻要忍受這個界面。”

100%AI 編寫，落地質(zhì)量堪憂

對此，還有其他網(wǎng)友吐槽：“一個整天說‘軟件開發(fā)已經(jīng)被解決了’的公司，現(xiàn)在做成這樣，確實挺好笑的。”不過，也因此至少說明開發(fā)者的飯碗還沒丟。

畢竟 Anthropic 過去這一年的對外敘事一直很激進，核心就一句話：代碼越來越多是 AI 寫的，而且比例還在一路往上抬。從“80% 到 90%”，到“90%”，再到“100%”，數(shù)字一次比一次高。到了 2026 年初，“內(nèi)部大多數(shù)產(chǎn)品基本已經(jīng)是 100% AI 編碼”的說法，也已經(jīng)被他們反復(fù)講了很多次。

問題在于，這個“100%”一旦真正落到產(chǎn)品上，情況就開始變得不太對勁。Claude Code 桌面版給人的感覺，不像一個打磨完成的正式產(chǎn)品，更像一個邊寫邊補、一路 vibe 出來的半成品。問題不在于它偶爾出錯，而在于它在最基礎(chǔ)的使用路徑上就已經(jīng)不穩(wěn)，這才是最讓人擔(dān)心的地方。

有人算了筆賬：這些工程師一天能拿到一千萬到一千五百萬 token，最后做出來的就是這個效果。更讓人困惑的是，從什么時候開始，行業(yè)默認“能大規(guī)模生成高質(zhì)量 token”就等于可以為了速度把編程質(zhì)量一起扔掉？

這種不滿，其實不只是針對桌面版這一次翻車。回頭看，之前的代碼泄露，已經(jīng)提前把問題暴露得很徹底了。

在 userPromptKeywords.ts 里，這家公司用來判斷用戶是否“情緒崩潰”的方式，是這樣一段正則：/b(wtf|shit|fuck|horrible|awful|terrible)b/i，也就是說，這家號稱擁有最先進大語言模型的公司，在做情緒識別時，用的還是最原始的關(guān)鍵詞匹配。這就像一家卡車公司，結(jié)果還在用馬來拉零件。也有人解釋，說正則更快、更便宜，不需要額外的推理調(diào)用，這在工程上是合理的。這話當(dāng)然沒錯。但這恰恰說明這是一個“能跑就行”的工程選擇。便宜優(yōu)先，速度優(yōu)先，先上線再說。

這家公司一邊賣 AI 編程工具，一邊卻沒法用自己的 AI 編程工具做出一個質(zhì)量過關(guān)的產(chǎn)品。那些百分比，從一開始就是用來講故事的，而不是用來交付產(chǎn)品的。80、90、95、100——在源碼被看見之前，沒有人真正問過，“100%”到底產(chǎn)出了什么。

AI 只是把原本的東西放大。原本有工程紀(jì)律，就會被放大成更好的產(chǎn)出；原本沒有紀(jì)律，就會以機器的速度放大成技術(shù)債。Anthropic 選了一條路：更快一點，讓 Claude 去檢查 Claude。出了問題，就再快一點。

如果在一家“構(gòu)建未來”的公司里，“100% AI 編寫”意味著一個包含 486 個分支、3167 行代碼的函數(shù)，一個桌面應(yīng)用包含無數(shù) bug 就能上線，那這個未來需要的不是更快的工程，而是更好的工程。

如果這就是一家正在把行業(yè)往前帶的公司所代表的質(zhì)量標(biāo)準(zhǔn)，那這個方向本身是有問題的。

聲明：個人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.