Anthropic 終于還是把 Claude Code 做成了桌面應(yīng)用。
Anthropic 顯然也對它寄予厚望,官方賬號親自下場發(fā)推,外界預(yù)熱已經(jīng)持續(xù)了幾個月,整個發(fā)布姿態(tài)都在傳遞一個信號:他們終于要把 Claude Code 從一個“能用的 CLI 工具”,推進成一個更完整的正式產(chǎn)品了。
![]()
但真正的問題在于,這個桌面版一旦開始上手,給人的感受并不是“終于成熟了”,而是“怎么會爛成這樣”。
新桌面版爛到根本沒法用
這個版本上線才兩天,就在社區(qū)里迅速積累起一波密集吐槽。
用戶提到,iOS 下,鍵盤會突然卡住。有時連最核心的輸入框都會頻繁消失,而且?guī)缀趺看螘挾紩龅剑仨毻顺鲈僦匦逻M入聊天才能恢復(fù)。
![]()
![]()
Windows 版本也一樣會經(jīng)常卡頓和崩潰。
![]()
界面層面的問題也很明顯:按鈕位置不符合預(yù)期,聊天框還頻繁閃爍,整體交互體驗不穩(wěn)定。
![]()
另一個明顯問題是,一些原本最該體現(xiàn)效率價值的自動化功能,本身就不太穩(wěn)定。比如用戶想用 Routines 跑一個簡單的數(shù)據(jù)庫內(nèi)容處理流程,結(jié)果不管怎么折騰,始終連不上數(shù)據(jù)庫。
![]()
不少人吐槽 bug 多到實際上沒法用。
![]()
![]()
![]()
上手一小時,直接撞出 40 多個 bug
網(wǎng)上很快就有人曬出了一份 bug 清單,里面列了 40 多個問題。更夸張的是,這 40 多個問題,都是 Theo 在一個小時的試用過程中集中撞出來的。
![]()
這些問題寫在列表里還只是觀感不佳,放進真實任務(wù)里,很快就會變成一連串的實打?qū)嵉氖褂谜系K。
比如在一個再普通不過的場景里,讓它去分析一個應(yīng)用可能存在的性能問題,本來只是一個起手測試,還沒涉及真正改代碼,系統(tǒng)就已經(jīng)開始不穩(wěn)定。任務(wù)一啟動,就先卡住了將近一分鐘,隨后 agent run 隨機停住,線程直接凍結(jié),界面上的圖標(biāo)卻還掛在那里,像是在告訴你它仍然在運行。
![]()
但實際上,它已經(jīng)不動了。UI 沒有任何提示,也沒有報錯,沒有結(jié)束,也沒有失敗。你眼前看到的是一個仿佛還活著的線程,實際面對的卻是一個已經(jīng)死掉的流程。
這個問題,本質(zhì)上可以說是它出錯的門檻太低了。不是在長鏈路任務(wù)里失手,也不是在高復(fù)雜度項目里崩掉,而是在一個本該最容易跑通的基礎(chǔ)場景里,把任務(wù)執(zhí)行、線程狀態(tài)和界面反饋三件事一起做亂了。這種狀態(tài)錯亂,放在聊天產(chǎn)品里都不算小問題,放在開發(fā)工具里就更致命,因為開發(fā)者最依賴的,恰恰是系統(tǒng)狀態(tài)的清晰、反饋的準(zhǔn)確,以及操作結(jié)果的可預(yù)期。
![]()
接著往下操作,在界面這一層,又會遇到更多問題。比如分屏?xí)r,你明明在右側(cè)窗口里操作,打開 terminal 后,它卻出現(xiàn)在左側(cè)分屏上;而且 terminal 一旦開出來,Tab 鍵會被當(dāng)作輸入鍵使用,也就沒法再順手切回其他窗口。
terminal 右上角的關(guān)閉按鈕旁邊又貼著 拖拽區(qū)域,結(jié)果那個 X 很難點中。也就是說,terminal 一旦開出來,輸入會受影響,想關(guān)又不那么容易關(guān)掉。
還有些極其荒謬、莫名其妙的 bug:
他吐槽說,“我不太相信那些說自己已經(jīng)用這個應(yīng)用用了好幾周的人,真的認真用過它。我甚至還沒開始用它干活、改代碼,就已經(jīng)連續(xù)撞上了五六個這樣的 bug,感覺自己都快瘋了。”
“現(xiàn)在的問題是,很多人只是接受了這種質(zhì)量。”即便存在大量更穩(wěn)定、功能更完整、甚至開源的替代方案,用戶仍然在使用 Claude Code,僅僅因為它綁定了模型入口。“他們不是在為這個界面付費,他們是為模型付費,但結(jié)果卻要忍受這個界面。”
100%AI 編寫,落地質(zhì)量堪憂
對此,還有其他網(wǎng)友吐槽:“一個整天說‘軟件開發(fā)已經(jīng)被解決了’的公司,現(xiàn)在做成這樣,確實挺好笑的。”不過,也因此至少說明開發(fā)者的飯碗還沒丟。
畢竟 Anthropic 過去這一年的對外敘事一直很激進,核心就一句話:代碼越來越多是 AI 寫的,而且比例還在一路往上抬。從“80% 到 90%”,到“90%”,再到“100%”,數(shù)字一次比一次高。到了 2026 年初,“內(nèi)部大多數(shù)產(chǎn)品基本已經(jīng)是 100% AI 編碼”的說法,也已經(jīng)被他們反復(fù)講了很多次。
![]()
問題在于,這個“100%”一旦真正落到產(chǎn)品上,情況就開始變得不太對勁。Claude Code 桌面版給人的感覺,不像一個打磨完成的正式產(chǎn)品,更像一個邊寫邊補、一路 vibe 出來的半成品。問題不在于它偶爾出錯,而在于它在最基礎(chǔ)的使用路徑上就已經(jīng)不穩(wěn),這才是最讓人擔(dān)心的地方。
有人算了筆賬:這些工程師一天能拿到一千萬到一千五百萬 token,最后做出來的就是這個效果。更讓人困惑的是,從什么時候開始,行業(yè)默認“能大規(guī)模生成高質(zhì)量 token”就等于可以為了速度把編程質(zhì)量一起扔掉?
這種不滿,其實不只是針對桌面版這一次翻車。回頭看,之前的代碼泄露,已經(jīng)提前把問題暴露得很徹底了。
在 userPromptKeywords.ts 里,這家公司用來判斷用戶是否“情緒崩潰”的方式,是這樣一段正則:/b(wtf|shit|fuck|horrible|awful|terrible)b/i,也就是說,這家號稱擁有最先進大語言模型的公司,在做情緒識別時,用的還是最原始的關(guān)鍵詞匹配。這就像一家卡車公司,結(jié)果還在用馬來拉零件。也有人解釋,說正則更快、更便宜,不需要額外的推理調(diào)用,這在工程上是合理的。這話當(dāng)然沒錯。但這恰恰說明這是一個“能跑就行”的工程選擇。便宜優(yōu)先,速度優(yōu)先,先上線再說。
這家公司一邊賣 AI 編程工具,一邊卻沒法用自己的 AI 編程工具做出一個質(zhì)量過關(guān)的產(chǎn)品。那些百分比,從一開始就是用來講故事的,而不是用來交付產(chǎn)品的。80、90、95、100——在源碼被看見之前,沒有人真正問過,“100%”到底產(chǎn)出了什么。
AI 只是把原本的東西放大。原本有工程紀(jì)律,就會被放大成更好的產(chǎn)出;原本沒有紀(jì)律,就會以機器的速度放大成技術(shù)債。Anthropic 選了一條路:更快一點,讓 Claude 去檢查 Claude。出了問題,就再快一點。
如果在一家“構(gòu)建未來”的公司里,“100% AI 編寫”意味著一個包含 486 個分支、3167 行代碼的函數(shù),一個桌面應(yīng)用包含無數(shù) bug 就能上線,那這個未來需要的不是更快的工程,而是更好的工程。
如果這就是一家正在把行業(yè)往前帶的公司所代表的質(zhì)量標(biāo)準(zhǔn),那這個方向本身是有問題的。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.