<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      否認(rèn)降配!Claude Code 降智風(fēng)波復(fù)盤:鍋在推理強(qiáng)度、緩存、提示詞

      0
      分享至


      Claude Code 近期遭遇的一輪“變笨”爭議,終于等來了 Anthropic 的正式回應(yīng)。


      在用戶連續(xù)數(shù)周抱怨 Claude Code 輸出質(zhì)量下降后,Anthropic 承認(rèn),這款編程工具的體驗(yàn)確實(shí)出現(xiàn)了問題。

      但同時否認(rèn)外界關(guān)于其“故意削弱模型能力”的猜測,稱問題并不在底層模型,而是出在 Claude Code 產(chǎn)品層的一系列調(diào)整上。

      之前,AMD AI 負(fù)責(zé)人 Stella Laurenzo 發(fā)帖稱,Claude Code 已經(jīng)退化到“不能被信任去完成復(fù)雜工程任務(wù)”的程度,并給出了 6852 個 Claude Code 會話文件、234760 次工具調(diào)用和 17871 個 thinking block 的分析。

      Anthropic 在 4 月 23 日發(fā)布的復(fù)盤文章中表示,排查后發(fā)現(xiàn),近期體驗(yàn)下降主要由 3 個問題疊加造成。

      第一個問題發(fā)生在 3 月 4 日。

      Anthropic 將 Claude Code 的默認(rèn)推理強(qiáng)度從 high 調(diào)整為 medium,原本是為了降低部分用戶在 high 模式下遇到的超長延遲,因?yàn)橛袝r界面看起來像是卡住了。但現(xiàn)在承認(rèn),這是一個錯誤的取舍。用戶更希望默認(rèn)獲得更高智能表現(xiàn),而不是為了簡單任務(wù)犧牲能力。Anthropic 已在 4 月 7 日撤回這一調(diào)整。該問題影響了 Sonnet 4.6 和 Opus 4.6。

      第二個問題發(fā)生在 3 月 26 日。

      Anthropic 上線了一項(xiàng)緩存優(yōu)化,目標(biāo)是在會話閑置超過 1 小時后,清理 Claude 較早的 thinking 內(nèi)容,從而降低用戶恢復(fù)會話時的延遲。但其中一個 bug 導(dǎo)致系統(tǒng)不是只清理一次,而是在之后的每一輪對話里持續(xù)清理舊 reasoning 內(nèi)容。這讓 Claude 看起來更健忘、更容易重復(fù),也更容易做出奇怪的工具調(diào)用選擇。該問題已在 4 月 10 日修復(fù),影響范圍同樣包括 Sonnet 4.6 和 Opus 4.6。

      第三個問題發(fā)生在 4 月 16 日。

      Anthropic 為了減少 Claude Code 的冗長輸出,在系統(tǒng)提示詞中加入了更強(qiáng)的長度限制。但這一調(diào)整與其他提示詞變更疊加后,意外損害了編碼質(zhì)量。Anthropic 后續(xù)通過更廣泛的評測發(fā)現(xiàn),這一改動會讓 Opus 4.6 和 Opus 4.7 的相關(guān)評測結(jié)果下降約 3%,因此已在 4 月 20 日回滾。該問題影響了 Sonnet 4.6、Opus 4.6 和 Opus 4.7。

      Claude Code 不是單點(diǎn)故障,而是幾次看似合理的產(chǎn)品優(yōu)化疊在一起,最終讓用戶感知成了一場大范圍“降智”。

      Anthropic 表示,從 3 月初就開始調(diào)查相關(guān)反饋,但一開始很難把這些反饋和正常的用戶體驗(yàn)波動區(qū)分開來,內(nèi)部使用和評測也沒有立刻復(fù)現(xiàn)這些問題。

      但 Anthropic 強(qiáng)調(diào),沒有故意削弱模型,也沒有讓 API 或推理層發(fā)生降級。底層模型本身沒有受影響,問題來自 Claude Code 的默認(rèn)參數(shù)、上下文管理和系統(tǒng)提示詞調(diào)整。


      但上線后,用戶很快開始反饋 Claude Code “沒有以前聰明”。

      Anthropic 后來嘗試通過啟動提醒、內(nèi)聯(lián)推理強(qiáng)度選擇器、恢復(fù) ultrathink 等設(shè)計調(diào)整,讓用戶更容易看到當(dāng)前設(shè)置并手動切換。

      但大多數(shù)用戶仍停留在 medium 默認(rèn)設(shè)置。聽取更多客戶反饋后,Anthropic 在 4 月 7 日撤銷這一決定。

      現(xiàn)在,Opus 4.7 默認(rèn)使用 xhigh 推理強(qiáng)度,其他模型默認(rèn)使用 high。

      關(guān)于緩存 bug。

      Anthropic 解釋稱,Claude 在執(zhí)行任務(wù)時,reasoning 通常會保留在對話歷史中,這樣后續(xù)每一輪都能看到此前為什么做出某些編輯和工具調(diào)用。3 月 26 日的優(yōu)化原本是為了在長時間閑置會話恢復(fù)時減少未緩存 token,降低成本和延遲。但實(shí)現(xiàn)中出現(xiàn) bug,導(dǎo)致舊 thinking 在之后每一輪都被持續(xù)丟棄。隨著對話繼續(xù),Claude 會越來越缺少此前決策依據(jù),于是表現(xiàn)為健忘、重復(fù)和工具選擇異常。

      Anthropic 還認(rèn)為,這個 bug 可能也是一些用戶反饋“使用額度消耗比預(yù)期更快”的原因,因?yàn)槌掷m(xù)丟棄 thinking block 會導(dǎo)致后續(xù)請求反復(fù)出現(xiàn)緩存未命中。

      這個問題位于 Claude Code 的上下文管理、Anthropic API 和 extended thinking 的交叉處,因此不容易排查。相關(guān)變更經(jīng)過了人工審查、自動代碼審查、單元測試、端到端測試、自動驗(yàn)證和內(nèi)部試用,但仍然沒有被及時發(fā)現(xiàn)。

      關(guān)于系統(tǒng)提示詞問題。

      Anthropic 表示,Opus 4.7 相比前代有一個明顯行為特點(diǎn):更啰嗦。

      雖然這種傾向有助于提升復(fù)雜問題上的表現(xiàn),但也會產(chǎn)生更多輸出 token。為此,在 Claude Code 中加入了更強(qiáng)的簡潔性要求,限制工具調(diào)用之間的文字和最終回復(fù)長度。經(jīng)過數(shù)周內(nèi)部測試后,這一調(diào)整隨 Opus 4.7 在 4 月 16 日上線。

      但在后續(xù)調(diào)查中,Anthropic 通過更廣泛的 ablation 測試發(fā)現(xiàn),系統(tǒng)提示詞中的某些限制確實(shí)會損害編碼質(zhì)量。于是在 4 月 20 日版本中回滾了相關(guān)提示詞。

      后續(xù)改進(jìn)方面。

      Anthropic 表示,將采取幾項(xiàng)措施避免類似問題再次發(fā)生。會讓更多內(nèi)部員工使用與公眾完全一致的 Claude Code 版本,而不是主要使用帶有新功能測試的內(nèi)部版本;同時會改進(jìn)內(nèi)部使用的 Code Review 工具,并把改進(jìn)后的版本提供給客戶。

      Anthropic 還會加強(qiáng)對系統(tǒng)提示詞變更的控制。

      未來,Claude Code 的每一次系統(tǒng)提示詞調(diào)整,都將經(jīng)過更廣泛的分模型評測,并繼續(xù)通過 ablation 分析每一行提示詞的影響。公司還開發(fā)了新的工具,讓提示詞變更更容易被審查和審計。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      行走的“負(fù)重感”,快坐下歇歇吧,別硬撐著營業(yè)了!

      行走的“負(fù)重感”,快坐下歇歇吧,別硬撐著營業(yè)了!

      飛娛日記
      2026-04-22 10:17:45
      爺爺最后一面不見,姥姥錄音罵賣國!張本智和,你贏了世界輸了家

      爺爺最后一面不見,姥姥錄音罵賣國!張本智和,你贏了世界輸了家

      曹老師評球
      2026-05-01 13:49:39
      重慶:加大公積金惠民力度

      重慶:加大公積金惠民力度

      界面新聞
      2026-05-01 16:38:19
      上映前1天突然跑路!五一檔3部電影組團(tuán)撤檔,影院哭暈在廁所

      上映前1天突然跑路!五一檔3部電影組團(tuán)撤檔,影院哭暈在廁所

      小椰的奶奶
      2026-05-02 07:54:40
      雖然有紋身,但不妨礙端莊得體又有氣質(zhì)

      雖然有紋身,但不妨礙端莊得體又有氣質(zhì)

      牛彈琴123456
      2026-04-30 21:35:37
      100個能救命的冷知識!關(guān)鍵時刻能保命,建議收藏

      100個能救命的冷知識!關(guān)鍵時刻能保命,建議收藏

      詩詞天地
      2026-04-22 14:06:22
      終于,一位接地氣的專家說了大實(shí)話:中國老百姓的負(fù)擔(dān)太重了

      終于,一位接地氣的專家說了大實(shí)話:中國老百姓的負(fù)擔(dān)太重了

      巢客HOME
      2026-04-28 05:25:03
      張雪峰的靈車細(xì)節(jié)讓人淚奔,車尾掛著一棵竹子,上面系著他的衣服

      張雪峰的靈車細(xì)節(jié)讓人淚奔,車尾掛著一棵竹子,上面系著他的衣服

      魔都姐姐雜談
      2026-03-28 18:18:48
      人窮能卑微到什么地步?網(wǎng)友說:一個男人兩千塊買了我三個晚上!

      人窮能卑微到什么地步?網(wǎng)友說:一個男人兩千塊買了我三個晚上!

      黯泉
      2026-04-14 12:13:04
      上海男籃4分惜敗!結(jié)束23連勝,洛夫頓正式回歸,沖擊總冠軍

      上海男籃4分惜敗!結(jié)束23連勝,洛夫頓正式回歸,沖擊總冠軍

      體壇瞎白話
      2026-05-02 08:03:09
      一個時代結(jié)束,大疆首都遇冷,禁飛令已下,閉店開始,網(wǎng)友喊冤?

      一個時代結(jié)束,大疆首都遇冷,禁飛令已下,閉店開始,網(wǎng)友喊冤?

      眼光很亮
      2026-05-01 12:35:39
      誰懂這幾條白月光裙的殺傷力!

      誰懂這幾條白月光裙的殺傷力!

      英國報姐
      2026-05-01 13:06:30
      別不信玄學(xué),喪偶之人身上,都有共同征兆

      別不信玄學(xué),喪偶之人身上,都有共同征兆

      新時代的兩性情感
      2026-05-01 11:04:04
      車頂架偷走你90公里續(xù)航,電車車主還沒意識到

      車頂架偷走你90公里續(xù)航,電車車主還沒意識到

      像素與芯片
      2026-05-01 08:29:04
      一個項(xiàng)目巨虧171億!頂級富二代接班,四年敗光千億家產(chǎn)

      一個項(xiàng)目巨虧171億!頂級富二代接班,四年敗光千億家產(chǎn)

      花朵財經(jīng)
      2026-04-29 16:17:58
      國產(chǎn)車天花板,單臺售價超2000萬元

      國產(chǎn)車天花板,單臺售價超2000萬元

      電動知家
      2026-04-30 09:39:36
      扎心的現(xiàn)象:很多中國男人已經(jīng)養(yǎng)不起家了,無數(shù)普通頂梁柱被壓垮

      扎心的現(xiàn)象:很多中國男人已經(jīng)養(yǎng)不起家了,無數(shù)普通頂梁柱被壓垮

      搗蛋窩
      2026-04-28 11:29:00
      上海街頭偶遇彭于晏,44歲大熱天來回跑,渾身是汗但狀態(tài)絕了

      上海街頭偶遇彭于晏,44歲大熱天來回跑,渾身是汗但狀態(tài)絕了

      深海的秘密
      2026-05-01 19:39:34
      為什么夫妻之間,認(rèn)知高的那個,是絕對斗不過認(rèn)知低的那個的?兩個原因

      為什么夫妻之間,認(rèn)知高的那個,是絕對斗不過認(rèn)知低的那個的?兩個原因

      心理觀察局
      2026-05-02 07:20:06
      山西一地多名干部任前公示

      山西一地多名干部任前公示

      山西晚報
      2026-04-29 10:20:32
      2026-05-02 08:43:00
      云頭條 incentive-icons
      云頭條
      引領(lǐng)科技變革,連接技術(shù)與商業(yè)。
      20000文章數(shù) 27309關(guān)注度
      往期回顧 全部

      科技要聞

      AI熱潮耗盡庫存,Mac Mini起售調(diào)高200美元

      頭條要聞

      男子因健身設(shè)備鎖扣崩斷被彈飛致癱瘓 監(jiān)控?zé)o法調(diào)取

      頭條要聞

      男子因健身設(shè)備鎖扣崩斷被彈飛致癱瘓 監(jiān)控?zé)o法調(diào)取

      體育要聞

      無奈!約基奇:這要在塞爾維亞 全隊早被炒了

      娛樂要聞

      馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶外直播

      財經(jīng)要聞

      雷軍很努力 小米還是跌破了30港元大關(guān)

      汽車要聞

      限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

      態(tài)度原創(chuàng)

      旅游
      游戲
      時尚
      數(shù)碼
      健康

      旅游要聞

      陪盲人一起春游,他們看不見,出去玩的樂趣是什么?

      《英雄無敵:上古紀(jì)元》特別好評 首日銷量破25萬份

      聰明女人衣服從來不買太多!這三種精品提前準(zhǔn)備好,耐穿又實(shí)用

      數(shù)碼要聞

      蘋果因AirTag"跟蹤"爭議面臨數(shù)十起新訴訟

      干細(xì)胞治燒燙傷面臨這些“瓶頸”

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产一区二区三区在线观看免费 | y1111111少妇无码| 久久久久久久久无码精品亚洲日韩| 欧美性猛交xxxx免费看| 亚洲日本va午夜在线影院| 91密桃精品国产91久久| 中文字幕AV伊人AV无码AV狼人| 亚洲最大AV一区二区三区| 亚洲欧美日韩国产综合久| 熟女一区| 熟女精品激情免费视频| 亚洲日韩AV秘 无码一区二区| 国产免费黄| 少妇被又大又粗下爽a片| 日韩人妻中文无码一区二区七区| 婷婷五月综合缴情在线视频| av中文无码韩国亚洲色偷偷 | 内射美女主播在线观看| 天天摸天天做天天爽| 成人亚洲一区二区三区在线| 制服丝袜在线亚洲| 91精品久久久久久久免费看| 久久精品亚洲一区二区三区浴池| 国产91精品一区二区亚洲| 午夜av一区二区三区| 日韩精品久久久肉伦网站| 成在人线AV无码免费高潮水老板| 国产精品3p视频| 国产成年无码久久久免费| 乱色欧美激惰| 在线看一区二区三区| 伊人蕉久中文字幕无码专区| 真人性囗交视频| 又黄又硬又粗av影视在线观看| 在线精品视频一区二区| 亚洲人成网站色7799| 色综合av社区男人的天堂| 无遮挡1000部拍拍拍免费| 在线看片a| 人妻制服OL熟女の美脚| 手机免费看黄在线高清视频|