<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Claude終于認了!降智坐實,越聊越傻,3個bug全曝光

      0
      分享至

      henry 發自 凹非寺
      量子位 | 公眾號 QbitAI

      感謝OpenAI(doge)。

      就在GPT-5.5發布的前后腳,Claude招了:

      模型降智屬實,所有使用額度均已重置。



      嘴硬了一個多月,這降智bug終于從A社自己嘴里蹦出來了:

      • 推理等級偷偷從「高」調成「中」
      • 緩存bug導致每輪對話都清空思考記錄
      • 一句25詞限制的提示詞砸了輸出質量

      三個bug疊在一起,Claude使用體驗全面拉垮。

      只能還好說友商今天及時給上了一波壓力,教育用戶終究不可取。



      不過,說歸說,更新bug當然是好事。就是這時間也太巧了,GPT-5.5剛發,Claude就開始「認慫」。

      難不成是5.5幫忙debug的?

      Dario啊,你該不會真的是故意讓Claude變笨,好在GPT-5.5放出來的時候找畫面的吧?



      Bug實錘了,一共三個

      先說一句,這已經不是第一次了。

      去年8月,Anthropic剛發過一次類似的降智postmortem,當時影響的是Opus 4.0和4.1,官方說辭也是「我們從未有意降低模型質量」。

      這次新postmortem的標題叫「A postmortem of three recent issues」。recent,意思也很明白。

      不是剛剛,是最近。



      之所以「最近」,是因為Claude降智這事兒,社區已經嚷嚷吵了很久了。

      十多天前,AMD AI組高級總監Stella Laurenzo就在GitHub上發了一份硬核審計報告,覆蓋6852份會話文件、17871個思考塊、超過23萬次工具調用。



      分析結果顯示,從2月份開始,模型的推理深度出現了斷崖式下滑。

      更細節的發現是,Claude開始陷入reasoning loops,而且有明顯的傾向去選「最簡單的修復」而不是正確的修復。

      BridgeMind的BridgeBench測試也在同期炸鍋,Opus 4.6準確率從83.3%掉到68.3%,排名從第2跌到第10。



      雖然后來被研究者批評方法論有問題,前后測試的任務數量根本不一樣,但「Claude變蠢了」的敘事已經傳開了。

      網友甚至造了個新詞,AI shrinkflation,AI縮水通脹。同樣的價格,你拿到的是稀釋過的產品。

      換句話說,大伙買到了A社的「兒童套餐」。

      但沒辦法,當時Claude確實是打遍天下無敵手,不少用戶邊罵邊用,沒啥脾氣。

      直到GPT-5.5發了,A社終于坐不住,在官方博客上發了一篇postmortem,把過去兩個月的「降智」拆成三條獨立問題:

      偷偷降了推理等級

      3月4日,Claude Code的默認推理從high調成了medium,理由是high模式下延遲太高。但界面上還是顯示「high」。用戶以為自己在用滿血版,實際拿到的是降檔貨。一個多月后才回滾。

      越聊越傻

      3月26日上了個緩存優化,本意是會話空閑超過一小時后清掉舊的思考記錄。結果代碼有bug,清除變成了每一輪都執行。

      Claude繼續干活,但逐漸忘了自己為什么要干這件事。健忘、重復、工具調用亂飛,就是這個bug的癥狀。

      而且因為思考記錄被反復清,每次請求都緩存未命中,token消耗反而飆升。花了15天才修好。

      一句提示詞砸了輸出質量。

      4月16日,系統提示里加了一條「工具調用之間文字不超過25個詞,最終回復不超過100個詞」。

      Opus 4.6和4.7都掉了3%性能,四天后回滾。

      三個問題影響不同用戶群,在不同時間段生效。疊加起來的效果就是整個Claude Code在持續、不均勻地變差,但誰也說不清到底哪里不對。

      官方推特上,ClaudeDevs發總結,Claude之父Boris Cherny也親自下場回復,并預告Opus 4.7的bug也正在de了。



      但問題是,光有bug不夠解釋這兩個月發生的一切。

      四月里,A社的騷操作一籮筐

      把時間線拉開看,四月其實是A社連續三拳打在自己臉上。

      4月4日,Anthropic封禁了OpenClaw等第三方agentic工具通過Pro/Max訂閱運行。想繼續用?去走API按token付費。

      4月21日,官方定價頁悄悄把Pro plan里的Claude Code去掉了,支持文檔也從「Pro或Max plan」改成了「只有Max plan」。

      被網友抓包后,Head of Growth Amol Avasare出來說這只是2%新用戶的A/B測試。但問題是公開頁面是全站更新的,口徑完全對不上。幾小時后灰頭土臉地回滾。

      連起來算一筆賬。Pro用戶20/月,年費240。要繼續用Claude Code,得升到Max 5x,100/月起步,年費1200。五倍。Max 20x是2400,十倍。中間沒有過渡檔。

      注意,這里單位是美元。

      4月23日,就是今天,postmortem上線,補償是重置使用額度。

      有網友不客氣地指出,上周Opus 4.7發布時就已經重置過一次了,所以這次的「補償」其實就是一次正常的周期重置。

      三件事連起來,味道就不是bug了,是成本焦慮全面爆發。

      網友不買賬

      綜上種種,對于Claude,網友的反應也開始分化。

      有人覺得出bug可以理解,postmortem寫得也算透明。Boris在HN一條一條回復,這比大多數公司做得好。



      但更多人在算另一筆賬。

      這兩個月里,所有正式渠道一聲不吭。

      只有幾個員工在X上零星回復用戶,而且被批評為「隨機時間隨機回復」,完全不成體系。



      還有人質疑「緩存優化」的真正動機。清除思考記錄的觸發時間恰好卡在緩存過期的節點上,有人覺得這不是為了降延遲,是為了省成本。

      同期Anthropic還對一小部分Pro用戶做了A/B測試,悄悄給了不同的產品配置,信任又挨了一刀。



      補償措施是重置使用額度。有人不客氣地指出,上周Opus 4.7發布時就已經重置過一次了。

      BridgeMind的BridgeBench測試也在這段時間炸了鍋,顯示Opus 4.6準確率從83.3%掉到68.3%,排名從第2跌到第10。

      雖然后來被研究者批評方法論有問題,前后測試的任務數量根本不一樣,但「Claude變蠢了」的敘事已經傳開了。

      正如一位網友說的,不能把所有雞蛋放在一個模型公司里。



      One more thing

      HN評論區里一個有意思的現象,不少人在聊自己的「遷移經歷」。

      有人說二月份就「下意識地」轉去了Codex,直到現在才意識到大概是被Claude變差給逼的。



      也有人說GPT-5.4已經比Opus4.6好了。



      還有人在用MiniMax做補充,40美金4500條消息一個5小時周期,還能看到完整思考過程。



      半年前「寫代碼就用Claude」幾乎是共識。

      現在Codex有400萬活躍用戶,GPT-5.5主打的就是編碼和計算機操作能力,連OpenAI的人都直接說這個模型能當「參謀長」用。

      Claude不是變差了。是別人變好了,而它在最不該出問題的時候出了問題。

      留給Anthropic修bug和重建信任的窗口,比兩個月前窄了不少。

      GPT-5.5已經發布,DeepSeek V4儼然就位。



      Gemini快來吧!就差你了。

      [1]https://www.anthropic.com/engineering/april-23-postmortem

      [2]https://news.ycombinator.com/item?id=47878905

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “都絕戶了,還拼命掙錢干嘛?”看見父親50歲就躺平,我崩潰了

      “都絕戶了,還拼命掙錢干嘛?”看見父親50歲就躺平,我崩潰了

      素十三兒
      2026-04-13 07:12:36
      因凡蒂諾宣布參加下屆國際足聯主席選舉,若當選將成唯一連任四屆主席

      因凡蒂諾宣布參加下屆國際足聯主席選舉,若當選將成唯一連任四屆主席

      懂球帝
      2026-05-01 10:23:10
      為華晨宇演唱會買的房,賣不出去了

      為華晨宇演唱會買的房,賣不出去了

      南風窗
      2026-05-01 20:02:27
      中國內地的世界杯版權,成了堰塞湖|顏強專欄

      中國內地的世界杯版權,成了堰塞湖|顏強專欄

      顏強
      2026-05-01 19:14:28
      受美國拖欠會費等因素影響 世貿組織計劃削減10%預算

      受美國拖欠會費等因素影響 世貿組織計劃削減10%預算

      財聯社
      2026-05-02 02:56:05
      柳巖都這樣了,還沒有大紅大紫,難紅真相原來是這些

      柳巖都這樣了,還沒有大紅大紫,難紅真相原來是這些

      金鱗化龍2
      2026-04-07 10:37:42
      女演員長相多重要?看42歲唐嫣跟33歲楊采鈺,才知長相成熟多吃虧

      女演員長相多重要?看42歲唐嫣跟33歲楊采鈺,才知長相成熟多吃虧

      劇芒芒
      2026-05-01 12:53:20
      熬走了默克爾卻輸給了經濟:馬克龍走后,法國會成歐洲最大雷區?

      熬走了默克爾卻輸給了經濟:馬克龍走后,法國會成歐洲最大雷區?

      寰球經緯所
      2026-04-28 20:31:21
      央視不慣FIFA高價,美加墨世界杯或面臨轉播危機

      央視不慣FIFA高價,美加墨世界杯或面臨轉播危機

      怎挽怎挽
      2026-05-01 14:12:56
      英國查爾斯抱病訪美,委婉提醒遭美冷遇,英美情誼剩空殼

      英國查爾斯抱病訪美,委婉提醒遭美冷遇,英美情誼剩空殼

      智腦的趨勢
      2026-04-30 18:11:38
      老師和孩子的天都塌了!不去春游事件發酵,無恥的家長沒有下限!

      老師和孩子的天都塌了!不去春游事件發酵,無恥的家長沒有下限!

      知曉科普
      2026-04-30 12:25:16
      自然資源廳原副廳長,主動向組織交代問題

      自然資源廳原副廳長,主動向組織交代問題

      礦材網
      2026-05-02 00:05:19
      我媽拿我彩禮給弟弟買車,我遠嫁外地后再沒回家,3年后弟弟來電

      我媽拿我彩禮給弟弟買車,我遠嫁外地后再沒回家,3年后弟弟來電

      五元講堂
      2026-03-12 14:27:11
      東部華僑城關閉傳聞如潮涌,業主堅決否認卻引發市民熱議

      東部華僑城關閉傳聞如潮涌,業主堅決否認卻引發市民熱議

      阿萊美食匯
      2026-05-01 20:08:45
      經典日劇《麻辣教師GTO》拍新版 7月20日播出

      經典日劇《麻辣教師GTO》拍新版 7月20日播出

      3DM游戲
      2026-04-30 20:35:39
      美專家無奈承認:我們沒打贏伊朗,但是中國、俄羅斯、朝鮮都贏了

      美專家無奈承認:我們沒打贏伊朗,但是中國、俄羅斯、朝鮮都贏了

      風笛悠揚聲
      2026-05-01 14:12:25
      19歲皇馬神童橫空出世 解約金5000萬歐 5豪強瘋搶 最熱門下家浮現

      19歲皇馬神童橫空出世 解約金5000萬歐 5豪強瘋搶 最熱門下家浮現

      零度眼看球
      2026-05-01 07:05:30
      一下午一句話 Codex 幫我開發了一個完整的游戲!

      一下午一句話 Codex 幫我開發了一個完整的游戲!

      歸藏的AI工具箱
      2026-05-01 08:36:59
      下一任國民黨主席浮出水面,無論誰接班,統一只是時間問題

      下一任國民黨主席浮出水面,無論誰接班,統一只是時間問題

      小影的娛樂
      2026-05-01 18:50:45
      心碎!西湖首窩鴛鴦寶寶12只變0只,才6天就團滅?真相讓人沉默

      心碎!西湖首窩鴛鴦寶寶12只變0只,才6天就團滅?真相讓人沉默

      超人強動物俱樂部
      2026-05-01 19:55:04
      2026-05-02 03:51:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12567文章數 176459關注度
      往期回顧 全部

      科技要聞

      DeepSeek發布多模態論文又連夜刪除

      頭條要聞

      伊朗未爆彈藥爆炸 致革命衛隊14人死亡

      頭條要聞

      伊朗未爆彈藥爆炸 致革命衛隊14人死亡

      體育要聞

      無奈!約基奇:這要在塞爾維亞 全隊早被炒了

      娛樂要聞

      馬筱梅產后身材恢復超好 現身戶外直播

      財經要聞

      GPU神話松動,AI真正的戰場變了

      汽車要聞

      限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

      態度原創

      健康
      時尚
      親子
      本地
      游戲

      干細胞治燒燙傷面臨這些“瓶頸”

      這個夏天,彩色褲子又火了!

      親子要聞

      教孩子預防侵犯,分辨危險身體觸碰并且拒絕!

      本地新聞

      用青花瓷的方式,打開西溪濕地

      PS玩家團結起來!請愿復活第一方3A 耗時7年卻被取消

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产午夜福利片在线观看| 女人腿张开让男人桶爽| 一本无码av一区二区三区| 亚洲偷自拍国综合| 国产精品久久久一区二区三区 | 精品视频不卡免费观看| 日日日影院| 亚洲精品国产V片在线观看| 性色av一区二区三区夜夜嗨| 中国精品少妇hd| 国产综合视频一区二区三区| 120秒试看无码体验区| 影音先锋在线资源无码| 国产人免费人成免费视频| 波多野结衣av88综合| 超碰97人人做人人爱综合| 国产情侣激情在线对白| 中文字幕一二区| 2021精品国产品免费观看| 亚洲 综合 校园 欧美 制服| 中文字幕国产精品综合| 又粗又长美女电影在线| 无码人妻精品一区二区三区夜夜嗨 | 老司机亚洲精品| 亚洲日本中文字幕天天更新 | 日本欧美一区二区免费视频 | 亚洲一区二区三区| 久久AV无码精品人妻系列果冻传媒 | 亚洲色欲av| 精品精品国产高清A毛片| 久久九九51精品国产免费看| 国产伦精品免编号公布| 亚洲欧美日韩国产精品一区| 亚洲人成网站在线播放动漫| 精品人妻免费看一区二区三区| 日韩av一区二区三区精品| 亚洲最大AV资源网在线观看| 亚洲视频在线观看免费视频| 国产二级一片内射视频播放| 亚洲欧美综合中文| 色www88|